阿里發佈 FLUX.1-Turbo-Alpha：基於FLUX.1-dev、8步提煉Lora

近日，阿里媽媽創意團隊發佈了 FLUX.1-Turbo-Alpha，這是基於 FLUX.1-dev 模型訓練的一款8步蒸餾 Lora 模型。

該模型採用了多頭判別器，顯著提高了蒸餾的質量，支持文本到圖像生成、修復控制網等多種 FLUX 相關的應用。團隊建議在使用時將引導尺度設置爲3.5，Lora 尺度爲1，未來還會推出更低步數的版本。

FLUX.1-Turbo-Alpha 可以直接與 Diffusers 框架結合使用。用戶只需通過幾行代碼便能加載模型並生成所需的圖像。例如，你可以創建一個有趣的場景:一隻微笑的樹懶穿着皮夾克、牛仔帽、格子裙和蝴蝶結，站在一輛畫有城市風景的光滑大衆麪包車前。只需簡單調整參數，就能在1024x1024的分辨率下生成高質量的圖像。

此外，該模型也兼容 ComfyUI，可以用於文本到圖像的快速工作流程，或在修復控制網中實現更高效的生成效果。通過這種技術，生成的圖像能夠很好地跟隨原始輸出，提升用戶的創作體驗。

FLUX.1-Turbo-Alpha 的訓練過程同樣令人矚目。該模型在超過100萬幅開源和內部資源的圖像上進行訓練，具備6.3以上的美學評分，且分辨率均高於800。團隊在訓練過程中採用了對抗訓練的方法，以提升圖像質量，並針對每個變換器層增加了多頭的設計。訓練過程中的引導尺度固定爲3.5，時間偏移則設爲3，使用了混合精度 bf16，並設定學習率爲2e-5，批量大小爲64，圖像尺寸爲1024x1024。

FLUX.1-Turbo-Alpha 的推出，標誌着阿里媽媽在圖像生成領域的又一次突破，推動了人工智能技術的普及與應用。

項目入口:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

劃重點:
🌟 這款模型基於 FLUX.1-dev，採用8步蒸餾和多頭判別器，提升圖像生成質量。
🖼️ 支持文本到圖像生成及修復控制網，用戶可輕鬆創建多種有趣場景。
📊 訓練過程採用對抗訓練，訓練數據超過100萬張圖像，確保模型高質量輸出。

阿里媽媽重磅推出超級經營智能體引擎 “AI 萬相”

阿里媽媽推出“AI萬相”超級經營智能體引擎，標誌着2026年AI營銷進入智能體時代。該引擎由萬相智識、萬相智品、萬相智造和萬相智投四大智能體組成，能高效協同，商家僅需簡單指令即可快速完成電商經營任務，爲品牌增長帶來顛覆性變革。

阿里媽媽推出URM大模型，引領廣告智能化新潮流

近日，在 TongAI 大會上，阿里媽媽正式發佈了 URM 通用召回大模型。這一全新的技術成果，結合了深度學習與大數據分析能力，旨在提升電商廣告的智能投放效果。URM 大模型不僅能夠精準解析消費者的行爲和興趣偏好，還能有效提高廣告投資回報率（ROI），標誌着阿里媽媽在生成式推薦領域的首次技術落地，爲廣告行業的智能化轉型注入了新的動力。URM 大模型的發佈意味着阿里媽媽在廣告投放領域邁出了重要的一步。隨着電商行業的不斷髮展，傳統廣告模式已經難以滿足用戶個性化需求，

阿里媽媽：天貓618期間將投入三大AI紅利

在日前召開的 “質贏618・增長策略發佈會” 上，阿里媽媽宣佈了一系列新舉措，以推動天貓618購物節的成功。此次活動將利用三大 AI 紅利，並結合30億紅包等多重激勵，旨在全面提升品牌的市場表現，並貫徹 “扶優扶新” 的平臺戰略。阿里媽媽表示，將通過其先進的 AIGX 能力，全面提高營銷效率，助力商家在全域範圍內提升品牌影響力。此外，阿里媽媽還將推出 “種‘搜’一體” 的策略，以幫助商家在產品推廣和搜索流量之間建立更緊密的聯繫。這一新舉措將爲商家帶來更高的曝光率

OCR 2.0模型：一鍵將文本、公式、圖表圖像轉換爲可編輯文本

在數字化時代，將圖像中的文字內容快速轉換成可編輯文本是一個常見且重要的需求。現在，一項名爲GOT（通用光學字符識別理論）的新型光學字符識別(OCR)模型的問世，標誌着OCR技術邁入了2.0時代。這一創新模型結合了傳統OCR系統與大型語言模型的優勢，旨在打造一個更高效、更智能的文本識別工具。GOT模型採用了一種創新的端到端架構，這一設計不僅節省資源，還極大地擴展了識別能力，使其不僅限於文本識別。該模型由一個參數約8000萬的圖像編碼器和一個參數約500萬的解碼器組成。

蘋果可能會在明年推出售價 2000 美元的 Vision 頭顯