重大突破！OpenAI新技術讓AI繪圖提速50倍，僅需0.11秒生成一張圖

OpenAI最近公佈了一項名爲sCM（簡化型、穩定型和可擴展型一致性模型）的突破性技術，這一創新徹底改變了AI圖像模型的訓練方式。該技術在原有的一致性模型(CMs)基礎上實現了重大突破，爲快速圖像生成開闢了新天地。

技術核心優勢:

只需兩步計算即可生成高質量圖像

在A100GPU上生成一張圖片僅需0.11秒

相比傳統擴散模型，速度提升50倍

最大模型參數達15億，創下新紀錄

在實際測試中，sCM的表現令人矚目。在CIFAR-10數據集上獲得了2.06的FID評分，在ImageNet上生成512x512像素圖像時達到了1.88的優異成績。這些指標僅比現有最佳擴散模型落後約10%，但速度卻有質的飛躍。

技術革新的關鍵在於解決了傳統一致性模型的根本性問題。此前的模型使用離散時間步長，不僅需要額外參數，還容易出錯。OpenAI的研究團隊通過建立簡化的理論框架，統一了各種方法，成功識別並解決了訓練不穩定的主要原因。

更令人期待的是，這項技術展現出強大的擴展潛力。OpenAI成功在ImageNet數據集上訓練了參數量達15億的模型，這在同類模型中尚屬首次。研究發現，隨着模型規模增大，圖像質量持續提升，這意味着未來可能實現更大規模的模型訓練。

黑森林實驗室推FLUX Pro微調API，僅用五張樣本圖像就能定製AI模型

德國人工智能初創公司 Black Forest Labs （黑森林實驗室）近日發佈了一款FLUX Pro 微調 API，用戶可以通過這款 API 使用僅僅五張樣本圖像來定製 FLUX Pro AI 圖像模型，以匹配特定品牌的視覺風格。據 Black Forest Labs 介紹，經過微調後，模型仍然保持靈活性，能夠將用戶提供的內容融入到新的圖像創作中，該系統能夠生成最高達四百萬像素的高分辨率圖像。藉助 FLUX Pro 微調 API，創作者可以利用自己的圖片和概念對 FLUX.1[pro] 進行定製，從而更好地控制最終結果。用戶提供的圖像可用於訓練 FLUX Pro 模

AI重大發現：最先進視覺模型在基礎視覺推理能力上仍顯不足

來自德國達姆施塔特工業大學的最新研究揭示了一個令人深思的現象:即便是當前最先進的AI圖像模型，在面對簡單的視覺推理任務時也會出現明顯失誤。這項研究結果對AI視覺能力的評估標準提出了新的思考。研究團隊採用了由俄羅斯科學家Michail Bongard設計的Bongard問題作爲測試工具。這類視覺謎題由12張簡單圖像組成，分爲兩組，要求識別出區分這兩組的規則。對於大多數人來說，這種抽象推理任務並不困難，但AI模型的表現卻令人意外。即便是目前被認爲最先進的多模態模型GPT-4o，在100個

OpenAI推全新模型sCM，內容生成速度提升50倍，生圖只需0.1秒

近日，OpenAI 的研究人員發佈了一項令人振奮的研究成果，介紹了一種全新的連續時間一致性模型（sCM）。這一模型在生成多媒體內容(如圖像、視頻和音頻)的速度上實現了飛躍，相較於傳統的擴散模型，速度提高了整整50倍。具體來說，sCM 能夠在不到0.1秒的時間內生成一幅圖像，而傳統擴散模型則往往需要超過5秒。研究團隊通過這項技術，成功地在僅需兩次採樣步驟的情況下，生成出高質量的樣本。這一創新使得生成過程更爲高效，而不會犧牲樣本的質量。文章由 OpenAI 的兩位研究人員 —

MIT和Google聯手推出StableRep技術，利用AI生成圖像訓練高效AI模型

["MIT和Google的研究人員合作開發了StableRep技術，通過AI生成圖像訓練詳細高效的AI圖像模型。","StableRep採用多正對比學習方法，使用數百萬標記的合成圖像進行訓練，取得在ImageNet分類上的顯著成就。","儘管取得成功，StableRep生成圖像速度較慢，存在語義不匹配問題，底層模型需要在真實數據上進行初始訓練。","技術已在GitHub上開源，可用於商業用途，但生成圖像時間長，使用成本可能較高。"]

重大突破！OpenAI新技術讓AI繪圖提速50倍，僅需0.11秒生成一張圖

相關推薦

Freepik 上線豆包 Seedream 4.0 圖像模型，premium+會員可無限使用

黑森林實驗室推FLUX Pro微調API，僅用五張樣本圖像就能定製AI模型

AI重大發現：最先進視覺模型在基礎視覺推理能力上仍顯不足

OpenAI推全新模型sCM，內容生成速度提升50倍，生圖只需0.1秒

MIT和Google聯手推出StableRep技術，利用AI生成圖像訓練高效AI模型

重大突破！OpenAI新技術讓AI繪圖提速50倍，僅需0.11秒生成一張圖

相關推薦

​Freepik 上線豆包 Seedream 4.0 圖像模型，premium+會員可無限使用

黑森林實驗室推FLUX Pro微調API，僅用五張樣本圖像就能定製AI模型

AI重大發現：最先進視覺模型在基礎視覺推理能力上仍顯不足

OpenAI推全新模型sCM，內容生成速度提升50倍，生圖只需0.1秒

MIT和Google聯手推出StableRep技術，利用AI生成圖像訓練高效AI模型

Freepik 上線豆包 Seedream 4.0 圖像模型，premium+會員可無限使用