Freepik 發佈“F Lite”：一個爲版權安全而構建的開放 AI 圖像模型

西班牙數字圖形巨頭 Freepik 近日推出了其最新的文本到圖像生成模型“F Lite”，旨在成爲 Midjourney 等因版權問題而備受爭議的生成器的合法且安全的替代品。

F Lite 擁有約100億個參數，其獨特之處在於完全基於 Freepik 自身商業授權的圖像庫進行訓練。Freepik 聲稱，這使其成爲首個完全依賴“工作安全”內容進行訓練的如此規模的公開模型。

這款模型是 Freepik 與人工智能初創公司 Fal.ai 合作開發的成果。訓練過程耗時兩個多月，使用了64塊 Nvidia H100GPU 和約8000萬張 Freepik 內部數據集的圖像。

Freepik 對照片提示“單反相機拍攝的照片，一個紅鬍子男人在雨中跳舞”的詮釋，帶有一種復古、早期人工智能的感覺。| 圖片:THE DECODER 出品的 F Lite

通過推出 F Lite，Freepik 加入了日益壯大的基於合法審查數據的圖像生成器陣營，其中包括 Adobe、Getty Images 和 Shutterstock 等公司的產品。在 OpenAI 和 Midjourney 等公司因使用抓取自開放互聯網的圖像而面臨多起訴訟的背景下，版權安全的訓練數據集正變得越來越重要。

與一些競爭對手不同，Freepik 將 F Lite 定位爲一個開放的替代方案，供開發者在其基礎上進行進一步開發。該模型已在 GitHub 上開源，但運行它需要至少24GB VRAM 的 GPU。此外，Hugging Face 上也提供了一個演示版本供用戶試用。

在《Midjourney》中，同樣的提示會產生一幅藝術感十足、照片般逼真的圖像，幾乎看不出是人工智能生成的。| 圖片:THE DECODER 提示的《Midjourney》

Freepik 指出，F Lite 在生成插圖和矢量風格的作品方面表現出色，這可能得益於其來自 Freepik 自身目錄的訓練數據。然而，在處理照片級逼真的圖像時，該模型仍顯不足，例如皮膚紋理或織物等細節常常缺失，並且在處理複雜的解剖結構場景時可能會出現明顯的錯誤。由於該模型主要基於較長的描述性文本進行訓練，因此在處理簡短提示時也存在一定的困難，並且在圖像中準確渲染文本仍然是一個挑戰。

Freepik 將這些侷限性歸因於其訓練數據集的大小和所使用的計算量，並強調擴散模型的著名縮放定律——隨着數據量和訓練時間的增加，圖像質量和細節將顯著提高。

Freepik 是一家總部位於西班牙的公司，專注於爲設計師、企業和創意專業人士提供授權的數字圖形資源，包括矢量圖形、照片、插圖、圖標和演示模板。除了付費訂閱服務外，Freepik 還提供部分免費內容。此次推出 F Lite，標誌着 Freepik 在其核心庫存媒體業務之外，進一步拓展至人工智能工具領域。

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

在圖像生成領域，Midjourney 近期推出了一項名爲 “Omni-Reference”（全向參考）的新功能，爲用戶帶來了更大的創作自由。這一全新圖像引用系統不僅是 V6版本中 “角色參考” 功能的升級版，更是賦予用戶在創作過程中對圖像元素的精準控制。核心功能:全向參考與多元素支持Omni-Reference通過先進的圖像參考系統，爲用戶提供了前所未有的創作控制力。AIbase梳理了其主要亮點: 精準元素指定:用戶可上傳參考圖像（如人物、動物、武器或車輛），通過提示明確要求“將此元素放入圖像”，生成

谷歌Gemini聊天機器人全新升級：支持多圖上傳和圖像編輯功能

近日，谷歌的 Gemini 聊天機器人迎來了重要更新，新增了多圖上傳功能，這一功能目前已經向部分用戶開放。以往，用戶只能上傳單張圖片，但現在在 Gemini2.0Flash 模型的支持下，部分用戶已經能夠在網頁端同時上傳多張圖片。值得注意的是，該功能尚不支持免費賬戶，且在某些付費高級賬戶中也沒有完全開放。這種分階段推出的策略可能是爲了逐步評估用戶的反饋。除了多圖上傳，谷歌還在更新中加入了 AI 圖像編輯功能，用戶現在可以對 AI 生成的圖像以及自己上傳的圖片進行更改。用戶

阿聯酋從幼兒園起普及人工智能課程，全球應效仿

阿聯酋近日宣佈了一項全國性計劃，將人工智能（AI）作爲所有學生從幼兒園到高中必修的課程。該政策將在2025-2026學年正式實施，屆時所有公立學校都將把 AI 課程納入核心教學體系。阿聯酋官員表示，私人學校也可能會在國家指導下跟進這一政策，旨在爲年輕一代做好迎接科技驅動未來的準備，增強他們的 AI 技能，鞏固阿聯酋在區域內的 AI 和數字創新領導地位。圖源備註：圖片由AI生成，圖片授權服務商Midjourney新課程結構經過精心設計，按年齡層逐步引入七個關鍵學習領域，包括基礎

英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升

近日，英偉達在 Hugging Face 平臺上推出了其最新的自動語音識別（ASR）模型 ——Parakeet-TDT-0.6B-V2。這一新模型不僅在性能上有顯著提升，還將開源理念與商業應用相結合，吸引了廣泛關注。超強轉錄能力Parakeet-TDT-0.6B-V2的最大亮點在於其出色的轉錄效率。據稱，該模型能夠在僅僅一秒內完成60分鐘音頻的轉錄，極大提高了語音處理的速度。這一效率讓開發者和企業在構建語音識別和轉錄服務時，能夠獲得更快的反饋和更高的生產力。在技術參數上，Parakeet-TDT-0.6B-V2擁有6億個參數，結合了 Fas

Freepik 發佈“F Lite”：一個爲版權安全而構建的開放 AI 圖像模型

相關推薦

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

Grok語音模式全面上線馬斯克更改X暱稱造勢

谷歌Gemini聊天機器人全新升級：支持多圖上傳和圖像編輯功能

阿聯酋從幼兒園起普及人工智能課程，全球應效仿

英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升

Freepik 發佈“F Lite”：一個爲版權安全而構建的開放 AI 圖像模型

相關推薦

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

Grok語音模式全面上線 馬斯克更改X暱稱造勢

谷歌Gemini聊天機器人全新升級：支持多圖上傳和圖像編輯功能

​阿聯酋從幼兒園起普及人工智能課程，全球應效仿

​英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升

Grok語音模式全面上線馬斯克更改X暱稱造勢

阿聯酋從幼兒園起普及人工智能課程，全球應效仿

英偉達全新開源自動語音識別模型 Parakeet-TDT-0.6B-V2，語音轉錄能力再提升