人工智能創業公司 Hugging Face 最近推出了一款名爲 IDEFIX 的開源多模態 AI 模型。IDEFIX 可以處理圖像和文本輸入,並生成連貫的文本輸出。IDEFIX 基於視覺語言模型 Flamingo 構建,使用了包括維基百科、公共多模態數據集和 LAION 在內的各種開放數據集進行了訓練。相比專有模型,IDEFIX 在各種圖像文本理解評估中的表現非常優異。這標誌着多模態 AI 開源模型的一個重要進步。