記事本文

Hugging Face、オープンソースのマルチモーダルAIモデルIDEFIXを発表

公開AI二ュ-ス

時間 :Aug 23, 2023

読む :1分

Hugging FaceがオープンソースのマルチモーダルAIモデル「IDEFIX」を発表

人工知能スタートアップ企業のHugging Faceは最近、IDEFIXという名前のオープンソースのマルチモーダルAIモデルを発表しました。

IDEFIXは画像とテキストの入力を処理し、首尾一貫したテキスト出力を生成できます。

IDEFIXは、ビジョン言語モデルFlamingoをベースに構築されており、ウィキペディア、公開マルチモーダルデータセット、LAIONなど、さまざまなオープンデータセットを使用してトレーニングされました。

独自開発のモデルと比較して、IDEFIXはさまざまな画像テキスト理解評価において非常に優れたパフォーマンスを示しています。

これは、マルチモーダルAIのオープンソースモデルにおける重要な進歩を示しています。

OpenAIの戦略的転換：ChatGPTにSoraという動画生成ツールを統合する予定

OpenAIはChatGPTに動画生成AI「Sora」を統合し、マルチモーダル機能を強化。週間ユーザー9.2億人の拡大と、Google Veo・Metaへの競争対応を図る。....

中国AI産業が台頭、世界のAPI呼び出し量で初めて米国を上回る。OpenRouterデータによると、2026年2月に中国AI大規模モデルの週間呼び出し量が米国を超え、実用化が進展したことを示す。....

サムスンは2026年に次世代ARグラスを発売予定。従来の「表示」から「理解」へ進化し、マルチモーダルAIによる現実環境との深い対話を実現、直感的なスマートアシスタントを提供します。....

サムスンは次世代ARメガネを2026年に発売予定。多モーダルAIを搭載し、音声や視覚など複数のインタラクションで没入型体験を提供。....

マルチモーダルAI関連銘柄は最近、一斉に大幅上昇し、複数企業がストップ高を記録した。この相場の動きは、通義千問やGPT-5.2などのマルチモーダル大規模モデルが最近技術的な突破を遂げ、商業化の進展を促したことに起因しており、資本市場から注目されている。

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク