シンガポール国立大学がNExT-GPTを発表

シンガポール国立大学は、テキスト、画像、ビデオ、オーディオの処理をサポートするマルチモーダル言語モデル、NExT-GPTを発表しました。これは、マルチメディアAIアプリケーションの発展に貢献します。

このモデルは3層アーキテクチャを採用しており、MosIT技術を用いて中間層のトレーニングが行われます。オープンソースとして公開することで、研究者や開発者はマルチモーダル入力の統合を容易に行うことができます。

NExT-GPTの大きな特徴は、モーダルシグナリングトークンを生成できる点です。これは、コンテンツ生成やマルチメディア分析などの分野で潜在的な応用が期待されます。