最近、百度は人工知能分野で重要な一歩を踏み出し、最新のマルチモーダル思考モデルである「ERNIE-4.5-VL-28B-A3B-Thinking」を正式にリリースしました。この新しいモデルは強力な言語処理能力を持つだけでなく、「画像思考」という革新機能も搭載しており、画像の理解と処理において大きな向上を遂げています。

百度によると、ERNIE-4.5-VLモデルはわずか3Bのアクティブパラメータを使用し、優れた計算効率と柔軟性を示しています。この設計により、さまざまなタスクを処理する際には迅速な応答と高い効率を維持でき、ますます増加するAIのニーズに対応できます。

特に注目すべきは、このモデルに「画像思考」機能が追加された点です。このイノベーションにより、ERNIE-4.5-VLは画像拡大だけでなく、画像検索などのツール呼び出しも行えます。このような技術的突破により、ユーザーが画像とテキストの間でより豊かなインタラクション体験を得ることができ、スマート検索やオンライン教育、電子商取引など複数の分野での応用が新たな可能性を開きます。

現在、AI技術が急速に発展する中、百度はERNIE-4.5-VLを通じてマルチモーダルAI分野でのリーダーシップをさらに示しています。このモデルがオープンソース化されることにより、開発者や研究者はマルチモーダルAIの潜在力をより簡単に探求でき、関連技術の発展と応用を促進することができます。

ERNIE-4.5-VL-28B-A3B-Thinkingのリリースは、百度にとって重要な技術革新であり、マルチモーダル人工知能の新しい章を切り開くものです。この技術がさまざまな業界でより大きな価値を発揮することを期待し、人々が情報をよりスマートに処理し、問題解決をより効果的に行えるよう支援することを願っています。