エロン・マスクは8月11日にXプラットフォームで、xAIのGrok V7ベースモデルが先週の予備トレーニングを完了したことを発表しました。このバージョンの最大の特徴は、ネイティブなマルチモーダル機能であり、ビデオや音声のビットストリームを変換することなく直接処理し、内容を理解できる点です。

これは、Grok V7が動画の画面を理解するだけでなく、音声の中の微細な変化も聞き取り、表現される感情やトーンの重点を正確に識別できることを意味しています。これにより、より深い意味の理解が可能になります。

Grok、マスカー、xAI

一方で、マスクはGrok4モデルがすべてのユーザーに無料で公開されていることも発表しました。無料ユーザーは毎日少量の照会を行うことができます。より多くの使用権限が必要な場合は、有料購読が必要です。この取り組みは、Grokのユーザー基盤を広げ、より多くの人々に接しやすくすることを目的としています。

Grok V7のネイティブなマルチモーダル機能は、ビデオおよび音声処理において大幅な向上を示しており、今後のAIアプリケーションに対して多くの可能性を開きます。また、Grok4の無料公開は、xAIが異なる戦略を通じて技術革新と市場普及のバランスを取ろうとしていることを反映しています。