グーグルのGemini 3がリリース後すぐにLMArenaランキングで1位に躍進、マスクとアルトマンが祝福を贈る

グーグルがGemini 3を発表した後、その中のGemini 3 Proは1501 EloでLMArenaの公開ランキングで歴史的な最高点を記録し、GPT-5.1やClaude 4.5、Grok-4.1を上回り、現在最も高いスコアを持つマルチモーダルモデルとなりました。

パフォーマンス面では、Gemini 3 Proは「人類の最終試験」で37.5%、GPQA Diamondでは91.9%のスコアを獲得し、MMMU-ProおよびVideo-MMMUではそれぞれ81%と87.6%を達成しました。これは、科学、数学およびビデオ理解タスクにおいて全体的に優れていることを示しています。強化された推論モードであるDeep Thinkにより、「人類の最終試験」のスコアは41%に上昇し、ARC-AGI-2では45.1%を記録し、汎用知能評価テストの記録を更新しました。

モデルの発表後、OpenAIのCEOであるSam AltmanはXプラットフォームで「Gemini3はとても良いように見えます」と投稿し、グーグルのCEOであるSundar Pichaiは「🙏」で応えました。エロン・マスクもLMArenaの公式アカウントにコメントし、「確かに祝うに値します」と述べ、Grok 4.20が間もなくリリースされる予定であることを明らかにしました。

市場的には、Altmanは後に流出した社内メモの中で、グーグルの急速な進展がOpenAIにとって「一時的な経済的困難」をもたらす可能性があると率直に語り、従業員に今後の外部からの評価が「相当厳しい」ものになると注意を促しました。これは、Gemini3の強力なパフォーマンスがシリコンバレーのAI競争の構図をさらに激化させていることを示しています。

テンセント・フンユアンマルチモーダルチームに新たな強力なメンバーが加わる。OpenAI元研究者である田永龍が加入したと報じられる

OpenAIの元研究者・田永龍氏がテンセントに入社し、混元マルチモーダルモデルの責任者としてVLM開発を主導する見通し。発表はまだだが、姚順雨氏に続く中核人材の獲得で、テンセントのマルチモーダルAI強化が鮮明に。....

中国のマルチモーダル大規模モデルが画期的な進展を遂げる MiniMax M3が正式にオープンソース化され、応答速度が倍増

稀宇科技が本日、ネイティブマルチモーダルフラッグシップモデル「MiniMax M3」をオープンソース化。総パラメータ428B、活性化パラメータ23Bで、業界初のモデル。既に重みを公開し、スパース注意機構の論文を発表、注目を集めている。オープンソースモデル総合性能で1位。....

16GBメモリでローカルで即時応答！グーグルがGemma 4 12Bを発表し、非符号化器アーキテクチャで画期的な変化をもたらす

グーグルが新しいマルチモーダルモデルGemma 4 12Bを発表しました。従来のアーキテクチャを逆転させ、独立した符号化器部品を取り除き、コンシューマー機器で効率的なローカルへの展開と推論を実現しました。この画期的な革新は、マルチモーダルモデルの計算複雑性を大幅に軽減し、実行速度を向上させ、オープンソース大規模モデルエコシステムの新たな段階を示しています。

グーグルが新しいGemma 4 12Bモデルを発表：視覚と音声データを簡単に処理し、エンコーダーは不要

グーグルがGemma 4 12Bマルチモーダルモデルをリリースしました。120億パラメータを持ち、従来のエンコーダーを创新的に廃止し、直接視覚および音声データを処理できます。このモデルは16GBのVRAMのみを必要とし、ハイエンドノートパソコンでローカルに実行でき、クラウドリソースに依存する必要はありません。

27B数学理 SOTA と3秒間の感情クローン有道が子曰4マルチモーダルおよびTTSエンジンを全面的にオープンソース化

NetEase Youdaoが「子曰」大モデル4.0を発表し、全モーダル時代にアップグレード。テキスト、画像、音声の融合インタラクションをサポート。マルチモーダルモデルとTTSモデルをオープンソース化。翻訳モデルを再構築し、品質と効率を向上。視覚と数理分野でSOTAを達成し、テキスト数理問題で業界をリード。....