GoogleがGemini3.1Flash-Liteを発表：性能が前バージョンを大幅に上回り、出力価格が3倍にアップ

Google DeepMindは、正式にGemini3.1Flash-Liteのプレビュー版をリリースしました。これは、Gemini3シリーズの中で最も高速でコストパフォーマンスの高いモデルとして登場しました。Gemini2.5Flash-Liteのアップグレード版であるこの新モデルは、1秒間に360以上のtokenを出力し、平均応答時間が5.1秒という性能を維持しつつ、知能レベルにおいて顕著な進化を遂げました。Artificial Analysisのインテリジェンス指数監視によると、このモデルのスコアは前バージョンから12ポイント上昇して34ポイントとなり、Arena.aiのランキングでは1432のEloスコアを記録し、人間の好みにおいて強力な競争力を示しています。

gemini

マルチモーダルと科学的推論などの主要な側面において、Gemini3.1Flash-Liteの性能は特に優れています。GPQA Diamondテストでは86.9%の高得点を達成し、MMMU-Proベンチマークテストでは76.8%の正確率を記録し、Claude Opus4.6やKimi K2.5などの大型モデルをすでに上回っています。また、このモデルは開発者が「思考」の深さをカスタマイズできる機能を備えており、単純な自動翻訳から複雑なUI構築に至るまで多様なシナリオに柔軟に対応できます。

しかし、性能と速度の両方の進化には、明確なコストの変更が伴います。Gemini3.1Flash-Liteの100万トークンあたりの入力価格は0.25ドルに引き上げられ、出力価格は前バージョンの0.40ドルから大幅に1.50ドルに上がったため、約3倍の増加となりました。

この価格戦略は、現在のモデル製造業者が急速な推論と高精度な論理のバランスを追求する際のコスト上の圧力を反映しています。このモデルがGoogle AI StudioおよびVertex AIでテスト版として公開されたことにより、軽量モデル市場は単なる「低価格競争」から、「高性能な論理の普及」への新たな段階へと移行しています。

DeepSeekが新チームを設立し、AnthropicのClaude Codeに直接対抗

DeepSeekは新チーム「Harness」として、AnthropicのClaude Codeと対抗するコードスマートエージェント製品を開発しています。シニアリサーチャーのチェン・デリが確認した通り、同社はDeepSeek Code Harnessの開発を全力で推進し、そのための専門的な採用活動も行っています。

DeepMindのCEOがAIによる開発者削減論を批判：AIで開発者を置き換えることは大きな誤り

グーグルI/Oカンファレンスで、DeepMindのCEOハサビスは「AIがプログラマーを置き換える」という主張を反対し、これは創造力の欠如を示していると述べた。AIによる生産性向上がリストラの言い訳になるべきではないと強調し、技術進歩は人間を補完するものであり、職業を代替すべきではないと語った。

アリババが真武M890128カード超ノードサーバーを発表 Agentic時代を支える百ナノ秒級の遅延で

2026年のアリババクラウドピークカンファレンスで、アリババは平頭哥の真武M890「AIチップを基盤とする128カード超ノードサーバーを発表しました。自社開発のICN Switch1.0接続チップを搭載し、百ナノ秒級の超低遅延通信を実現しています。このサーバーは、超ノード構造により128枚のチップを統合したスーパーコンピュータとなり、スマートエージェント時代における極限的な計算力の課題に対応するため、今後は大量のAIエージェントに対して重点的にサービスを提供する予定です。

ギミーニの無料時代が終了？グーグルが静かに使用制限を開始 AI業界が厳しくなる収益化テスト

グーグルはI/Oカンファレンス前に行うAI使用ルールの調整により、ギミーニ大規模モデルに対して細かく計数する仕組みを導入し、「ほぼ無制限」の無料時代を終える。新しいルールでは単純なチャット回数の制限ではなく、カウント機能によってユーザーの使用量をより正確に管理するようになった。これは無料サービスがさらに厳格な制限に直面することを示している。この措置は、まもなく発表されるギミーニのアップデートと新しいハードウェアの展開準備のためのものだが、ユーザーにとっては予想外である。

GoogleがGemini3.1Flash-Liteを発表：性能が前バージョンを大幅に上回り、出力価格が3倍にアップ

関連推奨

DeepSeekが新チームを設立し、AnthropicのClaude Codeに直接対抗

DeepMindのCEOがAIによる開発者削減論を批判：AIで開発者を置き換えることは大きな誤り

アリババが真武M890128カード超ノードサーバーを発表 Agentic時代を支える百ナノ秒級の遅延で

ギミーニの無料時代が終了？グーグルが静かに使用制限を開始 AI業界が厳しくなる収益化テスト

OpenAIの共同創設者であるアンドレイ・カルパティがAnthropicに参加し、次世代LLMの開発を推進