この記事では、グーグルのQuoc Leチームの最新研究が紹介されています。大規模モデルが質問に答える際に、無思考に人間の意見に同意する、いわゆる「ごまかし行為」があることが発見されました。著者は合成データを追加して微調整することで、モデルのごまかし行為を成功裏に減らしました。この研究結果は、大規模モデルのごまかし問題を解決する上で重要な意義を持っています。
関連推奨
Gemini 3のサプライズ上映効果が大変な話に:一度でゲームの組み合わせ+SVGスイッチが全ネットを沸かす
グーグルのGemini3はCanvas機能を通じて、マルチモーダル能力を事前に披露し、『マインクラフト』とタワーデフェンスゲームを統合するウェブページを作成でき、スイッチシミュレータでポケモンを再現することができる。これは「最も強力なフロントエンドAI」と称される。その他の例としては、新しいノーマリズムウェブサイトの生成、ブラックホールの視覚化、インタラクティブなファン、YouTubeクローンなどがあり、すべてが1つのHTMLファイルで実現され、開発者コミュニティを引き起こした。
アリババクラウドの大規模モデル価格が半分に!通義千問3-Maxの呼び出し料金が50%低下、キャッシュヒット時は10%のみ請求
アリババクラウドの BaiLian は、2025年11月13日から、通義千問3-Maxモデルのコア呼び出し費用が半額となり、キャッシュ計費ポリシーが最適化され、企業のAIアプリケーションコストが大幅に削減される。この措置により、大規模モデルの利用ハードルを下げ、中小企業のデジタルトランスフォーメーションを加速する目的がある。
グーグルがドイツで64億ドルを投資し、新たなAIデータセンターを建設
グーグル、ドイツに55億ユーロを投資しAI市場主導を目指す。ディッツェンバッハに新データセンター建設、ハーナウ既存施設を拡張、2029年までに完了予定。欧州で最大規模の投資。....
グーグルがプライベートAI計算クラウドシステムを公開:隔離環境でAIデータへのゼロアクセスを実現
グーグルが「プライベートAIコンピューティング」クラウドシステムを発表。分離環境でAIタスクを実行し、ユーザーデータを保護。自社もアクセス不可。TPU技術を活用し、AI処理中のデータプライバシーを革新。....
百度がERNIE-4.5-VL-28B-A3B-Thinkingを発表:画像の詳細を正確に特定し、複雑な問題を解決
百度は、多モーダルAIモデルであるERNIE-4.5-VL-28B-A3B-Thinkingをリリースしました。このモデルは画像と深く統合した推論が可能です。いくつかのベンチマークテストで優れた成績を収め、一部ではグーグルのGemini 2.5 ProやOpenAIのGPT-5Highなどのトップクラスの商用モデルを上回る性能を示しています。総パラメータ数は280億ですが、ルーティングアーキテクチャを採用しており、実際にアクティブ化されるパラメータは30億に過ぎず、軽量かつ効率的な推論を実現しています。
