記事本文

マルチモデル切り替えの壁を打破！グーグルがコンピュータ操作を原生でGemini 3.5 Flashに組み込む

公開AI二ュ-ス

時間 :Jun 25, 2026

読む :1分

グーグルのDeepMindチームは、ネイティブなコンピュータ使用能力をGemini 3.5 Flashモデルに直接統合する重要な技術的突破を発表しました。これにより、開発者は単一のモデルを通じて、ブラウザ、スマートフォン、およびコンピュータデスクトップ上で自律的に画面を見ながら操作を行うAIエージェントを構築できるようになりました。

以前はこの機能が独立したモデルとして提供されており、開発者は複数のモデル間で複雑な切り替えや文脈の伝達を行っていた必要があります。今やネイティブな統合が可能になったことで、AIはマルチプラットフォームの長時間タスクを実行する際に情報の手動伝達を必要とせず、開発プロセスが大幅に簡略化されました。

文脈の喪失から卒業し、エージェントの信頼性の課題に直面

グーグルのチームは、AIエージェントの核心的な制約は単一のツールの限界ではなく、複数のツールの切り替え時に生じる文脈情報の喪失にあると考えています。検索、地図、コンピュータ操作を1つのモデルアーキテクチャに統合することで、文脈が連続して流れ、複雑なタスクの途中で失敗する確率が大幅に低下します。

このような「複数のツールを統合」する設計は、内部がつながった総合ビルを直接建設するようなものです。これにより、複数の独立した建物間での長く間違いやすい通信プロセスを省略できます。このようなアーキテクチャレベルの調整は、エージェント型タスクの信頼性と応答遅延に実質的な改善をもたらすことが期待されます。

三大主要シナリオを特定し、多層的なセキュリティ防御を強化

このネイティブな機能は主に三大主要シナリオに応用され、数時間乃至数日続く自動化タスク、ユーザーインターフェースの一貫性を継続的に検証するソフトウェアテスト、アプリケーション間をまたぐ知識作業などが含まれます。これらのシナリオは、複数のタスク間の文脈の連続性に強く依存しており、人間の繰り返しで高エネルギーを要する作業を効果的に代替することができます。

トマトオムライスの調理をロボットに学ばせる裏方：Genesis AI オープンソース全スタックトレーニング場

Genesis AI社はWorld 1.0プラットフォームをオープンソース化しました。このプラットフォームは、ロボットや物理AI開発者向けに高性能な全スタックシミュレーションインフラストラクチャを提供し、コンピューターシミュレーションで効率的に訓練を可能にし、ロボットが調理などといったスキルを学ぶ際の障壁を低減し、具身知能の実用化を加速します。

Jul 3, 2026

1,423.3k

科学の新しい時代：AIエージェント Elements Claw が超伝導材料の開発を成功させた

アリババダモアカデミー、中国人民大学、中国科学院大学が共同で世界初の超伝導材料発見AIエージェント「Elements Claw」を発表。支援から独立研究への飛躍を実現し、試行錯誤に依存した長期間の従来型開発を変革する高効率自動化パラダイムを提供。....

Jul 3, 2026

189.1k

AI動画分野の構造が再編：グーグルのGemini Omni Flashが盲測ランキングで首位に

グーグルDeepMindのテキストからビデオを生成するモデルであるGemini Omni Flashが、信頼性の高い盲測ランキング「Video Arena」で1404Eloポイントを獲得し、第一位に躍り出た。これはグーグルのマルチモーダル技術の実力を示しており、ビデオ生成分野が急速に進化し続けていることを裏付ける。

Jul 3, 2026

189.1k

マイクロソフト AI PC専用システム Project Aionが暴露、従来のスタートメニューを完全に取り除く

マイクロソフトの社内AI OS「Project Aion」が明らかに。AI PC向けで、EdgeとWeb軽量化技術を基盤に、従来のスタートメニューやデスクトップアイコンを廃止。タスクバーからCopilotを直接呼び出す唯一の操作口で、情報フィード・創作・リアルタイム情報に特化。独自の「スペース」機能でウェブページを自動分類し、対話ロジックを根本的に再設計。....

Jul 3, 2026

181.8k

アリババ内部の逆方向無効化：ClaudeシリーズAIツールを全品下架

阿里巴巴が社内通達を発行し、7月10日までにAnthropic Claudeシリーズの全製品（SonnetやOpusなどのモデル、Claude Codeなどのツール）の使用停止を命じた。年初のAI利用開放・社内モデル無料枠提供の方針と対照的で、自社開発回帰への戦略転換を示す。....

Jul 3, 2026

230.4k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

マルチモデル切り替えの壁を打破！グーグルがコンピュータ操作を原生でGemini 3.5 Flashに組み込む

文脈の喪失から卒業し、エージェントの信頼性の課題に直面

三大主要シナリオを特定し、多層的なセキュリティ防御を強化

関連推奨

トマトオムライスの調理をロボットに学ばせる裏方：Genesis AI オープンソース全スタックトレーニング場

科学の新しい時代：AIエージェント Elements Claw が超伝導材料の開発を成功させた

AI動画分野の構造が再編：グーグルのGemini Omni Flashが盲測ランキングで首位に

マイクロソフト AI PC専用システム Project Aionが暴露、従来のスタートメニューを完全に取り除く

アリババ内部の逆方向無効化：ClaudeシリーズAIツールを全品下架