耐久性が非常に高い！AnthropicのエースモデルClaude Opus4.5が長時間タスク処理の新しい記録を樹立

大規模モデルの「高知能」を追求する一方で、AIの継続的な実行能力が、その進化レベルを測る新たな次元となっています。人工知能研究機関METRが公開した最新の基準テストによると、Anthropicが開発した最高性能モデルClaude Opus4.5は、非常に長い時間にわたるタスク処理において圧倒的な実力を示しています。

テスト結果によると、Claude Opus4.5は50％の成功率を維持しながら、約4時間49分

AIbaseは、テストデータにはモデルが理論上20時間を超えて連続して動作できる数値が含まれているものの、METRはそれがサンプル数が少ないため生じた誤差である可能性があると認めています。しかし、この突破はAIが「短期間の指示応答者」から「長期プロジェクトの実行者」へと転換していることを示しています。

しかし、一部の専門家はこのテストの限界について疑問を投げかけています。現在、METRは14のサンプルのみをカバーしており、このベンチマークテストがモデルに特化して「スコアを上げる」ことにつながる可能性があると考える人もいます。しかし、間違いなく言えるのは、Claude Opus4.5

OpenAIの初のハードウェア製品が暴露！スマートスピーカーがあなたのAIアシスタントとなる

OpenAIは初のハードウェア製品として、可動式で画面なしのスマートスピーカーを発売予定。家庭用AIアシスタントで、より人間らしい対話体験を提供。スマートホーム制御、音声・動画再生、質疑応答、メッセージ送受信など多機能。....

双子の顔と乱文が暴露！ホーフォーの写真賞はAIの偽造で取消しに

7月14日、フフホト市文聯が写真隔月コンテストで一等賞の『洒楽園林』がAI生成と判明し、非実写のため受賞取消。資格剥奪・コンテスト一時停止・全面是正、関係者処分を発表。AIの写真審査への介入と審査体制に注目集まる。....

アーカイブがAIネイティブなエージェントアプリの開発プラットフォームをリリースし、ノーコード等多种な開発方法をサポート

Oracleは「AI Agent Studio for Fusion Applications」をリリースし、ノーコード、ローコード、専門的なコードによる開発方法を提供し、企業が簡単にエージェント型アプリを構築し、AIネイティブへの転換を加速するお手伝いをします。

グーグル画像が25周年の大きなリニューアルを実施: Pinterestに全面的に感謝し、AIによる絵画を作成する機能を導入

Google画像検索が25周年を機に大幅刷新。検索ツールからPinterest風のインスピレーションギャラリーへと変貌。ログインすると興味に基づくおすすめ画像がリアルタイム表示され、気に入った画像はコレクションに保存可能。....

耐久性が非常に高い！AnthropicのエースモデルClaude Opus4.5が長時間タスク処理の新しい記録を樹立

関連推奨

OpenAIの初のハードウェア製品が暴露！スマートスピーカーがあなたのAIアシスタントとなる

サムスンがアンソロピックの大口注文を獲得し、AIチップ製造に新たな機会が訪れる！

双子の顔と乱文が暴露！ホーフォーの写真賞はAIの偽造で取消しに

アーカイブがAIネイティブなエージェントアプリの開発プラットフォームをリリースし、ノーコード等多种な開発方法をサポート

グーグル画像が25周年の大きなリニューアルを実施: Pinterestに全面的に感謝し、AIによる絵画を作成する機能を導入