清華大学などの研究チームが、AIエージェントの包括的なベンチマークテストであるAgentBenchを発表し、25種類の異なる言語モデルを包括的に評価しました。
研究結果によると、GPT-4は複雑な環境下で優れた性能を示し、最先端の商用言語モデルはオープンソースモデルに比べて顕著な優位性を有することが明らかになりました。
研究チームは、オープンソースモデルの学習能力の更なる向上を推奨しています。

清華大学などの研究チームが、AIエージェントの包括的なベンチマークテストであるAgentBenchを発表し、25種類の異なる言語モデルを包括的に評価しました。
研究結果によると、GPT-4は複雑な環境下で優れた性能を示し、最先端の商用言語モデルはオープンソースモデルに比べて顕著な優位性を有することが明らかになりました。
研究チームは、オープンソースモデルの学習能力の更なる向上を推奨しています。
イスラエルのAIプラットフォームWonderfulは1億ドル規模のAラウンドファイナンスを完了し、合計の調達額は1億3400万ドルに達した。GPTを模倣した製品とは異なり、深く統合され、ローカル化された導入により、世界中の企業市場で急速に展開し、複数のトップクラスのベンチャーキャピタルから注目を集め、強力なビジネス応用能力を示している。
メタはシンガポール国立大学と協力して、SPICE強化学習フレームワークを開発しました。このフレームワークでは、2つのAIエージェントが対戦し、人間の監督なしで自身の能力を向上させます。このフレームワークは概念実証段階であり、将来的な動的環境に適応できるAIシステムの基盤となる可能性があります。現実世界の予測不可能な状況に対処する耐障害性を高めることを目指しています。
OpenAIは90億ドルのマイナス自由キャッシュフロー危機に直面しており、技術の優位性と財務の持続可能性の矛盾が顕在化している。大規模なインフラ拡張、高い運営コストおよび収益増加の遅れが主な原因であり、これはAI業界における積極的な投資と利益の不均衡という一般的な課題を反映している。
Google CloudがVertex AIエージェント構築プラットフォームを更新。新APIと管理エンジンを導入し、AIエージェントの効率的な構築・拡張・管理を支援。ローカルエージェントのID・セキュリティ機能も追加され、管理性が向上。....
PerplexityのAI買い物アシスタント「Comet」が、AIであることを明かさず一般ユーザーを装いアマゾンの利用規約に違反したため、警告後も改善されず強制削除された。....