最近、科学者たちは「逆転の呪い」と呼ばれる現象を発見しました。これは、大規模モデルが逆方向の推論ができないというものです。論文では、仮想的なシナリオと現実世界の両方での実験を通じて、規模の大小に関わらず、主要な大規模モデル全てにこのバグが存在することが示されています。これは、大規模モデルの論理的推論能力の限界を露呈しており、重要な応用分野に影響を与える可能性があり、その信頼性に疑問符がつきます。大規模モデルに基づくAIアプリケーションがますます普及する中、「逆転の呪い」は、その信頼性について楽観視すべきではないという警鐘を鳴らしています。
関連推奨
マルチモーダル大規模モデルの視覚推論能力評価:o3 は 25.8% のスコアしか獲得できなかった
このほど、清華大学、テンセント・ハウン、スタンフォード大学およびキャロライナ州立大学の研究チームによって、多模態大規模モデルの視覚推論能力をテストする新しい評価基準「RBench-V」が発表されました。この基準の登場により、現在の評価システムにおけるモデルの視覚出力能力に関する空白を埋め、既存モデルの性能をより包括的に理解できるようになります。「RBench-V」の基準テストには、幾何学とグラフ理論、力学と電磁気学、マルチターゲット認識と経路計画など、複数の分野から803問の問題が含まれています。
快手CFO:AI開発支出の拡大が利润率に影響を与える見込み
快手は、人工知能(AI)領域への投資をさらに拡大すると発表しました。これは、同社の最新AIツールの収益化能力に対する懸念に対応するためです。5月27日の決算説明会において、CFOのキンビン氏は、収入が増加する中で、快手のコリンAI全体での損失も徐々に縮小すると述べました。また、トレーニングや労働力などの固定コストが希薄化することで財務状況が改善されるでしょう。キンビン氏によると、快手のAI支出は前年比で増加すると予想されます。その主な目的は、優秀なAI人材の引き留めと獲得、そして強化を目指すこと
掘金がMCP AI生成フロントエンドプロジェクトをワンクリックでデプロイ可能に
国内のプログラマーコミュニティである掘金は最近、革新的な機能であるMCP(Model Context Protocol)を発表しました。この機能によって開発者はAI生成のフロントエンドプロジェクトを掘金プラットフォームにワンクリックでデプロイできる便利なツールを手に入れました。MCP機能:簡単に効率的なフロントエンドプロジェクトのデプロイ 掘金のMCP機能は主にHTML、CSS、JavaScriptのフロントエンドプロジェクト向けで、開発者はシンプルなトークン設定を行うだけで、AI生成のプロジェクトを掘金プラットフォームにすぐに公開でき、従来のデプロイ手順を省略できます。
Rivrロボットが玄関先まで配達、最後の100ヤードの問題を解決し、ベゾス氏が投資
大半の配達自動化システムが人行道に留まっている中、Rivrはロボットを玄関先まで直接送ることを目指しています。スイスのチューリッヒに本拠地を持つこのロボットスタートアップは、アメリカのロジスティクス企業Vehoとテキサス州オースティンでパイロットプロジェクトを展開しており、「階段を上れる」4輪ロボットのテストを行っています。これは、末端配達の中で最も難しい「最後の100ヤード」問題を解決するために設計されています。Vehoのバンから顧客の玄関先までの最も複雑で体力を使う行程をこなすために、このロボットが考案されました。Rivrの創設者兼CEO
マスク氏「AIはグーグルの検索シェアを置き換える」--過去10年で初めて90%を下回る
先ごろ、マスク氏は自身のSNSアカウントでこの主張を発信し、自社のxAIが手掛けるチャットボット『Grok』に@を送り、業界関係者から大きな議論を巻き起こした。彼が示したのは、グーグルの検索シェアが過去10年間で初めて90%を下回ったという報告だ。その報告によれば、グーグルの世界的なエンジンシェアは89.71%にまで減少しており、これは2015年以来の最低水準となる。また、レポートではユーザーが従来の検索体験に対して、SEO最適化や広告干渉への飽和感を抱いていることが指摘されている。AIが
