アップル社とコーネル大学は、「Ferret」というオープンソースのマルチモーダル機械学習モデルを共同で発表しました。Ferretは、画像内の任意の位置にある要素を参照し、特定できるシステムです。ユーザーの問い合わせで役立つ要素を識別し、適切な応答を行うことができます。
今回の発表は、アップル社のAI開発におけるよりオープンな姿勢を示しており、影響力のあるAI研究へのコミットメントを証明するものです。

アップル社とコーネル大学は、「Ferret」というオープンソースのマルチモーダル機械学習モデルを共同で発表しました。Ferretは、画像内の任意の位置にある要素を参照し、特定できるシステムです。ユーザーの問い合わせで役立つ要素を識別し、適切な応答を行うことができます。
今回の発表は、アップル社のAI開発におけるよりオープンな姿勢を示しており、影響力のあるAI研究へのコミットメントを証明するものです。
テクノロジースタートアップは、大規模モデルを基盤としたアプリケーションの開発を加速している。その中で、オープンソースプラットフォーム「Osaurus」はAppleエコシステム向けに設計され、ユーザーがローカルとクラウドの大規模モデルを自由に切り替えられる一方、コアファイルをローカルハードウェアに保存する。このツールは、開発者のプライバシーと高額なトークン費用への懸念から生まれ、前身はすでに広く注目を集めている。....
百灵大模型は、実生産環境における実行力不足を解消するため、オープンソースの兆億パラメーターフラッグシップモデルRing-2.6-1Tを公開。Agentワークフロー、ソフトウェア工学、科学分析などの長鎖タスクに特化し、PinchBenchやClawEvalなどのベンチマークでオープンソース最高性能を達成した。....
北京モーターショーでは、前DeepSeekのマルチモーダル技術の中心研究者であるルン・チョン氏が元戎啓行のシニアサイエンティストとして登場し、同社の自動運転技術の方向性転換を示した。CEOのチュウ・ファン氏は、マルチモーダルの大モデルが2026年初頭に突破を遂げ、大モデルを基盤とした自動運転の道筋には明確な優位性があり、従来の技術を上回ると語った。
小米は4月23日にMiMo-V2.5シリーズの大型モデルを発表し、ベータテストを開始しました。このシリーズには4つのモデルが含まれており、そのうち中心となるモデルであるMiMo-V2.5-ProとMiMo-V2.5は世界中でオープンソース化され、AIエコシステムの開放を推進する意思を示しています。今回のアップデートは製品のイテレーションだけでなく、技術基盤の全面的な刷新でもあります。エントリーレベルの性能では百万単位のコンテキストと複雑なタスク処理をサポートします。
小紅書がオープンソース化したRelax強化学習トレーニングエンジンは、マルチモーダルおよびエージェントシナリオに特化しており、テキスト、画像、音声、動画を統一して処理することが可能で、AI業界の傾向に正確に対応しています。