アップル社とコーネル大学は、「Ferret」というオープンソースのマルチモーダル機械学習モデルを共同で発表しました。Ferretは、画像内の任意の位置にある要素を参照し、特定できるシステムです。ユーザーの問い合わせで役立つ要素を識別し、適切な応答を行うことができます。
今回の発表は、アップル社のAI開発におけるよりオープンな姿勢を示しており、影響力のあるAI研究へのコミットメントを証明するものです。

アップル社とコーネル大学は、「Ferret」というオープンソースのマルチモーダル機械学習モデルを共同で発表しました。Ferretは、画像内の任意の位置にある要素を参照し、特定できるシステムです。ユーザーの問い合わせで役立つ要素を識別し、適切な応答を行うことができます。
今回の発表は、アップル社のAI開発におけるよりオープンな姿勢を示しており、影響力のあるAI研究へのコミットメントを証明するものです。
2026年6月23日、火山引擎が動画生成モデル「Seedance2.5」を発表、7月提供開始。30秒の単一ネイティブ動画生成、50種の全モーダル素材の統合生成、一貫性を保つ部分編集の三大ブレークスルーを実現。譚待社長は動画生成が世界モデルへの鍵と述べた。....
稀宇科技が本日、ネイティブマルチモーダルフラッグシップモデル「MiniMax M3」をオープンソース化。総パラメータ428B、活性化パラメータ23Bで、業界初のモデル。既に重みを公開し、スパース注意機構の論文を発表、注目を集めている。オープンソースモデル総合性能で1位。....
Build2026会議でマイクロソフトは初の高精度推論モデルであるMAI-Thinking-1を発表し、350億パラメータを備え、ソフトウェアエンジニアリングの基準テストでリードを獲得しています。このモデルはクリーンなデータからゼロから訓練され、外部データソースを使用していません。これは、マイクロソフトが自社AIおよびエンドツーエンドのマトリクス構築において重要な一歩を踏み出したことを示しています。
国内のAIGCマルチモーダルクリエーション分野において新たな進展があり、网易有道傘下のオープンソースAI製品ロブスターアイ(ロブスター)がアップグレードされ、画像および動画生成機能を正式にリリースしました。今回のアップグレードではマトリクス式の統合戦略を採用し、4つの主要なマルチモーダル大規模モデル:シードリーム、シーダンス、ハッピーハース、ミニマックス・ハイルーを統合し、クリエイティブ効率と多様性を向上させました。
アリババクラウド百炼は2026年5月29日にすべてCLI化され、そのCLIプロジェクトをオープンソース化しました。この取り組みにより、AIエージェントへの接続と開発が全スタック一体化の変革をもたらしました。CLIは主要なモデル、ワークフロー、知識ベース、記憶管理、インターネット検索、マルチモーダルファイル処理などの核心的な能力を軽量なコマンドラインインターフェースにカプセル化し、開発者はインストールと認証後に効率的に利用できます。