4月7日、マイクロソフトのBingチームは、「Harrier」という新しい埋め込みモデルシリーズを正式にオープンソース化することを発表しました。このモデルは、世界中の検索、リトリーブ、および人工知能エージェントの基盤論理を再構築することを目的としています。Harrierシリーズには3つの異なる仕様のバージョンが含まれており、その中でもエリートモデルである27Bモデルは、多言語MTEB v2ベンチマークテストにおいて、OpenAIやアマゾン、Google Geminiなどの主要なプロプライエタリモデルを上回り、トップに立ちました。

QQ20260408-085511.jpg

このモデルの技術基盤は非常に高い産業水準を示しています。Harrierは100種類以上の言語をサポートしており、コンテキストウィンドウは32,000トークンに達します。トレーニング戦略では、マイクロソフトは20億を超える現実的な例を使用しただけでなく、GPT-5からの合成データも導入し、強化を行いました。このような高品質なデータの組み合わせにより、Harrierは複雑な文脈の理解と長文処理において顕著な優位性を持っています。270億パラメータを持つ完全版に加え、異なる計算能力環境に適応するため、マイクロソフトは同時に0.6Bおよび2.7Bの小さなパラメータバージョンを公開し、すべてMITライセンスでHugging Faceプラットフォーム上で公開されています。

埋め込みモデルは、AIシステムにおける情報の組織化と検索の鍵となる技術であり、その性能はRAG(検索増強生成)システムの正確さを直接決定します。マイクロソフトはこの技術をBing検索エンジンおよび新しいAIエージェントのグランドサービスに深く統合する計画です。人工知能が段階的なタスクの自律化に向かうにつれて、Harrierのオープンソース化は開発者に代替となる高性能ツールを提供するだけでなく、オープンソースエコシステムが語義表現能力においてトップクラスの非公開ソリューションを段階的に超えたことを示しており、AIエージェントがグローバルなマルチリンガル環境での展開をさらに加速させています。