コストパフォーマンスの王：マイクロソフトがPhi-4-reasoning-vision-15Bをオープンソース化、軽量なマルチモーダル推論を専門に

マイクロソフトは最近、最新に開発したマルチモーダル推論モデル「Phi-4-reasoning-vision-15B」を正式にオープンソース化しました。このモデルは15Bのパラメータ規模を持つものの、軽量性を維持しながら高性能と低コストの理想のバランスを実現し、リソース制限のある環境での複雑な視覚タスクに対して新たな選択肢を提供します。

データ駆動型の「小銃砲」

業界で一般的な数兆単位のトークンを消費するモデルとは異なり、Phi-4-reasoning-vision は200B以上のマルチモーダルトークンを使用してトレーニングされています。開発チームはデータ品質を最優先にし、オープンソースデータの深いクリーニング、特化した合成データの生成、そして精密な分野別データの比率調整（例えば数学データの増加によりコンピュータ操作能力が向上）を通じて、科学的推論やスクリーン位置指定タスクにおいて優れた性能を実現しています。

イノベーションなハイブリッド推論戦略

このモデルの大きな特徴は、「ハイブリッド推論パス」の設計です:

センシングタスク: 画像記述やOCRなどの簡単なタスク処理では、モデルはデフォルトで直接回答モードを使用し、遅延を効果的に低下させます。
推論タスク: 数学式や科学的な図表などの複雑な論理に対処する際には、モデルは構造化された思考チェーン（CoT）パスを自動的に呼び出し、答えの正確さを確保します。
ユーザーは特定のガイドワードを使用して、これらの2つのモードを手動で切り替えることも可能です。

SigLIP-2の動的解像度エンコーダーの導入により、このモデルは高解像度スクリーンショットの中の小さな要素にも非常に鋭い感覚を持っています。これにより、コンピュータ操作アシスタント（CUA）を開発するための理想的な選択肢となり、ウェブページやスマートフォン画面のボタンや入力フィールドを正確に識別し操作できます。

PC新時代が到来！旧黄が自社CPUで市場に参入、英伟達版MacBook Proの謎が解明

英伟達、マイクロソフト、ARMが同時期に謎の動態を発表し、英伟達独自のPCチップが登場する兆しを示しており、これはWindows on Arm陣営がAppleのMシリーズチップに挑戦する新たな一歩となる。世界的なPC市場構造が再編される見込みである。

Claudeは高いから買えない！マイクロソフトが自社開発路線に戻り、新たなAIプログラミング大規模モデルを発表

マイクロソフトは、外部のAI大規模モデルの調達コストが高すぎるため、自社開発のAI大規模モデルを計画し、AIプログラミング市場に焦点を当てている。この動きは外部依存から脱却し、運用コストを削減することを目的としており、社内従業員に対し、商用Claude大規模モデルの使用を期限内に停止するよう指示している。....

Claudeは高すぎる！マイクロソフトが自社開発のAIプログラミングモデルを発表、GitHub開発者に大きな変化が訪れる

マイクロソフトは年次Buildカンファレンスで自社開発のAIプログラミング大規模モデルを発表し、第三者調達コスト削減を図る。CEOナデラ氏は6月にAnthropicのClaude使用中止を指示し、戦略転換を示唆。AIプログラミングツール普及に伴い、大規模モデル市場の競争とコスト構造が質的変化を遂げている。....

マイクロソフト、来週のBuildカンファレンスで独自開発のコード用AIモデルとさまざまなシナリオに対応するAIモデルを発表

マイクロソフトは来週、サンフランシスコで開催されるBuildカンファレンスで、複数の独自開発AIモデルを発表する予定です。特に、コストパフォーマンスが高くコード専用のモデルを重点的に紹介し、CursorやClaude CodeによるGitHub Copilotの市場シェアの獲得を防ごうとしています。このモデルは、価格に敏感な開発者を引き付けるために運用コストを削減することを目的としており、さらにさまざまなパラメータ仕様のモデルも導入され、自社のAIエコシステムを充実させ、より多くの開発者からの支持を得ようとしています。

ソフトバンクとマイクロソフ트：AIで完全自動化されたコールセンターを構築し、日本の労働力問題を解決