北京時間の5月13日、Apple SiliconのローカルAIエコシステムは重要な進展を遂げました。oMLXフレームワークの0.3.9.dev2バージョンがリリースされ、複数の先端的な最適化技術を深く統合し、ローカルの大規模モデルにおける画像とテキスト処理の速度と使いやすさを顕著に向上させ、苹果のエッジ側AIの実際の体験での競争力をさらに強化しました。

image.png

コア技術のアップグレード: Gemma4の視覚パスが全面的にサポートされる

新バージョンで最も注目すべきアップデートは、Gemma4のMTP視覚パスDFlashエンジンおよびParoQuant量化技術を完全に統合したことです。この一連の組み合わせにより、画像とテキストのマルチモーダルデコード速度が大幅に向上し、ローカルでマルチモーダル大規模モデルを実行する際の遅延の障壁が顕著に低下しました。過去にローカルAIが指摘されていた「体験の格差」が、この最適化によって明らかに改善されました。

使いやすさの飛躍: omlx launch copilotでトップツールにワンクリックでアクセス

開発者やユーザーにとっての習熟の難易度を下げるため、oMLXは新たにomlx launch copilot機能を追加しました。ユーザーはワンクリックでClaude、Codex、OpenClawなどの主要なトップAIツールに迅速にアクセスでき、ローカルとクラウドサービスのシームレスな協働を実現します。この特徴により、ローカルAIの統合度が大幅に強化され、「開封即用(開封してすぐに使える)」が現実になります。

リソース管理の最適化: oQスマートProxyがVRAM制限を解決

Apple Siliconの統一メモリ構造における実際の展開上の課題に対応するために、新しいバージョンではoQオートプロキシメカニズムが導入されました。これはVRAM不足の問題を知的に処理し、コンシューマー向けデバイス上で大規模モデルの実行の安定性を顕著に向上させます。同時に、管理インターフェースにはサーバー再起動ボタンが追加され、日常的なメンテナンスプロセスがさらに最適化されました。

AIbaseコメント: MLXからoMLXへの継続的なイテレーションを通じて、苹果のエッジ側AIは驚くべき速さで雲上のソリューションに追いつき、一部ではそれを上回るようになっています。統一メモリ構造による帯域の優位性と、効率的な量子化とエンジンの最適化を組み合わせることで、ローカルAIはスピード、プライバシー保護、応答のリアルタイム性において独自の魅力を示しています。かつて「物足りない」と言われていたローカル配置は、今やスピード、統合性、使いやすさにおいて「信じられない」レベルの向上を遂げています。

このアップデートは明確なサインを伝えています: AIは実際に雲から個人デバイスへと移行しています。今後、より多くのユーザーが「大規模モデルを自分のコンピュータに搭載する」自由と強さを感じるでしょう。

プロジェクトのアドレス:https://github.com/jundot/omlx