通義千問が画像を認識できるようになりました！アリババクラウドが視覚言語大規模モデルQwen-VLをオープンソースで公開、画像とテキストの両方の入力に対応

アリババクラウドは、視覚言語モデルQwen-VLをオープンソース化しました。これは、8月に汎用モデルQwen-7Bと対話型モデルQwen-7B-Chatをオープンソース化した後に続く、新たな大規模言語モデルです。Qwen-VLは中国語と英語に対応しており、知識質問応答、画像キャプション生成、画像質問応答など、様々な用途に使用できます。他のモデルと比較して、Qwen-VLは中国語のオープンな領域での位置特定が可能で、画像内の検出領域を正確にマークできます。Qwen-VLはQwen-7Bをベースに開発され、視覚エンコーダーを導入することで画像入力に対応しています。Qwen-VLは、複数の視覚言語タスクにおけるテストで、同等のモデルの中で最高の結果を達成しました。Qwen-VLはModelScopeなどのプラットフォームで既にオープンソース化されています。マルチモーダルは、大規模言語モデル発展の重要な方向性ですが、依然として技術的な課題が残されています。

AIの波がサポート！アリババクラウドの中国市場シェアが36％に上昇し、3四半期連続増加で首位を維持

世界中でのAI需要の急増により、中国クラウドコンピューティング市場の構造が変化しました。アリババクラウドは2025年第三四半期に市場シェアを34％から36％に引き上げ、3四半期連続で増加しており、AIがその主要な成長要因となっています。

画像編集を統合したQwen-Image-2.0のリリース：2Kの高精細な質感が視覚の限界に挑戦

アリババクラウドは、2026年2月10日に新世代の画像生成基盤モデル「Qwen-Image-2.0」をリリースしました。このモデルでは画像生成と編集機能が統合されています。7Bの軽量アーキテクチャを採用しており、高速な推論を維持しつつ、4つの主な強みを持っています。専門的なテキストレンダリング能力、最大で1,000トークンの超長かつ複雑な指示処理への対応、そして多数の盲測基準において優れたパフォーマンスを発揮しています。

AI人材争奪戦が完全に狂った！年収128万で成長エンジニアを募集、アリババ通義千問は30億円を無償で支払う：誰が将来のトラフィックの王者になるのか？

春節の赤い封筒の競争がAIエントリーポイントの競争に進化し、各社はAI人材を高賃金で採用しています。例えば、アリババ通義千問はアルゴリズムエンジニアに異例の年収を提示し、大モデル時代におけるコア技術に対する激しい競争を示しています。

微信がアリババのQwenの赤い封筒リンクをブロック、AIマーケティング戦争がSNSエコシステムに拡大

アリババの「通義千問」の春節免許活動の赤い封筒リンクが微信でブロックされ、誘導ダウンロードと表示される。ユーザーはブラウザを通じてアクセスする必要がある。Qwenアプリはすでにコピーした口令で共有するように調整された。

通義千問が画像を認識できるようになりました！アリババクラウドが視覚言語大規模モデルQwen-VLをオープンソースで公開、画像とテキストの両方の入力に対応

関連推奨

AIの波がサポート！アリババクラウドの中国市場シェアが36％に上昇し、3四半期連続増加で首位を維持

画像編集を統合したQwen-Image-2.0のリリース：2Kの高精細な質感が視覚の限界に挑戦

AI人材争奪戦が完全に狂った！年収128万で成長エンジニアを募集、アリババ通義千問は30億円を無償で支払う：誰が将来のトラフィックの王者になるのか？

微信がアリババのQwenの赤い封筒リンクをブロック、AIマーケティング戦争がSNSエコシステムに拡大

アリババのAI戦略がさらにアップグレード：大規模モデルブランドが正式にQwenに改名