アリババがオープンソースの通義万相Wan2.2を発表：世界初のMoEアーキテクチャを持つ動画生成モデル

AIbase基地

AIニュースで公開 · 1 分読む · Aug 2, 2025

アリババは今夜、動画生成モデル「Tongyi Wanxiang Wan2.2」を正式にオープンソース化しました。今回のリリースには3つのコアモデルが含まれています: テキストから動画を生成する「Wan2.2-T2V-A14B」、画像から動画を生成する「Wan2.2-I2V-A14B」、そして統一的な動画生成を行う「Wan2.2-IT2V-5B」モデルで、動画生成技術に大きな飛躍をもたらしました。

業界初のMoEアーキテクチャ、計算効率が50%向上

Tongyi Wanxiang 2.2は、動画生成の拡散モデルにおいて初めてMoE（Mixture of Experts）アーキテクチャを導入し、動画生成処理におけるトークンの長さによる計算リソースの過剰な消費問題を効果的に解決しました。そのうち、テキストから動画を生成するモデルと画像から動画を生成するモデルの合計パラメータ数は27Bで、アクティブパラメータは14Bであり、いずれも業界で初めてMoEアーキテクチャを採用した動画生成モデルです。

このアーキテクチャは、高ノイズ専門モデルと低ノイズ専門モデルから構成されており、それぞれ動画全体のレイアウトと細部の完成を担当します。同じパラメータ規模下では、約50%の計算リソースを節約でき、複雑な運動生成、人物間のインタラクション、芸術表現などの面で顕著な向上を実現しています。

映画美学制御システムの最初の試み

Wan2.2の大きな特徴の一つは、「映画美学制御システム」の最初の導入です。光と影、色彩、構図、微表情などにおいてプロの映画レベルに達しています。ユーザーは「黄昏」「柔光」「エッジライト」「暖色調」「中心構図」などのキーワードを入力することで、金色の夕暮れのロマンチックなシーンを自動生成できます。一方、「冷色調」「ハードライト」「バランス構図」「低い角度」の組み合わせを使うことで、SF映画のような画面効果を生成することができます。

5Bの統一モデルでコンsumer級グラフィックカードでも運用可能

Tongyi Wanxiangはまた、5Bの小サイズの統一動画生成モデルをオープンソース化しました。このモデルは、単一のモデルでテキストから動画を生成することと画像から動画を生成することの両方に対応しています。このモデルは、高い圧縮率を持つ3D VAEアーキテクチャを使用しており、時間と空間の圧縮比は4×16×16で、情報圧縮率は64に達し、ともにオープンソースモデルの中でも最高水準です。

このモデルは、単一のコンシューマー向けグラフィックカードで22GBのVRAMがあれば、数分で5秒間のハイビジョン動画を生成できます。これは現在、24フレーム毎秒、720Pピクセルレベルでの生成速度が最も速いベースモデルであり、AI動画生成の技術的ハードルを大幅に下げました。

多様なチャネルで公開

開発者はGitHub、HuggingFace、魔搭コミュニティからモデルとコードをダウンロードできます。企業はアリババ雲の百煉を通じてモデルAPIを呼び出すことができます。一般ユーザーは通義万相公式サイトや通義アプリで直接体験できます。

PPIOがWAICに登場し、国内初のエージェンティックAIインフラストラクチャープラットフォームを発表

PPIOは2025年世界人工知能大会で国内初のエージェンティックAIインフラストラクチャープラットフォームを発表し、汎用版と企業版の2製品マトリクスをリリースしました。プラットフォームの主要な特徴には、初めてE2Bインターフェースをサポートするエージェントサンドボックスがあり、強力な隔離性、ミリ秒単位の起動時間、高並列処理性能を備えています。100以上の主要なAIモデルをサポートし、計画、記憶、実行などのニーズをカバーしています。すでにスマート教育のシーンで導入されています。このプラットフォームは、下位の計算力から上位のアプリケーションに至るまで幅広く支援し、開発のハードルを下げ、エージェントテクノロジーをより一層進化させます。

アリインターナショナルAIサービスがEC輸出の新注目株に、エコシステムパートナーの利用量が23倍に急増

アリインターナショナルのAIソリューション「Marco」が2025年の世界人工知能大会SAIL賞を受賞し、EC輸出分野で初の受賞製品となった。このソリューションは技術共有を通じて、妙手（Miaoshou）、店小秘（Dianxiaomi）などの主要なEC輸出サービスプロバイダーに統合され、 merchants の運営効率を向上させている。2025年、外部エコシステムパートナーのAI利用量は23倍に急増し、スマート化サービスに対する市場の強い需要を示している。EC輸出の発展とともに、AIはデータ分析、消費者予測、サプライチェーン管理などの分野での応用が日に日に広がっている。

小米初のAIメガネの販売数量が予想を上回る今後3年間の出荷目標は500万台を超える

小米初のAIメガネ発売後、販売数量が予想を上回った。1999元の価格設定でも依然として赤字状態にある。製品には12MPカメラやオープン型イヤホンなどの機能が搭載され、現在は数千の小米之家および数百の眼鏡店で販売されている。中国には7億人の近視患者がいる市場に対して、小米は今後3年間で年間出荷量500万台の目標を達成することを目指し、スマートグラス業界の発展を促進する計画である。

100行のコードで、このミニプログラミングエージェントは65％の実際のプロジェクトのバグを修正できます！

SWE-benchチームが軽量なオープンソースプロジェクトmini-SWE-agentをリリースしました。GitHubのプロジェクトのバグの65％を100行のコードだけで修正できます。このバージョンではアーキテクチャを簡略化し、複雑なツールインターフェースを削除し、Bashを使ってコマンドを実行するようにしています。互換性がより強くなり、依存関係が少なくなりました。元のバージョンのコア機能を保持しつつ、バッチ推論やトレースブラウザなどのツールを提供しており、コマンドラインから起動し、可視化されたモニタリングも可能です。チームはmini-SWE-agentがシンプルさを求める開発者に適していると述べており、オリジナルバージョンはさらに適していると考えています。

北電数智がWAICに登場：AIを駆動にして百業の革新を推進し、スマートな未来を開く！

2025年世界人工知能大会において、北電数智は1つのAI基盤と2つの産業プラットフォームのイノベーションモデルを紹介しました。その星火・大プラットフォームは、文化財のデジタル化から村の統治に至るまで、AI応用成果を示し、国有企業の技術転化能力を示しています。会社は都市レベルのAI基盤を通じてカスタマイズサービスを提供し、複数の業界でライフサイクル全体の支援を実現しています。前進・AIインテリジェント計算プラットフォームは計算資源のスケジューリングを最適化し、紅湖・信頼性のあるデータサービスはデータ価値を解放します。政府および医療分野での成功事例は、AIの実装における模範的なケースを提供しています。