記事本文

6Bパラメータ、16Gグラフィックメモリ、8ステップで画像生成：アリバのZ-Imageが数百億パラメーターモデルを打ち負かす

公開AI二ュ-ス

時間 :Nov 27, 2025

読む :1分

昨夜、1024×1024のネオン着物の写真がRTX4090でわずか2.3秒でレンダリングされ、VRAMポインタは安定して13GBに保たれた――アリババ・トングイラボが公開したZ-Image-Turboにより、周囲の注目は一瞬で静まり返った。パラメータ数は6Bのみだが、20B以上の閉鎖型トップモデルと同等の性能を達成し、一部では優位を維持している。

華美なスローガンはなく、Z-Imageは実績で語る。

- 8ステップのサンプリングで印刷品質の画質を提供可能。エントリーレベルのGPUである3060 6Gでも動作可能。VRAM容量は最大16G;

- 長い中国語のプロンプトを一度に理解可能。例えば「夜の太陽」や「左手にチヤー、右手にスマートフォン画面に今日のニュース」といった表現も自動的に修正され、中英文字母も乱れなくなる。

- 皮膚の毛穴、ガラスの反射、雨や霧の逆光、映画のような焦点深度などがすべてオンラインで処理可能。Elo人工的好みランキングではZ-Image-Turboがオープンソース界の最上位グループにランクインした。

その秘密は新開発のS3-DiTアーキテクチャにある。テキスト、視覚的な意味、画像トークンが単一流に結合され、パラメータ数は競合の1/3に削減され、推論効率は最大限まで引き上げられている。チームはついでにZ-Image-Editも公開しており、自然言語で1文で元の画像の「顔替えや風景変更」が可能となり、コミュニティユーザーは即座に遊ぶことができる。

アリババはまだ完全オープンソースするかどうかを公式発表していないが、モデルはすでにModelScopeおよびHugging Faceにアップロードされており、pull requestはdiffusersのメインブランチにマージされている。pipコマンド1行で読み込むことが可能だ。企業版APIの価格が発表されれば、MidjourneyやFluxたちも早めに価格引き下げを考える必要があるかもしれない。

Z-Imageの登場はスタートピストルのようだった。画像生成のレースは本格的に「軽量かつ高品質」の時代に入った。計算力の民主化はただのスローガンではなくなり――誰のGPUにも16GBはあるだろう。

プロジェクトアドレス：https://github.com/Tongyi-MAI/Z-Image

GPU市場に再び火花：Nvidia RTX5070発売延期、AMDは対抗策か

GPU市場は新たな激しい競争の時期を迎えます。Nvidiaは間もなく発売されるRTX5070 GPUに大きな期待を寄せており、その性能はRTX4090に匹敵する一方、価格は549ドルに抑えると主張しています。しかし、この主張が市場で実証されるかどうかはまだ分かりません。Nvidiaは当初2月にRTX5070を発売する予定でしたが、本日製品ページの最新情報によると、発売日は3月5日に延期されました。それでもNvidiaは、AMDの予定イベントの前週となる2月20日に発売を開始する計画です。

Feb 14, 2025

98.3k

Nvidia RTX 5070：549ドルでRTX 4090並みの性能？

最近のCESで、NvidiaのCEOであるジェンスン・フアンは衝撃的な発言をしました。「RTX 5070は、549ドルでRTX 4090並みの性能を実現する」と。この発言は、YouTubeやTikTokを中心にソーシャルメディアで大きな話題となり、様々な意見が飛び交っています。では、RTX 5070は本当に1599ドルのRTX 4090に対抗できるのでしょうか？答えは単純ではありません。重要なのはN...

Jan 9, 2025

104.0k