Stable Diffusion 3：既存のテキストツーイメージ生成システムを凌駕する最強のテキストツーイメージモデル

Stable Diffusion 3は、MMDiTアーキテクチャを用いることで、既存のテキストから画像生成システムを凌駕する、最高のテキストツーイメージモデルです。視覚的な美しさ、テキストへの忠実度、レイアウトのいずれにおいても、他の最先端モデルを上回っています。MMDiTアーキテクチャは、DiTと矩形流形式を組み合わせることで、画像とテキスト表現を独立して処理し、より正確で高品質な画像生成を実現しています。さらに、Stable Diffusion 3は柔軟性が高く、様々なハードウェアデバイスで迅速に画像を生成でき、複数のモデルサイズを選択できます。MMDiTアーキテクチャ、Prompt Following機能、Rectified Flow手法などの技術改良により、Stable Diffusion 3はテキストから画像生成タスクにおいて優れた成果を上げており、将来のクリエイティブ産業や仮想現実アプリケーションに新たな可能性をもたらします。

Stable Diffusion 3モデル公開、アーキテクチャの詳細を解明、Soraの再現に役立つ？

Stable Diffusion 3モデルがDiT（Diffusion Transformer）アーキテクチャを採用して公開されました。Stable Diffusion 3は品質が大幅に向上しており、他のテキストから画像生成システムを凌駕しています。Stable Diffusion 3のパラメータ数は8億から8BSDに増加しました。このアーキテクチャはSoraの中核開発メンバーとニューヨーク大学助教授の共同研究に基づいています。

Stable Diffusion 3技術レポートがSoraと同等のアーキテクチャの詳細を明らかに

Stable Diffusion 3の技術レポートが公開されました。SD3はマルチモーダル拡散TransformerアーキテクチャMMDiTを採用しており、再重み付け流技術を導入することで性能が向上しています。SD3の大規模な研究と今後の性能向上、テキストエンコーダーの問題点と提案について説明しています。

バイヤーがAIで画像を改ざんし悪意ある返金を要求、プラットフォームが即座に仲裁を許可し新規店舗のオーナーを失望させ退店に追い込む

河北省辛集市の果樹農家・張氏はライブコマースプラットフォームで無花果の苗木を販売したところ、わずか12件の注文で「返品のみ」の申請を受けた。購入者は葉が枯れた写真を添付して苗木の枯死を主張したが、張氏は経験からその写真がAI生成であることを見抜き、信憑性に疑問を呈した。....

百度第1四半期のAIクラウド収入は88億元で前年同期比79％増　コンロンチップP800が万枚クラスタを納入

百度が2026年第1四半期の決算を発表。総売上高は321億元、一般事業収入は260億元で前年同期比2%増加し、予想を上回った。AI事業が好調で、AIクラウド収入は88億元（前年同期比79%増）、GPUクラウド収入は184%急増。百度智能雲は大規模AIエージェント向けのフルスタックAIクラウドに進化し、基盤演算からAIエージェント応用までの能力を強化した。....

張朝陽が搜狐のAI戦略について語る：大規模モデルの軍備競争には参加せず、応用の実現とコンテンツの中立性に焦点を当てる

搜狐CEO張朝陽氏は2026年の搜狐科技フォーラムで、同社が大規模モデルの「第一陣営」における千億パラメータ研究開発に参加せず、自社事業に基づく合理的な応用に注力する方針を明確にした。この戦略は、中堅テクノロジー企業がAIブームの中で資源を集中し、戦略的取捨選択を通じて大手との競争を避け、実際のシーンへの適用に重点を置く実務的な選択を反映しており、生成AI時代における生存の知恵を示している。....