【AIニュース】へようこそ!毎日、あなたが人工知能の世界を探索するためのガイドです。毎日、AI分野のホットなコンテンツをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品:クリックして詳細を確認https://app.aibase.com/zh

1、騰訊がミックス3D 3.0モデルを発表!モデリング精度が3倍に向上

騰訊は2025年のグローバルデジタルエコシステムカンファレンスで、ミックス3D 3.0モデルを発表しました。このモデルは3D-DiT階層彫刻技術により、モデリング精度を大幅に向上させ、さらにミックス3D Studioプラットフォームとオープンソース計画をリリースし、3Dクリエーションの境界を拡大しています。

image.png

【AiBase要約:】

🧠 ミックス3D 3.0モデルは3D-DiT階層彫刻技術を使用し、モデリング精度が3倍になりました。

🎨 ミックス3D Studioプラットフォームは専門的な創作ツールを提供し、3Dアート創作の効率と品質を向上させます。

🚀 騰訊はミックス3D omniモデルのオープンソース化を計画しており、3D生成技術の学術的および産業的な応用を加速します。

2、昆仑万维AI音楽創作プラットフォームMurekaにAgent Studio機能を追加!音楽創作がより簡単になります!

Murekaの「Agent Studio」機能は直感的な方法で音楽創作を容易にし、ユーザーは単純なアイデアを説明するだけで、AIが自動的に歌詞と音楽を生成できます。この機能には複数の創作シーンがあり、アルバム制作や話題曲の作成など、多様な音楽体験を提供します。

image.png

【AiBase要約:】

🎧 Murekaは「Agent Studio」機能を導入し、一般人でも簡単に音楽創作ができるようにしました。

🤖 ユーザーは簡単なアイデアを述べるだけで、AIが完全な歌詞と音楽を生成します。

🎶 現在6つの創作シーンがあり、アルバム制作、話題曲の作成、感情表現などの機能をカバーしています。

3、アリババQoderが有料サブスクリプションサービスを開始!Pro版月額20ドル、AI自律プログラミングを支援

Qoderは正式に有料サブスクリプションプランを開始し、ProとPro+のバージョンを提供し、無限のコード補完や高級モデル呼び出しなどの機能をサポートして、開発効率を向上させます。同時にCredits消費問題を最適化し、インテリジェントなツールの並列処理能力とエンジニアリング検索の正確性を向上させました。

image.png

【AiBase要約:】

🔥 Qoderは有料サブスクリプションサービスを開始し、ProとPro+バージョンを提供し、開発者の効率的なプログラミングニーズに対応します。

💡 Pro版は無限のコード補完と2000 Creditsを提供し、Pro+版は6000 Creditsとさらに多くのリソースを提供します。

🚀 Creditsの消費を最適化し、インテリジェントなツールの並列処理能力を向上させ、トークン消費を削減します。

4、VEED Fabric 1.0が登場!1枚の画像から「話す」動画に変身

VEEDがリリースしたFabric 1.0は、革命的なAI動画生成ツールで、1枚の画像と音声入力によって高品質な「話す」動画を生成できます。このツールは唇の同期、顔の表情の自然さ、および生成速度において優れた性能を発揮し、動画制作のコストと時間を大幅に削減し、さまざまなコンテンツクリエーションシナリオに適用可能です。

image.png

【AiBase要約:】

🖼️ Fabric 1.0は静止画から生動な「話す」動画を作成でき、ダイナミックな物語作りを実現します。

⏱️ 動画生成速度が7倍に向上し、コストが60倍低下し、迅速なコンテンツ制作に適しています。

🌐 多言語対応と自動字幕機能を統合し、グローバルユーザーの使用体験を強化します。

詳細リンク:https://www.veed.io/ai/fabric-1-0

5、OpenAIがGPT-5-Codexを発表!AIコードエージェントが開発者界を劇的に変える

OpenAIはGPT-5-Codexを発表し、代理型コードの分野での大きな突破を示しています。その動的な思考メカニズムと多プラットフォーム統合能力により、ソフトウェア開発効率が大幅に向上しました。

image.png

【AiBase要約:】

🧠 GPT-5-Codexは動的な思考メカニズムを持ち、タスクの複雑さに応じて処理時間を調整し、コード生成効率を向上させます。

💻 さまざまなプラットフォームとの統合をサポートし、IDE拡張、Webインターフェース、GitHubコードレビュー機能を含み、開発者エコシステムを強化します。

🚀 開発者のフィードバックによると、GPT-5-Codexは開発サイクルを大幅に短縮し、コード生成速度を向上させ、エラーのコメントを減少させています。

詳細リンク:https://openai.com/index/introducing-upgrades-to-codex/

6、全国で『人工知能セキュリティガバナンスフレームワーク』2.0版が公開され、安全で信頼できるAI生態系の構築を推進

『人工知能セキュリティガバナンスフレームワーク』2.0版は2025年9月15日に正式に公開され、急速に進展するAI技術がもたらす新たな課題に対応することを目的としています。このフレームワークは1.0版に基づいて最適化され、実際の応用状況を考慮し、リスクの分類と防止策を整備し、グローバル協力を強調しています。

image.png

【AiBase要約:】

🔐 『人工知能セキュリティガバナンスフレームワーク』2.0版が正式に公開され、AI技術の進展に伴う新しい課題に対応します。

🔍 フレームワークは1.0版を基盤にして最適化され、リスクの分類と防止策が整備されています。

🤝 グローバル協力を強調し、多国間メカニズム下での人工知能セキュリティガバナンス協力を推進します。

詳細リンク:https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm

7、OpenAI Evalsにネイティブ音声入力と評価機能が追加されました

OpenAIのEvalsツールにネイティブ音声入力と評価機能が追加され、開発者は直接音声ファイルをアップロードしてパフォーマンスを評価できるようになりました。これにより、音声認識および生成モデルの開発効率と正確性が大幅に向上します。

image.png

【AiBase要約:】

🎧 ネイティブ音声入力機能により評価プロセスが簡略化され、開発効率が向上します。

🔍 音声認識および生成モデルのパフォーマンスをテキスト変換なしで直接評価できます。

💡 新機能により、スマートスピーカーアシスタントや音声コンテンツ生成に更なる正確なテストサポートを提供します。

8、従来を打ち破る!Mini-o3オープンソースモデルが超長視覚推論を実現、深層思考が難しくなくなった

Mini-o3は、ビットテクノロジーと香港大学が共同でリリースしたオープンソース視覚推論モデルであり、数十ラウンドの視覚推論が可能となり、複雑な視覚問題の処理能力が著しく向上しました。その核心設計にはVisualProbeデータセット、反復データ収集プロセス、超ラウンドマスク戦略が含まれており、多ラウンド視覚推論技術に新たな方向性を提供しています。

image.png

【AiBase要約:】

🧠 Mini-o3は数十ラウンドの視覚推論能力を実現し、これまでの1〜2ラウンドの会話制限を超えた。

📊 VisualProbeデータセットと反復データ収集プロセスの構築により、モデルの深層推論能力が向上した。

🔄 超ラウンドマスク戦略により、トレーニング効率が最適化され、テスト段階でのパフォーマンスが向上した。

詳細リンク:https://arxiv.org/pdf/2509.07969

9、上海AI LabがLumina-DiMOOをリリース!多モーダル生成と理解の新時代を開拓

上海人工智能実験室は、多数の大学と連携して新世代の多モーダル生成と理解モデルであるLumina-DiMOOをリリースしました。このモデルは、比較学習技術を用いてテキスト、画像、音声などのデータを効果的に統合・対応させた革新的な全離散拡散アーキテクチャを採用し、生成品質と効率を大幅に向上させ、多様な応用シナリオで広範な応用可能性を示しています。

image.png

【AiBase要約:】

🌟 Lumina-DiMOOは新世代の多モーダル生成モデルで、革新的な「全離散拡散アーキテクチャ」を採用し、データ処理効率を向上させます。

🛠️ このモデルは比較学習技術を用いて、テキスト、画像などのデータを効果的に対応させ、理解します。

🚀 Lumina-DiMOOは画像生成と理解において優れた性能を発揮し、さまざまな応用シナリオに適応し、広範な応用可能性を示しています。

詳細リンク:https://github.com/Alpha-VLLM/Lumina-DiMOO

10、騰訊のAI描画が新しくアップグレード!微調整技術で生成画像の美しさが300%向上

騰訊がリリースした微調整技術は、AI生成画像のリアルさと美学評価を大幅に向上させ、その革新的方法には「Direct-Align」と「文脈的相対好み最適化」が含まれており、報酬詐欺とオフライン調整の制限問題を効果的に解決しています。

image.png

【AiBase要約:】

🧠 「Direct-Align」技術により勾配爆発を減らし、モデルの最適化能力を向上させます。

🎨 「文脈的相対好み最適化(SRPO)」により、テキストで画像スタイルの調整が可能です。

📈 SRPOトレーニングモデルは、リアルさと美学質において顕著に向上していることが実験で示されています。

詳細リンク:https://arxiv.org/pdf/2509.06942

11、Meta AIがMobileLLM-R1を発表!軽量でエッジ計算に特化し、パラメータ数が10億未満、性能が大幅に向上

Meta AIがリリースしたMobileLLM-R1シリーズモデルは、軽量化とエッジ計算分野で優れた性能を発揮し、パラメータ数は140Mから950Mまで、数学、コード、科学的推論に特化しています。このモデルは訓練効率と性能の両方で同様のモデルよりも優れており、特に数学とコードのタスクでは突出しています。