【AIニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用を理解するお手伝いをいたします。

新規AI製品:クリックして詳細を見るhttps://app.aibase.com/zh

1. アリババがZ-Image画像モデルを開源:中国語と英語の両言語テキストレンダリングをサポート

アリババ通義ラボは、新たな画像生成モデル「Z-Image」をオープンソース化しました。わずか6Bパラメータで効率的な画像生成と編集を実現し、視覚的な品質は3倍のパラメータを持つ商用モデルに近づいています。軽量なアーキテクチャと高い性能により、消費者向けデバイスにも適しており、複雑な指示の理解や両言語レンダリングにおいて優れた性能を発揮しています。

image.png

【AiBase要約:】

🔥 Z-Imageは単一フローDiTアーキテクチャを採用し、Turbo、Base、Editの3つのバリエーションを提供し、さまざまなニーズに対応します。

💡 中国語と英語の両言語テキストレンダリングをサポートし、従来のAIモデルにおけるテキスト処理の課題を解決します。

🚀 メモリ使用量は16GBまで低減され、エントリーレベルのGPUでもスムーズに動作し、画像生成の効率を向上させます。

詳細リンク:https://tongyi-mai.github.io/Z-Image-homepage/

2. 夸克AIグラスの発表:ダブルプレミアムチップ搭載、アリババ千問との接続

夸克AIグラスの発表は、アリババ千問が物理的な世界に初めて進出したことを意味します。ハードウェアのアップグレードと革新技術を通じて、ユーザーにより効率的で使いやすいAI体験を提供します。

image.png

【AiBase要約:】

📱 ダブルプレミアムチップを搭載し、千問の応答速度と性能を向上させます。

📷 スマートフォンレベルの画像能力を導入し、暗所での撮影画質と安定性を向上させます。

🔋 バッテリー交換可能な二重バッテリーデザインにより、長時間の待機が可能になります。

3. Opera Neonブラウザの大規模アップデート:1分間の研究+Gemini3のワンタッチ切換+Google Docsの瞬時作成

Opera Neonブラウザは大規模なアップデートをリリースし、「1分間の深層研究」モードを追加し、Gemini3ProとNano Banana Proの2つのモデルを統合し、初めて自然言語によるGoogle Docsの作成および編集をサポートしました。この機能は、ユーザーが迅速な検索と全体的な研究の間の効率を向上させ、ドキュメント作成に対して自動化されたソリューションを提供します。

image.png

【AiBase要約:】

✨ 「1分間の深層研究」モードを追加し、複雑な問題の処理効率を向上させます。

🔄 Gemini3ProとNano Banana Proモデルの切り替えをサポートし、多段階タスクに対応します。

📝 Google Docsスマートエージェントを統合し、自然言語でドキュメント操作が可能になり、執筆効率を向上させます。

4. 清華大学がAI応用指針を発表:AI生成コンテンツを学業成果として使用禁止

清華大学は正式に「清華大学人工知能教育応用指針」を発表しました。これは、校内における人工知能の使用を規範化するものです。この指針は、人工知能応用の包括性と階層的なガイドラインを体系的に提唱し、教育および学術研究の各主要なシナリオをカバーしています。

image.png

【AiBase要約:】

🧠 清華大学が人工知能教育応用指針を発表し、校内におけるAIの使用を規範化します。

📚 指針はAI生成コンテンツを学業成果として使用することを厳しく禁止し、学術の誠実性を確保しています。

🔍 学校は教師および学生がAIを活用した学習を積極的に探求することを奨励していますが、明確な使用規則に従う必要があります。

5. DeepMindが「Gemini 3 Proシステム命令」を公開:Agentタスク成功率が5%向上、マルチステップワークフローの信頼性の工程化

DeepMindはGemini 3 Pro専用のSystem Instructionsを公開し、複数のベンチマークテストでの性能を顕著に向上させました。この指令は論理的推論、リスク評価、耐久性を強調し、大規模モデルが「ブラックボックス調整」から「エンジニアリング指令」の段階へ移行したことを示しています。

image.png

【AiBase要約:】

📌 Gemini 3 ProのSystem Instructionsにより、Agentタスク成功率は約5%向上しました。

🔍 指令は論理的依存関係、リスク評価、仮定の探求を強調し、モデルの信頼性を高めています。

🚀 DeepMindは指令を構成可能なJSON Schemaにカプセル化し、2026年Q1にVertex AIなどのプラットフォームに開放する予定です。

6. AdobeがProject Graphを発表:クリエイティブワークフローを再構築するAIツール

Adobeが発表したProject Graphは、ノードベースのビジュアルエディターであり、アーティストやデザイナーが創作プロセスをより効率的にカスタマイズできるように設計されています。AIモデル、ツール、エフェクトを接続することで、創造性の制御性と正確性を向上させ、複雑なワークフローを共有可能なツールにパッケージ化し、チーム協働の効率を向上させます。

image.png

【AiBase要約:】

🎨 AdobeがProject Graphを発表し、AI時代のクリエイティブワークフローを再構築する目的で設計されました。

🛠️ このシステムはノードエディターを使用し、クリエイティブプロセスを積み木のようにカスタマイズできます。

📦 クリエイティブワークフローを共有可能なツールとしてパッケージ化し、チーム協働やアプリケーションに役立ちます。

詳細リンク:https://www.adobe.com/express/create/chart/bar

7. Trae SOLO中国版が爆発的にリリース:Planモード+Sub Agent、コードを書く前に作戦図を描き、長い会話も曖昧にならない!

Trae SOLO中国版は5つの新機能をリリースし、Planモード、マルチタスク並列、Sub Agent、DiffView、コンテキスト圧縮を含んでおり、開発効率を向上させ、AIプログラミングをよりスマートにします。

image.png

【AiBase要約:】

🎯 Planモード:自然言語でニーズを記述し、AIがステップを自動分解し、ファイル変更リストを生成します。

ParallelGroupマルチタスク並列:複数のタブとチャットを同時に実行でき、互いに干渉しません。

🔍 DiffView:すべてのコード変更をまとめ、ハイライト表示し、1クリックでロールバックできます。

8. 巨人ネットワークが三大Muli-Modalモデルを発表:動画歪みを解消し、歌声変換で「本物の曲を扱える」に

巨人ネットワークAIラボは、清华大学SATLab、西北工業大学と共同で3つの音声・映像マルチモーダル生成技術の成果を発表しました。その中には、音楽駆動型の動画生成モデルYingVideo-MV、ゼロサンプル歌声変換モデルYingMusic-SVC、歌声合成モデルYingMusic-Singerがあり、チームが音声・映像マルチモーダル生成分野での最新の進展を示し、これらの技術をオープンソース化する計画があります。

image.png

【AiBase要約:】

🎥 音楽駆動型の動画生成モデルYingVideo-MVは、音楽と人物画像を使って高品質な音楽動画を生成できます。

🎤 ゼロサンプル歌声変換モデルYingMusic-SVCは「本物の曲を扱える」歌声変換能力を実現し、不要なノイズを効果的に抑制し、破音のリスクを低減します。

🎵 歌声合成モデルYingMusic-Singerは任意の歌詞を入力して自然な歌声を生成でき、ゼロサンプルの音色クローン機能を持ち、創造の柔軟性を向上させます。