AIデイリーレポート：千問が階層型画像編集モデルQwen-Image-Layeredを発表；Kling2.6に音声コントロールとアクションコントロール機能が追加；グーグルがA2UIオープン標準を公開

【AI日報】へようこそ！ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな情報をあなたにお届けし、開発者に焦点を当てて、技術のトレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を確認：https://app.aibase.com/zh

1、アリババ通義千問 Qwenが階層画像編集モデル「Qwen-Image-Layered」を公開しました。ワンタッチで「Photoshopレイヤー」を作成可能

アリババ通義千問 Qwenは、階層画像編集モデル「Qwen-Image-Layered」を発表しました。このモデルは静止画を複数の透明背景を持つ独立したRGBAレイヤーに分解でき、AI画像編集にPhotoshopのような構造化操作の能力をもたらします。ユーザーは特定のレイヤーを正確に制御でき、スケーリングや再配置、色の変更などを行うことができますが、他の部分には影響を与えません。さらに、このモデルのレイヤー処理は繰り返しが可能であり、より高精度な修正が可能です。現在、このモデルのコードはオープンソースとなっており、開発者やユーザーはHugging Faceと魔搭コミュニティから取得・テストできます。

【AiBaseまとめ:】
📸 自動的にレイヤー化：単一の画像をスマートに複数の透明チャネルを持つ独立したRGBAレイヤーに分割し、普通の画像を「編集可能なPS原稿」に変える。
🎨 精密で損ないない編集：特定のレイヤーのサイズ、位置、色を個別に調整でき、人物交換や背景色の変更で画面の他の要素に影響を与えない。
🔓 オールインワンの技術公開：モデルのコードはGitHubで公開されており、オンラインデモも提供しており、AI画像編集の構造化と専門化を推進する目的があります。
詳細リンク:https://modelscope.cn/models/Qwen/Qwen-Image-Layered

2、Claude Chrome拡張機能が完全公開！有料ユーザーは瞬時にAIブラウザアシスタントを獲得

AnthropicはClaude Chrome拡張機能をすべてのClaude Pro、Team、Enterpriseの有料ユーザーに完全公開しました。登録や申請は必要ありません。この拡張機能は常設のサイドバー設計とマルチタブ協働機能により、AIとウェブページとのインタラクション方法を変革し、ブラウザ内でコード実行とデバッグ機能を追加し、開発者に効率的なプログラミング体験を提供しています。

【AiBaseまとめ:】
🧠 常設サイドバー設計、マルチタブ協働機能をサポート
💻 ブラウザ内でのコード実行とデバッグ機能
🚀 有料ユーザー専用、サービスの安定性とデータセキュリティを確保

3、硬直なAIビデオから脱却！快手Kling2.6であなたの声がAIキャラクターの中に生き、複雑なダンス動作も完璧に再現

快手Kling2.6バージョンのアップデートは、AIビデオ生成分野において大きな飛躍を遂げました。音声コントロールと動作コントロールという2つの主要な機能を通じて、ビデオ生成の正確さと多様性を向上させました。同時に、価格面の優位性と市場展開も競争力を強化しました。

【AiBaseまとめ:】
🔊 音声コントロール機能で音声とビデオコンテンツの正確なマッチングを実現
💃 動作コントロールのアップグレードにより、複雑な全身動作の処理精度を向上
💰 価格の優位性と市場展開によって競争力を強化

4、AIスター企業MiniMaxが香港取引所の上場審査通過：アリババと騰訊が共同で投資

MiniMaxは若いAIスタートアップ企業として、香港取引所の上場審査を通過し、汎用人工知能分野における強力な実力と市場可能性を示しました。

【AiBaseまとめ:】
🚀 MiniMaxは香港取引所の上場審査を通過し、最も速くIPOを完了したAIテクノロジー企業となりました。
💼 会社はアリババや騰訊などの大手企業から投資を受け、成熟した製品ラインナップを構築しました。
💰 2025年9月までの時点で、会社の現金残高は10億4600万ドルに達し、研究開発費用は約5億ドルでした。

5、サムソンとグーグルが提携！世界初のGemini AI冷蔵庫がCES前に明らかに。食材認識+赤ワイン管理はすべてAIによる

サムソンとグーグルは、世界初のGemini大規模モデルを搭載したAI冷蔵庫を発売しました。AIビジョン技術によって食材認識、レシピ提案および赤ワイン管理が実現され、スマートホームが主動的なサービス時代に入りました。

【AiBaseまとめ:】
🍎 智能的な食材認識、レシピ提案と買い物リスト生成
🍷 赤ワインの認識と評価、専門的な食事提案を提供
🤖 AIとハードウェアの深い統合により、スマートホーム体験を再定義

6、北京人形ロボットが国内初の国際標準に適合したVLA大規模モデルXR-1を公開

北京人形ロボットイノベーションセンターは、国内初の身体知能国際標準に適合したVLA大規模モデルXR-1を公開しました。これは中国が知能ロボット分野で重要な突破を遂げたことを示しています。このモデルはクロスプラットフォーム運用能力を持ち、複雑な二本腕操作を実行でき、RoboMIND2.0やArtVIPといった補完的リソースと組み合わせて、開発者に対して強いデータサポートを提供します。

【AiBaseまとめ:】
🔥 XR-1は国内初の国際標準に適合したVLA大規模モデルであり、中国の知能ロボット技術の発展を促進します。
🤖 クロスプラットフォーム運用能力を持ち、様々なロボットプラットフォームで複雑な操作を実行できます。
📊 付随するリソースにはRoboMIND2.0とArtVIPが含まれており、開発者と研究者による革新を支援します。

7、グーグルがA2UIオープン標準を公開：AIエージェントが瞬時にUIデザイナーになる。退屈な文章対話から解放される

グーグルが公開したA2UIオープン標準により、AIエージェントが即座にグラフィックインターフェースを作成できるようになり、従来のテキスト相互作用方式を変革し、ユーザー体験と効率を向上させます。

【AiBaseまとめ:】
📅 A2UI標準により、AIエージェントが即座にグラフィックインターフェースを生成し、相互作用効率を向上させます。
🔒 トランスミッション構造化データをコードではなく使用することで、セキュリティと柔軟性を強化します。
🌐 A2UIはオープン標準であり、多様なプラットフォームに対応し、AIインターフェースの革新を推進します。

8、AI絵画プロンプトの新ツール：PromptFillがリリースされました！

この記事では、PromptFillというオープンソース構造化プロンプト生成ツールについて紹介します。空欄形式のインタラクティブ操作により、AI絵画の障壁を下げ、複雑なプロンプトの記述問題を解決し、創作効率とプライバシー保護の利点を強調します。

【AiBaseまとめ:】
🧠 空欄形式のインタラクティブ操作によりプロンプト作成が簡略化され、AI絵画の効率が向上します。
🔄 ローカルプライバシー保護と複数テンプレート管理をサポートし、さまざまなユーザーに適しています。
🌐 オープンソースコミュニティによりツールが継続的に最適化され、AI創作の普及を助けます。
詳細リンク:https://github.com/TanShilongMario/PromptFill

AIデイリーレポート：千問が階層型画像編集モデルQwen-Image-Layeredを発表；Kling2.6に音声コントロールとアクションコントロール機能が追加；グーグルがA2UIオープン標準を公開

関連推奨

身体知能の新進展：アントグループがLingBot-Visionをオープンソース化し、ロボットに空間認識を提供

AI電子ペットの進化：追尋が大規模モデル内蔵の新製品Domiを発売

ロボットビジョンに新たな突破！アリババのリンボー空間認識モデルLingBot-Depth 2.0が正式リリース

AIチップ自社開発の進出で新参者：Anthropicが初期開発を開始、サムスンの2nmプロセス採用を計画

一括処理の終焉：Cloudflareが細粒度なAIトラフィック管理を提供し、ウェブサイト収益化のバッファゾーンを築く