【AI日報】へようこそ!ここは毎日人工智能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。
新しいAI製品クリックして詳細を確認:https://app.aibase.com/zh
1. アントグループがLingBot-VLAをリリース:二本のアームを持つロボットが「大規模モデル時代」へ
アントグループは、視覚・言語・動作(VLA)のベースモデルであるLingBot-VLAを発表しました。このモデルは現実世界におけるロボットの複雑な操作を専門としており、膨大なデータで訓練され、さまざまな形態のロボットで汎用的な操作能力を実現しています。これは身体知能分野において重要な進展を示しています。

【AiBase要約:】
🤖 LingBot-VLAは、Qwen2.5-VLをマルチモーダルの主幹として使用する独自の「ハイブリッドトランスフォーマー」アーキテクチャを採用しており、多視点画像と自然言語指令を同時に処理できます。
🔍 LingBot-Depth空間認識モデルを導入し、特徴蒸留技術により3D空間推論能力を向上させ、積み重ねや挿入などのタスクで優れた性能を発揮します。
🚀 このモデルは非常に高いデータ効率を持ち、約80件の特定タスクのデモンストレーションデータで迅速に新しいロボットに適応可能です。また、すべてのトレーニングツールキットとモデルの重みがオープンソース化されています。
詳細リンク:https://arxiv.org/pdf/2601.18692
2. ウーシュがUnifoLM-VLA-0の大規模モデルをオープンソース化:一般的な人型ロボットに「物理的常識」を注入
ウーシュは、一般的な人型ロボット向けに設計されたUnifoLM-VLA-0の大規模モデルをオープンソース化しました。このモデルは、ロボットの脳が単なる「画像と文章の理解」から、「物理的常識」を持つ身体知能への重要な一歩を踏み出しました。

【AiBase要約:】
🧠 ロボット操作データでの事前学習により、モデルは物理的世界の相互作用の法則を理解します。
🌐 テキスト命令と2D/3D空間の詳細を深く統合し、複雑な環境における空間認識能力を強化します。
⚙️ 動作の分割予測および動力学制約を統合し、長時間にわたる動作シーケンスを統一的にモデリングします。
3. また名前を変更!ClawdがOpenClawに名称変更、GitHubスター数が10万を突破しコミュニティを巻き起こす
この記事では、オープンソースの個人AIアシスタントプロジェクトがClawdからMoltbot、そして最終的にOpenClawに名称変更した経緯について紹介しています。また、GitHub上で爆発的な成長とコア機能のアップデートも紹介しています。プロジェクトはオープンソース、プライバシー保護、セキュリティに重点を置き、今後はセキュリティと拡張性を強化する予定です。

【AiBase要約:】
🧩 プロジェクトは複数回の名称変更を経て、最終的にOpenClawとなりました。これはオープンソースとコミュニティ駆動の特性を強調しています。
🚀 OpenClawのGitHubスター数は10万を突破し、機能が豊富でプライバシー保護にも配慮しています。
🔒 プロジェクトはセキュリティ対策を継続的に強化し、コミュニティの持続可能な発展を確保するためのメンテナーや報酬メカニズムを模索しています。
詳細リンク:https://github.com/openclaw/openclaw
4. 商湯がSenseNova-MARSをオープンソース化:Agentic VLMによりAIに「思考と行動」を付与
商湯科技は、動的視覚推論と画像・テキスト検索の融合をサポートする最初のAgentic VLMモデルであるSenseNova-MARSを正式にオープンソース化しました。このモデルは、多くのランキングでGPT-5.2を上回り、強力なパフォーマンスと自律的な計画能力を示しています。

【AiBase要約:】
🧠 SenseNova-MARSは、動的視覚推論と画像・テキスト検索の融合をサポートするAgentic VLMモデルです。
📊 MMSearchやHR-MMSearchなどの評価で優れた成績を収め、GPT-5.2を上回っています。
🛠️ 二段階のトレーニングにより、AIに自律的な計画能力和複雑なタスク処理能力を付与しています。
5. 腾讯「元宝派」の内側テストスクリーンショットがリーク、SNS+AIがエンタメ体験を再構築
腾讯のAIアシスタント「元宝」の内側テストで、SNS機能「元宝派」の公試版スクリーンショットがリークされて注目を集めています。この機能には「一緒に音楽を聴く」と「一緒に映画を見る」機能が追加され、QQ Musicと Tencent Videoのリソースライブラリを統合し、友人とリアルタイムで一緒に映画や音楽を楽しむことが可能になりました。さらに、「元宝派」はWeChatとQQの友達を跨プラットフォームで統合し、初めて2つのSNSエコシステムの境界を突破しました。AIはグループチャットで活発な役割を果たし、スマートな要約やタスク監督などのツールサービスを提供し、コメディアン画像を生成して空気を和らげます。馬化騰はこの機能を10億円のギフトで広告し、春節の機会を利用して再びSNSの奇跡を再現しようとしています。

【AiBase要約:】
🎧 QQ MusicとTencent Videoのリソースを統合し、同期して映画や音楽を楽しむことができます。
🤝 WeChatとQQの友達を跨プラットフォームで統合しています。
🤖 AIはグループチャットでスマートな要約、タスク監督、空気を和らげる役割を果たします。
6. マスクがAIのビジョンに投資を増やす:xAIは来年、カスタマイズ可能な生成型ゲームと映画を大幅にリリースする予定
マスクはxAIのビジョンに自信を持っており、来年にリアルタイムで生成され、高品質で高度にカスタマイズされた映画コンテンツと電子ゲームをリリースする予定です。現在市場には一部のAI補助開発ゲームがありますが、マスクの目標は、プレイスタイル、美術デザイン、ステージ生成など、全工程をAIで生成することです。これは業界内で広範な関心と疑問を引き起こしています。

【AiBase要約:】
🎮 マスクはxAIが2025年にAIで生成されるゲームをリリースすると予測し、従来のコンテンツ制作モデルを挑戦しています。
🖼️ 影像コンテンツがリアルタイムで生成され、高品質で高度にカスタマイズされることが強調されています。
🤔 現在では、純粋なAI生成ゲームの実機デモはまだ印象的ではありません。その目標が実現できるかどうかは時間が証明する必要があります。
7. 30億ドルの賠償請求!Anthropicを音楽出版会社が提訴、大量の著作権侵害を指摘
この記事では、音楽出版会社がAnthropicを提訴し、AIモデルのトレーニング中に大量の著作権侵害行為を行ったとして30億ドルの賠償を求めることが紹介されています。

【AiBase要約:】
🎼 Anthropicは、2万曲以上の著作権付き音楽作品を不正に使用したとして指摘されています。
💰 賠償額は30億ドル以上になり、米国で最も規模の大きな非集団著作権訴訟の一つになる可能性があります。
⚖️ 出版会社は、Anthropicのビジネス行為が宣伝しているコンプライアンスと倫理的なイメージと大きく矛盾していると指摘しています。
8. クラウドの主導権争い:字節と阿里が春節に新世代の大規模モデルを発表予定
この記事では、字節跳動とアリババが春節前後に新世代の基礎モデル技術を発表する競争について考察し、両社が国内技術リード地位と将来のクラウドサービス市場の主導権を巡って取る戦略とその業界への影響を分析しています。

【AiBase要約:】
🧠 字節跳動は3つの主要モデルを発表する予定で、大規模言語処理、画像生成、ビデオ生成の分野をカバーします。
💻 アリババは、論理的推論、数学的計算、コード作成能力を強化したエースモデルQwen3.5を発表する予定です。
💰 中国のクラウド市場規模は2030年までに約900億ドルに達すると予測されています。技術競争は将来的なテクノロジー産業の競争構図を再構築するでしょう。
