テンセントがHY-Embodied-0.5エンボディドモデルを発表、22項目の評価で16項目で最良記録を更新

最近、テンセント Robotics X ラボはテンセント Hunyuanチームと共同で、身体知能専用の基本モデル「HY-Embodied-0.5」を正式にリリースしました。この取り組みは、汎用的な視覚言語モデル（VLM）が詳細な3次元空間認識および物理的相互作用能力に欠けており、現実世界での応用が難しい業界の課題を解決することを目的としています。これにより、大規模モデルの認知プロセスがロボット制御分野に実質的に拡張されたことを示しています。

このシリーズモデルは、汎用ベースモデルの単純な微調整ではなく、アーキテクチャからトレーニング方式に至るまで完全な再構築です。チームは同時に2つの主力モデルを発表しました：MoT-2B（総パラメータ4B、アクティブ2B）はエッジ側のリアルタイム応答を主に扱い、MoE-32B（総パラメータ407B、アクティブ32B）は最適な推論性能を目指しています。

技術面では、チームは視覚と言語モードのパラメータを共有しない混合トランスフォーマー（MoT）アーキテクチャを独自に開発し、本物の解像度の視覚エンコーダー「HY-ViT2.0」と視覚潜在トークン機構を組み合わせることで、マルチモーダルトレーニングにおける小モデルの災害的忘却を効果的に回避しました。トレーニング面では、1億以上の高品質な身体知能専用データに依存し、拒否サンプリング微調整、強化学習、オンライン蒸留などの多段階後のトレーニング戦略を組み合わせ、モデルの思考プロセスを自律的に進化させました。

性能検証によると、MoT-2Bは感覚、推論、計画を含む22項目の権威ある評価で16項目で最優秀を獲得し、Qwen3-VL-4BやRoboBrain2.5などの同パラメータ競合モデルを上回っています。フラッグシップ版のMoE-A32Bも、Gemini3.0Proなどの国際的な基準と対等に競えることが確認されています。

実機テストでは、このベースモデルを搭載したロボットがパッキングや積み重ねなどのタスクで主流のベースラインモデルよりも優れたパフォーマンスを示しました。この進展は、身体知能が仮想シミュレーションから物理的な作業へと移行するための高性能な下位ベースを提供しています。

テンセントがCodeBuddy Securityを発表、AIエージェントによりコードレビューをより効率的に

2026年腾讯雲AI産業応用大会で、コードセキュリティ製品CodeBuddy Securityを発表。AI深層監査エンジンと静的解析ツールXcheckを統合し、AI時代の脆弱性急増や従来のコード監査の限界に対応。AIによる脆弱性発見は進展（例：27年間隠れた脆弱性を発見）するが、課題も多い。....

中国が初めて公有クラウド大規模モデルのトークン性能ランキングを発表、1日当たりの呼び出し量は140兆回を超えた

AI技術の爆発的成長に伴い、大規模モデルの計量・決算単位であるToken（トークン）の使用量が急増。2026年3月時点で、中国の1日あたりのトークン呼び出し数は140兆回を突破し、2024年初頭比で1000倍、2025年末比3ヶ月で4割以上増加。国内大規模モデル応用の急速な拡大を示す。....

バイチューテック傘下のドゥーパオが有料機能をリリース　大規模モデルが商業化への本格的な段階へ進む

バイチューテック傘下のAI製品「ドゥーパオ」は、6月下旬に有料サブスクリプション機能をリリースする予定で、これは国内の大規模モデルが無料で市場に参入していた状況から収益化への転換を示している。この取り組みは、ユーザー数が最大級の大規模モデルアプリケーションが商業化の深い段階に入ったことを示しており、消費者向けAI市場が徐々に無料時代を脱していっている。ドゥーパオの有料メカニズムの門檻は低く、価格も控えめで、持続可能なビジネスモデルの発展を目指している。

智譜が150億元を資金調達し、科创板に上場を目指す。香港株式市場への上場から5ヶ月未満

智譜AIは科创板IPOを開始し、150億元の資金調達を計画している。これは、1月に香港株式市場に上場してからわずか5ヶ月後のことである。会社は「A+H」の二つのチャネルを通じて資金を調達し、資金源を広げ、大規模モデル分野でのリーダー地位を強化することを目的としている。

指標は驚くべきものだが、コミュニティから非難を受けたのか？MiniMaxの新エントリーモデルM3が二極化する議論を引き起こす

AIスタートアップMiniMaxがフラッグシップ大規模言語モデルM3を発表。ソフトウェアエンジニアリングの実践的テストで59%のスコアを達成し、GPT-5.5を上回り、Opus4.7に迫る性能を示す。百万レベルのコンテキスト処理能力とネイティブマルチモーダル機能を備えるが、発表後に論争を巻き起こしている。....