【AIニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな情報をご提供し、開発者に焦点を当て、技術のトレンドや革新的なAI製品の応用を理解するお手伝いをいたします。

新鮮なAI製品クリックして詳細を確認https://app.aibase.com/zh

1、HeyGenがAI動画翻訳で話題に!外国人も簡単に中国語で話せ、唇の動きがミリ秒単位で正確に同期

記事では、HeyGenがリリースした新しいビデオ翻訳エンジンについて紹介しています。3つの主要な技術突破により、言語間のビデオローカライズを高品質で出力することが可能となりました。この技術は、翻訳の正確性を向上させるとともに、唇の同期と複数の話し手の識別を最適化し、世界中のコンテンツクリエイターにより効率的なソリューションを提供します。

image.png

【AiBaseの要約:】

🌍 コンテキスト感知翻訳:機械的な直訳から文化共鳴への移行

👄 唇の同期革命:横顔や遮蔽物にも対応し、誤差をミリ秒単位まで抑える

👥 複数の話し手のスマート分離:男性・女性の声線を正確に再現し、会話の臨場感を再現

詳細リンク:https://www.heygen.com/translate

2、科大訊飛が全国産算力「星火 X1.5」を発表、AI技術がさらに進化

科大訊飛が発表した星火 X1.5 大規模モデルは、技術面で大きな突破を遂げました。多言語サポートとパフォーマンスにおいて国際的先進水準に達し、国内の開発者にさらに強力な技術支援を提供し、中国のAI技術のグローバル市場における競争力をさらに高めています。

image.png

【AiBaseの要約:】

🧠 星火 X1.5 はMoEモデルの全フロー訓練効率で突破を達成し、性能は国際的な主流の大規模モデルレベルに達しています。

🌐 星火 X1.5 は130種類以上の言語をサポートし、全体的な性能はGPT-5の95%以上に達しています。

🚀 星火 X1.5 の発表により、中国のAI業界には「第二の選択肢」が生まれ、国内のAI技術のグローバル市場における競争力を高めます。

3、QQブラウザがAI+小窓を導入、いつでも呼び出してすぐ使える

QQブラウザのPC版最新バージョンでは、「AI+」小窓機能が導入されました。浮遊ウィンドウを通じて様々なAI補助ツールを提供し、ユーザーのブラウジング体験を向上させます。この機能はユーザーを妨げない設計で、インテリジェントな推薦とワンストップ使用をサポートし、多様なニーズに対応します。

image.png

【AiBaseの要約:】

✨「AI+」小窓は邪魔しないブラウジング体験を実現し、浮遊ウィンドウはいつでも利用可能です。

🔍 ページタイプに応じたAIツールのインテリジェントな推薦機能を備え、動画要約やウェブ要約などの機能を提供します。

🔄 動画要約や購読アシスタントなどの複雑なタスクをサポートし、情報処理のスマートハブとして機能します。

4、科大訊飛がAIソフトウェア・ハードウェア一体型ソリューションを発表:90dBのノイズ環境でも正確に認識

科大訊飛は2025年の開発者祭りでAIソフトウェア・ハードウェア一体型ソリューションを発表しました。アルゴリズムとハードウェアの深く融合により、高ノイズや遠距離などの複雑な環境下での正確な認識と理解を実現しました。このソリューションにより、多数のAIハードウェアのノイズ低減と認識性能が大幅に向上し、星火音声大規模モデルを基盤とする「多様なボイス復刻」技術を導入し、パーソナライズされた音声創作を普及段階に進めます。

image.png

【AiBaseの要約:】

🔊 科大訊飛がAIソフトウェア・ハードウェア一体型ソリューションを発表し、複雑な環境下での音声認識性能を向上させます。

🎤 星火音声大規模モデルを基盤とする「多様なボイス復刻」技術により、パーソナライズされた音声創作が可能になります。

📊 90dBのノイズ環境下でも、訊飛ダブルスクリーン翻訳機2.0は98.69%の高い認識精度を維持します。

5、Google Gemini 3 Proプレビュー版がVertex AIに登場:100万トークンの長文対応

グーグル傘下のAIモデルであるGeminiシリーズは大きな進展を遂げました。最新のプレビュー版Gemini-3-Pro-Preview-11-2025はVertex AIプラットフォーム上で確認され、最大で100万トークンの超大規模な文脈窓をサポートしています。11月に正式リリース予定で、マルチモーダル推論およびエージェント型インテリジェンスにおいて顕著な改善があり、GPT-4oを上回る可能性があります。

image.png

【AiBaseの要約:】

✨Gemini-3-Pro-Preview-11-2025は最大100万トークンの文脈窓をサポートし、複雑なタスクに適しています。

🧠Gemini 3 Proはマルチモーダル推論とエージェント型インテリジェンスに特化しており、トレーニングデータは2024年8月までカバーされています。

🚀Vertex AIプラットフォームはAPIアクセスとAI Studioのプレビュー経路を提供し、開発者が迅速に始められるようにしています。

6、Comfy Cloudのベータテストが話題に!ブラウザでStable Diffusionが即座に起動、AI制作が本当に「ゼロコスト」に

Comfy CloudのベータテストはAI画像生成技術のさらなる普及を示しています。これはクラウドプラットフォームを活用して複雑なローカル配置プロセスを簡素化し、ハイエンドハードウェアがなくても専門的なAI制作ツールに簡単にアクセスできるようにすることで、一般クリエイターにとってこれまでになかった利便性を提供しています。

image.png

【AiBaseの要約:】

🔥 Comfy Cloudは完全なStable Diffusion環境を提供し、インストールやローカル配置が必要ありません。

🚀 高性能GPUクラスターを活用し、高解像度レンダリングをサポートしながら滑らかな体験を提供します。

🌐 オープンソースコミュニティとリアルタイム同期し、200以上のテンプレートを内蔵し学習曲線を低下させます。

詳細リンク:https://cloud.comfy.org/

7、10分でロボットを動かせる?上海のAgiBotが製造業のルールを再定義

AgiBot社が開発した新しい技術により、ロボットが10分以内で複雑な製造作業を完了できるようになりました。これは、世界中の製造業の生産方法を再定義するものです。この技術は人間とロボットのリモート操作と強化学習を組み合わせており、ロボットが非常に短時間で新しい工場プロセスに適応できるようにしています。現在、AgiBotのG2人形ロボットは龍驰科技の生産ラインで運用されており、スマートフォンとVRヘッドセットの部品の組立を担当しています。

image.png

【AiBaseの要約:】

🤖 AgiBotのG2人形ロボットは10分以内に複雑な製造作業を学ぶことができ、工業自動化の効率を大幅に向上させます。

🧠 人間とロボットのリモート操作と強化学習を組み合わせることで、ロボットは自己最適化を行い、新しい工場プロセスに適応できます。

🌐 中国の製造業エコシステムは、AgiBotの技術の実装に供給チェーン、迅速なプロトタイピング、データ収集の優位性を提供しています。