【AI日報】へようこそ!ここは毎日あなたが人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて、技術トレンドを把握し、革新的なAI製品の応用を理解するお手伝いをします。
新規のAI製品クリックして詳細を確認:https://app.aibase.com/zh
1、アリババ ATHがオープンワールドモデル「Happy Oyster」を公開し、リアルタイムインタラクティブ体験の申請を開始
アリババ ATHチームは、新しいオープンワールドモデル「Happy Oyster」をリリースしました。このモデルはリアルタイムでのインタラクティブ性と作成機能を備えており、生成型AI分野における技術構築をさらに拡大しています。また、同社の「HappyHorse-1.0」モデルは、Video Edit分野のランキングで世界第1位を獲得し、強力なマルチモーダル視覚処理能力を示しています。「Happy Oyster」のリリースは、業界が動的でインタラクティブな環境に向かっている傾向を反映しており、ゲーム開発、仮想シミュレーション、クリエイティブデザインのための高次元の生産性ツールを提供します。
【AiBase要約:】
🧠 アリババ ATHチームが新しくオープンワールドモデル「Happy Oyster」をリリースし、リアルタイムでのインタラクティブ性と作成機能をサポート。
📊 「HappyHorse-1.0」モデルは最新のVideo Edit分野ランキングで1299点で世界第1位となり、深い技術力を示しています。
🚀 「Happy Oyster」のリリースは、生成型AI技術が静的なコンテンツ生成から動的なインタラクティブな環境への進化を示しています。
詳細リンク:https://www.happyoyster.cn/
2、AnthropicがClaude Opus 4.7および新たなAIデザインツールをリリース予定
AnthropicはClaude Opus 4.7および新たなAIデザインツールのリリースを控え、市場の注目を集めています。

【AiBase要約:】
🧠 Claude Opus 4.7は4.6のアップグレード版であり、コード作成能力の向上とコンテキスト窓の拡張をもたらします。
🎨 AnthropicはAI駆動のデザインツールのリリース準備中で、GammaやGoogle Stitchなどの競合企業と直接対抗します。
💰 Anthropicの評価額は800億ドルに達し、年間収益は90億ドルから300億ドルに増加しています。
3、騰訊が混元3D世界モデル2.0をオープンソース化し、ワンクリックで編集可能な3D空間資産を生成
騰訊のHunyuanチームは、「混元3D世界モデル2.0」を正式にリリースし、オープンソース化しました。このバージョンでは、マルチモーダル世界モデルにおいて大きなアップグレードを行い、インタラクティブで編集可能な3D資産を生成でき、複数の形式にエクスポート可能で、主流のゲームエンジンと接続可能です。その技術アーキテクチャは、空間理解、生成、再構築プロセスを統一し、主なアップグレードにはHY-Pano-2.0モデル、自社開発の空間Agent技術、WorldStereoメカニズムが含まれており、ゲームのステージプロトタイプや身体的インテリジェンスシミュレーション環境の構築の障壁を大幅に低下させます。

【AiBase要約:】
🧠 HY-World2.0は、ビデオの生成からインタラクティブで編集可能な3D資産の生成に飛躍しています。
🚀 複数の形式にエクスポート可能で、主流のゲームエンジンとスムーズに接続できます。
🌐 SOTA級の空間一貫性記憶メカニズムを通じて、AI駆動の3Dコンテンツ制作を実用段階に押し進めています。
4、グーグルが最強のTTSモデルをリリースし、約70種類の言語をサポート
グーグルがリリースしたGemini-TTSモデルは、テキストから音声への変換領域で重要な突破を遂げました。プロンプトを直接使って、音声の感情、テンポ、スタイルを制御することで、より自然で繊細な音声を生成できます。同時に、約70種類の言語をサポートし、自動的に言語を認識できるため、多言語コンテンツの音声化に効率的なソリューションを提供します。

【AiBase要約:】
✨ Gemini-TTSはプロンプトを使って音声の感情、テンポ、スタイルを正確に制御できます。
🌍 約70種類の言語をサポートし、言語を自動認識して手動でラベル付けする必要がありません。
🚀 同シリーズの音声モデルと連携し、リアルタイム会話やマルチモーダルインタラクション体験を向上させます。
5、アントグループがLingBot-Mapをオープンソース化:単一カメラでリアルタイムの3D再構築をサポート
アントグループのLingbo Techは、流式3D再構築モデル「LingBot-Map」をオープンソース化しました。このモデルは、単一の一般的なRGBカメラで、ビデオ収録中にカメラの姿勢をリアルタイムで推定し、シーンの3D構造を再構築することができます。ロボットナビゲーション、自動運転、ARハードウェアなどに効率的で安定したオンラインマッピング能力を提供します。

【AiBase要約:】
📱 単一の一般的なRGBカメラで、カメラの姿勢をリアルタイムで推定し、シーンの3D構造を再構築できます。
🚀 流式処理アーキテクチャを採用し、画像を受け取るたびに位置情報と構造をリアルタイムで出力するインタラクティブな構造を実現します。
🌐 オープンソースモデルにより、高精度な3Dセンシングのハードウェアの障壁を下げ、具身的インテリジェンスデバイスの発展を加速します。
詳細リンク:https://huggingface.co/robbyant/lingbot-map ModelScope:https://www.modelscope.cn/models/Robbyant/lingbot-map
6、芒果TVの会員数が7,560万を超え、自社開発の大規模モデルが30以上の番組で運用、湖南広播テレビ局のAI転換の成果が明らかに
湖南広播テレビ局は、第13回中国ネットワークビデオ視聴大会で目覚ましい成果を披露しました。芒果TVの有効会員数は7,560万を突破し、自社開発の芒果大モデルが30以上の番組で実際に使用され、生産効率を顕著に向上させました。

【AiBase要約:】
🍊 芒果TVの有効会員数が7,560万を突破し、ストリーミングメディア市場における競争力を示しています。
🤖 湖南広播テレビ局が自社開発した芒果大モデルは、80を超えるスマートエージェントを開発し、30以上の番組に活用されており、生産効率を30%以上向上させています。
💡 芒果TVのAI転換はコピー可能な形態を持ち、伝統的な放送機関が技術応用で成功した例を示しています。
7、20万台以上のAIサーバーが攻撃リスクにさらされている、MCPの重大な設計欠陥が暴露された
セキュリティ報告書によると、AnthropicのMCPプロトコルに重大な設計欠陥があることが明らかになり、それにより20万台以上のAIサーバーがリモートコード実行のリスクにさらされる可能性があります。この脆弱性は、MCP SDKのSTDIOインターフェースに起因しており、任意のOSコマンドを実行することが可能で、検証や警告がないためです。OX SecurityはAnthropicに通知しましたが、同社はアーキテクチャの修正を行わず、安全文書の更新のみを行ったため、開発者の関心を惹きつけました。

【AiBase要約:】
🧠 MCPアーキテクチャの設計欠陥により、20万台以上のAIサーバーがリモートコード実行のリスクにさらされています。
🛡️ バグはAnthropicのMCPプロトコルにあり、11種類のプログラミング言語をカバーしており、リスクが広範囲です。
⚠️ Anthropicはアーキテクチャを修正せず、セキュリティ文書の更新のみを行ったため、開発者の懸念を引き起こしています。
8、OpenAIが更新版Agents SDKをリリースし、企業向けにより安全なインテリジェントエージェントの構築を支援
OpenAIは、企業がより安全で効率的にインテリジェントエージェントを構築できるようにするために、Agents SDKを大幅にアップデートしました。このアップデートでは、サンドボックス機能を導入し、インテリジェントエージェントを制御された計算環境で動作させることで、システム全体の安全性を効果的に保護します。また、新版SDKでは、作業場でファイルや承認済みツールを使用できるビルトインフレームワークを提供し、開発の柔軟性を向上させます。OpenAIは、新しいAgents SDKの機能がすべての顧客にAPIで提供され、標準的な料金体系が適用されることを表明しています。現在、新しいフレームワークとサンドボックス機能はPythonバージョンからまずリリースされ、TypeScriptのサポートは今後のバージョンで追加される予定です。今後、さらに多くのエージェント機能が導入される予定です。

【AiBase要約:】
🛡️ OpenAIはAgents SDKを更新し、サンドボックス機能を導入し、インテリジェントエージェントの安全性を向上させました。
🔧 新版SDKには、ファイルと承認済みツールを使用できるビルトインフレームワークが搭載されており、開発の柔軟性を向上させています。
📈 APIはすべての顧客に提供され、PythonとTypeScriptバージョンが順次リリースされます。
