【AIニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな内容をお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをいたします。
新規のAI製品クリックして詳細を確認:https://app.aibase.com/zh
1、騰訊が原生3D再構築能力を持つ超長距離世界モデル「HunyuanWorld-Voyager」を開源
騰訊がリリースしたHunyuanWorld-Voyagerは、単一の入力画像に基づいて世界の一貫性を持つ3Dポイントクラウドを生成できるイノベーティブなビデオ拡散フレームワークです。また、没入感のある探索をサポートしています。このモデルは、ビデオ生成の質とシーン再構築の効果において優れた性能を発揮しており、AI駆動のVR、ゲーム、シミュレーション空間のインテリジェンス分野における潜在能力を示しています。

【AiBase要約:】
🌍 HunyuanWorld-Voyagerは、単一の入力画像から世界の一貫性を持つ3Dポイントクラウドを生成でき、ユーザーが没入感のある探索を行うことができます。
🎥 モデルは正確に整合された深度情報とRGBビデオを生成し、高品質な3D再構築に適しています。
🏆 複数のテストで、HunyuanWorld-Voyagerは他のモデルよりもビデオ生成の質とシーン再構築の効果が優れています。
2、通義ラボが新世代のエージェント開発フレームワークAgentScope 1.0を公開
通義ラボが公開したAgentScope 1.0は、マルチエージェント開発に特化したオープンソースフレームワークであり、開発・配置・モニタリングの全ライフサイクルソリューションを提供します。その3層のテクノロジー構造(コアフレームワーク、Runtime、Studio)は独立して使用可能であり、リアルタイム介入制御、スマートなコンテキスト管理、効率的なツール呼び出しの3つの能力を備え、エージェントの安全性と実行効率を確保しています。

【AiBase要約:】
🌟 AgentScope 1.0は新世代のエージェント開発フレームワークで、マルチエージェントの開発に特化し、全ライフサイクルソリューションを提供します。
🚀 実時間介入制御、スマートなコンテキスト管理、効率的なツール呼び出しの3つの機能を持ち、エージェントの開発および実行効率を向上させます。
🔒 AgentScope Runtimeは、セキュアなツールサンドボックスと効率的な配置実行エンジンを提供し、エージェントの安全と安定性を確保します。
詳細リンク:https://github.com/agentscope-ai/agentscope
3、即夢AIシリーズモデルがAPIを開放し、開発者にワンストップの画像および動画生成サービスを提供
即夢AIは火山引擎と連携し、APIサービスを全面的に開放し、企業に対して強力な画像および動画生成能力を提供し、クリエイティブを現実にするお手伝いをしています。

【AiBase要約:】
🎨 文字から画像3.0、文字から画像3.1などのモデルがAPIサービスを開放し、企業が効率的に画像および動画コンテンツを生成するお手伝いをしています。
🎬 動画生成3.0proおよびアクション模倣DreamActor M1などのモデルは多様な創作ニーズに対応できます。
💼 即夢AIは火山引擎を通じて企業市場を支援し、商業応用の革新を推進しています。
4、騰訊が翻訳界のスターであるHunyuan-MT-7Bを開源:WMT2025で30のチャンピオンを獲得し、翻訳界の新王者!
騰訊がリリースしたHunyuan-MT-7BはWMT2025で卓越したパフォーマンスを発揮し、翻訳分野のトップランナーとなりました。これは多言語処理における強大な実力を示し、オープンソースにより技術の広範な応用と発展を推進しています。

【AiBase要約:】
🧪 Hunyuan-MT-7BはWMT2025で30言語の第一名を獲得し、強力な翻訳能力を示しています。
🌐 31言語をサポートし、多様な少数言語も含み、自然言語処理分野におけるテクノロジーの蓄積を示しています。
🚀 オープンソースモデルにより技術の発展を推進し、グローバルな交流と協力を促進しています。
5、アップルがSTARFlowをリリース:DALL-EとMidjourneyに挑戦する新たなAI画像生成技術
アップルがリリースしたSTARFlow AI画像生成システムは、正則化フローと自己回帰変換器を組み合わせることで、高解像度画像生成の効率と品質を向上させました。このシステムは、深さ設計と潜在空間操作によりモデルの性能を最適化し、学術機関と協力してAI技術の発展を推進しています。

【AiBase要約:】
🧠 STARFlowは正則化フローと自己回帰変換器を組み合わせ、画像生成効率を向上させています。
💡 深さ設計と潜在空間操作によりモデルの性能を最適化しています。
🚀 アップルは学術機関と協力し、AI技術の発展を推進しており、今後の応用見通しが広がっています。
詳細リンク:https://arxiv.org/pdf/2506.06276
6、アップルのFastVLMが登場:5分で85倍速の視覚AI、データは常にデバイス内に残る
アップルがリリースしたFastVLMビジョン言語モデルは現在、一般に公開されています。Apple Siliconチップを搭載したMacでは直接体験可能です。FastVLMは動画キャプション処理速度を85倍以上に向上させ、サイズを3倍以上小さくしました。ブラウザで軽量版をロードすることができ、複雑なインストールプロセスなしで強力な機能を体験できます。ローカルでの動作設計により、データが常にデバイス内で保持され、プライバシー保護の理想的なソリューションを提供します。

【AiBase要約:】
🍎 FastVLMはほぼ瞬時に高解像度画像処理能力を提供し、動画キャプション処理速度を85倍以上向上させます。
💻 ブラウザで軽量版をロードすることができ、複雑なインストールなしで強力な機能を体験できます。
🔒 データは完全にローカルで動作し、プライバシーを保証し、オフラインでも使用できます。
7、新モデルCoMPaSS-FLUX.1:Fluxテキストから画像生成の空間理解能力を向上させる
CoMPaSS-FLUX.1は、FLUX.1テキストから画像生成の拡散モデルに基づくLoRAアダプターであり、物体間の空間関係の理解能力を大幅に向上させる目的で設計されています。このモデルは、複数のベンチマークテストで優れた性能を発揮し、特に物体間の空間関係の処理において顕著な進歩を遂げています。

【AiBase要約:】
🌟 CoMPaSS-FLUX.1はテキストから画像生成の空間理解能力を向上させ、特に物体間の関係の処理に優れています。
📊 性能評価では、このモデルは複数のベンチマークテストで明確な向上を示し、同時に高品質な生成結果を維持しています。
📚 モデルのトレーニングには厳密に選別されたデータセットが使用され、視覚的に良い空間関係と明瞭さを持つ画像の生成を確保しています。
詳細リンク:https://huggingface.co/blurgy/CoMPaSS-FLUX.1
8、Cherry Studioとシリコンベースの流れが深く協力し、Qwen38Bモデルを無料提供
Cherry Studioとシリコンベースの流れが深く協力し、ユーザーに無料のQwen38Bモデルを提供し、さらに多モデルサポート能力を豊かにし、AIインタラクティブ体験を向上させます。

【AiBase要約:】
🧠 Cherry Studioはシリコンベースの流れと協力し、Qwen38Bモデルを無料で提供し、AIインタラクティブ体験を向上させます。
💻 マルチプラットフォームおよび主流の大きな言語モデルをサポートし、ユーザーの使用プロセスを簡略化します。
🚀 クロス業界のインテリジェントアシスタントを提供し、生産性と個別化機能を強化します。
9、グーグルが新しいGemini API URL Context機能をリリース:ウェブページの内容を詳しく説明可能
グーグルがリリースしたGemini API URL Context機能により、AIはウェブページの内容を正確に解析し、理解することが可能になり、開発者のプロセスを大幅に簡素化し、情報抽出効率を向上させました。

【AiBase要約:】
🌐 開発者向けに設計されたAPIで、ウェブページ内のすべての内容(PDF、画像など)を解析および理解することができます。
📊 最大34MBのウェブページ内容を処理でき、「総資産」と「総負債」などのキーデータを抽出できます。
🔒 支払い壁を突破することはできません。YouTube動画やGoogle Docsなどの専用ツールには対応していません。
詳細リンク:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/
10、Youtu-Agentスマートエージェントフレームワークが正式にオープンソース化され、AI発展の新潮流をリード
騰迅優圖ラボはYoutu-Agentフレームワークをオープンソース化しました。このフレームワークは、自律的なAIエージェントの構築、実行、評価に特化しており、高性能、柔軟性、オープンソースモデルへの対応を備えています。複数のベンチマークテストで優れたパフォーマンスを発揮し、AIコミュニティにとって重要なツールとなっています。

【AiBase要約:】
✅ Youtu-Agentフレームワークは、データ分析やファイル処理などのさまざまなタスクをサポートし、開発効率を向上させます。
🚀 モジュール式設計により、開発者はエージェントの行動を柔軟に調整でき、カスタマイズ可能なアプリケーションに適しています。
🌐 オープンソース戦略により、グローバルな開発者が参加し、AI技術の革新と協力を促進しています。
詳細リンク:https://github.com/TencentCloudADP/Youtu-agent
