【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、李彦宏、文心大規模モデル「双星」を発表:X1TurboはDeepSeekを直撃、4.5TurboはGPT-4oを凌駕

百度Create開発者会議で、李彦宏は新世代の文心大規模モデルX1Turboを発表しました。このモデルは、性能と価格の両面で顕著な優位性を持ちます。X1Turboの入力と出力の価格はそれぞれ1元と4元で、競合製品DeepSeek-R1の25%に過ぎません。さらに、文心4.5Turboの入力と出力の価格はさらに低く、それぞれ0.8元と3.2元であり、複数のベンチマークテストで優れたパフォーマンスを示し、GPT-4oを上回りました。これらの2つのモデルの発表は、特に価格に敏感で性能を重視するアプリケーションシナリオにおいて、中国のAI大規模モデル市場の競争をさらに激化させるでしょう。

image.png

【AiBase要約:】

💡 文心大規模モデルX1Turboは性能が大幅に向上し、入力価格はわずか1元、出力価格は4元と非常に競争力があります。

📊 文心4.5Turboは速度が速く、価格は80%低下し、入力と出力の価格はそれぞれ0.8元と3.2元です。

🏆 文心4.5Turboはベンチマークテストで平均77.68点を獲得し、GPT-4oの72.76点を上回る素晴らしい結果となりました。

2、百度、AI開放計画を発表、開発者によるMCPの全面的な採用を支援

百度Create開発者会議で、李彦宏はAIアプリケーションを支援する一連の計画を発表し、「AI開放計画」を発表しました。これは、開発者に包括的なサポートを提供することを目的としています。この計画は、多様なコンテンツとサービス配信メカニズムを通じて、ユーザーのAIサービスに対するニーズを満たすと同時に、開発者にトラフィックと収益をもたらします。李彦宏は、百度が開発者の参入障壁を下げ、AIアプリケーションの迅速なイノベーションを推進し、今後5年間で1000万人のAI人材育成を計画していると強調しました。これは、スマートな新時代の到来を迎えるためのものです。

image.png

【AiBase要約:】

🚀 百度が「AI開放計画」を発表し、開発者への包括的なサポートを提供することで、AIアプリケーションの発展を促進します。

💡 最新のAIサービスに対するユーザーのニーズを満たし、開発者の収益の可能性を高めるために、さまざまな革新的なアプリケーションを計画に組み込みます。

🏆 「文心杯」創業コンテストを開始し、最大7000万元の投資を行い、1000万人のAI人材育成を計画しています。

3、OpenAI、軽量版Deep Researchを無料で公開、o4-miniがサポート

OpenAIは、AI研究ツールDeep Researchの軽量版を無料ユーザー向けに公開すると発表し、AI技術の普及化を示しました。Deep Researchは複雑な研究タスクを自律的に実行し、詳細な研究レポートを生成できます。現在、無料ユーザーもその恩恵を受けることができます。軽量版はo4-miniモデルによって駆動されており、レポートの分量は短いものの、コアとなるインテリジェンスと分析能力は維持されています。この措置は、ユーザーベースの拡大だけでなく、市場競争への対応にもなり、ChatGPTの市場地位をさらに強化するでしょう。

image.png

【AiBase要約:】

🧠 Deep ResearchはOpenAIが開発したAI研究エージェントであり、複雑な研究タスクを自律的に実行し、詳細なレポートを生成できます。

📈 軽量版Deep Researchはo4-miniモデルによって駆動されており、レポートの分量は短いものの、コアとなるインテリジェンスと高度な分析能力は維持されています。

🌍 無料ユーザー向けのDeep Research機能はテスト段階にあり、OpenAIはユーザーのニーズを満たすために、近日中に詳細情報を共有すると約束しています。

4、即夢ビデオ3.0内部テスト:滑らかな運鏡、人物の表情を正確に捉える

即夢ビデオ3.0の内部テストは、特に運鏡の滑らかさと感情表現の捉え方において、ビデオ制作分野での顕著な進歩を示しました。新しいモデルは、多様なシーンを処理でき、高画質にも対応しており、より高い芸術性を表現しています。まだ内部テスト段階ではありますが、その強力な機能と正確な表現力は、将来のAIビデオ制作の可能性を示唆しており、クリエイターの期待に値します。

image.png

【AiBase要約:】

🎬 豊富なカメラワークに対応し、プロフェッショナルな運鏡方法をサポートすることで、ビデオのストーリーテリング能力と視覚的なインパクトを高めます。

🎨 超現実主義、カートゥーンアニメーション、自然ドキュメンタリーなど、多様なスタイルに対応し、クリエイターの芸術的な構想を実現します。

🐾 動物の表現力が独特で、モデルは動物のキャラクターに生き生きとした動きと個性を付与し、全体の表現力を高めます。

5、百度、コンテンツオペレーティングシステム「滄舟OS」を発表、百度文庫のAI月間アクティブユーザー数は1億人に迫る

4月25日の百度Create会議で、李彦宏はコンテンツ分野の世界初のオペレーティングシステム「滄舟OS」を発表しました。これは、コンテンツ管理のインテリジェント化と効率化を向上させることを目的としています。中核コンポーネントである「Chatfile Plus」は、マルチモーダルコンテンツを深く解析できます。百度文庫と百度網盤が共同で発表した「AIノート」は、ユーザーに便利で学習とコンテンツ整理ツールを提供します。AI技術の普及に伴い、ユーザーエクスペリエンスは向上し続け、百度はAI分野への投資を拡大し、現代ユーザーの増え続けるニーズを満たしていきます。

image.png

【AiBase要約:】

🌟 百度がコンテンツ分野の世界初のオペレーティングシステム「滄舟OS」を発表しました。

📈 百度文庫と百度網盤のAI月間アクティブユーザー数は1億人に近づいています。

📝 新発表の「AIノート」は、業界唯一のマルチモーダルAIノートツールです。

6、百度文庫と百度網盤、GenFlow超能力コンビとAIノートを共同発表

4月25日のCreate2025百度AI開発者会議で、百度文庫と百度網盤は、「GenFlow超能力コンビ」と「AIノート」という2つの革新的なAIツールを発表しました。これらの2つの製品は、ユーザーの仕事と学習の効率を向上させることを目的としており、大規模モデル技術を最大限に活用して、複数のシナリオをカバーしています。GenFlow超能力コンビは、簡単な指示でタスクを自動的に計画し、高品質のコンテンツを生成します。一方、AIノートは、ビデオ学習とノートのシームレスな接続を実現し、構造化されたマルチモーダルノートを自動的に生成します。これらのツールは、ユーザーの生産性を向上させるだけでなく、AI時代において百度文庫と網盤を際立たせるものとなっています。

image.png

【AiBase要約:】

📈 GenFlow超能力コンビは、簡単な指示でタスクを自動的に計画し、高品質のコンテンツを迅速に生成します。

🎓 AIノートは、ビデオ学習とノートのシームレスな連携を実現し、マルチモーダルな構造化ノートを自動的に生成します。

🌐 百度文庫と網盤が共同で発表したAIツールは、複数のシナリオをカバーし、ユーザー数は10億人に達しており、生産性の向上に貢献しています。

7、Pixverse、MCPを発表:AIビデオ生成の新境地をワンクリックで解き放つ

生成AI技術の急速な発展に伴い、Pixverseが発表したModel Context Protocol(MCP)は、ビデオ制作に革命的な変化をもたらしました。MCPを使用すると、ユーザーは自然言語のプロンプトで高品質のビデオを生成でき、複雑な開発環境は必要ありません。これにより、技術的なハードルが大幅に低くなりました。そのオープン性と柔軟性により、コンテンツクリエイター、マーケティング担当者、開発者はより自由に創作でき、開発者コミュニティにも新たな機会を提供します。このイノベーションは、ユーザーエクスペリエンスの向上だけでなく、AIビデオ生成の普及化も推進しています。

image.png

【AiBase要約:】

🚀 MCPはAIビデオ生成用に設計されたプロトコルであり、ユーザーは自然言語のプロンプトでビデオを生成できます。

💻 このプロトコルは、複数の解像度での出力と多様なシーンの説明をサポートし、ビデオコンテンツの構造化レベルを向上させます。

📈 MCPのオープン性により、開発者は機能のカスタマイズと拡張が可能になり、AIビデオ制作の普及を促進します。

8、Tavus、SOTA唇の同期モデルHummingbird-0を発表:ゼロショット唇の同期技術に革新をもたらす

Tavusが最近発表したHummingbird-0モデルは、唇の同期技術において画期的な進歩を遂げ、ゼロショット唇の同期の新時代を告げました。このモデルは、高精度の唇の同期能力を持つだけでなく、視覚的な品質とアイデンティティの維持においても、市場に出回っている他のモデルを凌駕しています。Hummingbird-0の適用範囲は広く、コンテンツ制作や多言語吹き替えなど、複数の分野を網羅しており、ビデオ編集の効率と品質を大幅に向上させます。

image.png

【AiBase要約:】

🚀 Hummingbird-0は、現在最も高度なゼロショット唇の同期モデルであり、モデルのトレーニングなしで高精度の同期を実現できます。

🌍 このモデルは、ユーザー生成コンテンツ、吹き替え、パーソナライズされたビデオなど、さまざまなアプリケーションシナリオに適用でき、編集時間を削減します。

🏆 Tavusは比較テストを通じて、Hummingbird-0が視覚的な品質と同期精度において、他の業界をリードするツールを上回っていることを証明しました。

9、豆包1.5・深層思考モデル、エッジ大規模モデルゲートウェイに上线、百万トークンを無料で入手可能

バイトダンス傘下の火山エンジンが発表した豆包1.5・深層思考モデルは、エッジ大規模モデルゲートウェイに上线し、ユーザーに最大500万トークンの無料使用枠を提供します。この高性能AIモデルは、推論とクリエイティブライティングなどの分野で優れたパフォーマンスを発揮し、マルチモーダル推論をサポートすることで、AIサービスの可用性と効率を大幅に向上させます。エッジコンピューティングにより、ユーザーは迅速かつ確実にさまざまな大規模モデルにアクセスでき、AI技術の幅広い適用を促進します。

image.png

【AiBase要約:】

🚀 豆包1.5・深層思考モデルは、最大500万トークンの無料使用枠を提供し、さまざまな使用シナリオに対応しています。

💡 このモデルはMoEアーキテクチャを採用し、パラメーターの最適化が顕著で、高並列処理と低遅延という利点があります。

🌐 エッジ大規模モデルゲートウェイは、100種類以上の主流大規模モデルに対応しており、AIサービスの速度と信頼性を向上させています。

10、Adobeの新しいFireflyプラットフォーム、OpenAIとGoogleのAIモデルを導入、クリエイティブツールのアップグレード

Adobeは新しいAIモデルセットFireflyを発表し、クリエイティブデザイン分野における大きな進歩を示しました。Fireflyは複数の提携企業の先進技術を統合し、Creative Cloudでのユーザーの創作効率を向上させることを目的としています。生成AIにより、ユーザーは迅速にクリエイティブなコンテンツを生成し、時間を節約できます。Fireflyの簡単な統合により、プログラミングの経験がないクリエイティブワーカーでも、これらの強力なツールを簡単に使用できます。将来的には、Fireflyはデザイン業界に大きな影響を与えるでしょう。

image.png

【AiBase要約:】

✨ FireflyプラットフォームはOpenAIとGoogleの先進的なAI技術を統合し、創作効率を向上させます。

🖼️ ユーザーは簡単なテキストの説明で、関連する画像やデザイン案を迅速に生成し、創作時間を節約できます。

🔧 Fireflyの統合方法は簡単で、クリエイティブワーカーはプログラミングの経験がなくても簡単に使用できます。

11、ImageSlider 2.0が主力製品ラインに追加予定、画像生成機能が全面的にアップグレード

Gradioチームは、主力製品ラインの一部としてImageSlider 2.0を発表し、一連の新しい機能とパフォーマンスの強化を提供します。このアップデートは、ユーザーエクスペリエンスの向上、創作オプションの拡大、生成効率の向上を目的としています。新バージョンは、複数のレイアウトと高解像度の画像生成に対応しており、eコマース、デジタルアートなど、複数の分野に適用できます。コミュニティからの反応は熱心で、ユーザーはすでにテスト段階でその商業的な可能性を体験しています。