豆包・ボイスポッドモデルが発表将来、豆包アプリやPC、クーツァーなどで利用可能

火山エンジンは正式に「豆包・音声ポッドキャストモデル」をリリースしました。このモデルはストリーミングモデルに基づいており、テキストの創作から双方向対話型ポッドキャストへの変換を秒単位で実現します。ユーザーに「低コスト、高効率、強力なインタラクション」という新しい創作体験をもたらします。このモデルの登場により、従来のAIポッドキャスト作成における多くの課題が解決され、ポッドキャスト制作プロセスが大幅に簡素化されました。これにより、ホットなトピックが瞬時に生動したポッドキャストに変換されるようになります。

微信截图_20250521100239.png

現代において情報が爆発的に増える時代、ポッドキャストは人気のあるコンテンツ伝達形式として多くのユーザーを引き寄せています。しかし、従来のAIポッドキャスト作成には多くの問題があります。例えば、内容が重複していたり、口語化されていなかったり、機械的な音声感覚やインタラクティブ性が欠けていたりするため、ユーザー体験に大きな影響を与えます。これらの問題に対して、「豆包・音声ポッドキャストモデル」は重点的に取り組み、三つの主要な利点をもたらしました：

まず、「豆包・音声ポッドキャストモデル」の会話効果は自然でスムーズであり、擬人的な音声効果と本物の専門ポッドキャスターの口語習慣を組み合わせることで、プロ級のポッドキャスト録音に匹敵するレベルまで達しています。次に、このモデルはエンドツーエンドの簡単なプロセスを構築しており、創作全体を一貫して行うことができ、ポッドキャスト作成の効率を大幅に向上させます。最後に、「豆包・音声ポッドキャストモデル」には深層検索機能があり、ユーザーがホットなトピックを入力するだけで、5秒以内に最新情報を利用して生成されたポッドキャスト音声を聞くことができます。

さらに、「豆包・音声ポッドキャストモデル」はユーザーのインスピレーションに基づく創作だけでなく、入力したテーマを深層ポッドキャストの視点に変換し、クリエイターに豊富なアイデアとコンテンツを提供します。また、超長文をポッドキャストに変換することも可能で、ユーザーがドキュメントやURLウェブページを入力するだけで、本物そっくりのポッドキャスト作品を作成することができます。

「豆包・音声ポッドキャストモデル」は、豆包アプリやPC版、クズなどの製品に順次リリースされる予定です。

面壁智能が新たな数億円規模の資金調達を完了～「エッジ側の頭脳」の规模化応用を推進

面壁智能は新しい数億円規模の資金調達を完了したことを発表しました。この資金調達には、洪泰ファンド、国中キャピタル、清控金信、及び茅台ファンドが共同で参加しました。この資金調達の完了により、面壁智能は効率的な大規模モデル技術、製品の障壁強化、業界への賦与、並びにエコシステムの拡張において堅実な基礎を築き、『エッジ側の頭脳』を千行百業に広範に適用することを促進します。

美図とアリババが戦略的提携を発表し、2.5億ドルの投資を得る

2025年5月20日、美図公司はアリババと戦略的提携を発表し、2.5億ドルの投資を受けました。この提携を通じて、両社は電子商取引プラットフォーム、AI技術、クラウドコンピューティングなどの複数の領域で深い協力を展開し、技術革新と事業発展を共に推進することを目指します。公告によると、アリババは美図公司に対し転換社債を通じた投資を行い、投資総額は2.5億ドルで、純資金調達額は約2.496億ドルになります。この投資の期限は3年間で、年利は1％です。アリババは発行日から満期の5日前までに転換権を持っています。

描きながら画像生成！腾讯がゲームビジュアル生成プラットフォーム「混元」をリリース

腾讯は正式に「混元ゲームビジュアル生成プラットフォーム」を発表しました。これは、混元宝モデルを活用したAIコンテンツエンジンで、ゲームの工業レベルのコンテンツ制作に特化しています。このプラットフォームの登場により、ゲーム美術デザイン業界は新たな高効率なクリエイティブ時代に入ることになります。創作効率は数十倍向上することが見込まれています。過去には、ゲーム美術デザイナーがキャラクター図版を作成する際、複数のソフトウェアを頻繁に切り替える必要がありました。参考図の選定からラフスケッチ、3面図の作成、さらに動的デモのレンダリングまで、プロセスは分散しており煩雑であり、ファイルは反復的にインポート/エクスポートする必要がありました。

字節跳動豆包AIイヤホンOla Friendがアップデート、英語学習のインテリジェントボディを直接呼び出せる

5月19日、字節跳動豆包のAIスマートボディイヤホンOla Friendが重要なアップデートを迎えました。今回のアップデート後、ユーザーはこのイヤホンを使用する際、音声で独立した英語学習インテリジェントボディOwenを呼び出してリアルタイムの対話を行うことができます。これにより、英語学習に新しい体験をもたらします。今回のアップデート前、Ola Friendは「豆包」アクティブなインテリジェントボディを呼び出すだけが可能でした。新しく導入されたOwenインテリジェントボディは、英語会話と学習シーン専用にカスタマイズされた独立型英語教師です。その質疑応答ロジックとインタラクションモードには密接な関係があります

火山エンジン、大模型エコシステム広場MCP Serversを発表

火山エンジンは正式に、その大模型エコシステム広場であるMCP Serversを発表しました。この革新プラットフォームの登場により、AI開発は新たなモジュール化組み合わせ時代に入りました。MCP Market（ツール広場）＋火山の舟（大模型サービス）＋Trae（アプリケーション開発環境）の深い連携により、MCP Serversはツール呼び出しからモデル推論、そしてアプリケーション展開までのフルチェーン開発フローを実現し、開発プロセスを大幅に簡素化しました。これにより、開発者はより効率的にAIモデルやアプリケーションを構築できるようになりました。

豆包・ボイスポッドモデルが発表 将来、豆包アプリやPC、クーツァーなどで利用可能