5月29日、人工知能会社の出门问问は正式にMobvoi MCP Serverをリリースし、コードをオープンソース化しました。複数のAI機能をワンストップで統合することで、ユーザーに「AI能力の自由」を実現させています。
Mobvoi MCP Serverには音声合成、音声クローン、画像駆動デジタルヒューマン、ビデオナレーション、ビデオ翻訳など多くの機能が統合されています。ユーザーはシンプルなテキスト入力だけで、これらのサービスを柔軟に呼び出すことができます。現在、このプラットフォームはCursor、Cline、Claude Desktop、Windsurf、OpenAI AgentsなどのMCPクライアントと互換性があり、さまざまなシナリオやマルチデバイスでのワークフローに対応しています。コード初心者からAIコーディング愛好家、開発エンジニアまで、誰でも簡単に始めることができます。

出门问问の優れた音声技術により、Mobvoi MCP ServerとMCPクライアントを統合すると、ユーザーに高品質な音声を提供するだけでなく、3秒間で音声クローンを作成したり、話す速度、トーン、ボリュームなどを調整することも可能です。Cursorで出门问问の音声機能を使用する例では、ユーザーが単純に要件を記述するだけで、システムが最適な音声を推薦し、ユーザーの要望に応じて話す速度を調整します。また、Mobvoi MCP Serverは3秒クローン機能もサポートしており、ユーザーが音声サンプルを提供すれば、その音色を使って文章をナレーションできます。
デジタルヒューマン合成のシナリオでは、Mobvoi MCP Serverは複雑なデジタルヒューマン非同期タスクシナリオにも対応できます。これは、画像駆動デジタルヒューマンやビデオナレーションなどです。ユーザーがインターネット上にアクセス可能なリンク、画像、ビデオ、音声を提供すれば、画像の中の人間が話し始めるか、ビデオにナレーションを追加することができます。
上述の機能に加え、Mobvoi MCP Serverはビデオ翻訳、ビデオ生成、音声生成などの機能も次々に統合していきます。出门问问は、Mobvoi MCP ServerのリリースがAI全プロセス能力のシームレスな連携を実現しただけでなく、標準化されたインターフェースとオープンエコシステムを通じて複雑なAI技術を誰でも使えるデジタル生産力に変えることを示しています。未来、出门问问は業界に深く取り組み続け、ユーザーに広範かつ深いAI能力を提供し続けていく予定です。
アプリケーションリンク👇
https://openapi.mobvoi.com/document?name=MCP%20Server
GitHubリンク👇
https://github.com/mobvoi/mobvoi-mcp
