最近、Soul AI Lab は業界で初めて140億パラメータを持つリアルタイムのデジタル人間生成モデル「SoulXFlashTalk」を正式にオープンソース化しました。このモデルの特徴は、サブ秒単位の遅延と1秒当たり32フレームの高いフレームレートを実現することです。これにより、業界に包括的なリアルタイムインタラクションソリューションを提供します。

SoulXFlashTalk のオープンソース化により、開発者はプロジェクトページ、技術報告書、ソースコード、モデル重みを簡単にアクセスできるようになります。これは、全面的なオープンなシステムを形成するものです。この取り組みは、業界内の研究開発のハードルを効果的に下げ、より多くのイノベーションプロジェクトに基礎となる支援を提供します。注目すべきは、昨年10月にSoulがすでに音声合成モデル「SoulXPodcast」をオープンソース化したことです。今回のオープンソース化は、Soulが「音声+視覚」の二モードオープンソースマトリクスの構築において重要な一歩を踏み出したことを意味しています。

image.png

Soulのオープンソース戦略は、技術の共有にとどまらず、AIエコシステムの共通発展を目指しています。会社は今後もオープンソースの道を堅持し、さらに多くのAI技術成果を公開することで、AIとソーシャル分野のイノベーションと融合を推進していきます。

SoulがマルチモーダルAIエコシステムの構築を継続して改善していく中、業界の専門家は、これがソーシャルネットワーク、オンライン教育、バーチャルリアリティなどの業界に画期的な変化をもたらすと予測しています。Soulの努力が将来的なデジタルインタラクション体験に新たな基準を設定するものであることは間違いありません。今後の展開を注目しましょう。

ポイント:

🌟 Soul AI Lab は140億パラメータを持つリアルタイムのデジタル人間生成モデル「SoulXFlashTalk」をリリースしました。高速応答能力と高フレームレートを持っています。

🚀 オープンソースにより、プロジェクトページ、技術報告書、ソースコードおよびモデル重みへのアクセスが可能となり、研究開発のハードルが低下し、さらなるイノベーションが促されます。

🤝 Soulは引き続きオープンソース戦略を推進し、AIとソーシャルの発展とイノベーションを促進し、マルチモーダルAIエコシステムを構築していきます。