快手の子会社であるKuaishou AIは、公式WeChat公众号で初めての「音画同出」モデルであるKuaishou 2.6を発表しました。このモデルの特徴は、一度の生成プロセスで画像、自然な声、効果音、環境の雰囲気を同時に生成できることです。これにより、「音」と「画」の世界を完全に統合し、ユーザーのクリエイティブな体験を向上させます。

画像

Kuaishou 2.6には「テキストから音画を生成する」および「画像から音画を生成する」2つの創作ルートが用意されています。「テキストから音画を生成する」機能では、簡単な一文だけで、完全な音声・映像コンテンツを迅速に生成できます。一方、「画像から音画を生成する」機能は、静止画を「話す」ようにし、動的に表現します。つまり、ユーザーはテキストまたは画像を提供するだけで、豊富な音声・映像作品を作成することができます。

画像

このモデルは幅広い応用シーンを持ち、さまざまな形式のコンテンツ制作に適しています。例えば、単人独白(商品紹介、生活Vlog、ニュースキャスター、スピーチ)、ナレーション(商品説明、試合解説、ドキュメンタリー、物語)、多人数対話(インタビュー番組、ショートドラマ)、音楽パフォーマンス(歌唱、ラップ、複数合唱、楽器演奏)などです。

Kuaishou AIは、2.6バージョンのリリースによって、ビデオ制作がより柔軟かつ使いやすくなると述べています。ユーザーは自分のアイデアや創造性をよりよく表現できるようになります。今回のモデルのリリースは、快手がAI創作分野でさらに前進したことを示しており、ユーザーの増加するコンテンツ制作ニーズをより満たすものです。

注目ポイント:

🎨 Kuaishou 2.6モデルは音画同期生成を実現し、ユーザーの創作体験を向上させます。

🖊️ 「テキストから音画を生成する」および「画像から音画を生成する」2つの創作ルートを提供し、多様なコンテンツ形式に対応します。

🎤 独白、ナレーション、対話、音楽パフォーマンスなど、多くのシナリオに適用可能です。