アリババチームは、表情豊かな顔の表情と頭の動きを伴う音声肖像ビデオを生成できる肖像ビデオ生成フレームワークEMOを発表しました。EMOは、参照ネットワークを利用して参照画像と動作フレームから特徴を抽出し、事前にトレーニングされたオーディオエンコーダーを使用して音声を処理し、埋め込みます。そして、複数フレームのノイズと顔領域マスクを組み合わせてビデオを生成します。実験結果によると、EMOは表現力とリアルさの点で既存の方法を上回っています。このモデルは、デジタルメディアや仮想コンテンツ生成技術の向上に役立つ可能性がありますが、犯罪ツールとして悪用される可能性も秘めています。
関連推奨
オープンAIのCEO:大学の学位の投資収益率は急速に低下するが、AIの応用分野は広大である
OpenAI CEOサム・アルトマン氏は、一般大学学位の投資収益率が加速的に低下するが急激にゼロにはならないと指摘。AI普及が教育リターンに大きな影響を与え、技術変革が伝統的学歴の価値を揺るがすと予測。....
Nov 7, 2025
144.1k
SNSプラットフォームXがAIを導入し、ユーザー情報の真実性の確認を補助する
X(旧Twitter)はAIを活用したコンテンツ検証を拡大し、情報の信頼性向上を図っています。コミュニティノートの約10%を8つのAIボットが自動生成。例として、10月の抗議動画にMSNBC関連の注釄を自動追加しました。....
Nov 7, 2025
84.2k
グーグル、Anthropicへの投資を拡大 評価額は3500億ドルを超える可能性
GoogleがAI企業Anthropicへの追加投資を協議中。クラウドサービスや転換社債を通じた協力を強化し、評価額は3500億ドル超に達する可能性。....
Nov 6, 2025
139.5k
IBMは数千人の社員を削減し、人工知能やソフトウェアビジネスに焦点を当てます
IBMは戦略再編の一環として数千人を削減し、ソフトウェアとAIサービスに注力。全世界従業員27万人の「一桁台%」、約2700~5000人に影響。業界の新潮流を反映した「定期的な人員調整」と説明。....
Nov 6, 2025
85.2k
北京がAIと医療健康の深まりな融合を推進し、実体医院を設立して産業の発展を加速
北京市が昌平区の医療健康産業発展支援策(意見募集稿)を発表。AIと医療の融合を推進し、技術基盤強化を通じて産業革新と医療サービスの効率化・精密化を図り、デジタル転換を支援。....
Nov 5, 2025
148.8k
