アリババチームは、表情豊かな顔の表情と頭の動きを伴う音声肖像ビデオを生成できる肖像ビデオ生成フレームワークEMOを発表しました。EMOは、参照ネットワークを利用して参照画像と動作フレームから特徴を抽出し、事前にトレーニングされたオーディオエンコーダーを使用して音声を処理し、埋め込みます。そして、複数フレームのノイズと顔領域マスクを組み合わせてビデオを生成します。実験結果によると、EMOは表現力とリアルさの点で既存の方法を上回っています。このモデルは、デジタルメディアや仮想コンテンツ生成技術の向上に役立つ可能性がありますが、犯罪ツールとして悪用される可能性も秘めています。
関連推奨
スマート時代へ:PayPalの幹部がAI技術の未来のトレンドを明らかにする
情報時代はコンピュータの小型化とウェブの普及によって登場したが、人工知能の台頭がその終焉を示している。PayPalの幹部によると、我々は情報時代から新たな段階に移行しており、AIが技術の枠組みを再構築している。
Dec 26, 2025
140.5k
OpenAI、Metaが真の資金を投入し、AI人材争奪戦が下層システムにまで広がる
技術大手企業はAI人材を獲得するために、戦火をインターンと研究者にも広げている。Metaなどの会社は正規職と同等の高額給与を提示し、さらには巨額の投資で核心チームを確保しようと試みており、業界全体がトップ層の人材を激しく求めていることを示している。
Dec 26, 2025
128.3k
タイムリミットに迫る ソフトバンク、225億ドルの資金を急ぐ OpenAI
ソフトバンクはオープンエイの約束を果たすために、225億ドルの資金を緊急に集めている。これはアームの株式関連ローンを動員する可能性がある。オープンエイの主要な支援者であるソフトバンクは、「5000億ドルの宇宙网」データセンター計画に参加している。
Dec 23, 2025
116.0k
グーグルが画期的な打撃を仕掛けた:Gemini 3 Flashが無料で公開され、性能はProを上回る?
Googleが軽量フラッグシップモデルGemini3Flashを発表。高速・低コストを特徴とし、前世代製品を置き換え、Google検索AIモードとGeminiアプリのデフォルト基盤エンジンとなる。実測で速度3倍向上、価格大幅削減により、企業・開発者向け高コストパフォーマンス選択肢を提供。....
Dec 18, 2025
130.3k
ヘイ・シャオペンがシリコンバレーから帰国した感想:物理的なAIは3年間の爆発期を迎え、人型ロボットが巨大企業同士の激戦になる
小鵬汽車の何小鵬会長は、AI業界にはバブルがなくまだ初期段階にあると指摘。今後3年で物理AIが飛躍し、自動運転は準L4/L4に、人型ロボットも技術的突破が見込まれると述べた。....
Dec 17, 2025
137.7k
