記事本文

研究者がLPM1.0モデルを発表：1枚の画像からリアルタイムでインタラクティブなデジタル人間の動画に変換

公開AI二ュ-ス

時間 :Apr 14, 2026

読む :1分

最近、研究者たちはLPM1.0モデルを正式に公開しました。この研究プロジェクトは、1枚の参照画像を用いて、話す、聞く、歌うなどの行動を含む人物ビデオをリアルタイムで生成することを目的としています。LPM1.0の中心的な突破点は、マルチモーダル処理能力であり、テキスト、音声、画像入力を同時に統合し、正確な口元の同期、繊細な顔の表情、自然な感情の移行を備えた動的な映像を生成できます。このモデルは、ChatGPTやドウバオなどの主要な音声AIに直接接続でき、従来の音声対話を視覚的フィードバックを持つリアルタイムインタラクションにアップグレードします。

技術面では、LPM1.0は「多粒度アイデンティティ条件付き」技術を導入しました。複数の角度と表情を持つ参照素材から詳細を抽出し、歯やシワや横顔の輪郭など複雑な特徴をモデル自身が生成する必要がなくなり、跨スタイル処理能力が大幅に向上しました。写実的な人間の顔、アニメ、3Dゲームキャラクターなど、あらゆる種類の画像に対して、二次トレーニングなしで即時の駆動が可能です。また、このモデルはストリーミング伝送技術をサポートしており、45分以上のビデオ生成においてもシステムの安定性を維持できます。

インタラクティブな論理において、LPM1.0は3つの会話状態を正確に認識できます。聞くときはうなずきや視線のずれなどの反応的な表情を生成し、話すときは音声によって体と口の動きを駆動し、止まっているときはテキスト指令に基づいて自然な暇つぶしの行動を生成します。プロジェクトマネージャーのZeng Ailing氏は、LPM1.0はリアルタイム会話だけでなく、オフライン音声駆動のビデオ生成にも対応していると述べました。これはポッドキャストや映画制作に技術的な冗長性を提供しています。

強力な応用可能性を示したものの、開発チームはLPM1.0が現在は研究プロジェクトであり、公開コードや重みの計画はまだないと強調しています。研究者は、生成されたビデオと本物の映像との間に一定の質的なギャップが存在し、技術自体に潜在するディープフェイク（Deepfake）のリスクも無視できませんと認めています。この研究の意義は、今後のAIシステムの進化方向を明確にしたことにあります。それは、単一の論理的なインタラクションから、感情への応答、目と目での交流、視覚的な身体化を備えた全次元的なインタラクションへの転換です。

OpenAIがAI就業発表会を開催し、6つの業界ワークフロープラグインを発表

OpenAIは『AI就業』発表会でCodexのワークフロープラグインを発表し、株式投資やクリエイティブデザインなどに適したポジション向けに、AIを企業の日常プロセスに深く統合し、知識従業者のタスクを代替する。Codexはプログラミングツールから非プログラミング分野へと拡張され、資本市場から注目されている。

Jun 3, 2026

191.0k

累計でOpenAIに600億ドル以上を投資：孫正義が1000億ドルの資産で再びアジア第1位

孫正義は人工知能ブームによって約1000億ドルの資産で再びアジア第1位となり、ソフトバンクグループの株価はトヨタを上回り、日本の最大上場企業となった。フォーブスのデータによると、ソフトバンクの株価は6月1日に14％上昇し、時価総額が一時48兆円を突破した。6月3日時点で約48.79兆円に達した。

Jun 3, 2026

96.3k

Anthropic、秘密に上場申請を提出　最強のセキュリティを持つ大規模言語モデル「Mythos」が突然内側テストを公開

Anthropicは、最高水準のセキュリティモデル「Myth」のグローバルテストを拡大し、新たに150の機関にプレビュー権限を付与しました。このモデルは、重要なインフラのシステム脆弱性を特定するために設計されており、強力なプログラミングと脆弱性発見能力を持ち、AIセキュリティ分野で両刃の剣と見なされています。....

Jun 3, 2026

101.1k

テンセントと寧徳時代がDeepSeekのシリーズAラウンドに大規模出資、評価額は4000億元に達する見通し

中国のAIスタートアップ企業であるDeepSeekは、初回の大規模資金調達を計画しており、約500億元人民元（約74億ドル）を調達する目標としている。資金調達後、同社の評価額は3500〜4000億元人民元になると予想されている。この企業はV3およびR1モデルによって世界中で注目を集め、中国の大規模モデル開発能力への世間の認識を変えてきた。

Jun 3, 2026

158.2k

まず理解してから実行せよ！ビットでオープンソースの統一フレームワークBerniniがAI映像編集を運任せから解消

ビットスタックがオープンソースで動画生成と編集の統一フレームワークBerniniを開発しました。コアには「まず理解してから生成する」協調メカニズムが採用されており、従来モデルでは複雑なテキスト指示を正確に理解できず、画面の制御不能やフレーム間のちらつきなどの課題に直面していたことを解決し、主体の変形や背景の漂移などのブロックを突破しました。

Jun 3, 2026

155.4k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

研究者がLPM1.0モデルを発表：1枚の画像からリアルタイムでインタラクティブなデジタル人間の動画に変換

関連推奨

OpenAIがAI就業発表会を開催し、6つの業界ワークフロープラグインを発表

累計でOpenAIに600億ドル以上を投資：孫正義が1000億ドルの資産で再びアジア第1位

Anthropic、秘密に上場申請を提出 最強のセキュリティを持つ大規模言語モデル「Mythos」が突然内側テストを公開

テンセントと寧徳時代がDeepSeekのシリーズAラウンドに大規模出資、評価額は4000億元に達する見通し

まず理解してから実行せよ！ビットでオープンソースの統一フレームワークBerniniがAI映像編集を運任せから解消

Anthropic、秘密に上場申請を提出　最強のセキュリティを持つ大規模言語モデル「Mythos」が突然内側テストを公開