テンセント、新たな画像から動画生成モデルHunyuanVideo-I2Vをオープンソース化

テンセントは、新たに開発した画像から動画を生成するフレームワーク「HunyuanVideo-I2V」をオープンソースとして公開することを発表しました。このモデルの公開は、HunyuanVideoのオープンソース化に続く重要な進展であり、オープンソースコミュニティの更なる発展を促進することを目指しています。

HunyuanVideo-I2Vは、高度な動画生成技術を組み合わせることで、静止画を生き生きとした動画に変換でき、クリエイターに新たな可能性を提供します。

HunyuanVideo-I2Vは、事前学習済みのマルチモーダル大規模言語モデルをテキストエンコーダーとして利用することで、入力画像のセマンティックな内容に対する理解能力を大幅に向上させています。つまり、ユーザーが入力した画像からモデルがセマンティックな画像タグを生成し、これらのタグと動画の潜在的なタグを組み合わせることで、より包括的なフルアテンション計算を実現します。この方法により、システムは画像とテキストのモーダル間の協調作用を最大限に発揮し、静止画から生成される動画の内容がより一貫性があり、リアルなものになるよう保証します。

HunyuanVideo-I2Vを使用して動画を生成したいユーザーのために、テンセントは詳細なインストールガイドと使用方法を提供しています。ユーザーは一定のハードウェア要件を満たす必要があり、最適な動画生成品質を実現するには、少なくとも80GBのVRAMを搭載したNVIDIA GPUを使用することを推奨しています。また、最大720Pの解像度と129フレーム（約5秒）の長尺動画生成に対応しています。

ユーザーがより効果的にこのモデルを使用できるように、テンセントはいくつかのヒントも共有しています。例えば、プロンプトを作成する際には簡潔さを心がけ、動画の主なテーマ、アクション、背景など、主要な要素を網羅するようにしてください。

プロジェクト：https://github.com/Tencent/HunyuanVideo-I2V?tab=readme-ov-file

画像だけで空も陸も自由自在、ViduのAI動画がここまで来た？

清華大学系出身の生数科技が「主体参照」機能を発表。一枚の画像だけで、異なる背景を持つ動画を生成できる「動画魔法」のような機能です。この機能は、動画内の単一キャラクターの顔、半身、全身を統一的に保つことができ、操作も簡単です。必要な部分の鮮明な画像を切り取り、主体の特定部分を必要に応じて一貫性を保ちます。この革新は、動画生成の自由度と制御力を向上させ、従来の方法では詳細が不安定になりがちなコンテンツの崩壊問題を回避することを目指しています。ユーザーは、AIbaseテストのように、様々なシーンでキャラクターの表現を簡単に調整できます。

テンセントHunYuan文による画像生成大規模モデルのトレーニングコードをオープンソースで公開、LoRAとControlNetプラグインも提供

テンセントのHunYuan文による画像生成大規模モデル（HunYuan DiTモデル）のトレーニングコードが全面的にオープンソース化されました。LoRAプラグインとControlNetプラグインも含まれています。LoRAは大規模言語モデルを微調整するための技術であり、元のモデルを変更したり、モデルサイズを増やすことなく、少量のデータを使用して特定の特性を持つモデルをトレーニングできます。

OpenAI、macOS版ChatGPTをアップデート：IDE内で直接コード編集が可能に

OpenAIは先日、macOS版ChatGPTに主要な新機能を追加したと発表しました。ユーザーはIDE内で直接コードを編集できるようになりました。現時点では、Plus、Pro、Teamサブスクリプションユーザーのみに利用可能です。Xプラットフォームのツイートによると、このアップデートにより、ChatGPTは会話ツールから開発者の生産性向上ツールへと進化しました。OpenAIはX上で、「macOS対応のChatGPTは、IDE内でコードを直接編集できるようになりました」と発表しています。対応IDEは…

YCの現孵化企業の4分の1はAI生成コードを使用

人工知能技術の急速な発展に伴い、AIによるコード生成に依存する開発者が増加しています。この傾向は、シリコンバレーの著名なスタートアップアクセラレーターであるY Combinator（YC）の最新のスタートアップ企業において特に顕著です。YCのマネージングパートナーであるJared Friedman氏は、最近YouTubeで公開された対談の中で、2025年冬季バッチ（W25）のスタートアップ企業の4分の1が、コードベースの95％を人工知能によって生成していると明らかにしました。Friedman氏は、明確化のために...

Light-R1-32B：低コスト高性能な数学問題解決の新星登場