記事本文

バイトダンス、高効率・高解像度ビデオ生成FlashVideoをオープンソース化　忠実度と計算効率のバランスを実現

公開AI二ュ-ス

時間 :Feb 17, 2025

読む :1分

先日、バイトダンスは、FlashVideoと呼ばれる新しい2段階ビデオモデルを発表しました。この技術は独自の2段階アーキテクチャにより、ビデオ生成の品質を維持しながら計算コストを大幅に削減し、ダイナミック顔パーソナライズなどのシナリオに効率的なソリューションを提供します。技術的ブレークスルー：階層型最適化で業界の課題を解決現在の主流であるDiT拡散モデルは、テキストからビデオ生成の分野で優れたパフォーマンスを示していますが、そのシングルステージアーキテクチャには顕著な欠点があります。高解像度出力におけるディテールの精度を追求するために、膨大な計算リソースを消費することが多く、…

騰訊元宝が新機能をリリース：一文または一枚の画像でビデオを生成できます！

騰訊元宝が新機能をリリースし、ユーザーは一文または一枚の画像だけで高解像度のビデオを生成できます。HunyuanVideo1.5オープンソースモデルを基盤とし、DiTアーキテクチャを採用し、パラメータ数8.3億個で、5〜10秒間のビデオ生成をサポートし、コンテンツ制作プロセスを簡素化します。

Nov 21, 2025

99.2k

バイトダンスの大規模モデル研究者が情報漏洩で解雇！知乎でロボット開発の詳細を頻繁に暴露していた。会社が情報セキュリティを厳しく整備

バイトダンスの研究員が機密情報を複数回漏洩し解雇。8万人のフォロワーを持つZhihuで内部開発情報を頻繁に公開し、社内調査を招く。過度な情報共有がキャリア危機に繋がった。....

Nov 13, 2025

157.4k

バイトダンスAIアシスタントのCiciが海外の多くの国でのアプリランキングでトップに：国内のドウバオとは2つのブランド戦略を採用

ByteDanceのAIアシスタントCiciが海外で好調、メキシコGoogleストアで1位、英国Appleストアでトップ10入り。豆包と同時展開の二重ブランド戦略で、開発元はByteDanceと確認。....

Oct 21, 2025

151.8k

生数テクノロジーが数十億人民元の資金調達を達成し、ビデオ生成がAI商業化の新トレンドをリード

最近、マルチモーダルAI分野の先駆けである生数テクノロジーは、数十億人民元規模のAラウンド資金調達を成功させたと発表した。この資金調達はボーハー・キャピタルが主導し、既存の投資家であるバイドゥの戦略投資部門や北京市人工知能産業投資基金などが継続的に参画し、市場が生数テクノロジーに対して高い認知度を持っていることを示している。同社はこの資金を活用してモデルの研究開発と技術革新をさらに推進し、マルチモーダル大規模モデルの潜在能力を探求し、製品の拡大とユーザー向けサービスの加速を目指す。マルチモーダル技術、特にビデオ生成分野は急速に発展しており、生

Sep 19, 2025

144.2k

伝統を打ち破る！Mini-o3 オープンソースモデルが超長時間の視覚的推論を実現　深層的な思考はもう難しくない

最近、バイトダンスと香港大学は、新たなオープンソースの視覚的推論モデルであるMini-o3を共同でリリースしました。これは多ラウンドの視覚的言語モデル（VLM）技術における大きな進展を示しています。従来の視覚的言語モデルが1〜2ラウンドの対話しか行えなかったのに対し、Mini-o3はトレーニング時に6ラウンドの対話に制限されていますが、テストでは数十ラウンドまで推論ラウンドを拡張でき、視覚的問題処理の能力を大幅に向上させています。Mini-o3の強みは、困難な視覚検索タスクにおいて深い推論を実現したことにあるのです。

Sep 16, 2025

144.2k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

バイトダンス、高効率・高解像度ビデオ生成FlashVideoをオープンソース化 忠実度と計算効率のバランスを実現