バイトダンス、高効率・高解像度ビデオ生成FlashVideoをオープンソース化 忠実度と計算効率のバランスを実現


騰訊元宝が新機能をリリースし、ユーザーは一文または一枚の画像だけで高解像度のビデオを生成できます。HunyuanVideo1.5オープンソースモデルを基盤とし、DiTアーキテクチャを採用し、パラメータ数8.3億個で、5〜10秒間のビデオ生成をサポートし、コンテンツ制作プロセスを簡素化します。
バイトダンスの研究員が機密情報を複数回漏洩し解雇。8万人のフォロワーを持つZhihuで内部開発情報を頻繁に公開し、社内調査を招く。過度な情報共有がキャリア危機に繋がった。....
ByteDanceのAIアシスタントCiciが海外で好調、メキシコGoogleストアで1位、英国Appleストアでトップ10入り。豆包と同時展開の二重ブランド戦略で、開発元はByteDanceと確認。....
最近、マルチモーダルAI分野の先駆けである生数テクノロジーは、数十億人民元規模のAラウンド資金調達を成功させたと発表した。この資金調達はボーハー・キャピタルが主導し、既存の投資家であるバイドゥの戦略投資部門や北京市人工知能産業投資基金などが継続的に参画し、市場が生数テクノロジーに対して高い認知度を持っていることを示している。同社はこの資金を活用してモデルの研究開発と技術革新をさらに推進し、マルチモーダル大規模モデルの潜在能力を探求し、製品の拡大とユーザー向けサービスの加速を目指す。マルチモーダル技術、特にビデオ生成分野は急速に発展しており、生
最近、バイトダンスと香港大学は、新たなオープンソースの視覚的推論モデルであるMini-o3を共同でリリースしました。これは多ラウンドの視覚的言語モデル(VLM)技術における大きな進展を示しています。従来の視覚的言語モデルが1〜2ラウンドの対話しか行えなかったのに対し、Mini-o3はトレーニング時に6ラウンドの対話に制限されていますが、テストでは数十ラウンドまで推論ラウンドを拡張でき、視覚的問題処理の能力を大幅に向上させています。Mini-o3の強みは、困難な視覚検索タスクにおいて深い推論を実現したことにあるのです。