最近、The Intercept、Raw Story、AlterNetの3つのニュース機関が、OpenAIとMicrosoftを著作権侵害で訴えました。ChatGPTが、場合によっては著作権で保護されたニュース記事をほぼそのまま複製することがあると主張しています。マルチモーダル大規模言語モデルは、テキスト、画像、動画コンテンツを含む、将来の大規模言語モデル分野の主流トレンドになると予想されています。AI政策の相次ぐ発表により、高品質なデータセットとトレーニングデータの著作権への関心が集まっており、将来は質の高いトレーニングデータベースの価値が高まると予想されます。また、中信出版は、大規模言語モデル企業と協力して言語トレーニングを行っており、视觉中国はAIGC時代におけるデジタルコンテンツ取引、著作権が明確なデータ、豊富な著作権管理経験というコアな強みを持っています。
関連推奨
テンセントが身体的マルチモーダル大規模モデル HY-Embodied-0.5-X を発表し、ロボットのスマートなインタラクションをサポート
テンセント Robotics X とホンユアンチームは共同で HY-Embodied-0.5-X マルチモーダル大規模モデルを開源しました。このモデルはロボットの身体的タスクに特化して最適化されています。MoT-2Bアーキテクチャに基づき、「見る」「考える」「行う」能力を強化しており、細かい操作、空間推論、動作予測、リスク判断において優れた性能を発揮します。このシリーズには MoT-2B および MoE-32B の2つのバージョンがあり、現実的な環境でのロボットの知能的なインターフェースレベルを向上させることを目的としています。
アリババのATH事業グループが開発したハッピーハースモデルがAI動画ランキングで首位に、EloスコアでSeedance2.0を上回る
国内のマルチモーダルモデル「HappyHorse-1.0」は、テキストから動画への評価において1332点を獲得し、ビーティーのモデルに約60ポイントの差をつけて首位に輝きました。その海外のSNSアカウントの最初のフォロワーはアリババであり、その開発背景を示唆しています。
上級レコード会社とSunoはAI音楽の著作権交渉で膠着状態に
世界トップレベルのレコード会社とAI音楽スタートアップのSunoは、AI生成音楽の著作権ライセンスに関する交渉で膠着状態に陥っており、アーティストの権利を保護する点で意見の食い違いがあり、現在まで明確な解決策は見つかっていない。
メイドゥーがネイティブマルチモーダルLongCat-Nextを発表:視覚と音声の下層統一を実現
美团が発表したLongCat-Nextは、従来の「言語基盤+プラグイン」アーキテクチャを超え、DiNA技術で画像・音声・テキストを統一トークン化し、AIの物理世界の「見る」「聞く」能力を実現、多モーダルモデリングの深い統合を達成。....
Qwen3.5-Omniが画期的にリリースされました:215項目のSOTAにより、全感覚AI時代を切り開く
Tongyi Labはマルチモーダル大規模モデルであるQwen3.5-Omniを発表しました。このモデルは理解力、インタラクティブ性、およびタスク実行能力において飛躍的な進化を遂げ、AIが「スクリーンアシスタント」から「物理世界を理解するインテリジェントなエージェント」へと進化するきっかけとなります。このモデルは「ネイティブフルモーダル」アーキテクチャを採用し、テキスト、画像、音声、ビデオの入力をシームレスに処理でき、音声・動画分析、推論、会話および翻訳のテストで優れたパフォーマンスを示します。
