最近、The Intercept、Raw Story、AlterNetの3つのニュース機関が、OpenAIとMicrosoftを著作権侵害で訴えました。ChatGPTが、場合によっては著作権で保護されたニュース記事をほぼそのまま複製することがあると主張しています。マルチモーダル大規模言語モデルは、テキスト、画像、動画コンテンツを含む、将来の大規模言語モデル分野の主流トレンドになると予想されています。AI政策の相次ぐ発表により、高品質なデータセットとトレーニングデータの著作権への関心が集まっており、将来は質の高いトレーニングデータベースの価値が高まると予想されます。また、中信出版は、大規模言語モデル企業と協力して言語トレーニングを行っており、视觉中国はAIGC時代におけるデジタルコンテンツ取引、著作権が明確なデータ、豊富な著作権管理経験というコアな強みを持っています。
関連推奨
JanチームがJan-v2-VL-Maxをリリース!30Bのマルチモーダルモデルが長期間のエージェントタスクに特化しており、長時間のシーケンス処理でGemini 2.5 Proを上回る
Janチームは300億パラメータを持つマルチモーダル大規模モデルJan-v2-VL-Maxをリリースしました。このモデルは長期的な高安定性の自動化タスクに特化しており、GoogleのGemini 2.5 ProやDeepSeek R1を上回る性能を持っています。このモデルは、複数ステップのタスクにおける誤差累積や焦点の喪失といった問題を重点的に解決し、オープンソースのスマートエージェントエコシステムに強力な支援を提供します。
長距離型AI登場:JanチームがJan-v2-VLを発表、マルチステップタスクの実行能力を深く最適化
Janチームが30Bパラメータのマルチモーダルモデル「Jan-v2-VL-Max」を発表。LoRAベースのRLVR技術を導入し、複雑な自動化タスクにおける中断問題を解決し、長周期タスクの安定性を向上させます。....
ZhiPuがオープンソースしたGLM-4.6Vシリーズ:106BのネイティブなFunction Callをサポートし、軽量版の9Bは無料で商用利用可能
智譜がマルチモーダル大規模モデルGLM-4.6Vシリーズをオープンソース化。128kトークンのコンテキストウィンドウを実現し、視覚理解精度は同規模で最高水準。初のネイティブFunction Call統合により、視覚認識から実行可能なアクションまで一貫した処理が可能に。API価格を大幅値下げ、軽量版は完全無料でGLM Coding Planに統済。....
智源研究院が世界最強のマルチモーダル世界モデル「Emu3.5」を発表。リアルな世界の次の瞬間をワンクリックで予測!
北京智源AI研究院が発表したEmu3.5は、物理的理解と因果推論を強化し、AIが単なる生成から現実世界の理解へ進化する「世界統一モデリング」を実現。....
小米が7BマルチモーダルモデルMiMo-VLをオープンソース化し、AIアシスタントのMilocoで家電を自動調整
小米は7Bパラメータのマルチモーダルモデル「Xiaomi-MiMo-VL-Miloco-7B-GGUF」とスマートホームマネージャー「Xiaomi Miloco」を発表。米家カメラによるリアルタイムの行動・ジェスチャー認識でスマート家電を自動連携。Home Assistant対応、NVIDIA GPU/Dockerで商用利用不可のオープンソースとして提供。....
