人工知能の大規模モデルの競争において、また一つ新たな実力者を迎えた。最近、メイドゥーはその最新開発したトランザクションパラメータを持つ大規模モデル「LongCat-2.0」を正式に公開し、全面的にオープンソース化することを発表した。これは業界内の技術交流と応用の実現を目的としている。

LongCat-2.0 は国内の計算能力クラスターの強力な可能性を示している。このモデルは5万枚の国内計算能力クラスター上で全プロセスのトレーニングと推論が行われており、国内のソフトウェアとハードウェアが大規模な分散計算において信頼性を証明しただけでなく、業界内での超大規模モデル構築の参考となるモデルを提供した。技術的な仕様では、LongCat-2.0 の総パラメータ数は1.6Tに達しており、動的範囲設計(アクティブパラメータは約48Bで、動的範囲は33Bから56Bまで)を採用している。このような設計により、膨大な知識の蓄積を保ちながら、推論の柔軟性と効率性も確保されている。

データのサポートと文脈処理能力に関して、LongCat-2.0 は優れた性能を見せている。このモデルの事前学習データ量は30Tトークンを超え、中国語と英語の語彙を深くカバーし、多言語および高品質なコードデータも統合しており、異なる分野における論理的理解を実現している。さらに目を引くのは、このモデルが1Mを超える長文文脈をネイティブにサポートしていることであり、これにより長文書の分析や複雑なコードベースの構築などのタスクにおいて、非常に高い一貫性と正確さを維持できる。

今回のメイドゥーによるLongCat-2.0のオープンソース化は、開発者コミュニティに新たな活力をもたらすものである。トランザクションパラメータレベルのオープンソースモデルとして、これはメイドゥーが人工知能の基盤技術開発において継続的に努力を重ねていることを示すだけでなく、国内の大規模モデルエコシステムの繁栄に重要な計算基盤を貢献している。今後、このモデルが広く応用されるにつれて、超長文脈理解に基づいた多くの革新的なAIアプリケーションが登場する見込みである。