このたび、メイティウは混合専門家アーキテクチャを基盤とした大規模な推論モデル「LongCat-Flash-Thinking」を発表しました。この新モデルのパラメータ数は5600億に達し、注目を集めています!しかし最も驚くべき点は、文脈に応じて186億〜313億のパラメータを動的にアクティブ化でき、平均で約270億のパラメータがアクティブ化されることです。このような柔軟な設計により、モデルはさまざまなタスクにおいて優れた性能を発揮しており、特に論理的推論、数学演算およびプログラミングの分野で高い成果を収めています。

メイティウの公式データによると、LongCat-Flash-Thinking はいくつかの主要モデルと比較して、多くのベンチマークテストで詳細な評価が行われました。数学的推論においては、MATH500やAIME25などのテストで優れた結果を示しており、ネイティブツールを使用することでトークン消費量を64.5%削減しながらも、トップクラスの精度を維持できると述べています。また、汎用的な推論(GPQA-Diamond)、コード生成(LiveCodeBench、OJBench)および形式的定理証明(MiniF2F-Test)などの分野でも、業界のリードレベルに近い性能を示しています。

LongCat-Flash-Thinking のモデルウェイトはMITライセンスに基づいてオープンソース化され、開発者はこの強力なツールを自由に使用・研究できます。公式には詳細なチャットテンプレートが提供されており、ユーザーがインタラクティブかつ実践的に利用できる専用チャットサイトも公開されています。
LongCat-Flash-Thinking は単なる大規模なAIモデルだけでなく、メイティウが人工知能研究分野で行っている重要な試みでもあります。その優れた性能と柔軟なアーキテクチャは、今後のアプリケーション開発や研究に新たな可能性をもたらすでしょう。
公式サイト: https://longcat.chat/
