AIbaseの報道によると、DeepSeek-R1のリリースから1周年を迎える中、DeepSeekの次世代エンドモデルの手がかりが静かに浮かび上がっています。The Informationのリークを踏まえると、この注目されている新モデル(おそらくDeepSeek V4)は、今年2月中旬(旧暦の新年期間中)に正式に登場する予定で、より強力なコード生成能力を提供すると予想されています。

開発者らは、DeepSeekのGitHubリポジトリで更新されたFlashMLAコードベースを発見し、114ファイルにまたがる28箇所で「MODEL1」という謎の識別子が参照されていることがわかりました。コードの論理からは、「MODEL1」は現在の「V32」(DeepSeek-V3.2)とは異なる新たなアーキテクチャであることが示されています。これらの2つのモデルの主な違いは、キー・バリュー(KV)キャッシュの配置、スパーシティ処理方法、およびFP8データ形式のデコードサポートにあり、これは新モデルがメモリ最適化や計算効率に関して下位レベルの再構築を行ったことを示しています。
以前には、DeepSeekチームは「最適化された残差接続(mHC)」や生物学的インスピレーションに基づいた「AI記憶モジュール(Engram)」に関する技術論文を順次公開してきました。業界では、これらの最新の研究成果がおそらく現在開発中の「MODEL1」に統合され、今後発表されるこの新しいエンドモデルに主要な技術的支援を提供するものと推測されています。
