最近、大規模モデルスタートアップ企業のKimi(月の暗面)が発表した最新の技術論文「Attention Residuals: Rethinking depth-wise aggregation」が業界内で広く注目を集めています。テスラCEOのイーロン・マスク(Elon Musk)はソーシャルメディアでこの研究成果を公開して賛辞し、「Kimiからの素晴らしい仕事(Impressive work)」と評価しました。
これに対して、Kimiの公式アカウントは対応し、マスクの「ロケットを作るのがとても上手だ」と称賛し、このクロスオーバーのやり取りは世界中のAI技術コミュニティで話題となりました。

Kimiが今回の研究で提案した新たな「注目残差」(Attention Residuals)方法は、大規模モデルにおいて長年使用されてきた固定された累積残差接続のパターンに挑戦し、改善することを目的としています。この技術は、従来の再帰構造に代わって、より柔軟な深さ方向の集約メカニズムを導入しています。この革新により、モデルは非常に複雑な文脈情報を処理する際に、元の計算経路の制限を打ち破ることができ、長期間のデータの表現精度と処理効率を著しく向上させることができます。
