GPT-4を凌駕、20億パラメーターモデルが算術問題でほぼ100％の精度

学術ニュース速報によると、清華大学、TAL AI Lab、智譜AIの研究者らが、大規模言語モデルの数学的推論能力を探るため、20億パラメーターの言語モデル「MathGLM」を開発しました。このモデルはTransformerデコーダアーキテクチャを採用し、大規模な算術データセットで訓練されており、数学演算能力が大幅に向上しています。実験結果によると、MathGLMは様々な算術演算タスクにおいて、正解率がほぼ100％に達し、GPT-4を明らかに上回っています。パラメーター数が1億しかない場合でも、GPT-4やChatGPTを凌駕しています。さらに、パラメーター数の増加に伴い、MathGLMの算術演算能力も向上することが分かりました。複雑な数字形式を含む混合算術演算においても、GPT-4やChatGPTより優れた性能を示しました。この研究は、パラメーター数とデータ量が十分であれば、言語モデルが複雑な数学演算を正確に実行できることを示唆しています。

百度がErnie5.1を発表：事前訓練コストが94％低下、性能は世界のSearchランキング上位4位に到達

百度は2026年5月11日に新世代言語モデルであるErnie5.1を発表しました。2.4兆パラメーターを持つErnie5.0の事前訓練ベースを基盤としています。「一度きりの柔軟なトレーニングフレームワーク」により、単一のトレーニングで複数サイズのモデルを最適化することが可能となり、事前訓練コストは同類モデルの6％にとどまります。5月9日時点でのArena Searchランキングでは、このモデルは1223点で世界第4位、中国第1位を記録し、高いリソース利用効率とパフォーマンスのバランスを示しています。

アップルが新規な FS-DFM モデルを発表。AIによる長文作成効率が128倍向上！

アップルとオハイオ州立大学が共同で FS-DFM モデルをリリースしました。従来のモデルが何千回もイテレーションを行う必要がある長文生成を、わずか8回のイテレーションで実現可能にし、書き込み速度は最大128倍向上しました。このモデルは、ChatGPTなどの逐文字生成を行う自己回帰モデルとは異なり、離散フロー整合技術を採用しています。

GPT-4を凌駕、20億パラメーターモデルが算術問題でほぼ100％の精度

関連推奨

百度がErnie5.1を発表：事前訓練コストが94％低下、性能は世界のSearchランキング上位4位に到達

アリババ・テンセントQwen3-Maxが公式ウェブサイトでディープシンキング機能をリリース

アップルが新規な FS-DFM モデルを発表。AIによる長文作成効率が128倍向上！

アリババがトレンドパラメータ言語モデル「Ling-1T」を発表。推論速度と能力が業界の新たな基準を示す

グーグルDeepMindがVaultGemmaを発表。差分プライバシーに対応

GPT-4を凌駕、20億パラメーターモデルが算術問題でほぼ100％の精度

関連推奨

百度がErnie5.1を発表：事前訓練コストが94％低下、性能は世界のSearchランキング上位4位に到達

アリババ・テンセントQwen3-Maxが公式ウェブサイトでディープシンキング機能をリリース

​アップルが新規な FS-DFM モデルを発表。AIによる長文作成効率が128倍向上！

アリババがトレンドパラメータ言語モデル「Ling-1T」を発表。推論速度と能力が業界の新たな基準を示す

グーグルDeepMindがVaultGemmaを発表。差分プライバシーに対応

アップルが新規な FS-DFM モデルを発表。AIによる長文作成効率が128倍向上！