昆仑万维の天工大規模言語モデル

昆仑万維は、自社開発の天工大規模言語モデルがBenchmark GSM8Kテストにおいて80%の正解率を達成し、GPT-3.5やLLaMA2-70Bを上回り、世界トップレベルに達し、GPT-4に迫る性能を示したと発表しました。

天工大規模言語モデルは、MMLU、C-EVAL、HumanEvalなど複数のデータセットにおいても優れた性能を発揮し、他の主要な大規模言語モデルよりも高い精度を達成しています。

推論能力においては、GPT-3.5やLLaMA2-70Bを上回り、GPT-3.5と比較して、天工大規模言語モデルはよりシンプルで分かりやすい解法を示します。

現在、天工大規模言語モデルは内部テスト段階にあり、今後も技術力の向上に努め、ユーザーと企業に強力なインテリジェントな支援を提供していきます。