崑崙萬維表示,其自研的天工大模型在 Benchmark GSM8K 測試中取得了 80% 的正確率,超過了 GPT-3.5 和 LLaMA2-70B,達到了全球領先水平,接近於 GPT-4。天工大模型還在 MMLU、C-EVAL、HumanEval 等多個數據集上表現出色,準確率均高於其他主流大模型。天工大模型的推理能力超過了 GPT-3.5 和 LLaMA2-70B,與 GPT-3.5 相比,天工大模型的解題思路更爲簡單、清晰。天工大模型目前仍處於內測階段,將持續提升技術實力,爲用戶和企業提供強大的智能化助力。