在人工智能領域,大語言模型的"幻覺問題"一直是困擾業界的關鍵挑戰。近日,一項基於HHEM-2.1-Open評估體系的測試結果顯示,智譜AI旗下的GLM-4-9B模型交出了一份令人矚目的成績單。
測試數據顯示,在參與評估的85個大語言模型中,GLM-4-9B以98.7%的事實一致性率和100%的回答率摘得桂冠。特別值得關注的是,該模型的幻覺率僅爲1.3%,這一成績不僅位居榜首,更是超越了行業巨頭OpenAI的GPT系列和Google的Gemini系列模型。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
這一突破性成果標誌着中國大語言模型在降低"幻覺率"方面取得重要進展,爲提升AI應用的可靠性和準確性帶來新的可能。這不僅體現了智譜AI在模型研發上的技術實力,也爲全球AI領域樹立了新的標杆。
在當前AI技術競爭日益激烈的背景下,GLM-4-9B模型的出色表現無疑將爲智譜AI贏得更多關注,同時也爲中國AI企業在國際舞臺上贏得了更多話語權。