數據顯示,xAI 團隊的Grok-2和 Grok-Mini 這兩款模型正式躋身 LMSys 聊天機器人Arena排行榜,其中Grok-2以第二名的佳績脫穎而出,這一表現超過了 OpenAI 的 GPT-4o(5月份),與最新的 Gemini 模型並列,由超過6000名社區用戶的積極投票支持。

值得一提的是,Grok-2在數學任務方面表現尤其出色,榮獲該類別的第一名,同時在多個其他任務中也取得了第二名的優異成績,包括複雜提示、編程和遵循指令等。相較之下,Grok-2-Mini 則以第五名的成績進入排行榜,展現了其不俗的實力。
Grok-2-Mini 也經歷了顯著的速度提升,現如今的運行速度是之前的兩倍。這一飛躍的改進源自於 xAI 的推理團隊,他們徹底重寫了推理堆棧,利用 SGLang 實現了更高效的多主機推理和精確度的提升。同時,團隊還引入了新的計算和通信內核算法,以及更優的批處理調度和量化技術,進一步提升了模型的整體性能。
儘管有些人對 Grok-2的表現持懷疑態度,認爲 OpenAI 的 GPT-4o 更爲出色,但在實際使用中,許多用戶紛紛表示 Grok-2在編程和數學任務上確實表現得相當出色。Grok-2系列模型本月以測試版發佈,用戶還可以通過 X 平臺進行體驗,此外,該模型還支持使用 FLUX.1圖像生成模型進行圖像創作。
劃重點:
✨ Grok-2在 LMSys 聊天機器人排行榜中獲得第二名,超過 GPT-4o(五月份),與 Gemini 並排第二。
🚀 Grok-2在數學任務上表現優秀,獲得第一名,同時在其他多個任務中也名列前茅。
💡 Grok-2-Mini 實現速度提升,是之前速度的兩倍,進一步增強了性能表現。
