阿里巴巴的"通義千問"團隊又搞了個大新聞!他們剛剛放出了Qwen2Math Demo,這個數學模型簡直是個小怪獸,連GPT-4都被它踩在腳下。
這個模型不僅能處理文字輸入的數學問題,還能讀懂圖片和截圖中的公式。想象一下,你拍個算式的照片,它就能給你解答,簡直就是數學課上的做題神器啊!(當然,我們並不提倡作弊哦)

Qwen2-Math推出了三個版本:72B、7B和1.5B。其中72B版本簡直是個數學天才,在MATH數據集上居然比GPT-4多得了7分,提高了9.6%。這就好比高考數學你考了145分,而你旁邊的學霸只考了132分。
更厲害的是,7B版本用不到十分之一的參數量,就超過了72B的開源數學模型NuminaMath。要知道,NuminaMath可是在全球首屆AIMO中獲獎的模型,獎項還是由數學界的"頂級大佬"陶哲軒親自頒發的。
阿里的高級算法專家林俊暘興奮地宣佈,他們把Qwen2模型變成了一個數學高手。怎麼做到的呢?他們用了一個特製的"數學補腦液"——精心設計的數學專用語料庫。這個"補腦液"包含了大量高質量的數學網絡文本、書籍、代碼、考試題目,甚至還有Qwen2模型自己"編"的數學題。
結果呢?在GSM8K、MATH等經典數學測試集上,Qwen2-Math-72B把405B的Llama-3.1都甩在了身後。這些測試集可不是鬧着玩的,裏面有代數、幾何、概率、數論等各種數學難題。
不僅如此,Qwen2-Math還挑戰了中文數據集CMATH和高考試題。在中文數據集上,連1.5B版本都能吊打70B的Llama3.1。而且,無論哪個版本,相比同規模的Qwen2基礎模型,成績都有明顯提升。
看來,"通義千問"這次是真的問出了一個數學天才啊!以後做數學題,我們是不是可以問問它了?不過記住,這只是個工具,可別被它的聰明才智迷惑了眼睛,自己的數學功底還是得好好練啊!
在線體驗地址:https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo
