通義千問數學模型Qwen2 Math Demo放出，72B版吊打GPT-4

阿里巴巴的"通義千問"團隊又搞了個大新聞!他們剛剛放出了Qwen2Math Demo，這個數學模型簡直是個小怪獸，連GPT-4都被它踩在腳下。

這個模型不僅能處理文字輸入的數學問題，還能讀懂圖片和截圖中的公式。想象一下，你拍個算式的照片，它就能給你解答，簡直就是數學課上的做題神器啊!（當然，我們並不提倡作弊哦）

Qwen2-Math推出了三個版本:72B、7B和1.5B。其中72B版本簡直是個數學天才，在MATH數據集上居然比GPT-4多得了7分，提高了9.6%。這就好比高考數學你考了145分，而你旁邊的學霸只考了132分。

更厲害的是，7B版本用不到十分之一的參數量，就超過了72B的開源數學模型NuminaMath。要知道，NuminaMath可是在全球首屆AIMO中獲獎的模型，獎項還是由數學界的"頂級大佬"陶哲軒親自頒發的。

阿里的高級算法專家林俊暘興奮地宣佈，他們把Qwen2模型變成了一個數學高手。怎麼做到的呢?他們用了一個特製的"數學補腦液"——精心設計的數學專用語料庫。這個"補腦液"包含了大量高質量的數學網絡文本、書籍、代碼、考試題目，甚至還有Qwen2模型自己"編"的數學題。

結果呢?在GSM8K、MATH等經典數學測試集上，Qwen2-Math-72B把405B的Llama-3.1都甩在了身後。這些測試集可不是鬧着玩的，裏面有代數、幾何、概率、數論等各種數學難題。

不僅如此，Qwen2-Math還挑戰了中文數據集CMATH和高考試題。在中文數據集上，連1.5B版本都能吊打70B的Llama3.1。而且，無論哪個版本，相比同規模的Qwen2基礎模型，成績都有明顯提升。

看來，"通義千問"這次是真的問出了一個數學天才啊!以後做數學題，我們是不是可以問問它了?不過記住，這只是個工具，可別被它的聰明才智迷惑了眼睛，自己的數學功底還是得好好練啊!

在線體驗地址：https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

阿里新一代大模型千問3. 8 將至：預覽版搶先登陸阿里雲與Qoder，正式版擬近期開源

國內大模型開源節奏持續加快。阿里即將發佈並開源新一代通義千問3.8，預覽版Qwen3.8-Max已率先上線阿里雲Token Plan、Qoder及QoderWork三平臺，用戶可提前體驗其能力邊界，正式版近期推出。此舉進一步推動通義千問家族在開源賽道上的迭代與佈局。

通義千問正式接入蘋果生態，國內Apple智能體驗迎來重磅升級

阿里巴巴確認，自研大模型通義千問已接入Apple智能，將全面集成至中國區iPhone、iPad、Mac和Vision Pro等設備。屆時用戶可在iOS、iPadOS、macOS、visionOS系統層直接調用，實現圖文深度理解與高質量生成等智能操作，徹底告別以往需要頻繁切換的繁瑣體驗。

豆包千問同日下線智能體功能，國內首部AI擬人化互動服務新規今起正式施行

字節跳動豆包、阿里通義千問今日下線智能體功能，用戶無法新建或調用。下線日恰逢《人工智能擬人化互動服務管理暫行辦法》施行。該辦法由五部門聯合發佈，系我國首部專門立法，不搞“一刀切”，重點盯防虛擬伴侶等擬人化互動。

阿里新一代大模型千問3. 8 將至：預覽版搶先登陸阿里雲與Qoder，正式版擬近期開源