微軟推出Phi-4生成式AI模型改進數學能力與訓練數據質量

微軟宣佈，其Phi系列生成式AI模型迎來了新成員——Phi-4。與之前的版本相比，Phi-4在多個方面有所改進，尤其在數學問題的解決能力上表現突出，這得益於訓練數據質量的提升。

截至週四晚上，Phi-4的訪問權限相對有限，僅在微軟最新推出的Azure AI Foundry開發平臺上可用，且僅限於微軟研究許可協議下的研究用途。

人工智能大腦，大模型

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

Phi-4是微軟推出的最新小型語言模型，擁有140億個參數。與其他小型模型如GPT-4o mini、Gemini2.0Flash和Claude3.5Haiku相當，這些小型模型通常具有更快的運行速度和更低的成本，而在過去幾年中，小型語言模型的性能也在持續提升。

微軟將Phi-4的性能提升歸因於使用了“高質量合成數據集”以及來自人類生成內容的高質量數據集，並進行了未公開的訓練後改進。

如今，許多人工智能實驗室正在密切關注合成數據和後訓練在提升模型性能方面的潛力。Scale AI的首席執行官Alexandr Wang在週四的推文中提到:“我們已經到達了訓練前數據瓶頸。”這一說法也證實了近期關於該話題的一些報告。

此外，值得注意的是，Phi-4是微軟AI副總裁Sébastien Bubeck離職後推出的首款Phi系列模型。Bubeck在微軟AI領域扮演了重要角色，並且是Phi模型開發的關鍵人物。Bubeck於10月離開微軟，加入了OpenAI。

Suno源代碼遭泄露:黑客曝光其大規模抓取音樂數據訓練AI模型