Meta 在提高人工智能效率方面邁出了重要一步。這家科技巨頭於本週三發佈了預訓練模型,採用了一種新穎的多標記預測方法(multi-token-prediction),可能改變大型語言模型(LLMs)的開發和部署方式。

image.png

項目入口:https://top.aibase.com/tool/multi-token-prediction

這種新技術首次在 Meta 今年四月的一篇研究論文中提出,與傳統的訓練 LLMs 只預測序列中下一個單詞的方法不同。Meta 的方法要求模型同時預測多個未來單詞,有望提高性能並大幅縮短訓練時間。

Meta 的多標記預測方法可能提供一種抑制這種趨勢的方法,使高級人工智能更易於獲取和可持續。

這種新方法的潛力不僅限於提高效率。通過同時預測多個標記,這些模型可能會對語言結構和上下文產生更細緻的理解。這可能會改善從代碼生成到創意寫作等任務,從而有可能彌合人工智能與人類水平的語言理解之間的差距。

Meta 在Hugging Face 上以非商業研究許可發佈這些模型,這符合該公司對開放科學的承諾。但這也是在競爭日益激烈的人工智能領域採取的一項戰略舉措,開放可以加快創新和人才獲取。

初始版本專注於代碼完成任務,這一選擇反映了人工智能輔助編程工具市場的增長。隨着軟件開發與人工智能的聯繫越來越緊密,Meta 的貢獻可能會加速人機協作編碼的趨勢。