近日,瑞士聯邦理工學院洛桑分校(EPFL)、蘇黎世聯邦理工學院(ETH Zurich)以及瑞士國家超級計算中心(CSCS)聯合發佈了一個名爲 “Apertus” 的大規模開源語言模型。該模型的名字在拉丁語中意爲 “開放”,而其開發理念恰恰體現了這一精神。
與當前市場上如 OpenAI 的 GPT 系列、Meta 的 Llama 和 Anthropic 的 Claude 等美國大型模型相比,Apertus 不僅注重技術本身,更以其透明度贏得了廣泛的關注。這款模型的所有內容,包括模型權重、架構設計、訓練代碼以及數據來源等,全部實現了公開,甚至連訓練過程的完整文檔也毫無保留。這種 “開放” 策略讓 Apertus 成爲了一個值得期待的新選擇。
在這個 AI 快速發展的時代,“數據黑箱” 的現象依然普遍存在。許多大型科技公司在發佈他們的模型時,往往對外界隱瞞了大量關鍵細節,導致了行業的不信任感。而 Apertus 則打破了這一常規,力求通過開源的方式來促進技術的共享與合作。研究人員和開發者們可以在此基礎上進行創新與改進,推動整個行業的進步。
這項研究的團隊表示,Apertus 的推出不僅旨在爲研究提供便利,更希望激勵全球的 AI 研究者和開發者共同參與到開源生態中來。通過這種方式,Apertus 希望能夠降低 AI 技術的門檻,讓更多的人能夠參與到 AI 的開發和應用中,從而加速科技進步。
Apertus 的出現標誌着瑞士在全球 AI 領域的一次重要嘗試,預示着未來可能會有更多類似的開源項目涌現,推動整個行業向前發展。隨着這一項目的持續推進,我們期待看到更多的創新和突破。
