瑞士的科研機構正在聯手挑戰大型語言模型的“黑箱”現狀。瑞士聯邦理工學院洛桑分校(EPFL)、**蘇黎世聯邦理工學院(ETH Zurich)以及瑞士國家超級計算中心(CSCS)**近日發佈了一款名爲 Apertus 的大規模開源語言模型。該模型不僅在名稱上——拉丁語意爲“開放”——彰顯了其核心理念,更在實踐中將“開放”做到了極致。

與OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude等美國主流模型不同,Apertus以其史無前例的透明度脫穎而出。它公開了從模型權重、架構、訓練代碼、數據配方,到完整的訓練過程文檔的所有關鍵信息,毫不保留。這種完全透明的發佈方式,旨在促進全球範圍內的合作與創新,讓研究人員和開發者能夠深入理解模型的工作原理,並在此基礎上進行改進與優化。
Apertus的發佈,標誌着瑞士在推動人工智能研究開放性與可復現性方面邁出了重要一步,爲行業樹立了新的標杆。
