艾倫人工智能研究所(AI2)發佈了名爲 Dolma 的開放式文本數據集,旨在促進 AI 語言模型的透明度和創新。Dolma 作爲 AI2 開放式語言模型 (OLMo) 計劃的核心,將爲研究人員和開發者提供免費的數據資源,以支持更廣泛的 AI 研究。Dolma 不僅是一個規模龐大的開放數據集,擁有 30 億標記,而且使用和許可方面也非常簡便。AI2 採用了 “中風險成果的 ImpACT 許可證”,並鼓勵用戶提供聯繫信息和使用情況。該數據集的開放爲研究人員和開發者提供了更多的資源,將推動 AI 領域走向更加透明和合作的未來。