最近,SnorkelAI 在其 AI 數據開發平臺 Snorkel Flow 上推出了一系列新功能,旨在幫助企業加速 AI 和機器學習模型的專門化。這些新功能能夠顯著減少在預測和生成 AI 開發生命週期中數據準備的時間、成本和複雜性。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
在當今企業中,擁有 “AI-ready data”(適合 AI 的數據)是至關重要的。根據 Gartner 的說法,AI-ready data 不僅僅是指你的數據需要代表特定的用例,還必須涵蓋每種模式、錯誤、異常和意外情況,以便有效訓練或運行 AI 模型。而且,數據的準備並不是一蹴而就的,而是需要持續進行的。
Snorkel Flow 的新版本爲企業提供了一個強大的平臺,以實施和擴展 AI 數據開發實踐,從而加快高精度、專門化 AI 模型的生產交付。
具體來說,新功能包括 LLM 評估工具,讓用戶可以針對特定行業用例進行定製評估,從而深入瞭解模型錯誤類型並能快速介入數據開發進行修復。此外,還有 RAG 調優工作流,通過先進的文檔塊處理、嵌入模型的微調和文檔元數據提取來提升檢索準確性。這些功能能夠顯著縮短改進 AI 助手響應質量所需的開發時間。
而針對 PDF 文件的新命名實體識別(NER)功能,用戶只需點擊文字、繪製邊界框、指定模式並提示基礎模型,就能更輕鬆、更快速地提取信息。這種靈活性使得信息捕捉更加簡便,從而提升了 NER 模型的準確性。
另外,Snorkel Flow 還簡化了註釋和反饋流程,使得專家能以更加高效的方式進行數據標註。此外,新增加的序列標記分析工具能夠幫助用戶更直觀地發現模型預測中的錯誤,同時提供更細緻的性能分析。
在用戶體驗方面,Snorkel Flow 進行了一系列優化,使得數據科學家和專家之間的協作更加流暢。它支持與主要的 AI 開發平臺無縫集成,包括 Databricks 和 Amazon SageMaker,以便更快速地微調和部署專門化模型。
Snorkel AI 的首席執行官 Alex Ratner 表示:“AI 已經成爲每位企業領導的優先事項,但持續且一致的 AI 開發工作仍然非常繁瑣、成本高昂且需要大量人工。因此,這些平臺的更新對於幫助企業加速和優化 AI 解決方案的交付至關重要。”
劃重點:
🌟 新功能:Snorkel Flow 推出 LLM 評估工具和 RAG 調優工作流,提升數據準備效率。
📄 便捷提取:新命名實體識別功能使得從 PDF 中提取信息更簡單快速。
🤝 優化體驗:用戶體驗提升,促進數據科學家與專家之間的高效協作。