最近,微軟的研究人員提出了一種名爲 Auto Evol-Instruct 的全新 AI 框架,這個框架可以自動演進指導數據集,無需任何人爲干預。

在人工智能領域,大型語言模型(LLMs)的發展至關重要,尤其是在提高這些模型遵循詳細指令的能力方面。研究人員一直在探索如何改進用於訓練 LLMs 的數據集,以提高模型的性能和適應性。

image.png

傳統的演進方法如Evol-Instruct依賴於人類專家指定的演進規則,這不僅昂貴耗時,而且在適應新任務時需要重新設計方法。相比之下,Auto Evol-Instruct通過首先使用LLMs分析輸入指令,並自主設計演進規則的初始方法,實現了自動化演進過程。隨後,通過優化器LLMs對演進方法進行迭代優化,識別和解決演進過程中的問題,確保最終的演進指令複雜性和穩定性。

Auto Evol-Instruct 通過自動分析輸入指令並制定演進規則,利用 LLMs 設計演進方法,從而提高數據集的複雜性和多樣性。

在性能評估方面,Auto Evol-Instruct在多個基準測試中表現出色。例如,僅使用10K個演進的ShareGPT數據對Mixtral-8x7B進行微調,框架在MT-Bench上達到了8.09分,在AlpacaEval上達到了91.4分,超過了GPT-3.5-Turbo和WizardLM-70B,並與Claude2.0相當。

此外,通過僅使用7K個演進的GSM8K訓練數據,框架在GSM8K上達到了82.49分,在代碼生成方面,通過使用20K個演進的Code Alpaca對DeepSeek-Coder-Base-33B進行微調,框架在HumanEval上達到了77.4分,超過了其他競爭模型。

image.png

可見,這個全新的框架在多個基準測試中表現出色,包括 MT-Bench、AlpacaEval、GSM8K 和 HumanEval,展現出其在提高指令遵循、數學推理和代碼生成能力方面的潛力。

論文地址:https://arxiv.org/abs/2406.00770

劃重點:

🔍 Auto Evol-Instruct 是一個全自動的 AI 框架,能夠自動分析和演進指導數據集,無需人爲干預。

🚀 框架通過優化演進方法,有效提高了數據集的複雜性和多樣性,從而增強了 LLMs 在各種任務中的性能和適應性。

💡 Auto Evol-Instruct 的研究結果表明,通過自動化演進指導數據集的方法。