天眼查App顯示,騰訊科技(深圳)有限公司近日申請了一項名爲“大語言模型的訓練方法、裝置、計算機設備及存儲介質”的專利。這項專利的摘要揭示了該方法通過引入第一摘要文本和第二摘要文本,在大語言模型的訓練過程中爲模型提供更多可學習的信息。
根據專利描述,第一摘要文本和第二摘要文本所包含的信息量不同,其中第一摘要文本中還包含了正確語句和錯誤語句。通過對同一文本的這兩個不同摘要進行對比學習,並區分學習其中的正確語句與錯誤語句,能夠有效避免摘要文本單一可能導致的模型過擬合和生成不準確等問題。
該方法的創新之處在於提升了模型的泛化性能,並有效提高了模型的準確性。通過引入多樣化的摘要文本內容,騰訊的這一訓練方法爲大語言模型的訓練過程帶來了更高效、更精準的提升。