Gboard是Google爲移動設備打造的智能鍵盤,通過統計解碼提供流暢的打字體驗。現在,Google研究團隊又爲它增添了一項創新功能"校對",利用大型語言模型(LLM)的強大能力,實現了一鍵修復整個句子和段落錯誤的突破。
根據Google新發布的論文《校對:一鍵修復所有錯誤》,這項名爲"校對"的Gboard新功能依託於服務器端LLM的支持,用戶只需輕輕一按,就能無縫更正整個句子或段落中的各種錯誤,完全改變了傳統的逐字修正體驗。該功能目前已在Pixel8設備上推出,每天惠及數千名用戶。
這一系統包括數據生成、指標設計、模型調整和服務四個關鍵部分。研究團隊通過複雜的錯誤合成框架生成模擬數據集,設計多個指標從不同角度評估模型,並借鑑InstructGPT的思路,先通過監督學習進行微調,再採用強化學習技術進行調整,顯著提升了模型性能。
此外,該模型部署在雲端TPU V5上,通過量化、分桶、分段輸入和推測解碼等手段優化延遲,最終將中位響應時間降低了39.4%。
分析人士認爲,這一探索性研究充分展現了大模型爲提升移動端輸入交互體驗所蘊藏的巨大潛能,是對傳統人機交互方式的顛覆性革新。它標誌着大模型在提升用戶輸入效率方面的變革力量,並對未來藉助人工智能優化日常交互體驗帶來啓示。
論文地址:https://arxiv.org/abs/2406.04523