Gboard革新打字體驗谷歌憑大模型實現"一鍵修復所有錯誤"

Gboard是Google爲移動設備打造的智能鍵盤，通過統計解碼提供流暢的打字體驗。現在，Google研究團隊又爲它增添了一項創新功能"校對"，利用大型語言模型（LLM）的強大能力，實現了一鍵修復整個句子和段落錯誤的突破。

根據Google新發布的論文《校對:一鍵修復所有錯誤》，這項名爲"校對"的Gboard新功能依託於服務器端LLM的支持，用戶只需輕輕一按，就能無縫更正整個句子或段落中的各種錯誤，完全改變了傳統的逐字修正體驗。該功能目前已在Pixel8設備上推出，每天惠及數千名用戶。

QQ截圖20240620104503.png

這一系統包括數據生成、指標設計、模型調整和服務四個關鍵部分。研究團隊通過複雜的錯誤合成框架生成模擬數據集，設計多個指標從不同角度評估模型，並借鑑InstructGPT的思路，先通過監督學習進行微調，再採用強化學習技術進行調整，顯著提升了模型性能。

QQ截圖20240620104510.png

此外，該模型部署在雲端TPU V5上，通過量化、分桶、分段輸入和推測解碼等手段優化延遲，最終將中位響應時間降低了39.4%。

QQ截圖20240620104521.png

分析人士認爲，這一探索性研究充分展現了大模型爲提升移動端輸入交互體驗所蘊藏的巨大潛能，是對傳統人機交互方式的顛覆性革新。它標誌着大模型在提升用戶輸入效率方面的變革力量，並對未來藉助人工智能優化日常交互體驗帶來啓示。

論文地址：https://arxiv.org/abs/2406.04523

谷歌發佈Rambler語音聽寫功能:基於Gemini模型，集成至Gboard鍵盤

谷歌在2026年Android Show上推出基於Gemini多語言模型的AI語音聽寫功能“Rambler”，集成於Gboard鍵盤中。該功能可自動過濾語氣詞，並實時理解自然語言更正，如用戶中途修改時間或地點時，模型能精準識別並輸出正確指令，標誌着系統級輸入法進入生成式語義理解時代。

爆火！學術團隊僅憑SFT打破大廠壟斷，OpenSeeker-v2 登頂搜索智能體榜單

深度搜索能力是當前大模型領域的核心競爭點，但傳統開發模式依賴資源密集的預訓練、微調和強化學習，長期被工業巨頭壟斷。近日，學術界團隊推出OpenSeeker-v2，打破常規，通過高質量方法顯著降低資源消耗，展示了高效創新的新路徑。

日本科學家發佈“Sui”編程語言，宣稱能讓 LLM100% 準確編寫代碼

日本數據科學家本田崇人推出開源編程語言“Sui”，旨在解決大語言模型生成代碼的準確性問題，宣稱可實現100%準確率。其設計理念源於日本美學“粋”，強調精煉與去除冗餘，核心原則包括保證零語法錯誤率，並使用數字作爲變量。

OpenAI聯合創始人Andrej Karpathy宣佈加盟Anthropic，發力下一代LLM研發