Cursor 是一款基於人工智能的編程平臺,最近宣佈對其 Tab 模型進行了升級。Tab 模型是爲開發者提供自動補全建議的系統。此次升級顯著減少了低質量建議的數量,提高了建議的準確性。具體來說,新的 Tab 模型相比於之前的版本,建議數量減少了21%,而接受率提高了28%。

image.png

Cursor 在其博客中表示,實現高接受率不僅僅是讓模型變得更智能,還需要懂得何時提供建議、何時不提供。爲了應對這一挑戰,Cursor 考慮了訓練一個單獨的模型,用於預測某個建議是否會被接受。該公司引用了一項2022年的研究,指出這種方法在 GitHub Copilot 中取得了成功。研究中採用了邏輯迴歸過濾器,分析編程語言、最近的接受歷史和訓練字符等特徵,將那些得分較低的建議隱藏起來。

然而,Cursor 認爲這種解決方案雖然可以預測用戶接受建議的概率,但希望有一個更通用的機制,能夠重用 Tab 模型學到的強大代碼表示。Cursor 希望通過改變 Tab 模型的結構,避免在最初就產生低質量建議,而不是後續再進行過濾。

因此,Cursor 採用了策略梯度方法,這是一種強化學習的方法。當用戶接受建議時,模型會得到獎勵;當建議被拒絕時,模型會受到懲罰;而在選擇保持沉默時則不會得到任何反饋。此方法需要 “在線” 數據,即從當前使用的模型收集的反饋。Cursor 通過每天多次向用戶部署新的檢查點,並迅速基於新交互對模型進行再訓練,來解決這一問題。

Cursor 表示,當前從部署檢查點到收集數據的過程僅需1.5到2小時,這在 AI 行業中已經算是較快,但仍有進一步加速的空間。該公司的 Tab 模型每天處理超過4億個請求,Cursor 希望這一改進能夠提升開發者的編碼體驗,並計劃在未來進一步開發這些方法。

在線強化學習是該領域最令人興奮的方向之一,一位在 OpenAI 從事後訓練的工程師在社交媒體上對此表示讚賞,稱 Cursor 似乎是第一個成功在大規模上實施該技術的公司。 

不久前,Cursor 的母公司 Anysphere 宣佈融資9億美元,估值達99億美元,並推出了一項月費200美元的 “超值” 計劃,承諾提供20倍於20美元月費 “專業版” 的使用量。此外,Cursor 還在同月進行了平臺更新,新增了自動代碼審查、記憶功能和一鍵設置模型上下文協議服務器的功能。

劃重點:

🌟 Cursor 的 Tab 模型升級後,建議數量減少21%,接受率提升28%。  

🤖 採用實時強化學習方法,模型可根據用戶反饋自我調整。  

💰 Cursor 母公司 Anysphere 融資9億美元,推出新計劃與功能提升。