最近,AI 編程工具 Cursor 如火如荼,迅速成爲編程界和人工智能領域的焦點。Cursor 是一款基於 VS Code 的代碼編輯器,它爲 AI 輔助編程帶來了衆多強大功能,讓開發者們興奮不已。

最近,知名播客主持人 Lex Fridman 與 Cursor 團隊的四位創始成員進行了深入對話,聊聊他們的創新曆程和未來規劃。

Cursor 的故事可以追溯到2020年,那時 OpenAI 發佈了一篇關於縮放損失的論文。這篇論文讓人們對機器學習的未來充滿期待。它提出,如果能獲得更多計算資源和數據,模型的表現會越來越好。

這一想法讓團隊成員們開始暢想:未來的 AI 將如何幫助各個領域的知識工作者提高效率。2022年底,Cursor 團隊提前獲得了 GPT-IV 的使用權,這讓他們意識到,之前的理論預測正在一步步變爲現實。這個時刻激發了他們更大的願景,他們相信所有編程活動都將藉助這些強大的模型來完成。

image.png

Cursor 的一大亮點是它獨特的代碼差異功能。當你在編輯器中修改代碼時,模型會用紅色和綠色的高亮顯示出變化部分,這樣用戶可以清楚地看到代碼的增刪。

在自動完成功能的優化中,Cursor 還專門設計了快速的 diff 接口,以便讓開發者在需要快速閱讀代碼時,能夠更高效地獲取信息。團隊經歷了多次嘗試,最終找到了最佳的用戶體驗設計,使得代碼的建議既直觀又不至於分散注意力。

說到 Cursor 的強大,怎麼能不提它背後的機器學習技術呢?Cursor 實際上是由多個定製和前沿模型組成的集成體,特別是它的 Tab 和 Apply 功能,都是經過精心微調的成果。

儘管這些模型在生成代碼修改建議時表現優秀,但在實際操作中處理大型文件時仍常常出錯。爲了改善這個問題,Cursor 採取了一個策略:先讓模型生成一個粗略的代碼修改方案,再用另一個模型將這些修改應用到實際文件中。這樣做不僅提高了代碼修改的效率,也讓模型在生成代碼時使用更少的 tokens,從而降低延遲和成本。

在談到如何提升 Cursor 的處理速度時,團隊介紹了一個名爲 “投機編輯” 的概念。通過這一技術,模型能夠一次處理多個 tokens,而不是逐個生成。傳統的方法是用一個小模型來預測代碼,再用大模型來驗證,但 Cursor 的團隊發現,直接將原始代碼片段輸入模型,往往能得到更快速的反饋。最終,當模型生成的文本與原始代碼不一致時,它纔會生成新的 tokens 進行更新。