Genie,一款由Cosine公司發佈的AI程序員,它在權威測試平臺SWE-Bench上的評分高達30.08%,以斷崖式的優勢領先於Devin的13.8%和Swe-agent+GPT-4的12.47%,被譽爲目前全球最強的AI程序員。

Genie的誕生並非一蹴而就。早在2022年12月,Cosine的聯合創始人Alistair Pullen就已在倫敦大學的一次路演中展示了Genie的原型。他的初衷是開發一款能夠端到端自動執行編碼和優化的AI機器人,無需任何人爲干預。

image.png

Genie之所以能夠大幅度領先於其他知名產品,與其獨特的訓練數據和方法密不可分。Genie的訓練不依賴常規的大模型微調,而是採用了一個特殊的數據集,這個數據集包含了人類程序員的推理過程,如信息的完整傳承、知識的逐步發現,以及基於實際案例的決策制定步驟等。

QQ截圖20240813103417.jpg

Genie在訓練過程中採用了獨特的“自我改進機制”。初始訓練在大量高質量數據上進行,使模型達到“完美”狀態。隨後,開發人員通過Genie生成合成數據,並將其注入到後續模型訓練中,以豐富錯誤和複雜情況。這一過程類似於母親教孩子走路,每當Genie跌倒或姿勢不正確時,都會得到及時的糾正。

QQ截圖20240813103503.jpg

Genie的功能覆蓋了功能開發、BUG修復、代碼重構、代碼小改動、代碼測試以及編寫代碼文檔和更新等。它支持的編程語言包括JavaScript、Python、Java、C#、C++等幾十種主流語言,幾乎涵蓋了所有編程領域的需要。

知名開發者Mckay表示,他對Genie充滿期待,並希望能夠儘快測試這款產品。他目前已擁有Devin的使用權限,因此能夠輕鬆評估Genie的性能。

儘管目前Genie仍處於申請測試階段,但Alistair已經表示,現在可以接受申請註冊,未來2—3周內將發放測試權限,並在發佈時增加一些小驚喜功能。

體驗地址:https://cosine.sh/register