谷歌今日宣佈推出全新升級的Gemini模型系列,包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。這次更新不僅大幅提升了性能,還帶來了令人驚喜的價格優惠,無疑將在AI開發圈掀起一陣熱潮。

首先,最吸引眼球的是價格的大幅下調。新版模型的使用成本直接腰斬,降幅超過50%。與此同時,性能卻得到了顯著提升。Gemini1.5Flash的處理速率翻倍,而1.5Pro更是接近三倍。這意味着開發者可以以更低的成本獲得更快的輸出和更短的延遲,大大提高了開發效率。

image.png

在性能方面,新版Gemini模型展現出全面的提升。特別是在數學、長文本處理和視覺任務上,進步尤爲明顯。例如,模型現在能夠輕鬆處理超過1000頁的PDF文檔,回答包含上萬行代碼的問題,甚至能從一小時的視頻中提取有用信息。在MMLU-Pro這個具有挑戰性的基準測試中,新模型實現了約7%的性能提升。更令人矚目的是,在MATH和HiddenMath基準測試中,提升幅度高達20%。

image.png

谷歌還對模型的響應質量進行了優化。新版本在保證內容安全的同時,提供了更有幫助、更簡潔的回答。在總結、問答和信息提取等任務中,輸出長度比之前縮短了5%到20%,這不僅提高了效率,也進一步降低了使用成本。

對於企業用戶來說,Gemini1.5Pro的長文本處理能力(高達200萬詞)和多模態能力開啓了全新的應用場景。從2024年10月1日起,輸入令牌、輸出令牌和增量緩存令牌的價格將分別降低64%、52%和64%,這無疑將大大降低企業使用AI的成本。

image.png

在使用限制方面,谷歌也做出了重大調整。Gemini1.5Flash的付費服務速率限制提高到每分鐘2000次請求,1.5Pro則提高到1000次,這爲開發者提供了更大的靈活性。

安全性一直是谷歌的重點關注領域。新版模型在遵循用戶指令的同時,進一步增強了安全性。谷歌還調整了過濾器的默認設置,給予開發者更多自主權。

此外,谷歌還推出了改進版的Gemini1.5Flash-8B實驗模型,在文本和多模態應用場景中表現出色。這個版本已經在Google AI Studio和Gemini API上發佈,爲開發者提供了更多選擇。

對於Gemini Advanced用戶,他們很快就能體驗到專爲聊天優化的Gemini1.5Pro-002版本。

參考資料:https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/