最近一週,AI 行業真是熱鬧非凡,谷歌和 Meta 都在推出新版本的 AI 模型,吸引了不少關注。首先,谷歌在週二宣佈了其 Gemini 系列的新更新,推出了兩個新的生產就緒模型 ——Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002。

image.png

這次更新大幅提升了模型的整體質量,尤其在數學、長上下文處理和視覺任務上都有顯著進步。谷歌聲稱,在 MMLU-Pro 基準測試上,性能提升了7%,而數學相關任務的表現更是提高了20%。如果你關注 AI,應該知道基準測試的意義有限,但這次的數據還是很令人興奮的。

除了模型的性能提升,谷歌還大幅降低了 Gemini1.5Pro 的使用成本,輸入和輸出代幣的費用分別下降了64% 和52%。這一舉措讓開發者們在使用 Gemini 時更具成本效益。

此外,更新後,Gemini1.5Flash 和 Pro 的請求處理速度也有所提升,前者可以支持每分鐘2000個請求,後者則爲每分鐘1000個請求。這樣的改進,無疑會幫助開發者更輕鬆地構建應用程序。

image.png

而在週三,Meta 也沒有閒着,推出了 Llama3.2,這是對其開放重量 AI 模型的重大更新。這次更新包含了具有視覺功能的大型語言模型,參數規模從11億到90億不等,同時還推出了專爲移動設備設計的1億和3億參數的輕量級文本模型。

Meta 聲稱,這些視覺模型在圖像識別和視覺理解上可以與市場上領先的閉源模型媲美。而且,一些 AI 研究者對新模型進行了測試,結果顯示這些小模型在許多文本任務上表現優異。

image.png

接下來,在週四,谷歌 DeepMind 正式宣佈了一個重磅項目 ——AlphaChip。這個項目是基於2020年的研究,旨在通過強化學習來設計芯片佈局谷歌表示,AlphaChip 已經在其最近三代張量處理單元(TPU)中取得了 “超人芯片佈局”,生成高質量芯片佈局的速度可以從人類的幾周甚至幾個月縮短到幾小時。

更值得一提的是,谷歌還將 AlphaChip 的預訓練模型在 GitHub 上分享給公衆,這樣其他芯片設計公司也可以使用這一技術,甚至 MediaTek 等公司已經開始採用。

劃重點:  

📈 ** 谷歌發佈新版本 Gemini 模型,提升整體性能並大幅降價。**  

🤖 **Meta 推出 Llama3.2,支持視覺功能的小型語言模型,表現出色。**  

💡 ** 谷歌的 AlphaChip 加速芯片設計,顯著提高設計效率並共享技術。**