AI工具賽道再掀驚濤駭浪!谷歌AI Studio今日投下一枚重磅炸彈,其最新升級的功能在X平臺瞬間引爆科技圈。用戶驚呼,谷歌AI Studio 現在竟然可以直接“啃食”YouTube視頻鏈接,無需下載上傳,就能瞬間理解視頻內容!更令人瞠目結舌的是,Gemini2.0Flash Experimental 模型(以下簡稱 Gemini2.0Flash exp) 悄然解鎖了自然圖片生成神技,而且還能在多張圖片中讓角色“靈魂附體”般保持一致! 這波“官方親自下場做應用”的王炸級更新,被業內人士視爲“最爲致命”的降維打擊,預示着一大批仰仗“套殼”技術的AI小工具,或將迎來它們的“末日”。
X 平臺用戶 interjc 今日發帖驚呼:“谷歌 AI Studio 現在可以直接粘貼 YouTube 鏈接來理解視頻內容了,各種‘套殼’小工具們又要倒下一批了。” 他犀利地指出,這項新功能的加入,簡直是“降維打擊”,用戶無需再費力下載視頻再上傳,直接甩個鏈接就能提問或總結,效率提升了不止一個量級。更讓人叫絕的是,即使是那些“硬骨頭”般的無字幕視頻,Gemini2.0Flash exp 也能輕鬆拿下,快速解析內容,簡直是“神器”降臨。 用戶 jesselaunz 也親測了一個沒有字幕的中文視頻,結果 Gemini2.0Flash exp “完美總結”了視頻內容,效果遠超其他大模型,堪稱“獨家絕技”,讓其他AI望塵莫及。
如果說視頻理解只是“開胃小菜”,那麼 Gemini2.0Flash exp 在圖像生成方面的進化,則堪稱“核彈級”的重磅炸彈。 X 用戶 dotey 在平臺上分享了一段震撼的錄屏, 她以 “龜兔賽跑” 爲關鍵詞, 一口氣生成了8張場景圖片, 結果令人驚豔! 生成的圖片不僅自然流暢, 更令人驚歎的是, 圖片中的 “龜” 和 “兔” 角色, 竟然如同擁有 “靈魂” 一般, 在8張圖中都保持了高度一致的外貌特徵! 更令人驚喜的是, 第一張圖中甚至還出現了中文 “龜兔賽跑” 四個大字, 雖然仔細觀察筆畫略有瑕疵, 但這項能力依然讓人歎爲觀止。 dotey 激動地感嘆: “這速度也太快了, 完全是吊打各種 ‘套殼’ 工具啊!”
X 平臺上的討論熱度持續高漲, Gemini2.0Flash exp 展現出的強大實力, 不僅體現在多模態處理能力上, 更在於其驚人的生成速度和超乎尋常的穩定性。 用戶 python_xxt 測試了一個時長超過一小時的無字幕視頻鏈接, Gemini2.0Flash exp 竟然能夠 “直接輸出會議內容和深度分析, 效果完爆市面上所有總結類工具”, 簡直是 “神乎其技”。 這項功能的實現, 無疑得益於 Gemini2.0Flash exp 對視頻內容的深度理解能力, 即使沒有字幕的 “加持”, 也能精準提煉視頻中的關鍵信息, 其技術實力可見一斑。
業內人士敏銳地捕捉到, Google AI Studio 此次更新, 標誌着其發展戰略的重大轉型—— 從單純的基礎模型平臺, 加速嚮應用級工具進化。 X 用戶 gantrols 一針見血地指出, Gemini2.0Flash exp 的圖片生成功能, 已經能夠完美支持中文提示詞和對話修改, 這無疑大幅降低了用戶的使用門檻。 他還貼心地附上了操作指南, “去 AI Studio 跟着選模型就行了”, 字裏行間透露出 Google 對開發者友好性的高度重視。
當然, 新功能固然令人興奮, 但也有用戶指出了其尚存的 “瑕疵”。 例如, dotey 就觀察到, Gemini2.0Flash exp 生成的中文文字, 仍然存在一些筆畫上的小問題。 用戶 Lessnoise365也提到, 類似的功能其實已經在 Pixel 手機的 Gemini 中內置, AI Studio 的免費優勢固然突出, 但在易用性方面, 可能還有進一步優化的空間。 然而, 瑕不掩瑜, X 平臺上的用戶普遍認爲, 這次更新將對現有的 AI 工具生態產生深遠影響, 尤其是那些依賴簡單封裝的 “套殼” 應用, 無疑將面臨巨大的生存挑戰。
谷歌尚未正式公佈 Gemini2.0Flash exp 的全面技術細節, 但其展現出的驚豔的多模態能力和高效性, 已經引發了整個行業的強烈期待。 隨着 AI Studio 的持續迭代升級, 谷歌是否會進一步整合其龐大的生態資源, 推出更多顛覆性的 AI 功能, 或將成爲2025年 AI 領域最值得關注的重磅看點。
API地址:
https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube