谷歌宣佈NotebookLM新增圖像數據源,用戶上傳黑板板書、教科書掃描頁或街拍表格後,系統自動完成OCR與語義解析,並可用自然語言直接檢索圖中內容。該功能面向全平臺免費推出,谷歌表示未來數週內將追加本地處理選項,以減少敏感資料上傳雲端。

新版NotebookLM底層採用多模態模型,可分辨手寫與印刷區域、提取表格結構,並與既有文本、音頻、視頻筆記自動關聯。谷歌在演示中展示用例:拍攝課堂板書後提問“左下角公式如何推導”,系統即時定位公式並生成步驟講解;掃描教材第127頁表格後可直接查詢單元格數值;上傳街頭咖啡店菜單即可提取拿鐵價格。
谷歌稱,功能上線後48小時內,教育賬號上傳圖像量突破50萬頁,環比增加340%。公司計劃明年爲NotebookLM集成AR眼鏡實時拍攝接口,實現“所見即所問”。目前圖像處理沿用現有免費配額,未透露是否推出付費加速通道。
