亞馬遜在 re:Invent2025推出第二代自研大模型家族 Nova2,含四款新品:輕量級多模態模型 Lite、複雜推理代理 Pro、語音對話 Sonic 與75萬字上下文 Omni;公司同時宣佈與谷歌雲達成互聯協議,方便客戶跨平臺調用 Gemini 等競對模型。
Nova2系列主打“行業領先性價比”,官方定價顯示,Lite 每百萬 token 輸入0.045美元、輸出0.09美元,約爲同類模型50% 水平。AWS 首席執行官 Matt Garman 表示,新增多模態、代碼生成與代理任務優化,目標在“成本而非參數”上取勝。

真正引發開發者關注的是同步發佈的“Nova Forge”服務:年費10萬美元,客戶即可介入預訓練、中期訓練或後期訓練階段,注入私有數據構建專屬前沿模型。Garman 解釋,過早微調易削弱模型推理能力,“Forge 讓客戶像學語言一樣‘從小’開始定製”。
AWS 披露,內部電商與 Alexa 團隊已用 Forge 構建業務大模型;外部客戶 Reddit 則通過該服務訓練內容審覈模型,官方稱其在內部評測中優於市面可商用大模型。若需亞馬遜工程師全程協助,需額外支付諮詢費用。
亞馬遜通用人工智能首席科學家 Rohit Prasad 稱,Forge 可將企業自建模型成本從“數億至數十億美元”降至百萬美元量級,“相當於用1% 預算獲得90% 性能”。該服務預計2026年一季度在北美、歐洲部分區域開放預覽。
