在週二的re:Invent大會上,亞馬遜網絡服務(AWS)宣佈推出其新型多模式生成AI模型系列——Nova。此次發佈的Nova系列包括四種文本生成模型:Micro、Lite、Pro和Premier,此外還推出了圖像生成模型Nova Canvas和視頻生成模型Nova Reel。

亞馬遜首席執行官Andy Jassy表示,Micro、Lite和Pro模型將在當天開始向AWS客戶推出,而Premier模型預計將在2025年初發布。Nova系列專爲處理多種輸入形式(包括文本、圖像、視頻)而設計,其中文本生成模型特別優化了15種語言,主要支持英語。

Nova文本生成模型

Nova文本生成模型具有不同的功能和規格。Micro模型以最低延遲和快速響應著稱,但僅支持文本輸入輸出,適合快速處理任務。Lite模型支持文本、圖像和視頻的快速輸入處理,而Pro模型則在準確度、速度和成本之間提供了平衡。Premier是最強大的模型,專爲複雜工作負載設計,適合需要定製模型的高級應用。

這些模型的上下文窗口大小也有所不同。Micro支持最多約100,000個單詞,Lite和Pro模型可處理大約225,000個單詞、15,000行代碼或30分鐘的音頻內容。而AWS表示,到2025年初,某些Nova模型的上下文窗口將擴展到200萬個標記。

Jassy強調,Nova系列是同類產品中速度最快、成本最低的AI模型。它們能夠在AWS的AI開發平臺AWS Bedrock上進行微調,進一步提高速度和效率。此外,Nova系列可以與專有系統和API無縫配合,執行多種自動化任務。

Nova Canvas和Nova Reel

除了文本生成,AWS還推出了兩款圖像和視頻生成工具:Nova Canvas和Nova Reel。Nova Canvas允許用戶通過提示生成和編輯圖像,並提供對生成圖像的配色方案和佈局的控制。Nova Reel則可以根據提示或參考圖像生成長達6秒的視頻,並允許用戶調整攝像機運動,包括平移、旋轉和縮放。

以下是來自 Canvas 的圖片:

QQ20241204-092926.png

儘管目前Reel僅限於製作6秒短視頻,AWS表示更長的視頻版本將在不久後推出。此外,AWS爲這些工具內置了責任使用控制措施,包括水印和內容審覈,以避免生成有害內容。

Jassy還透露,AWS正在開發一款語音到語音模型,預計於2025年第一季度推出,這款模型將支持語音輸入並生成自然的人類語音。此外,AWS還在開發一個“任意到任意”模型,預計在2025年中期發佈,支持跨文本、語音、圖像和視頻的多模態轉換。

AWS對於其訓練數據的保密性保持謹慎,並表示在版權問題上會提供賠償政策,以保障客戶的合法權益。

項目入口:https://aws.amazon.com/cn/ai/generative-ai/nova/

官方博客:https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/