亞馬遜希望用戶能夠更好地評估人工智能模型,並鼓勵更多人蔘與這一過程。AWS推出Bedrock上的模型評估,以評估其存儲庫中的模型。模型評估包括自動評估和人工評估兩個部分,可以根據不同指標評估模型性能。AWS還提供人工評估團隊與用戶合作,檢測到自動系統無法檢測到的指標。重要的是模型要爲客戶工作,要知道哪個模型最適合他們,我們正在給他們一種更好地評估這一點的方法。