在全球製造業和建築業面臨嚴重勞動力短缺的背景下,如何讓挖掘機等重型設備實現自主作業成了行業焦點。初創公司Bedrock Robotics近日通過與 AWS 生成式 AI 創新中心合作,成功利用視覺語言模型(VLMs)解決了自動駕駛系統開發中最耗時的難題——海量視頻數據的標註。

image.png

傳統上,訓練施工自動化系統需要人工對數百萬小時的監控視頻進行標註,識別各種剷鬥、掛鉤及作業任務,這不僅成本極高,且效率極低。AIbase 獲悉,通過引入Amazon Bedrock平臺上的視覺語言模型,該團隊能夠像與人類聊天一樣,通過自然語言指令讓 AI 自動識別並描述視頻中的複雜場景。

這種“AI 標註 AI”的模式帶來了顯著的效率飛躍。報道指出,原本由於拍攝角度奇特、工地粉塵干擾,普通模型對施工工具的識別準確率僅爲34%,但在經過針對性的提示工程(Prompt Engineering)優化後,準確率飆升至70%。這意味着原本繁瑣的人工篩選過程現在已轉化爲自動化、可擴展的數據流水線。

目前,這項技術已應用於Bedrock Operator改造方案中,讓普通的挖掘機具備了釐米級的精準操作能力。這一案例不僅證明了 AI 在處理物理世界複雜數據方面的潛力,也爲面臨“用工荒”的建築、物流及農業領域提供了一套可複製的自動化轉型模板。