近日,在計算機視覺頂會CVPR 2026 NTIRE 圖像檢測挑戰賽中,螞蟻集團同時獲得“複雜真實場景魯棒性樣本測試”賽道和“人臉增強異常檢測”賽道冠軍,爲進一步提升AI時代支付、內容安全審覈、金融身份認證等場景的風險識別能力提供重要支撐。
當前,深度僞造(Deepfake)與AIGC濫用風險加劇,不僅肉眼難辨真假,現有檢測模型在面對真實場景與多模態大模型快速迭代時,準確率也出現斷崖式下跌。本次CVPR挑戰賽直擊這一痛點,要求模型在“未知生成架構”與“複雜退化干擾”的雙重極限考驗下,保持高準確率與強魯棒性。
螞蟻集團以支付場景起家,在過去 20 年裏積累的安全技術代表了國際領先水平,這一優勢正延續至 AI 安全領域。螞蟻集團提出了一個基於 DINOv3 視覺基礎模型的檢測框架,實現了 AIGC 檢測從實驗室向真實場景的能力躍遷。
在“複雜真實場景魯棒性樣本測試”賽事,螞蟻AI安全實驗室參賽團隊搭建了一個包含數百萬高質量樣本的複雜訓練語料庫,覆蓋WildFake、Z-Image、Seedream、Nano-banana-pro 等開源數據集和前沿模型;底層採用雙流並行集成架構,如同爲檢測模型配備兩雙互補的眼睛,分別捕捉圖像的局部細節與整體特徵。團隊模擬圖像從單一噪點到多重失真的全鏈路退化效果,深度還原社交平臺傳播、二次翻拍等真實場景的圖像失真特徵,大大提升了模型在真實場景下的檢測能力。
此外,團隊還提出了“先定位可疑區域,再進行細節審查”(Locate-Then-Examine)的兩階段檢測範式,並構建了提供局部區域文本解釋的數據集 FakeXplained。在面對可疑圖像時,該方法不僅能準確判斷其是否由 AI 生成,還能在圖像上定位出存在僞造瑕疵或違揹物理常識的區域,並同步生成詳盡的解釋。該方法突破了傳統“黑盒”檢測的侷限,讓模型決策“有據可查”。爲方便技術從業者共同應對 Deepfake 挑戰,團隊還通過 GitHub 開源了領域內最全面的 AIGC 圖像視頻檢測資源倉庫。
在“人臉增強異常檢測”賽事,螞蟻國際參賽團隊憑藉精準定位人臉圖像異常區域的技術能力奪冠。這項技術能夠精確識別並定位人臉圖像中的異常區域,主要應用於金融交易身份鑑別、開戶材料審覈等場景,爲防範Deepfake深度僞造與AIGC攻擊提供重要技術保障。在跨境支付與金融服務領域,螞蟻國際將AIGC識別技術深入應用到EKYC、憑證、材料的防僞當中,確保了對各類生成內容的檢測能力。
CVPR是IEEE主辦的國際計算機視覺與模式識別會議,與ICCV、ECCV並稱爲計算機視覺領域的世界三大頂級會議,該挑戰賽共吸引 500 多支國內外隊伍參賽。
