近日,在中關村論壇系列活動第12屆數字金融與科技金融大會上,螞蟻數科的 Deepfake 檢測方案入選大會“金融科技技術創新與應用案例”。
螞蟻數科依託旗下天璣實驗室,業界首次構建了大規模、高質量、多模態的 Deepfake 數據集,其合成超過百萬級多媒體內容,充分地模擬了真實世界金融風控環境中的Deepfake攻擊樣本,成爲評測現有金融領域Deepfake檢測模型性能的重要標準。在金融業務場景中,螞蟻數科多組測試數據集上的 Deepfake 檢測準確率達到了98%以上,併成功阻止了多起利用Deepfake技術進行的欺詐行爲,保護了用戶的資產安全。
該數據集解決了以往金融領域Deepfake檢測模型無法大規模訓練,無法在真實環境中測評的問題,並且從多模態分析角度促進了傳統檢測模型的發展。目前該數據集已經成爲螞蟻數科反深僞產品 ZOLOZ Deeper 對外服務客戶的關鍵能力。
據瞭解,螞蟻數科使用先進的多達 81 種 Deepfake 技術生成高質量的合成圖像,覆蓋了多種僞造技術類型、複雜光照條件、背景環境和麪部表情,以模擬複雜逼真的真實世界攻擊環境。除了靜態圖像外,還收集並生成了大量包含聲音的視頻數據,包括100多種僞造技術類型,涵蓋不同語種、口音和背景噪音,確保數據集的多樣性和複雜性。
在數據預處理和標註階段,螞蟻數科對收集到的數據進行清洗和預處理,確保數據質量。通過專家團隊對數據進行標註,明確每張圖像或每個視頻是否爲Deepfake生成的內容,同時保證僞造痕跡的最小化,達到高度逼真的效果。此前,螞蟻數科發佈了AI數據合成與生產平臺,在數據標註層面實現了 “AI 主導”,標註模型依賴人工標註量降低了 70%以上。
此外,螞蟻數科在 2024 外灘大會發起了一場 Deepfake 攻防挑戰賽,將Deepfake數據集作爲比賽的基礎訓練和測試數據,吸引到了全球 26 個國家和地區,2200 多名選手報名參賽。通過大賽選手貢獻的算法方案,Deepfake 數據集的攻擊質量和檢測難度得到了有效驗證和評估。
隨着人工智能技術的發展,Deepfake技術也在迅速進步。這種技術利用深度學習算法,可以對視頻中的人臉進行逼真的替換。儘管Deepfake在娛樂和傳媒等領域有着積極的應用,但在金融領域,特別是身份驗證和交易驗證環節,Deepfake技術帶來了新的風險。金融機構的身份驗證系統往往依賴於生物識別技術,如人臉識別。一旦這些系統被Deepfake技術所欺騙,可能導致嚴重的金融欺詐。
鑑於此,開發針對Deepfake攻擊的檢測系統在金融領域是十分必要的,但是強大的Deepfake檢測防禦模型需要高質量符合真實世界環境的人臉Deepfake數據集,所以如何構建模擬真實世界的數據集以及如何驗證其有效性是緊迫的問題。