告別“黑匣子”！北大研發新AI框架FakeShield，讓圖像造假無所遁形！

隨着AIGC技術的快速發展，圖像編輯工具日益強大，圖像篡改變得更加容易，也更難被察覺。雖然現有的圖像篡改檢測和定位方法（IFDL）通常很有效，但它們往往面臨兩大挑戰:一是“黑匣子”性質，檢測原理不明;二是泛化能力有限，難以應對多種篡改方法(如Photoshop、DeepFake、AIGC編輯)。

爲解決這些問題，北京大學的研究團隊提出了可解釋的IFDL任務，並設計了FakeShield，這是一個多模態框架，能夠評估圖像的真實性，生成篡改區域掩碼，並基於像素級和圖像級的篡改線索提供判斷依據。

傳統的IFDL方法只能提供圖像的真實性概率和篡改區域，而無法解釋檢測原理。由於現有IFDL方法的準確性有限，仍然需要人工進行後續判斷。但由於IFDL方法提供的信息不足，難以支持人工評估，用戶仍然需要自己重新分析可疑圖像。

此外，在現實場景中，篡改類型多種多樣，包括Photoshop（複製移動、拼接和移除）、AIGC編輯、DeepFake等。現有的IFDL方法通常只能處理其中一種技術，缺乏全面的泛化能力。這就迫使用戶事先識別不同的篡改類型，並相應地應用特定的檢測方法，大大降低了這些模型的實用性。

爲解決現有IFDL方法的這兩大問題，FakeShield框架利用了大型語言模型（LLM）的強大能力，特別是多模態大型語言模型(M-LLM)，它能夠對齊視覺和文本特徵，從而賦予LLM更強的視覺理解能力。由於LLM在海量且多樣化的世界知識語料庫上進行了預訓練，因此它們在機器翻譯、代碼補全和視覺理解等衆多應用領域都具有巨大的潛力。

FakeShield框架的核心是多模態篡改描述數據集（MMTD-Set）。該數據集利用GPT-4o對現有IFDL數據集進行了增強，包含了篡改圖像、修改區域掩碼和編輯區域詳細描述的三元組。通過利用MMTD-Set，研究團隊對M-LLM和視覺分割模型進行了微調，使其能夠提供完整的分析結果，包括檢測篡改和生成準確的篡改區域掩碼。

FakeShield還包含領域標籤引導的可解釋僞造檢測模塊（DTE-FDM）多模態僞造定位模塊(MFLM)，分別用於解決各種類型的篡改檢測解釋和實現由詳細文本描述引導的僞造定位。

大量實驗表明，FakeShield可以有效地檢測和定位各種篡改技術，與以往的IFDL方法相比，它提供了一種可解釋的、更優越的解決方案。

該研究成果是將M-LLM應用於可解釋IFDL的首次嘗試，標誌着該領域取得了重大進展。 FakeShield不僅擅長篡改檢測，還能提供全面的解釋和精確定位，並展現出對各種篡改類型的強大泛化能力。這些特性使其成爲適用於各種現實應用的多功能實用工具。

未來，這項工作將在多個領域發揮至關重要的作用，例如幫助改進與數字內容操縱相關的法律法規，爲生成式人工智能的開發提供指導，以及促進更清晰、更值得信賴的網絡環境。此外，FakeShield還可以協助法律訴訟中的證據收集，並幫助糾正公衆話語中的錯誤信息，最終有助於提升數字媒體的完整性和可靠性。

項目主頁:https://zhipeixu.github.io/projects/FakeShield/

GitHub地址:https://github.com/zhipeixu/FakeShield

論文地址:https://arxiv.org/pdf/2410.02761

阿里雲 AI 漫劇解決方案：短劇製作迎來智能化新時代！

5月14日，阿里雲在鄭州高新區舉辦“AI創享日”活動，發佈覆蓋短漫劇創作的智能化方案，以“模型+平臺+工具+生態”爲核心，推動AI短漫劇從生成邁向規模化生產。據阿里雲首席架構師李瑾介紹，短劇行業快速增長，預計2025年中國動漫市場將迎來更大發展。

圖森未來正式更名爲CreateAI 此前發佈圖生視頻大模型“Ruyi”

北京圖森未來科技有限公司宣佈正式更名爲CreateAI。這一更名伴隨着公司在生成式AI領域多項重大進展的發佈，標誌着其在動畫和視頻遊戲行業應用生成式AI技術的雄心壯志。同時，CreateAI宣佈獲得著名武俠IP《金庸羣俠傳》的正版授權，計劃開發一款大型武俠開放世界RPG遊戲。此外，公司還將與著名動畫導演河森正治及頂級動畫製作公司株式會社白組合作，利用AIGC技術推動創作者在展示宏大宇宙文明方面實現更多突破。

Cohere新開源AI模型Aya Expanse，能力碾壓谷歌、Meta同規模模型

近日，Cohere 宣佈推出兩款新的開源 AI 模型，旨在通過其 Aya 項目縮小基礎模型的語言差距。這兩款新模型名爲 Aya Expanse8B 和35B，現已在 Hugging Face 上提供使用。這兩個模型的推出，讓23種語言的 AI 性能得到了顯著提升。Cohere 在其博客中表示，8B 參數模型讓全球研究人員能更輕鬆地獲得突破，而32B 參數模型則提供了業界領先的多語言能力。Aya 項目的目標是擴展更多非英語語言的基礎模型訪問。在此之前，Cohere 的研究部門去年啓動了 Aya 計劃，並在2月份發佈了 Aya101大語言模型（LLM），這款

重大突破！OpenAI新技術讓AI繪圖提速50倍，僅需0.11秒生成一張圖

OpenAI最近公佈了一項名爲sCM（簡化型、穩定型和可擴展型一致性模型）的突破性技術，這一創新徹底改變了AI圖像模型的訓練方式。該技術在原有的一致性模型(CMs)基礎上實現了重大突破，爲快速圖像生成開闢了新天地。技術核心優勢:只需兩步計算即可生成高質量圖像在A100GPU上生成一張圖片僅需0.11秒相比傳統擴散模型，速度提升50倍最大模型參數達15億，創下新紀錄在實際測試中，sCM的表現令人矚目。在CIFAR-10數據集上獲得了2.06的FID評分，在ImageNet上生成512x512像素圖像時達到了1.88的優異成

Google Photos標註AI編輯照片，但僅在"細節"中顯示引發爭議