Facefusion 人臉合成工具1.3.1版本更新

站長之家

發布於AI新聞資訊 · 1 分鐘閱讀 · Aug 11, 2025

Facefusion的最新版本1.3.1帶來了多項改進，提升了人臉合成的效率和性能。更新包括提升網絡攝像頭性能，使攝像頭合成更加流暢，優化重新合成速度，加入設置攝像頭分辨率和fps的功能，提供高性能版本，引入CodeFormer面部增強器。這次更新還改進了界面，採用簡約扁平化設計風格，提供更好的用戶體驗。Facefusion是一種圖像處理技術，可以將兩個人臉圖像合成在一起，創造出具有兩個人臉特徵的全新圖像。該技術適用於娛樂和美容應用，通過面部檢測、對齊和特徵匹配等技術確保合成圖像的質量和真實性。

人工智能助力醫療影像分析，減輕放射科醫師負擔

澳大利亞科研機構AEHRC正利用視覺語言模型(VLM)技術革新醫療影像分析，重點開發能自動生成胸部X光報告的AI系統。該技術通過海量醫療數據訓練，已顯著提升報告準確性，並嘗試整合急診記錄進一步優化。研究團隊強調AI旨在輔助而非替代醫生，目前正與醫院合作評估AI報告與人工報告的差異，未來將擴大臨牀試驗驗證技術普適性。核心突破在於緩解放射科醫生短缺壓力，同時確保技術應用的倫理安全性。

通義千問 Qwen Code 每日免費調用2000次，比 Gemini 更大方

阿里雲通義千問推出Qwen Code AI編程智能體，爲中國大陸用戶提供每日2000次免費調用權限，海外用戶1000次。該工具支持終端命令行操作，相比Google Gemini CLI等競品具有更高免費額度和更簡易安裝流程（僅需一行命令）。阿里雲通過免除Token限制、簡化安裝步驟及提供GitHub開發者資源，旨在降低AI編程工具使用門檻，搶佔市場份額，特別在中國大陸市場憑藉高免費額度吸引開發者。

小鋼炮4.0視覺模型MiniCPM-V 4.0，手機端應用更流暢

MiniCPM-V4.0人工智能模型引發關注，這款4.1億參數的新模型在視覺理解方面表現優異，OpenCompass評測得分69.0超越多款競品。其最大亮點是專爲移動設備優化，在iPhone16Pro Max上響應迅速且無發熱問題。開發團隊提供了iOS應用和詳細指南，支持多種平臺工具，讓用戶輕鬆上手使用。

超小的TTS模型 Kitten TTS：參數量僅爲 1500 萬

KittenML團隊發佈開源輕量級文本轉語音模型Kitten TTS，僅25MB大小、1500萬參數，支持CPU運行無需GPU。該模型提供高質量多語音選項，優化了推理速度實現實時合成，並配套簡易安裝指南。目前處於開發者預覽階段，未來將推出完整模型權重、移動SDK和網頁版，推動語音合成技術普及應用。

GPT-5正式發佈 OpenAI 在華申請“GPT-5”商標被駁回

OpenAI在中國申請GPT-5商標遇阻，多枚商標處於"駁回複審"狀態。此前深圳某公司申請的GPT-5商標已被駁回。雖然商標註冊受阻，但GPT-5作爲OpenAI最新AI模型，在健康諮詢、編程等領域表現突出。這一事件凸顯了AI領域知識產權競爭的激烈程度，商標註冊成爲企業保護核心技術的關鍵環節。

谷歌推出 BlenderFusion:顛覆3D 視覺編輯與生成合成的新框架

谷歌推出BlenderFusion 3D視覺編輯框架，通過分層、編輯、合成三階段工作流實現高效創作。該工具整合SAM2等視覺模型提取2D圖像中的3D對象，利用Blender進行移動、旋轉等精細編輯，最後通過優化的擴散模型完成高質量合成。這一創新顯著提升了複雜場景處理能力，爲設計師提供更直觀的創作體驗。（140字）