剪映推出AI音色克隆功能，引發AI聲音創業公司競爭壓力

站長之家

發布於AI新聞資訊 · 1 分鐘閱讀 · Aug 7, 2025

剪映推出AI音色克隆功能，通過錄制5秒聲音實現克隆，給AI聲音創業公司帶來挑戰。競爭壓力激烈，剪映成爲市場最受歡迎產品。在激烈競爭的AI聲音領域，技術創新至關重要。然而，音色克隆功能容易實現，但潛在安全風險需警惕。AI聲音公司需找到差異化競爭點，否則可能陷入慢性死亡狀態。

重磅!OpenAI 旗艦模型 GPT-5詳細信息疑似在 GitHub 上提前泄露

疑似GPT-5模型信息在GitHub意外泄露，引發開發者社區轟動。泄露文件顯示GPT-5將實現推理能力、代碼質量和用戶體驗的重大飛躍，僅需少量提示即可完成複雜編程任務，並具備更強大的智能體能力。模型將推出多個版本：旗艦版gpt-5專注複雜任務處理；輕量版gpt-5-mini降低成本門檻；極速版gpt-5-nano優化延遲；企業版gpt-5-chat支持多模態對話。若屬實，該多版本策略將大幅擴展應用場景。目前OpenAI尚未迴應，開發者正密切關注官方消息。

騰訊重磅開源WeKnora！解鎖複雜文檔智能解析，知識管理進入AI新時代

騰訊開源多模態文檔理解工具WeKnora，支持PDF、Word等格式的智能解析與檢索。該工具基於大語言模型，具備文本、表格、圖像等複雜文檔的結構化處理能力，可生成統一語義視圖。其核心優勢包括：1）智能交互支持自然語言問答和多輪對話；2）模塊化架構便於定製開發；3）適用於企業知識庫、科研文獻分析等場景。WeKnora的開源將推動文檔處理智能化發展，項目已在GitHub發佈。

騰訊 AI Lab 全新開源框架，助力深度研究智能體的崛起

騰訊AI Lab推出開源智能體框架Cognitive Kernel-Pro，採用多模塊設計降低外部依賴，主智能體負責任務分解，子智能體專注特定功能。框架引入"進度狀態"機制提升效率，通過文本接口實現智能體間通信，並採用反思投票機制優化任務質量。在GAIA測試中表現優異，接近付費工具智能體水平，同時提供訓練配方促進社區發展。代碼和技術報告已在GitHub開源。

微軟宣佈 Windows 11 本地支持 OpenAI 開源模型 gpt-oss-20b

微軟通過Windows AI Foundry平臺向Win11用戶提供OpenAI開源大模型gpt-oss-20b，支持本地運行AI功能。該輕量級模型擅長代碼執行和工具調用，需16GB顯存設備，但存在53%事實錯誤率。目前僅支持文本處理，未來將擴展至macOS等平臺，並已在Azure和AWS上線。

AI國際象棋大賽火熱開戰！Grok 4一騎絕塵，DeepSeek與 Kimi K2的冤屈

首屆AI國際象棋大賽開戰，Grok4首日表現驚豔。谷歌與Kaggle聯合舉辦的賽事匯聚OpenAI、DeepSeek等8款頂尖AI模型，由國際象棋大師中村光解說。Grok4憑藉超凡戰術獲最高評價，DeepSeek R1不敵o4-mini，Kimi K2因頻繁違規引爭議。馬斯克稱Grok4表現是"副產品"，強調比賽重在測試AI的"涌現能力"。國際象棋因其明確規則和超高複雜度（10^120種局面）成爲理想測試平臺。首輪後Grok4、Gemini2.5Pro等晉級半決賽，賽事引發對AI決策能力的深度探討。