DeepSeek關聯公司發佈大語言模型創新部署專利，推動 AI 技術新發展

近日，DeepSeek 的關聯公司 —— 杭州深度求索人工智能基礎技術研究有限公司，公開了一項名爲 “一種大語言模型的部署方法及系統” 的專利。這項專利的公佈，標誌着該公司在人工智能領域的又一重要進展，尤其是在大語言模型的部署方面。

DeepSeek

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

根據專利的摘要，該發明主要涉及到人工智能的核心技術。其創新之處在於將大語言模型的兩個關鍵階段 —— 預填充階段和解碼階段，分別部署在高性能計算能力和大內存的機器上。這種分佈式的部署方式能夠有效均衡負載任務，最大限度地利用硬件資源。通過減少閒置的計算能力，該方法不僅降低了整體的延遲，還顯著提高了系統的吞吐量。

在當前的 AI 技術發展中，系統的擴展性和容錯性顯得尤爲重要。DeepSeek 的這一專利，正是通過優化資源配置，增強了系統在面對不同工作負載時的適應能力。這種創新部署方法，預示着未來的 AI 模型將更高效、更智能，有望爲各類應用場景提供更好的支持。

值得一提的是，DeepSeek-V3作爲該公司的核心產品之一，其強大的 Mixture-of-Experts （MoE）語言模型，擁有671B 個參數，每個 token 的激活參數達到37B。這一技術的進步，無疑將推動 AI 技術的普及和應用，助力各行各業的數字化轉型。

劃重點:
🌟 DeepSeek 發佈新專利，創新部署大語言模型的方法，提高系統性能。
🚀 分佈式部署實現硬件資源的最大化利用，減少整體延遲。
📈 增強系統的擴展性和容錯性，助力未來 AI 技術的發展。

騰訊混元"合二爲一"：多模態與大語言模型部門合併，姚順雨統管衝全模態上限

據7月24日報道，騰訊於7月23日宣佈將混元多模態模型部門與大語言模型部門合併，組建基礎模型部，由首席AI科學家姚順雨統率。此舉旨在提升研發與協同效率，全力衝刺全模態模型的智能上限。整合早有伏筆，去年12月姚順雨已接管大語言模型團隊，如今雙邊歸一，意味着騰訊集中資源推動多模態與語言深度融合，加速構建新一代統一基礎模型，向全模態智能更高峯邁進。

DeepSeek梁文鋒談開源：只賺 6 倍利潤不加班，想賺 100 倍纔會受制於開源

DeepSeek投資者交流會內部談話流出，梁文鋒闡述開源底層邏輯。他明確承諾最強模型也會開源，認爲閉源無必然好處。首次從財務角度說明：十個月回本對應約6倍利潤，開源不影響此利潤，但會制約100倍暴利。因此在6倍利潤前提下，開源對商業模式無礙。

DeepSeek梁文峯談定價策略:模型曾降價四分之三，只賺合理利潤不以商業化爲目標

梁文峯在投資人會議中闡述定價策略、技術路線和商業化思路，強調DeepSeek追求合理利潤而非最大化，以極致成本效率驅動更強模型能力，推動技術普惠。實踐中，某模型曾因擔憂需求過大而設定較高初始價，隨後直接大幅降價，體現出成本優勢支撐的讓利邏輯。

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

Epoch AI研究顯示，主流AI文本檢測器能近乎完美識別普通AI生成內容，但當大語言模型刻意模仿特定作者寫作風格時，準確率明顯下降，科學寫作最難辨別。實驗測試了Pangram、GPTZero和Originality.ai三款工具，採用495篇涵蓋博客、小說、科學的人類原創文本（均創作於ChatGPT問世前），發現風格模仿可有效逃逸檢測。

DeepSeek關聯公司發佈大語言模型創新部署專利，推動 AI 技術新發展

相關推薦

騰訊混元"合二爲一"：多模態與大語言模型部門合併，姚順雨統管衝全模態上限

DeepSeek梁文鋒談開源：只賺 6 倍利潤不加班，想賺 100 倍纔會受制於開源

DeepSeek梁文峯談定價策略:模型曾降價四分之三，只賺合理利潤不以商業化爲目標

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

DeepSeek梁文鋒身價飆升至 360 億美元，成AI公司新首富

​DeepSeek關聯公司 發佈大語言模型創新部署專利，推動 AI 技術新發展

相關推薦

騰訊混元"合二爲一"：多模態與大語言模型部門合併，姚順雨統管衝全模態上限

DeepSeek梁文鋒談開源：只賺 6 倍利潤不加班，想賺 100 倍纔會受制於開源

DeepSeek梁文峯談定價策略:模型曾降價四分之三，只賺合理利潤不以商業化爲目標

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

DeepSeek梁文鋒身價飆升至 360 億美元，成AI公司新首富

DeepSeek關聯公司發佈大語言模型創新部署專利，推動 AI 技術新發展