聯想問天WA7785a G3服務器創紀錄!單機運行671B DeepSeek大模型吞吐量高達6708token/s!

聯想今日宣佈，旗下首款 AMD AI 大模型訓練服務器——聯想問天 WA7785a G3在單機部署671B（滿血版） DeepSeek 大模型時，實現了高達6708token/s 的極限吞吐量，再次刷新了單臺服務器運行超大規模模型性能的紀錄。

據介紹，此次性能突破得益於聯想萬全異構智算平臺的強大支持。聯想通過訪存優化、顯存優化、創新的 PCIe5.0全互聯架構以及精選 SGLang 框架中的最優算子等一系列創新技術手段，對大模型從預訓練、後訓練到推理的全流程進行了持續優化。實測結果顯示，在單臺部署 DeepSeek671B 大模型的聯想問天 WA7785a G3服務器上，最高吞吐量達到了驚人的6708token/s。

GPU 芯片 (5)

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

在模擬問題對話場景（上下文序列長度128/1K）時，該服務器最高可支持158的併發數，TPOT(Time Per Output Token)爲93毫秒，TTFT(Time To First Token)爲2.01秒;而在模擬代碼生成場景(上下文序列長度512/4K)時，併發數可達140，TPOT 爲100毫秒，TTFT 爲5.53秒。聯想方面表示，這一性能表現意味着單臺聯想問天 WA7785a G3服務器即可支撐1500人規模企業的正常使用，是繼聯想問天 WA7780G3服務器單機部署滿血版 DeepSeek 大模型總吞吐量突破2500token/s 之後，在單機部署該大模型推理性能上的又一次重大飛躍。

聯想方面強調，此次技術突破是聯想中國基礎設施業務羣、聯想研究院 ICI 實驗室和 AMD 聯合設計、協同調優、共同實現的成果。同時，這並非最終結果，聯想與 AMD 仍在持續探索深度調優的新方法，以期實現更高的性能突破。

華爲 WATCH 5智能手錶接入雙大模型，運動健康體驗全面升級

在今天舉辦的華爲智能穿戴與運動健康新品技術溝通會上，華爲正式發佈了其最新旗艦產品 —— 華爲 WATCH5智能手錶。這款手錶不僅在外觀設計上繼續追求時尚與科技感，更是在功能上進行了重大的技術升級，尤其是在運動健康領域。華爲 WATCH5將接入兩個強大的人工智能大模型 —— 盤古大模型和 DeepSeek 大模型。這兩個模型的引入，將使手錶在語音交互、運動健康監測和生態互聯方面帶來顯著的提升。用戶可以通過語音指令更加便捷地操作手錶，同時也能獲得更加準確和個性化的健康數據

巨人網絡發佈行業首個DeepSeek原生遊戲玩法太空殺推出內鬼挑戰

巨人網絡宣佈旗下社交推理遊戲《太空殺》正式接入DeepSeek大模型，並推出基於該技術的原生遊戲玩法“內鬼挑戰”，目前該玩法已開啓灰度測試，後續將面向全量用戶開放。這標誌着業內首次將DeepSeek大模型能力深度應用於遊戲玩法創新，以AI驅動遊戲核心玩法，重塑遊戲的競技和交互體驗。

騰訊元寶功能上新：允許分享長圖時是否展示AI思考過程

騰訊元寶是一款支持騰訊混元（Turbo/T1）和DeepSeek(V3/R1)大模型的AI助手工具，用戶可以不限量使用其聯網搜索和文件解析功能，以提升工作和學習效率。此次更新的核心亮點在於用戶可以根據需求選擇分享“短圖”(僅展示回答結果)或“長圖”(包含詳細推理過程)，使分享內容更加個性化和多樣化。

騰訊雲智能數智人全面接入DeepSeek大模型提升用戶交互體驗

近日，騰訊雲智能數智人與 DeepSeek 大模型成功實現全面接入，標誌着人工智能技術在用戶交互體驗方面邁出了重要一步。藉助 DeepSeek 大模型強大的語義理解和意圖識別能力，騰訊雲智能數智人在多種應用場景中將更加智能、靈活。這一接入使得騰訊雲智能數智人能夠在交互、播報等多個領域中提供更爲豐富的用戶體驗，助力其在實際生產和生活中更好地發揮作用。具體來說，用戶在使用數智人平臺時，無需進行任何開發，只需藉助內置的 V3、R1等多種模型及100多種2D 小樣本數智人，即可讓

周鴻禕談AI幻覺與網絡安全:問題不可誇大也不應忽視

在今年全國兩會前夕，全國政協委員、360集團創始人周鴻禕就DeepSeek大模型及AI安全問題發表看法，強調正確認識AI安全，既不可誇大也不應忽視。周鴻禕指出，當前AI安全議題需警惕被誇大的趨勢。他批評以OpenAI爲代表的美國五大AI公司傾向於通過渲染AI不安全來爲其壟斷和閉源策略辯護，藉此推動政府加強監管，阻撓後來者追趕。他認爲，這種背景下討論AI安全有“耍流氓”之嫌，並強調“不發展是最大的不安全”。在他看來，抓住AI工業革命機遇，提升生產力並實現科技普惠，纔是當務之

聯想問天WA7785a G3服務器創紀錄!單機運行671B DeepSeek大模型吞吐量高達6708token/s!

相關推薦

華爲 WATCH 5智能手錶接入雙大模型，運動健康體驗全面升級

巨人網絡發佈行業首個DeepSeek原生遊戲玩法 太空殺推出內鬼挑戰

騰訊元寶功能上新：允許分享長圖時是否展示AI思考過程

騰訊雲智能數智人全面接入DeepSeek大模型 提升用戶交互體驗

周鴻禕談AI幻覺與網絡安全:問題不可誇大也不應忽視

巨人網絡發佈行業首個DeepSeek原生遊戲玩法太空殺推出內鬼挑戰

騰訊雲智能數智人全面接入DeepSeek大模型提升用戶交互體驗