蘋果研究團隊出品！LazyLLM：提高LLM長文本推理效率

AIbase基地

Published in AI News · 1 minute read · Jul 17, 2025

最近蘋果公司的研究團隊和 Meta AI 的研究人員聯合推出了一項名爲 LazyLLM 的新技術，這項技術在提高大型語言模型（LLM）在長文本推理中的效率。

大家都知道，當前的 LLM 在處理長提示時，特別是在預充階段，往往會面臨速度慢的問題。這主要是因爲現代的變換器架構在計算注意力時，其計算複雜度隨着提示中的 token 數量呈平方關係增長。因此，在使用 Llama2模型時，首個 token 的計算時間往往是後續解碼步驟的21倍，佔據了生成時間的23%。

爲了改善這一狀況，研究者們提出 LazyLLM，這是一種通過動態選擇重要 token 的計算方式來加速 LLM 推理的新方法。LazyLLM 的核心在於它會根據之前層的注意力分數評估每個 token 的重要性，從而逐步削減計算量。與永久性壓縮不同的是，LazyLLM 可以在必要時恢復被削減的 token，以確保模型的準確性。此外，LazyLLM 引入了一種名爲 Aux Cache 的機制，可以存儲被剪枝 token 的隱含狀態，從而高效地恢復這些 token，並防止性能下降。

LazyLLM 在推理速度上表現突出，尤其是在預填充和解碼階段。該技術的三個主要優點是:它與任何變換器基礎的 LLM 兼容，實施過程中不需要進行模型的再訓練，並且在多種語言任務上都表現得非常有效。LazyLLM 的動態剪枝策略使其在保留大部分重要 token 的同時，可以大幅度減少計算量，進而提升生成速度。

研究結果表明，LazyLLM 在多個語言任務上均表現優異，TTFT 速度提升達2.89倍（對於 Llama2）及4.77倍(對於 XGen)，同時準確率幾乎與基線持平。無論是問答、摘要生成還是代碼補全任務，LazyLLM 都能實現更快的生成速度，並且在性能與速度之間取得良好的平衡。其漸進的剪枝策略加上逐層分析，爲 LazyLLM 的成功奠定了基礎。

論文地址：https://arxiv.org/abs/2407.14057

劃重點:
🌟 LazyLLM 通過動態選擇重要 token，加速 LLM 推理過程，特別是在長文本場景中表現突出。
⚡ 該技術能夠顯著提高推理速度，TTFT 速度提升可達4.77倍，同時保持較高的準確性。
🔧 LazyLLM 不需要對現有模型進行改動，可與任何變換器基礎的 LLM 兼容，易於實施。

谷歌二季度收入達850億美元，AI與搜索業務助力增長

谷歌母公司Alphabet第二季度財報顯示，谷歌收入近850億美元，其中搜索業務貢獻485億美元，雲計算部門首次突破100億美元大關並實現10億美元的運營利潤。CEO桑達爾・皮查伊表示生成式AI解決方案爲公司帶來數十億收入，被超過200萬開發者使用。AI技術和在基礎設施和研究上的優勢，將把握技術發展中的機遇。谷歌嘗試收購初創公司Wiz以增強雲安全產品線，但Wiz選擇通過IPO進行發展，該消息引起關注。自市值突破2萬億美元后，在搜索中推出Gemini驅動的AI概述部分功能遭用戶反饋提供奇怪答案，谷歌已下架。廣告業務收入達到646億美元，YouTube廣告收入同比增長13%，達到86億美元。訂閱、平臺和設備部門收入爲93億美元。儘管推出AI概述帶來搜索使用量增長和用戶滿意度提升，但谷歌已決定放棄逐步淘汰第三方Cookie的計劃，Chrome瀏覽器要求用戶做出“知情選擇”，反映在隱私增強技術上的投資。這一決定與Safari和Firefox的策略一致。隨着即將召開的硬件發佈會，谷歌計劃推出新設備，未來業務有望再創新高。

可靈AI視頻開啓付費計劃結束免費生成體驗

AI視頻生成工具“可靈”宣佈結束免費服務，轉而推出多層次付費會員計劃。會員體系包括非會員、黃金、鉑金和鑽石四個級別，滿足不同用戶需求，從基本創作到專業級、大型團隊創作，分別享有每日66靈感值、每月300靈感值、每月800靈感值的生成能力。爲吸引更多用戶，推出一週限時半價優惠。鉑金會員以1500元年費聞名性價比高，每月能生成約300個高性能視頻，滿足大多數創作者需求。與競品如費用相對較高的AI視頻工具Runway相比，可靈方案更加親民。保留的非會員版本也提供每天66點免費生成能力。此舉展現了可靈在商業模式上的成熟和對市場需求的精準定位。隨着AI技術在創意領域的持續發展，可靈等創新工具正成爲推動內容創作領域發展的關鍵力量。

Adobe爲Illustrator和Photoshop引入更多生成式AI功能

Adobe在最新設計軟件更新中引入了一系列AI生成功能，旨在大幅提升Illustrator和Photoshop的創作品效。新增功能包括Illustrator的生成式形狀填充工具與Text to Pattern功能，以及Photoshop的生成圖像功能和選擇畫筆工具，均利用Adopt的Firefly AI模型。生成式AI被設計爲輔助，而非取代人類創作過程。更新受到行業內外不同觀點的影響：一方面，AI工具的引入可顯著提升設計效率並帶來創新可能；另一方面，亦有創意專業人士擔憂其對行業就業帶來的潛在影響。儘管面臨爭議，Adobe強調生成式AI旨在增強創意表達，而非取代人類創意。這輪更新是Adopt自去年推出Firefly AI模型後在生成式AI應用的里程碑發展，預示着技術創新對創意行業未來構建的影響。

PixVerse V2視頻模型發佈支持直接生成8秒視頻

PixVerse V2發佈，能生成8秒高質量視頻，大幅提高畫質與細節。該版本可將用戶創意瞬間變爲動畫短片，無論多麼天馬行空的想法都能實現。其特點是分辨率高、動態效果流暢、連貫性佳，可在一個視頻中加入5個場景，且提供多種風格選擇。操作簡單，只需三步：登錄、輸入、生成。此外，用戶可編輯直至滿意，滿足個性化需求。PixVerse V2爲用戶提供了創造短片的全新工具，只需8秒，就能在任何平臺上展現無限創意。

前特斯拉負責人推出“大力士”倉庫機器人：可搬運3000磅重物

一家名爲Mytra的初創公司，由克里斯·沃爾提（前特斯拉Optimus項目負責人）和阿哈德·貝塔爾馬爾（前Rivian負責人）創立，通過AI驅動的簡單模塊化3D機器人系統解決倉庫物料流動問題。Mytra的獨特之處在於其對硬件/軟件對的重新聚焦，並被稱作首項能廣泛自動化勞動密集、成本高昂和複雜物料流動環節的解決方案。自2022年起低調運作後，Mytra最近獲得了7800萬美元的B輪融資。 Mytra的解決方案以模塊化的細胞基礎矩陣結構爲核心，其AI驅動機器人能高效搬運最多3000磅貨品，並能靈活擴展，沒有任何移動部件，充分利用現代軟件優勢，同時AI軟件優化路徑和庫存管理，通過數據分析提升效率。Mytra已與大型超市阿爾伯森斯等財富100強企業達成合作，並計劃在2025年前部署更多新項目以滿足客戶增長需求。