小巧卻強大！IBM發佈新語言模型Granite 4.0 Tiny Preview：長上下文處理

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 21, 2025

IBM 發佈了 Granite4.0Tiny Preview，這是即將推出的 Granite4.0系列語言模型中最小的一款的預覽版本。該模型不僅具備高效的計算能力，還爲開源社區提供了一個值得關注的實驗平臺。

高效的性能與極小的內存需求

Granite4.0Tiny 在 FP8精度下，能夠在消費級硬件上運行多個長上下文（128K）的併發任務，適用於市面上價格低於350美元的 GPU。儘管該模型目前僅經過部分訓練，處理過2.5萬億個訓練標記，但其性能已接近 IBM Granite3.32B Instruct，且內存需求降低約72%。隨着後續訓練的進行，預計 Granite4.0Tiny 的性能將達到與 Granite3.38B Instruct 相當的水平。

全新的混合架構設計

Granite4.0系列語言模型採用了全新的混合 Mamba-2/Transformer 架構，結合了 Mamba 的速度與效率以及 Transformer 的自注意力精度。Granite4.0Tiny Preview 是一個細粒度的混合專家模型，具有70億個總參數，但在推理時僅激活10億個參數。這一創新的架構設計源自 IBM 研究與 Mamba 原始創造者的合作，提升了模型的整體性能。

無約束的上下文長度

Granite4.0的一個亮點是其理論上能夠處理無限長的序列。這一能力源自其不使用位置編碼（NoPE）的設計，有效避免了傳統模型在處理長上下文時的性能限制。測試表明，該模型在處理128K 個標記時表現良好，未來還將驗證其在更長上下文上的性能表現。

適合多種應用場景

Granite4.0Tiny 的內存效率和性能，使其成爲多個企業應用的理想選擇。IBM 計劃在未來幾個月內，進一步完善模型，並期待在即將召開的 IBM Think2025大會上分享更多信息。

IBM 的 Granite4.0Tiny Preview 不僅是對高效能語言模型的一次大膽嘗試，更是對開源社區的一次有力支持。隨着後續版本的推出，該模型有望爲開發者和企業用戶帶來更多可能性。

官方博客：https://www.ibm.com/new/announcements/ibm-granite-4-0-tiny-preview-sneak-peek

學而思推出全新學習機，AI 智能交互助力孩子個性化學習

日前，學而思在新品發佈會上正式推出了 P、S、T 三大系列學習機，旨在通過 “好 AI + 好內容” 來重塑學生的學習體驗。在 “好 AI” 方面，學而思藉助自主研發的九章大模型與 DeepSeek 雙核大模型，全面升級了智能學習系統。該學習機還提供了 “小思 AI1對1” 智能交互功能，旨在引導學生主動探索，提升個性化學習的效率。注：圖片來自官網截圖新款學習機在內容方面同樣表現不俗。學而思表示，學習機目前的課程總量已達1600萬分鍾，並新增了400萬分鐘的精品課程與85萬套真題。爲了緊

北大、清華聯合發佈！大模型邏輯推理能力新突破

在當前人工智能領域，大語言模型（LLMs）取得了顯著成就，但其邏輯推理能力依然顯得不足。爲了提升這一能力，來自北京大學、清華大學、阿姆斯特丹大學、卡內基梅隆大學以及阿布扎比的 MBZUAI 等五所高校的研究人員，聯合發佈了《Empowering LLMs with Logical Reasoning: A Comprehensive Survey》綜述論文，聚焦於邏輯推理的兩大關鍵問題:邏輯問答和邏輯一致性。研究表明，大語言模型在處理複雜邏輯推理時存在明顯的短板。例如，在邏輯問答任務中，當給定一系列前提時，模型往往無法生成正確的

OpenAI啓動 “星際之門” 計劃，全球佈局AI基礎設施

近日，人工智能公司 OpenAI 宣佈了一項雄心勃勃的新計劃，旨在全球範圍內建設 AI 基礎設施，這一舉措被稱爲 “OpenAI for Countries”。這一計劃將作爲美國 “星際之門” 項目的延伸，專注於在海外投資與合作，推動各國在人工智能領域的發展。根據 OpenAI 的消息，該計劃的初步目標是在全球範圍內啓動十個 AI 基礎設施項目。這些項目的資金將主要來自 OpenAI 本身以及各國政府的合作。雖然目前尚未公佈具體的項目地點，但 OpenAI 首席執行官山姆・奧爾特曼曾提到，許多國家已向公司表達了希

三星One UI Watch 8迎來谷歌Gemini AI，跨應用操作更加智能便捷

近日，三星宣佈將在其最新的 One UI Watch8系統中集成谷歌的 Gemini AI 助手，這一功能的引入將爲用戶帶來更爲流暢和高效的操作體驗。根據科技媒體 Android Authority 的報道，通過對 One UI Watch8的 APK 文件進行逆向編譯，發現 Gemini AI 將不僅僅是取代原有的 Google Assistant，還將提供一系列增強的 AI 功能，尤其是在健康和健身領域，期待能爲用戶提供更多幫助。Gemini AI 的核心新特性是 “Gemini Actions” 功能。該功能使得用戶能夠跨不同應用進行操作，意味着你不再需要頻繁切換設備或應用程序。只需

微軟採用谷歌的A2A標準，連接AI代理

微軟宣佈將支持 Google 推出的開放協議 ——Agent2Agent （A2A）標準，旨在促進人工智能(AI)代理之間的相互通信。通過這一協議，微軟計劃在其兩個 AI 開發平臺 Azure AI Foundry 和 C o p i l o t Studio 中引入 A2A 的支持，同時加入 GitHub 上的 A2A 工作組，積極參與協議的制定和工具的開發。圖源備註:圖片由AI生成，圖片授權服務商Midjourney在一篇博客文章中，微軟表示:“通過支持 A2A 並基於我們的開放式編排平臺進行構建，我們正在爲下一代軟件奠定基礎，這些軟件在設計上具備協作性、可觀察性和自適應

蘋果考慮在Safari中引入AI搜索功能，以應對用戶轉向新技術

蘋果公司的高級副總裁埃迪・庫伊（Eddy Cue）在美國司法部針對谷歌的反壟斷訴訟中透露，蘋果正積極考慮對 Safari 瀏覽器進行重大改造，計劃 AI 驅動的搜索引擎集成到其中。庫伊提到，Safari 瀏覽器的搜索量在上個月首次出現下降，他將這一變化歸因於用戶越來越多地轉向使用 AI 工具來滿足其搜索需求。圖源備註：圖片由AI生成，圖片授權服務商Midjourney在證詞中，庫伊指出，包括 OpenAI、Perplexity 和 Anthropic 等 AI 搜索提供商，可能會在未來取代傳統的搜索引擎如谷歌。蘋果正在考慮將這些新