Ollama推出全新多模態AI引擎，推理性能顯著提升

前不久，Ollama 宣佈推出一款全新的多模態 AI 引擎，這款引擎的研發是獨立於原有的 llama.cpp 框架進行的，標誌着公司在人工智能領域邁出了重要一步。這一引擎是基於 Golang 編程語言開發，旨在大幅提高本地推理的精度，同時增強大型圖像處理的能力。

新引擎的亮點在於其引入了圖像處理元數據、KVCache 優化及圖像緩存功能。這些創新使得在內存管理和資源利用效率上都取得了突破，確保 AI 模型在運行時更加高效。這對於需要處理大量數據的複雜模型，如 Llama4Scout，尤爲重要，能夠在更短的時間內提供更精準的結果。

元宇宙科幻賽博朋克繪畫 (4)大模型

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

此外，新引擎還支持分塊注意力機制和2D 旋轉嵌入等先進技術。這些功能使得引擎能夠靈活應對不同類型的數據輸入，無論是圖像還是文本，都能在處理時保持高效率與高準確度。Ollama 團隊表示，這種靈活性是他們開發這款引擎時的核心目標之一，旨在爲用戶提供更強大的 AI 應用能力。

Ollama 的這一舉措不僅推動了本地 AI 推理的性能，還使得大規模圖像處理變得更加高效，爲開發者和研究者打開了新的可能性。隨着技術的不斷進步，Ollama 的多模態 AI 引擎將在未來的應用中扮演越來越重要的角色，期待它在實際應用中展現出更大的潛力。

數學建模的AI助手MathModelAgent，給出題目就能完成分析到寫論文全流程

一款名爲MathModelAgent的AI助手在開源社區引發熱議。這款專爲數學建模設計的智能工具，能夠自動完成從問題分析、模型構建、代碼編寫到論文撰寫的全流程，展現了AI在學術與技術領域的深遠潛力。MathModelAgent:數學建模的革命性助手MathModelAgent是一個多智能體協作系統，集成了多個專業模塊，包括負責數學建模的“建模手”、代碼編寫與調試的“代碼手”以及論文撰寫的“論文手”。據開源社區介紹，該系統通過協同工作，能夠高效處理複雜的數學建模任務。無論是解析問題、建立數學模

谷歌I/O 2025重磅炸彈！Gemini AI搜索引擎將取代傳統搜索框，灰度測試啓動，競爭對手顫抖！

隨着谷歌I/O開發者大會臨近（5月20日至21日），業界傳出重磅消息:谷歌正計劃推出基於Gemini2.5的下一代AI搜索引擎，全面替換傳統的搜索框界面。這一新模式已進入灰度測試階段，標誌着谷歌將其最大流量入口切換至AI驅動的Gemini生態，對OpenAI、Perplexity等競爭對手構成重大挑戰。AIbase綜合最新動態，深入解析這一變革性舉措及其對全球搜索市場的潛在衝擊。Gemini AI搜索引擎:從搜索框到智能交互谷歌的傳統搜索框一直是其核心產品，但隨着AI技術的飛速發展，Gemini2.5的推出爲搜索體驗帶來了

消息稱Google I/O大會或發佈Gemini驅動的全新AI搜索引擎

有消息人士透露，Google 可能會在其年度 I/O 開發者大會上發佈一款顛覆性的全新搜索引擎，該引擎的核心技術將是 Google 最新的生成式人工智能模型 Gemini。據稱，目前該新搜索模式已經開始進行小範圍的灰度測試。如果消息屬實，這可能標誌着 Google 將其最重要的流量入口——目前的搜索框——全面切換到基於 Gemini 的 AI 搜索引擎。此舉無疑將在搜索引擎領域引發巨大的震動，並對其他競爭對手構成嚴峻的挑戰。目前關於這款基於 Gemini 的搜索引擎的具體功能細節尚未可知，但外界普遍猜測

廣東移動發佈全新AI通話系列產品，通信體驗再升級

近日，廣東移動揭曉了其最新的 AI 通話系列產品，旨在提升用戶的通信體驗。這次發佈的產品包括 AI 速記、AI 祕書、AI 家秀、AI 禮遇、AI 伴聊等多款新功能，涵蓋了從個人日常到商務溝通的多種場景。隨着 AI 技術的快速發展，這些創新產品將爲用戶帶來更加智能、便捷的通話體驗。首先，AI 速記功能將徹底改變用戶記錄通話內容的方式。它能夠在通話結束後自動將語音對話轉化爲文字記錄，並通過短信鏈接發送給用戶。用戶只需點擊鏈接，即可查看詳細的通話摘要，省去了繁瑣的手動記

中信證券：管理軟件或是AI Agent落地的最佳場景之一