從手機到手語翻譯，Gemma模型家族全面升級亮相Google I/O

在2025年Google I/O開發者大會上，谷歌正式發佈輕量級多模態模型Gemma3n，並宣佈Gemma模型家族持續擴展，新增面向醫療和無障礙場景的MedGemma與SignGemma。

作爲本地運行AI趨勢的代表，Gemma3n專爲手機、筆記本和平板等低算力設備設計，具備處理文本、音頻、圖像和視頻的能力。據谷歌介紹，Gemma3n甚至可在低於2GB運行內存的設備上流暢運行，體現出其高效架構優勢。該模型已於發佈日面向開發者預覽，並與Gemini Nano共享底層架構。

谷歌強調，Gemma3n的輕量與隱私優勢，使其成爲離線AI應用的理想選擇。相比需要依賴雲端的大型模型，本地AI模型不僅響應更快、成本更低，還能保護用戶數據不被傳輸至遠程服務器，尤其適用於隱私敏感型場景。

在健康領域，谷歌通過旗下健康AI開發者基金會，推出了MedGemma——一組針對健康相關文本與圖像的開放模型。據介紹，MedGemma具備出色的多模態分析能力，支持開發者在醫療影像識別、病歷文本處理等場景中構建更精準的AI工具。

此外，谷歌還預告了即將推出的SignGemma模型，專爲手語識別而設計，能夠將美國手語（ASL）翻譯成英語文本，旨在幫助開發者爲聾啞與聽障用戶構建更友好的溝通工具。谷歌表示，這是“目前爲止最強大的手語理解模型”。

儘管Gemma模型系列因其非標準許可條款引發部分開發者對商業化使用的擔憂，但其廣泛的功能性仍獲得開發者社區熱烈響應，Gemma模型系列的下載量已突破數千萬次。

隨着Gemma模型家族不斷拓展，谷歌正推動開放AI模型在設備端、本地隱私保護、醫療健康與無障礙領域邁向更廣闊的應用空間。

飛書將上線AI產品“知識問答” 革新企業知識管理

近日，飛書宣佈即將推出全新AI產品“知識問答”，以智能化手段重塑企業知識管理模式，助力企業數字化轉型。“知識問答”是一款深度融合人工智能技術的問答工具，能整合企業員工在飛書上有權限訪問的各類信息，包括文檔、消息記錄等，員工在工作中遇到業務、技術等各類問題，都能快速獲取精準答案，極大提升工作效率。在實際測試場景中，其表現亮眼。如在春招期間，飛書編輯部新員工用它解決文章標題難題，工具結合企業內部及公開知識給出建議，且信息來源清晰可溯。該

蘋果將開放AI模型給開發者，力求催生創新應用

蘋果公司近日宣佈，將向第三方開發者開放其人工智能模型，旨在激發新應用的創造力，並提升其設備的吸引力。知情人士透露，這一計劃將在6月9日的全球開發者大會（WWDC）上正式發佈。蘋果希望通過提供軟件開發工具包(SDK)和相關框架，讓開發者能夠基於其大型語言模型構建 AI 功能。目前，蘋果的 AI 平臺 “Apple Intelligence” 已經在 iOS 和 macOS 中應用於通知摘要、文本編輯及基礎圖像生成等功能。開放 AI 模型後，開發者可以將這些技術整合到具體應用中，甚至跨越整個應用程序。初期，

騰訊大模型戰略亮相 Turbo S 與 T1 模型全面升級

5月21日，騰訊宣佈其混元大模型矩陣全面升級，標誌着騰訊在人工智能領域的技術能力持續提升。此次升級涵蓋了多個方面，包括旗艦快思考模型混元TurboS、深度思考模型混元T1的升級，以及基於TurboS基座新推出的視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice。此外，騰訊還同步更新了混元圖像2.0、混元3D v2.5及混元遊戲視覺生成等一系列多模態模型。

騰訊混元宣佈模型矩陣全面升級，新推視覺推理模型T1-Vision和語音通話模型混元Voice

今日，騰訊混元正式宣佈其模型矩陣的全面升級，包括旗艦快思考模型混元TurboS、深度思考模型混元T1升級，並基於TurboS基座，新推出視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice。另外，騰訊混元圖像2.0、騰訊混元3D v2.5及混元遊戲視覺生成等一系列多模態模型同步“上新”。此次升級不僅增強了混元在 AI 領域的競爭力，也標誌着騰訊在多模態技術上的新進展。在2025騰訊雲 AI 產業應用峯會上，騰訊集團高級執行副總裁湯道生表示，混元 TurboS 模型在全球公認的 Chatbot Arena 評測

美圖獲阿里巴巴 2.5 億美元投資，深度佈局 AI 與電商領域