騰訊混元自主研發ASR語音識別大模型接入ima平臺

7月22日，騰訊混元宣佈其自主研發的ASR（語音識別）大模型正式應用於ima平臺，首次在手機App端實現了語音輸入功能，爲用戶帶來了“出口成章”的便捷體驗。用戶現在可以通過語音直接輸入問題或記錄靈感，無需手動敲擊鍵盤，極大地提升了輸入效率。

騰訊混元ASR大模型以其敏銳的聽覺和智能的理解能力脫穎而出，在複雜環境下依然能夠準確識別語音，每分鐘可識別300字，速度比手動輸入快4倍，且識別結果更加精準自然。該模型採用業界首個基於雙編碼器的流式ASR架構，相比傳統ASR技術，在語義理解能力上有了顯著提升，尤其在中英文混雜等場景中表現更爲出色。

微信截圖_20250723081854.png

此次ima平臺引入的語音輸入功能，覆蓋了知識庫問答、筆記創作等多個應用場景。用戶在進行知識庫查詢或首頁問答時，若問題較長，可直接通過語音輸入;在撰寫筆記時，ima則像一位會聽音的筆記小助手，幫助用戶進行創作，並能根據舊筆記快捷續寫，實現無縫銜接。此外，iOS用戶還可以通過添加桌面小組件，實現更快速的提問體驗。

騰訊混元團隊表示，未來將繼續優化ASR大模型，提升方言識別和多語言識別能力，不斷擴充支持的語言類型，以滿足不同場景下的使用需求。此次語音輸入功能的上線，不僅展示了騰訊混元在語音識別領域的技術實力，也爲用戶帶來了更加高效、便捷的輸入方式，開啓了智能交互的新篇章。

昔日合作伙伴反目成仇，微軟AI主管挖角谷歌20名核心員工引發行業震動

微軟AI戰略負責人蘇萊曼從DeepMind挖角超20名核心員工，包括前谷歌Gemini工程負責人蘇布拉馬尼亞，加速微軟AI佈局。這波人才爭奪戰導致行業薪酬飆升，OpenAI CEO批評高薪挖角助長功利風氣。谷歌數據顯示ChatGPT用戶數領先自家Gemini，雙方互挖研究人員競爭白熱化。值得注意的是，科技巨頭一邊高薪爭奪AI專家，一邊大規模裁員普通員工，微軟近期就裁撤9100個崗位，凸顯行業資源向AI傾斜的兩極分化趨勢。

李開復 AI 創業公司零一萬物發佈下首個智能體“萬仔”

零一萬物發佈"萬仔"企業智能體，定位"超級員工"，具備深度思考和任務規劃能力，支持私有化部署確保數據安全。CEO李開復提出AI智能體三階段發展路徑：從執行指令的工作流智能體，到自主規劃的推理智能體，最終實現多智能體協作網絡。該產品標誌着中國大模型進入"交付結果"的產業AI新時代。

OpenAI 完成300億美元融資，估值達3000億美元，軟銀領投

OpenAI將於7月28日重啓融資，計劃完成400億美元融資目標，由軟銀領投300億美元（其中軟銀出資225億）。融資後估值將達3000億美元，成爲估值最高初創企業之一。公司還與軟銀合作推進5000億美元的"星際之門"AI數據中心項目。針對公司結構爭議，OpenAI提出新架構方案：保留非營利組織控制權，將營利部門轉爲公益公司。軟銀投資取決於新架構能否在2025年初獲批。目前OpenAI已累計融資639.2億美元，投資者包括微軟等知名機構。

亞馬遜收購AI穿戴設備初創公司Bee，開啓智能助手新篇章

亞馬遜收購AI穿戴設備公司Bee，該公司主打49.99美元智能手環，能通過錄音生成提醒。相比同類高價產品更具價格優勢。該設備定位"雲手機伴侶"，但引發隱私擔憂。亞馬遜此舉顯示其拓展AI穿戴領域的野心，但用戶數據安全存疑，尤其亞馬遜過往數據管理記錄不佳。交易完成後Bee團隊將加入亞馬遜。

阿里新推出 Qwen3-Coder：開源 AI 編程模型助力開發者高效編程！

阿里巴巴推出開源AI編程模型Qwen3-Coder，採用MoE架構，參數量達480億。該模型在7.5TB代碼數據集上訓練，支持256K token上下文，性能媲美Claude4。在WebArena等評測中超越GPT4.1，擅長處理複雜編程任務。可降低編程門檻，快速生成3D模擬，已在魔搭社區等平臺開源，並接入阿里雲服務。