AI圈再掀巨浪!阿里巴巴震撼發佈並全面開源了其最新力作——通義千問QwQ-32B推理模型。這款被寄予厚望的新模型,並非徒有虛名,而是經過大規模強化學習的千錘百煉,在硬核的數學運算、複雜的代碼編寫以及通用的AI能力上實現了質的飛躍,整體性能已經能夠正面硬剛行業標杆DeepSeek-R1,實力不容小覷。


AI圈再掀巨浪!阿里巴巴震撼發佈並全面開源了其最新力作——通義千問QwQ-32B推理模型。這款被寄予厚望的新模型,並非徒有虛名,而是經過大規模強化學習的千錘百煉,在硬核的數學運算、複雜的代碼編寫以及通用的AI能力上實現了質的飛躍,整體性能已經能夠正面硬剛行業標杆DeepSeek-R1,實力不容小覷。

OpenAI 近期推出了一項新系統,旨在監控其最新的 AI 推理模型 o3和 o4-mini,以阻止與生物和化學威脅相關的提示。該系統的目標是防止模型提供可能教唆他人實施有害攻擊的建議,確保 AI 的安全性。OpenAI 表示,o3和 o4-mini 在能力上較之前的模型有顯著提升,因此在惡意用戶手中可能帶來新的風險。根據 OpenAI 的內部基準測試,o3在回答關於某些生物威脅的相關問題時,表現得尤爲出色。爲了應對這些風險,OpenAI 開發了這個新的監控系統,稱之爲 “以安全爲中心的推理監測器”。這個監測器
Kimi 技術團隊近日發佈了 Kimina-Prover 預覽版的技術報告,並開源了1.5B 和7B 參數的模型蒸餾版本、用於數據生成的 Kimina-Autoformalizer-7B 模型以及修訂過的 miniF2F 基準測試數據集。Kimina-Prover 是由 Numina 和 Kimi 團隊聯合研發的一款數學定理證明模型,它在形式化定理證明領域採用了一種新穎的、由推理驅動的探索範式,展現出極佳的性能。
近日,谷歌在開發者平臺 Google AI Studio 及 Gemini 應用程序上發佈了其最新的人工智能推理模型 ——Gemini2.5。此模型具備停下來 “思考” 的能力,標誌着人工智能技術的新進步。谷歌還推出了 Gemini2.5Pro Experimental,這款多模式推理 AI 模型被認爲是迄今爲止最智能的。Gemini2.5的發佈是谷歌針對每月20美元的 Gemini Advanced 訂閱者的一項新服務,用戶可以體驗到其強大的推理能力。自從2024年9月 OpenAI 發佈首個 AI 推理模型以來,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等紛紛推出了各自的推理模
騰訊混元 T1正式版上週發佈後,不少用戶關心何時能夠在元寶中使用這一新版本。對此,騰訊官方在最新消息中宣佈,混元 T1正式版與 DeepSeek V3最新版一同上線,爲用戶帶來了全新的體驗。混元 T1正式版是騰訊自研的深度思考模型,與之前的 T1Preview 版本相比,進行了全面的升級。新版本不僅提升了速度和性能,還顯著改善了綜合效果,能夠實現秒級響應,滿足用戶對推理模型的高效需求。用戶體驗的優化使得混元 T1在各類推理任務中表現得更加出色。此外,與混元 T1同時推出的還有 DeepS
混元T1正式版在大規模強化學習的基礎上,針對數學、邏輯推理、科學和代碼等理科難題進行了專項優化,從而實現了推理能力的顯著提升。在常見benchmark上,如大語言模型評估增強數據集MMLU-PRO中,混元T1取得了87.2分的優異成績