相關推薦
谷歌 Gemini 3 Pro Preview模型上線 AI Studio 開發者可靈活調整參數
谷歌發佈Gemini3大型語言模型,其Pro Preview版已在AI Studio平臺開放體驗。該平臺面向開發者、研究人員和學生,支持基於Gemini模型開發應用,並提供上下文長度、溫度等參數靈活調整功能,便於優化模型配置。
Nov 19, 2025
141.4k
楊立昆炮轟LLM:Meta AI戰略走錯了方向
Meta首席AI科學家楊立昆離職後首次公開表示,大公司重金投入大型語言模型是戰略錯誤,無法實現真正智能。他指出LLM僅能統計補全文本,缺乏物理世界理解、長期推理和規劃能力,註定無法達到人類智能水平。他認爲下一代突破應依靠“世界模型”。
Nov 18, 2025
148.0k
微博推出 VibeThinker-1.5B,低成本 AI 模型挑戰大型語言模型
微博AI部門推出開源大模型VibeThinker-1.5B,擁有15億參數。該模型基於阿里Qwen2.5-Math-1.5B優化,在數學和代碼任務表現優異。現已在Hugging Face等平臺免費開放,遵循MIT許可證,支持商業使用。
Nov 13, 2025
192.1k
ChatGPT新聞推薦來源大揭祕:界面與 API 差異顯著
漢堡大學與萊布尼茨媒體研究所研究發現,ChatGPT的新聞推薦因接口不同差異顯著。五週內分析2.4萬條新聞問題發現,API接口多引用維基百科等非新聞來源,而網頁界面更傾向新聞媒體。研究聚焦德國用戶體驗,揭示AI回答來源偏好。
Nov 10, 2025
133.9k
揭開MiniMax M2的神祕面紗:爲何選擇全注意力機制?
MiniMax M2模型採用全注意力機制,放棄線性或稀疏注意力技術。開發團隊認爲,儘管後者能節省計算資源,但全注意力在工業應用中更高效,能提升模型性能。這一決策旨在優化實際部署效果,推動AI技術發展。
Nov 6, 2025
155.5k
