相關推薦
AI醫療進入“深水區”:研究指生成式模型尚難獨立承擔臨牀推理重任
研究顯示,當前主流AI模型在模擬臨牀診療推理時仍存在明顯不足,尚不具備獨立承擔醫療任務的能力。該研究測試了21種大語言模型,結果發表於《JAMA Network Open》。
Apr 14, 2026
94.6k
蘋果發佈 AI 原型工具 SQUIRE,旨在重塑 UI 設計流程
蘋果發佈兩項機器學習研究:SQUIRE系統利用GPT-4o和槽查詢中間表示,提升AI生成UI的可控性與微調效率;另一項研究則強化圖像安全審查能力,旨在解決現有技術痛點。
Apr 8, 2026
199.5k
千問 3.6 正式發佈:100 萬長上下文,硬剛 Claude Code
阿里發佈新一代大語言模型Qwen3.6-Plus,被譽爲當前最強國產編程模型。相比3.5版本性能顯著提升,在多項編程評測中位居國產首位,整體能力接近國際標杆Claude系列。該模型在前端開發、複雜倉庫任務等方面展現出高度自主化能力。
Apr 3, 2026
685.9k
ChatGPT-5.2 首次獨立證明數學猜想,開啓“氛圍證明”時代
比利時布魯塞爾自由大學研究發現,商用大模型已能獨立生成原創數學證明。ChatGPT-5.2成功破解了2024年提出的數學猜想,標誌着大語言模型能力超越代碼輔助和文本創作,進入需要極強邏輯推理的數學領域。
Mar 31, 2026
220.1k
維基百科向 AI 下“逐客令”:嚴禁 LLM 生成內容,違者或遭處罰
維基百科正式禁止使用大語言模型生成或重寫文章內容,終結了此前對AI的模糊態度。新政策獲得志願者編輯壓倒性支持,旨在維護內容可靠性,避免AI生成不準確或抄襲內容。
Mar 27, 2026
473.2k
