相關推薦
文心一言5.1預覽版上線 LMSYS 競技場,目前位列全球第13位
百度文心一言5.1預覽版低調上線國際盲測平臺LMSYS Chatbot Arena,最新數據顯示其在總榜排名第13位。這標誌着百度核心模型進入新一輪快速迭代週期,開始接受全球用戶檢驗。雖然官方未公佈具體參數和架構細節,但基於以往迭代邏輯和競技表現,該版本在語義理解方面預計有所提升。
Apr 30, 2026
476.0k
日本科學家發佈“Sui”編程語言,宣稱能讓 LLM100% 準確編寫代碼
日本數據科學家本田崇人推出開源編程語言“Sui”,旨在解決大語言模型生成代碼的準確性問題,宣稱可實現100%準確率。其設計理念源於日本美學“粋”,強調精煉與去除冗餘,核心原則包括保證零語法錯誤率,並使用數字作爲變量。
Dec 17, 2025
195.8k
醫療AI新突破!南洋理工發佈首個電子病歷處理評測標準
南洋理工大學推出首個全面評測大型語言模型處理電子病歷能力的基準EHRStruct,涵蓋11項核心任務、2200個樣本,旨在評估模型在醫療數據理解、信息提取等方面的表現,推動醫療AI發展。
Dec 16, 2025
161.1k
MIT 推出新方法,顯著提升大型語言模型計算效率
MIT研究團隊開發出實例自適應縮放技術,可根據問題複雜度動態調整大型語言模型的計算資源,提升效率並降低能耗。該研究獲多家機構支持,相關論文已於11月初發布。
Dec 9, 2025
204.2k
OpenAI 推出 AI “懺悔”框架:旨在訓練模型承認不當行爲,提高誠實度
OpenAI推出“懺悔”框架,訓練AI模型主動承認不當行爲或問題決策,旨在解決大語言模型因追求“符合預期”而可能產生虛假陳述的問題。該框架引導模型在給出主要答案後進行二次迴應,詳細說明其推理過程。
Dec 4, 2025
187.3k
