大型語言模型 (LLM) 在自然語言處理 (NLP) 領域取得了顯著進展,使其在文本生成、摘要和問答等應用中大放異彩。然而,LLM 對令牌級處理(一次預測一個詞)的依賴也帶來了一些挑戰。這種方法與人類的交流方式形成對比,後者通常在更高層次的抽象層面運作,例如句子或想法。



大型語言模型 (LLM) 在自然語言處理 (NLP) 領域取得了顯著進展,使其在文本生成、摘要和問答等應用中大放異彩。然而,LLM 對令牌級處理(一次預測一個詞)的依賴也帶來了一些挑戰。這種方法與人類的交流方式形成對比,後者通常在更高層次的抽象層面運作,例如句子或想法。


日本數據科學家本田崇人推出開源編程語言“Sui”,旨在解決大語言模型生成代碼的準確性問題,宣稱可實現100%準確率。其設計理念源於日本美學“粋”,強調精煉與去除冗餘,核心原則包括保證零語法錯誤率,並使用數字作爲變量。
南洋理工大學推出首個全面評測大型語言模型處理電子病歷能力的基準EHRStruct,涵蓋11項核心任務、2200個樣本,旨在評估模型在醫療數據理解、信息提取等方面的表現,推動醫療AI發展。
MIT研究團隊開發出實例自適應縮放技術,可根據問題複雜度動態調整大型語言模型的計算資源,提升效率並降低能耗。該研究獲多家機構支持,相關論文已於11月初發布。
歐盟委員會對Meta啓動反壟斷調查,質疑其WhatsApp Business API新政僅允許自家Meta AI接入,禁止ChatGPT等第三方AI聊天機器人使用,涉嫌濫用市場支配地位。新政規定2025年10月起禁止第三方AI聊天機器人調用API,2026年1月15日前已集成服務必須退出,豁免範圍未明確。
OpenAI推出“懺悔”框架,訓練AI模型主動承認不當行爲或問題決策,旨在解決大語言模型因追求“符合預期”而可能產生虛假陳述的問題。該框架引導模型在給出主要答案後進行二次迴應,詳細說明其推理過程。