作爲OpenAI和Anthropic之外最受關注的AI初創公司之一,Cohere在 7 月份的估值已高達 55 億美元。這家公司的聯合創始人之一正是“Attention Is All You Need”論文的作者,這篇論文被認爲是引發大型語言模型(LLM)革命的關鍵。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

作爲OpenAI和Anthropic之外最受關注的AI初創公司之一,Cohere在 7 月份的估值已高達 55 億美元。這家公司的聯合創始人之一正是“Attention Is All You Need”論文的作者,這篇論文被認爲是引發大型語言模型(LLM)革命的關鍵。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
日本數據科學家本田崇人推出開源編程語言“Sui”,旨在解決大語言模型生成代碼的準確性問題,宣稱可實現100%準確率。其設計理念源於日本美學“粋”,強調精煉與去除冗餘,核心原則包括保證零語法錯誤率,並使用數字作爲變量。
南洋理工大學推出首個全面評測大型語言模型處理電子病歷能力的基準EHRStruct,涵蓋11項核心任務、2200個樣本,旨在評估模型在醫療數據理解、信息提取等方面的表現,推動醫療AI發展。
Cohere發佈Rerank4搜索模型,上下文窗口擴展至32K,比前代提升四倍。該模型能處理更長文檔,同時評估多個段落,捕捉短窗口無法識別的關聯,顯著提升真實文檔的排名準確性,幫助AI代理更高效地完成任務。
MIT研究團隊開發出實例自適應縮放技術,可根據問題複雜度動態調整大型語言模型的計算資源,提升效率並降低能耗。該研究獲多家機構支持,相關論文已於11月初發布。
OpenAI推出“懺悔”框架,訓練AI模型主動承認不當行爲或問題決策,旨在解決大語言模型因追求“符合預期”而可能產生虛假陳述的問題。該框架引導模型在給出主要答案後進行二次迴應,詳細說明其推理過程。