相關推薦
智譜 AI 發佈中文 LLM 對齊評測基準 AlignBench
["智譜 AI 發佈了針對中文大模型的評測基準 AlignBench","AlignBench 能夠在多維度上細緻評測模型和人類意圖的對齊水平","數據集分爲 8 個大類,包括知識問答、寫作生成、角色扮演等多種類型的問題","開發者可以利用 AlignBench 進行評測,並使用評價能力較強的打分模型進行評分","通過登錄 AlignBench 網站,提交結果可以使用 CritiqueLLM 作爲評分模型進行評測"]
智譜 AI 發佈第三代基座大模型 ChatGLM3 智譜清言具備代碼交互能力
["智譜 AI 在 2023 中國計算機大會上發佈第三代基座大模型 ChatGLM3","ChatGLM3 具備多模態理解能力、代碼生成和執行、網絡搜索增強等新功能","ChatGLM3 經過深度優化,在中英文公開數據集測試中表現優秀","智譜清言成爲國內首個具備代碼交互能力的大模型產品","智譜 AI 期待國產原生大模型與國產芯片在國際舞臺上脫穎而出"]
智譜 AI 完成 B-4 輪融資 騰訊阿里參投
["智譜 AI 完成 B-4 輪融資,騰訊和阿里參與投資。","融資金額達 10 億美元,估值達 10 億美元。","智譜 AI 由清華大學計算機系技術成果轉化而來。","智譜 AI 致力於打造新一代認知智能通用模型。","智譜 AI 推出了認知大模型平臺 Bigmodel.ai。"]
比GPT-4還強,20億參數模型做算術題,準確率幾乎100%
["清華大學等研究者提出20億參數語言模型MathGLM,在算術運算任務上準確率接近100%,明顯優於GPT-4。","MathGLM採用僅解碼器架構,在大規模算術數據集上訓練,數學運算能力得到顯著提升。","MathGLM在處理數字格式複雜的混合算術運算時,也優於GPT-4和ChatGPT等模型。"]
AI 進化再加速!Claude 祭出 “思考” 神器,AI 也能 “三思而後行” 了?
你是否曾對着笨笨的AI感到無奈,恨不得掰開它的腦袋,讓它好好思考一下再行動?現在,Anthropic真的給AI裝上了大腦升級包!他們爲明星模型Claude注入了一項突破性的思考工具(thinktool),讓AI在處理複雜任務時,不再像無頭蒼蠅一樣橫衝直撞,而是學會了像人類一樣——停下來,認真思考一番再做決定!這可不是簡單的慢一點,而是Claude擁有了全新的思考迴路。想象一下,你給Claude派了一個超級燒腦的任務,比如處理一份複雜的航空政策文件,或者解決一個棘手的零售客服糾紛。在過去,Cl
