近日,作者選取了2023年上半年教師資格證考試的真題,測試了科大訊飛的訊飛星火、百度的文心一言和阿里的通義千問三款國產大模型的作答能力。結果顯示,這三個大模型在學科常識、邏輯推理等方面的表現較好,但在考查法規條例和綜合素質的題目上,答題質量參差不齊,尤其是涉及到開放式問答時,表現仍然不太理想。其中,文心一言的回答較爲規範,顯示出了一定的答題技巧。總體來說,大模型或可用於教師資格考試的準備,但仍需要人工進行二次審覈。大模型能否替代教師職業素質方面的考覈,還有待觀察。
相關推薦
海外收入反超國內:Kimi K2.5 助力月之暗面全球爆發
月之暗面發佈K2.5模型,推動Kimi全球化進程取得里程碑式進展。其海外收入首次超過國內,實現國產大模型國際商業化重大突破。模型更新後,全球付費用戶數在幾天內激增四倍,並在Openroute等平臺熱度領先。
Feb 3, 2026
118.0k
Kimi公開喊話“找錯人”:百度搜索前四竟無一官網,迴應後已光速“消痕”
國產AI公司月之暗面公開質疑百度搜索結果存在誤導,指出搜索“Kimi”時前四個結果均非官方,且大量網站冒用“Kimi官網”名稱,容易誤導用戶。
Feb 2, 2026
169.5k
騰訊元寶攜 10 億紅包引爆春節,AI 應用爭奪戰升級!
騰訊元寶App啓動10億元春節紅包活動,登頂蘋果商店免費榜。紅包大戰不僅是金額競爭,更是AI技術應用的深度探索,成爲企業爭奪用戶流量的關鍵。中航證券分析師裴伊凡指出,AI技術正推動行業競爭升級。
Feb 2, 2026
141.5k
消息稱Kimi海外收入首超國內,劍指全球 AI 生產力巔峯
國產AI Kimi加速全球化,海外收入已超國內。新一代模型K2.5發佈後,全球付費用戶數幾天內激增4倍。在OpenRouter評測中,K2.5位列全球第三,僅次於Claude,躋身第一梯隊。
Feb 2, 2026
151.6k
告別 GPT-4o:OpenAI 宣佈停用多款經典大模型
OpenAI宣佈下月起將停用多款早期模型,包括付費用戶青睞的GPT-4o。該模型於2024年5月推出,以親切對話風格受用戶歡迎,雖在GPT-5發佈後曾短暫下線,後經CEO承諾恢復。此次退役或因使用率下降,OpenAI將引導用戶轉向更新模型。
Jan 30, 2026
151.8k
