作为OpenAI和Anthropic之外最受关注的AI初创公司之一,Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need”论文的作者,这篇论文被认为是引发大型语言模型(LLM)革命的关键。

图源备注:图片由AI生成,图片授权服务商Midjourney

作为OpenAI和Anthropic之外最受关注的AI初创公司之一,Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need”论文的作者,这篇论文被认为是引发大型语言模型(LLM)革命的关键。

图源备注:图片由AI生成,图片授权服务商Midjourney
日本数据科学家本田崇人推出开源编程语言“Sui”,旨在解决大语言模型生成代码的准确性问题,宣称可实现100%准确率。其设计理念源于日本美学“粋”,强调精炼与去除冗余,核心原则包括保证零语法错误率,并使用数字作为变量。
南洋理工大学推出首个全面评测大型语言模型处理电子病历能力的基准EHRStruct,涵盖11项核心任务、2200个样本,旨在评估模型在医疗数据理解、信息提取等方面的表现,推动医疗AI发展。
Cohere发布Rerank4搜索模型,上下文窗口扩展至32K,比前代提升四倍。该模型能处理更长文档,同时评估多个段落,捕捉短窗口无法识别的关联,显著提升真实文档的排名准确性,帮助AI代理更高效地完成任务。
MIT研究团队开发出实例自适应缩放技术,可根据问题复杂度动态调整大型语言模型的计算资源,提升效率并降低能耗。该研究获多家机构支持,相关论文已于11月初发布。
OpenAI推出“忏悔”框架,训练AI模型主动承认不当行为或问题决策,旨在解决大语言模型因追求“符合预期”而可能产生虚假陈述的问题。该框架引导模型在给出主要答案后进行二次回应,详细说明其推理过程。