还在为处理各种格式的非结构化文档而烦恼吗?Fireworks AI近日推出了一项名为“Document Inlining”的创新功能,它能将PDF、截图、图像等非结构化文档转化为大语言模型(LLM)可理解的结构化文本,为聊天机器人和AI模型提供可直接使用的文字内容,大幅提升了AI处理文档的效率和准确性。



还在为处理各种格式的非结构化文档而烦恼吗?Fireworks AI近日推出了一项名为“Document Inlining”的创新功能,它能将PDF、截图、图像等非结构化文档转化为大语言模型(LLM)可理解的结构化文本,为聊天机器人和AI模型提供可直接使用的文字内容,大幅提升了AI处理文档的效率和准确性。


字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框架在数据异构性与计算平衡上的瓶颈。相关研究已在arXiv公开,引发了AI研究社区的广泛关注。核心创新:PHD-Transformer优化长序列训练字节跳动的PHD-Transformer通过独特的键值缓存(KV Cache)管理策略与架构优
清华大学 KEG 实验室(THUDM)研发的 GLM-4-32B 及 GLM-Z1-32B 两款前沿大语言模型(LLM)正式在 OpenRouter 平台上线,且完全免费向全球用户开放。这一里程碑式的事件标志着高性能 AI 模型的普及迈出了重要一步,为开发者、研究人员及 AI 爱好者提供了强大的工具,以推动人工智能应用的进一步创新。模型上线:性能强劲,免费开放GLM-4-32B 作为一款拥有320亿参数的通用大语言模型,以其在复杂推理、数学能力及多语言处理方面的卓越表现,成为当前开源 LLM 领域的佼佼者。与此同时,GLM-Z1-32B 是基于
近日,Persona Engine(人格引擎)项目正式开源,凭借其融合大语言模型(LLM)、Live2D、自动语音识别(ASR)、文本转语音(TTS)以及实时语音克隆(RVC)等前沿技术的强大功能,引发了AI与虚拟内容创作领域的广泛关注。据AIbase了解,该项目通过赋予虚拟角色自然对话与动态表情能力,实现了与虚拟人物的实时交互,特别适用于VTubing、直播和虚拟助手场景。项目已在GitHub上线,标志着AI驱动虚拟交互技术的又一里程碑。图源备注:图片由AI生成,图片授权服务商Midjourney核心功能:多技术融合实现沉浸式交
Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具,AI Playground 被描述为一个“AI 中心”,支持本地运行聊天式大语言模型(LLM)以及图像和视频生成功能。此次开源标志着 Intel 在推动生成式 AI 技术普及和社区协作方面迈出了重要一步。开源 AI Playground:功能与潜力AI Playground 是一款功能强大的 AI PC Hannah’s Way 软件,支持多种生成式 AI 模型,包括图像扩散模型(如 Stable Diffusion 1.5、SDXL、Flux.1-Schnell 和
在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。传统的过程奖励模型(PRM)虽然能够验证推理步骤的正确性,但由于采用了标量评分机制,难以捕捉深层次的逻辑错误。此外,PRM 的判别式