百度旗下的PaddleOCR项目正式登顶 GitHub Star 排名,成为全球 OCR(光学字符识别)领域关注度最高的开源项目。这一里程碑标志着以飞桨(PaddlePaddle)为代表的中国深度学习开源框架,在垂直技术领域已经具备了国际领先的影响力,成功超越了包括 Tesseract 在内的众多老牌国际开源项目。

技术实力支撑:超轻量模型与全栈能力
生态繁荣:从学术研究走向千行百业
除了技术指标的领先,

百度旗下的PaddleOCR项目正式登顶 GitHub Star 排名,成为全球 OCR(光学字符识别)领域关注度最高的开源项目。这一里程碑标志着以飞桨(PaddlePaddle)为代表的中国深度学习开源框架,在垂直技术领域已经具备了国际领先的影响力,成功超越了包括 Tesseract 在内的众多老牌国际开源项目。

技术实力支撑:超轻量模型与全栈能力
生态繁荣:从学术研究走向千行百业
除了技术指标的领先,
百度正式发布了文心大模型4.5系列模型,并且将其完全开源。用户可以通过文心一言(https://yiyan.baidu.com)立即体验这一最新的开源技术。 这一系列模型涵盖了多种参数配置,包括激活参数为47B 和3B 的混合专家(MoE)模型,以及稠密型模型0.3B 参数的设计,合计达到了十款不同的模型。在训练和推理方面,文心4.5系列模型使用了飞桨深度学习框架,达到47% 的模型 FLOPs 利用率。实验结果显示,该系列模型在多项文本和多模态基准测试中表现优异,尤其是在指令遵循、世界知识记忆、视觉理
百度旗下文心系列大模型近日已在其飞桨(PaddlePaddle)平台开源,其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。尽管百度方面尚未主动披露此次开源行动,但飞桨平台的更新信息显示,这一系列动作集中在6月29日至6月30日,是其最新的举措。有内部人士证实:“官网上新并公布了开源代码,足见公司确实已在推进开源举措。”此次开源,将使更多开发者和研究者能够利用百度文心系列大模型的强大能力,推动人工智能技术的发展和应用。
近日,随着大模型与RAG技术的迅猛发展,结构化数据在智能系统中的价值愈发凸显。在此背景下,如何将文档图像、PDF等非结构化数据精准转换为结构化数据,成为行业亟待攻克的关键难题。针对此现状,飞桨团队凭借深厚的技术积累和对用户需求的深刻洞察,推出新一代文档解析工具——PP-StructureV3,为解决复杂文档解析难题提供了创新方案。 当前,众多开源方案在处理复杂文档时面临诸多挑战,如文字识别不准确、阅读顺序恢复混乱、表格及公式识别效果差等。这些问题严重制约了大模型训练微调的数据质量及AI应用的落地进程。而PP-StructureV3的诞生,正是为了打破这一僵局,为行业带来高效、精准的文档解析体验。
北京百度网讯科技有限公司与北京智源人工智能研究院今日宣布正式签署战略合作协议,双方将在大模型等领域展开深度合作,共同构建人工智能产研协同生态。百度自2010年起开始全面布局人工智能,是全球为数不多的进行全栈布局的人工智能公司,从昆仑芯、飞桨深度学习平台、文心大模型到应用
PaddleX3.0-beta昇腾版是由飞桨(PaddlePaddle)推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。此版本于2023年6月27日发布,聚焦7大主流AI场景,精选了68个优质飞桨模型,并构建了16条产业级模型产线。