PaddleOCR 登顶 GitHub Star 全球第一：中国开源力量领跑 OCR 领域

百度旗下的PaddleOCR项目正式登顶 GitHub Star 排名，成为全球 OCR（光学字符识别）领域关注度最高的开源项目。这一里程碑标志着以飞桨（PaddlePaddle）为代表的中国深度学习开源框架，在垂直技术领域已经具备了国际领先的影响力，成功超越了包括 Tesseract 在内的众多老牌国际开源项目。

技术实力支撑：超轻量模型与全栈能力

PaddleOCR的成功并非偶然，其核心竞争力在于提供了从算法研发、模型训练到推理部署的全栈能力。该项目首创的 PP-OCR 系列模型，以“超轻量”著称，在保持高精度的同时，模型体积大幅缩小，极大地降低了在手机、嵌入式设备等边缘端的部署门槛。目前，该项目已支持 80 余种主流语言的识别，并针对表格识别、文档分析等复杂场景推出了专项优化方案，解决了长期困扰开发者的识别难题。

生态繁荣：从学术研究走向千行百业

除了技术指标的领先，PaddleOCR的社区生态也表现出极强的生命力。依托百度飞桨的开发者底座，该项目已累计获得超过 4.3 万个 Star，吸引了全球数千名贡献者参与。在产业落地方面，它已被广泛应用于金融票据审核、工业零件编码识别、医疗档案数字化等多个垂直行业。这种“开发者贡献技术-企业应用反馈-模型持续迭代”的正向循环，正是中国开源项目能在短时间内实现全球跨越的关键。

百度重磅开源文心大模型 4.5 系列，十款新模型亮相！

百度正式发布了文心大模型4.5系列模型，并且将其完全开源。用户可以通过文心一言（https://yiyan.baidu.com）立即体验这一最新的开源技术。这一系列模型涵盖了多种参数配置，包括激活参数为47B 和3B 的混合专家（MoE）模型，以及稠密型模型0.3B 参数的设计，合计达到了十款不同的模型。在训练和推理方面，文心4.5系列模型使用了飞桨深度学习框架，达到47% 的模型 FLOPs 利用率。实验结果显示，该系列模型在多项文本和多模态基准测试中表现优异，尤其是在指令遵循、世界知识记忆、视觉理

百度文心系列大模型在飞桨平台开源，涵盖多款最新模型

百度旗下文心系列大模型近日已在其飞桨（PaddlePaddle）平台开源，其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。尽管百度方面尚未主动披露此次开源行动，但飞桨平台的更新信息显示，这一系列动作集中在6月29日至6月30日，是其最新的举措。有内部人士证实:“官网上新并公布了开源代码，足见公司确实已在推进开源举措。”此次开源，将使更多开发者和研究者能够利用百度文心系列大模型的强大能力，推动人工智能技术的发展和应用。

百度飞桨发布文档解析利器PP-StructureV3：PDF秒变Markdown文件

近日，随着大模型与RAG技术的迅猛发展，结构化数据在智能系统中的价值愈发凸显。在此背景下，如何将文档图像、PDF等非结构化数据精准转换为结构化数据，成为行业亟待攻克的关键难题。针对此现状，飞桨团队凭借深厚的技术积累和对用户需求的深刻洞察，推出新一代文档解析工具——PP-StructureV3，为解决复杂文档解析难题提供了创新方案。当前，众多开源方案在处理复杂文档时面临诸多挑战，如文字识别不准确、阅读顺序恢复混乱、表格及公式识别效果差等。这些问题严重制约了大模型训练微调的数据质量及AI应用的落地进程。而PP-StructureV3的诞生，正是为了打破这一僵局，为行业带来高效、精准的文档解析体验。

百度与智源研究院达成战略协议将在大模型等领域展开合作

北京百度网讯科技有限公司与北京智源人工智能研究院今日宣布正式签署战略合作协议，双方将在大模型等领域展开深度合作，共同构建人工智能产研协同生态。百度自2010年起开始全面布局人工智能，是全球为数不多的进行全栈布局的人工智能公司，从昆仑芯、飞桨深度学习平台、文心大模型到应用

百度飞桨PaddleX 3.0-beta昇腾版发布支持多场景、低代码开发

PaddleX3.0-beta昇腾版是由飞桨（PaddlePaddle）推出的端云协同低代码开发工具，旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。此版本于2023年6月27日发布，聚焦7大主流AI场景，精选了68个优质飞桨模型，并构建了16条产业级模型产线。

PaddleOCR 登顶 GitHub Star 全球第一：中国开源力量领跑 OCR 领域

相关推荐

百度重磅开源文心大模型 4.5 系列，十款新模型亮相！

百度文心系列大模型在飞桨平台开源，涵盖多款最新模型

百度飞桨发布文档解析利器PP-StructureV3：PDF秒变Markdown文件

百度与智源研究院达成战略协议 将在大模型等领域展开合作

百度飞桨PaddleX 3.0-beta昇腾版发布 支持多场景、低代码开发

百度与智源研究院达成战略协议将在大模型等领域展开合作

百度飞桨PaddleX 3.0-beta昇腾版发布支持多场景、低代码开发