PaddleOCR 登頂 GitHub Star 全球第一：中國開源力量領跑 OCR 領域

百度旗下的PaddleOCR項目正式登頂 GitHub Star 排名，成爲全球 OCR（光學字符識別）領域關注度最高的開源項目。這一里程碑標誌着以飛槳（PaddlePaddle）爲代表的中國深度學習開源框架，在垂直技術領域已經具備了國際領先的影響力，成功超越了包括 Tesseract 在內的衆多老牌國際開源項目。

技術實力支撐：超輕量模型與全棧能力

PaddleOCR的成功並非偶然，其核心競爭力在於提供了從算法研發、模型訓練到推理部署的全棧能力。該項目首創的 PP-OCR 系列模型，以“超輕量”著稱，在保持高精度的同時，模型體積大幅縮小，極大地降低了在手機、嵌入式設備等邊緣端的部署門檻。目前，該項目已支持 80 餘種主流語言的識別，並針對表格識別、文檔分析等複雜場景推出了專項優化方案，解決了長期困擾開發者的識別難題。

生態繁榮：從學術研究走向千行百業

除了技術指標的領先，PaddleOCR的社區生態也表現出極強的生命力。依託百度飛槳的開發者底座，該項目已累計獲得超過 4.3 萬個 Star，吸引了全球數千名貢獻者參與。在產業落地方面，它已被廣泛應用於金融票據審覈、工業零件編碼識別、醫療檔案數字化等多個垂直行業。這種“開發者貢獻技術-企業應用反饋-模型持續迭代”的正向循環，正是中國開源項目能在短時間內實現全球跨越的關鍵。

百度重磅開源文心大模型 4.5 系列，十款新模型亮相！

百度正式發佈了文心大模型4.5系列模型，並且將其完全開源。用戶可以通過文心一言（https://yiyan.baidu.com）立即體驗這一最新的開源技術。這一系列模型涵蓋了多種參數配置，包括激活參數爲47B 和3B 的混合專家（MoE）模型，以及稠密型模型0.3B 參數的設計，合計達到了十款不同的模型。在訓練和推理方面，文心4.5系列模型使用了飛槳深度學習框架，達到47% 的模型 FLOPs 利用率。實驗結果顯示，該系列模型在多項文本和多模態基準測試中表現優異，尤其是在指令遵循、世界知識記憶、視覺理

百度文心繫列大模型在飛槳平臺開源，涵蓋多款最新模型

百度旗下文心繫列大模型近日已在其飛槳（PaddlePaddle）平臺開源，其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等數十款最新模型。儘管百度方面尚未主動披露此次開源行動，但飛槳平臺的更新信息顯示，這一系列動作集中在6月29日至6月30日，是其最新的舉措。有內部人士證實:“官網上新並公佈了開源代碼，足見公司確實已在推進開源舉措。”此次開源，將使更多開發者和研究者能夠利用百度文心繫列大模型的強大能力，推動人工智能技術的發展和應用。

百度飛槳發佈文檔解析利器PP-StructureV3：PDF秒變Markdown文件

近日，隨着大模型與RAG技術的迅猛發展，結構化數據在智能系統中的價值愈發凸顯。在此背景下，如何將文檔圖像、PDF等非結構化數據精準轉換爲結構化數據，成爲行業亟待攻克的關鍵難題。針對此現狀，飛槳團隊憑藉深厚的技術積累和對用戶需求的深刻洞察，推出新一代文檔解析工具——PP-StructureV3，爲解決複雜文檔解析難題提供了創新方案。當前，衆多開源方案在處理複雜文檔時面臨諸多挑戰，如文字識別不準確、閱讀順序恢復混亂、表格及公式識別效果差等。這些問題嚴重製約了大模型訓練微調的數據質量及AI應用的落地進程。而PP-StructureV3的誕生，正是爲了打破這一僵局，爲行業帶來高效、精準的文檔解析體驗。

百度與智源研究院達成戰略協議將在大模型等領域展開合作

北京百度網訊科技有限公司與北京智源人工智能研究院今日宣佈正式簽署戰略合作協議，雙方將在大模型等領域展開深度合作，共同構建人工智能產研協同生態。百度自2010年起開始全面佈局人工智能，是全球爲數不多的進行全棧佈局的人工智能公司，從崑崙芯、飛槳深度學習平臺、文心大模型到應用

百度飛槳PaddleX 3.0-beta昇騰版發佈支持多場景、低代碼開發

PaddleX3.0-beta昇騰版是由飛槳（PaddlePaddle）推出的端雲協同低代碼開發工具，旨在幫助開發者以低成本和零門檻的方式解決產業中的實際問題。此版本於2023年6月27日發佈，聚焦7大主流AI場景，精選了68個優質飛槳模型，並構建了16條產業級模型產線。

PaddleOCR 登頂 GitHub Star 全球第一：中國開源力量領跑 OCR 領域

相關推薦

百度重磅開源文心大模型 4.5 系列，十款新模型亮相！

百度文心繫列大模型在飛槳平臺開源，涵蓋多款最新模型

百度飛槳發佈文檔解析利器PP-StructureV3：PDF秒變Markdown文件

百度與智源研究院達成戰略協議 將在大模型等領域展開合作

百度飛槳PaddleX 3.0-beta昇騰版發佈 支持多場景、低代碼開發

百度與智源研究院達成戰略協議將在大模型等領域展開合作

百度飛槳PaddleX 3.0-beta昇騰版發佈支持多場景、低代碼開發