PaddleOCR v2.8.0作爲飛槳深度學習開源框架下的文字識別開發套件,發佈了里程碑式的更新。這個版本引入了前沿的OCR技術,包括PaddleOCR算法模型挑戰賽的冠軍方案,如場景文本識別算法SVTRv2和表格識別算法SLANet-LCNetV2,爲OCR領域樹立了新的標準。

同時,項目結構經過深度優化,非核心模塊被遷移至新倉庫,使項目更專注於OCR核心技術。此外,解決了包括更新Backbone後模型無法運行、numpy版本依賴衝突、Mac系統運行卡頓等歷史疑難問題,提升了用戶體驗。

微信截圖_20240712084427.png

新版本還包括了對版面分析中OCR結果丟失問題的修復,引入了pyproject.toml以符合PEP518規範,以及對大圖推理的滑動窗口操作等優化改進,增強了軟件的穩定性、兼容性和性能。開源社區的支持和貢獻對PaddleOCR v2.8.0的每一個進步至關重要,PMC成員和貢獻者的努力被特別感謝。

PaddleOCR正在建設文檔教程專屬站點,將提供關鍵詞檢索功能和優雅舒適的界面。

項目地址:https://github.com/PaddlePaddle/PaddleOCR