百度旗下的PaddleOCR項目正式登頂 GitHub Star 排名,成爲全球 OCR(光學字符識別)領域關注度最高的開源項目。這一里程碑標誌着以飛槳(PaddlePaddle)爲代表的中國深度學習開源框架,在垂直技術領域已經具備了國際領先的影響力,成功超越了包括 Tesseract 在內的衆多老牌國際開源項目。

技術實力支撐:超輕量模型與全棧能力
生態繁榮:從學術研究走向千行百業
除了技術指標的領先,

百度旗下的PaddleOCR項目正式登頂 GitHub Star 排名,成爲全球 OCR(光學字符識別)領域關注度最高的開源項目。這一里程碑標誌着以飛槳(PaddlePaddle)爲代表的中國深度學習開源框架,在垂直技術領域已經具備了國際領先的影響力,成功超越了包括 Tesseract 在內的衆多老牌國際開源項目。

技術實力支撐:超輕量模型與全棧能力
生態繁榮:從學術研究走向千行百業
除了技術指標的領先,
百度正式發佈了文心大模型4.5系列模型,並且將其完全開源。用戶可以通過文心一言(https://yiyan.baidu.com)立即體驗這一最新的開源技術。 這一系列模型涵蓋了多種參數配置,包括激活參數爲47B 和3B 的混合專家(MoE)模型,以及稠密型模型0.3B 參數的設計,合計達到了十款不同的模型。在訓練和推理方面,文心4.5系列模型使用了飛槳深度學習框架,達到47% 的模型 FLOPs 利用率。實驗結果顯示,該系列模型在多項文本和多模態基準測試中表現優異,尤其是在指令遵循、世界知識記憶、視覺理
百度旗下文心繫列大模型近日已在其飛槳(PaddlePaddle)平臺開源,其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等數十款最新模型。儘管百度方面尚未主動披露此次開源行動,但飛槳平臺的更新信息顯示,這一系列動作集中在6月29日至6月30日,是其最新的舉措。有內部人士證實:“官網上新並公佈了開源代碼,足見公司確實已在推進開源舉措。”此次開源,將使更多開發者和研究者能夠利用百度文心繫列大模型的強大能力,推動人工智能技術的發展和應用。
近日,隨着大模型與RAG技術的迅猛發展,結構化數據在智能系統中的價值愈發凸顯。在此背景下,如何將文檔圖像、PDF等非結構化數據精準轉換爲結構化數據,成爲行業亟待攻克的關鍵難題。針對此現狀,飛槳團隊憑藉深厚的技術積累和對用戶需求的深刻洞察,推出新一代文檔解析工具——PP-StructureV3,爲解決複雜文檔解析難題提供了創新方案。 當前,衆多開源方案在處理複雜文檔時面臨諸多挑戰,如文字識別不準確、閱讀順序恢復混亂、表格及公式識別效果差等。這些問題嚴重製約了大模型訓練微調的數據質量及AI應用的落地進程。而PP-StructureV3的誕生,正是爲了打破這一僵局,爲行業帶來高效、精準的文檔解析體驗。
北京百度網訊科技有限公司與北京智源人工智能研究院今日宣佈正式簽署戰略合作協議,雙方將在大模型等領域展開深度合作,共同構建人工智能產研協同生態。百度自2010年起開始全面佈局人工智能,是全球爲數不多的進行全棧佈局的人工智能公司,從崑崙芯、飛槳深度學習平臺、文心大模型到應用
PaddleX3.0-beta昇騰版是由飛槳(PaddlePaddle)推出的端雲協同低代碼開發工具,旨在幫助開發者以低成本和零門檻的方式解決產業中的實際問題。此版本於2023年6月27日發佈,聚焦7大主流AI場景,精選了68個優質飛槳模型,並構建了16條產業級模型產線。