被pdf整破防？騰訊雲推出大模型知識引擎

站長之家（ChinaZ.com）6月22日消息:騰訊雲最近推出了大模型知識引擎，這是一個能夠快速搭建知識服務小助手的工具。它特別擅長處理複雜的PDF文檔，包括行業報告、會議PPT、課本、說明書、合同單據和學術論文等，這些文檔往往包含文字、圖像和表格，格式複雜，對傳統OCR技術來說是個挑戰。

微信截圖_20240622104006.png

騰訊雲大模型知識引擎採用騰訊優圖實驗室自研的多模態文檔解析大模型，通過版面分析定位文檔內容的位置和類型，然後進行精準識別，並按人類閱讀順序輸出連貫可讀的內容。它能夠理解並處理複雜的版面元素，如表格和公式，甚至能夠推理並對錶格數據和結構進行正確復原，極大提高了識別準確率。

此外，知識引擎還支持20多種語言和繁體字、生僻字等，能夠將圖片和PDF文檔轉換爲Markdown格式輸出，爲大模型訓練提供結構化數據源，提高模型的泛化能力和適應性。目前，文檔解析功能的準確率可達98%以上，已經在多個產品上線，並提供標準化API服務。

體驗地址：https://ocrdemo.cloud.tencent.com/

騰訊智能體大升級！全新開發平臺助力企業輕鬆構建 AI 應用

在2025騰訊全球數字生態大會上，騰訊雲發佈智能體開發平臺3.0（ADP3.0）並開源優圖實驗室核心技術，旨在爲開發者提供更多資源，推動智能體技術普及。騰訊雲副總裁吳運聲強調，雲服務競爭已從基礎設施轉向智能體能力，ADP3.0的推出意在強化騰訊雲的智能服務優勢，吸引更多客戶。

AI變身“神導演”：浙大推出沉浸式角色扮演框架，讓交互告別“機器人感”