站長之家(ChinaZ.com)6月22日 消息:騰訊雲最近推出了大模型知識引擎,這是一個能夠快速搭建知識服務小助手的工具。它特別擅長處理複雜的PDF文檔,包括行業報告、會議PPT、課本、說明書、合同單據和學術論文等,這些文檔往往包含文字、圖像和表格,格式複雜,對傳統OCR技術來說是個挑戰。

微信截圖_20240622104006.png

騰訊雲大模型知識引擎採用騰訊優圖實驗室自研的多模態文檔解析大模型,通過版面分析定位文檔內容的位置和類型,然後進行精準識別,並按人類閱讀順序輸出連貫可讀的內容。它能夠理解並處理複雜的版面元素,如表格和公式,甚至能夠推理並對錶格數據和結構進行正確復原,極大提高了識別準確率。

此外,知識引擎還支持20多種語言和繁體字、生僻字等,能夠將圖片和PDF文檔轉換爲Markdown格式輸出,爲大模型訓練提供結構化數據源,提高模型的泛化能力和適應性。目前,文檔解析功能的準確率可達98%以上,已經在多個產品上線,並提供標準化API服務。

體驗地址:https://ocrdemo.cloud.tencent.com/