還在爲處理各種格式的非結構化文檔而煩惱嗎?Fireworks AI近日推出了一項名爲“Document Inlining”的創新功能,它能將PDF、截圖、圖像等非結構化文檔轉化爲大語言模型(LLM)可理解的結構化文本,爲聊天機器人和AI模型提供可直接使用的文字內容,大幅提升了AI處理文檔的效率和準確性。



還在爲處理各種格式的非結構化文檔而煩惱嗎?Fireworks AI近日推出了一項名爲“Document Inlining”的創新功能,它能將PDF、截圖、圖像等非結構化文檔轉化爲大語言模型(LLM)可理解的結構化文本,爲聊天機器人和AI模型提供可直接使用的文字內容,大幅提升了AI處理文檔的效率和準確性。


字節跳動宣佈推出高效預訓練長度縮放技術(Efficient Pretraining Length Scaling),通過創新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,顯著提升大語言模型(LLM)在長序列預訓練中的效率與性能。據AIbase瞭解,該技術在保持推理效率的同時,支持高達2048K(2M)的上下文長度訓練,解決了傳統框架在數據異構性與計算平衡上的瓶頸。相關研究已在arXiv公開,引發了AI研究社區的廣泛關注。核心創新:PHD-Transformer優化長序列訓練字節跳動的PHD-Transformer通過獨特的鍵值緩存(KV Cache)管理策略與架構優
清華大學 KEG 實驗室(THUDM)研發的 GLM-4-32B 及 GLM-Z1-32B 兩款前沿大語言模型(LLM)正式在 OpenRouter 平臺上線,且完全免費向全球用戶開放。這一里程碑式的事件標誌着高性能 AI 模型的普及邁出了重要一步,爲開發者、研究人員及 AI 愛好者提供了強大的工具,以推動人工智能應用的進一步創新。模型上線:性能強勁,免費開放GLM-4-32B 作爲一款擁有320億參數的通用大語言模型,以其在複雜推理、數學能力及多語言處理方面的卓越表現,成爲當前開源 LLM 領域的佼佼者。與此同時,GLM-Z1-32B 是基於
近日,Persona Engine(人格引擎)項目正式開源,憑藉其融合大語言模型(LLM)、Live2D、自動語音識別(ASR)、文本轉語音(TTS)以及實時語音克隆(RVC)等前沿技術的強大功能,引發了AI與虛擬內容創作領域的廣泛關注。據AIbase瞭解,該項目通過賦予虛擬角色自然對話與動態表情能力,實現了與虛擬人物的實時交互,特別適用於VTubing、直播和虛擬助手場景。項目已在GitHub上線,標誌着AI驅動虛擬交互技術的又一里程碑。圖源備註:圖片由AI生成,圖片授權服務商Midjourney核心功能:多技術融合實現沉浸式交
Intel 宣佈將其生成式 AI 軟件 AI Playground 正式開源,這一舉措引發了 AI 社區的廣泛關注。作爲一款專爲 Intel Arc GPU 和集成顯卡優化的 AI 工具,AI Playground 被描述爲一個“AI 中心”,支持本地運行聊天式大語言模型(LLM)以及圖像和視頻生成功能。此次開源標誌着 Intel 在推動生成式 AI 技術普及和社區協作方面邁出了重要一步。開源 AI Playground:功能與潛力AI Playground 是一款功能強大的 AI PC Hannah’s Way 軟件,支持多種生成式 AI 模型,包括圖像擴散模型(如 Stable Diffusion 1.5、SDXL、Flux.1-Schnell 和
在人工智能領域,隨着 OpenAI 的 o1和 DeepSeek 的 R1模型受到廣泛關注,大語言模型(LLM)的推理能力和測試時擴展(TTS)技術引發了衆多研究者的興趣。然而,在處理複雜推理問題時,如何準確評估模型每一步的回答質量,依然是一個亟待解決的難題。爲此,清華大學與上海 AI Lab 共同提出了生成式過程獎勵模型(GenPRM),爲過程監督推理提供了創新解決方案。傳統的過程獎勵模型(PRM)雖然能夠驗證推理步驟的正確性,但由於採用了標量評分機制,難以捕捉深層次的邏輯錯誤。此外,PRM 的判別式