相關推薦
騰訊混元開源 HunyuanOCR 模型:1B 參數斬獲多項 SOTA,多場景賦能 OCR 應用
騰訊混元開源10億參數OCR模型HunyuanOCR,採用端到端設計,集成視頻編碼器、視覺適配器和輕量化語言模型,在多項榜單獲SOTA成績,以體積小、部署便捷爲核心優勢,提供高效OCR解決方案。
Nov 25, 2025
199.4k
混元推出國內首個交互式AI播客,用戶可隨時提問
騰訊混元推出國內首個交互式AI播客,用戶可通過語音或文字實時向主持人和嘉賓提問,打破傳統播客單向收聽侷限,提升互動性和信息獲取效率。
Oct 29, 2025
193.9k
騰訊發佈並開源新一代生圖模型“HunyuanImage3.0”
騰訊混元開源多模態圖像生成模型“混元圖像3.0”,參數規模達80B,爲首個開源工業級原生多模態生成模型。其生成效果媲美領先閉源模型,亮點在於可處理複雜語義,解析千字文本並生成對應圖像,具備知識推理能力。
Sep 28, 2025
157.3k
騰訊混元新技術給大模型 “去油”,讓AI生成圖像更真實!
近日,騰訊混元團隊在官方公衆號發佈了最新研究成果 ——SRPO(語義相對偏好優化),旨在提升 AI 生成圖像的真實感,尤其是解決開源文生圖模型 Flux 在人物皮膚質感方面的 “過油” 問題。這項創新技術的推出,預計將爲生圖領域帶來革命性的改變。在數字藝術日益普及的今天,AI 生成圖像的質量顯得尤爲重要。Flux 模型作爲開源文生圖社區的熱門基礎模型,常常因其生成的人物皮膚顯得過於光滑和不自然而受到批評。騰訊混元團隊與香港中文大學(深圳)及清華大學的聯合研究,提出
Sep 18, 2025
150.8k
騰訊開源HunyuanImage 2.1!2K高清神圖秒生成,複雜提示精準控多主體,AI設計效率爆表?
騰訊混元團隊開源HunyuanImage2.1文本生成圖像模型,支持原生2K分辨率輸出,顯著提升開源AI在高分辨率創作領域能力。該模型已在Hugging Face和GitHub開放,優化文本-圖像對齊,生成速度快,可廣泛應用於設計、廣告和內容創作。
Sep 10, 2025
216.4k
