騰訊混元圖像 2.0 發佈：實時生圖毫秒級速度與超寫實畫質

騰訊正式發佈其最新的混元圖像2.0模型（Hunyuan Image2.0），標誌着 AI 圖像生成技術邁入 “毫秒級” 響應時代。

新模型在速度上有了顯著提升，相比於前代產品，混元圖像2.0的參數量提高了一個數量級，結合了高效的圖像編解碼器和全新的擴散架構，能夠在同類商業產品通常需要5到10秒的推理速度下，實現毫秒級的快速響應。用戶在生成圖像時，可以一邊輸入文本或進行語音指令，一邊獲得實時圖像輸出，極大地改變了傳統的 “抽卡 - 等待 - 抽卡” 模式，提升了用戶的交互體驗。

超寫實的圖像質量

除了速度上的突破，混元圖像2.0在圖像生成的質量方面也有顯著進步。該模型通過強化學習和引入大量人類美學知識，有效避免了 AI 生成圖像常見的 “AI 味”，生成的圖像不僅真實感強，細節豐富，且具有很高的可用性。在國際權威的 GenEval 基準測試中，混元圖像2.0在複雜文本指令的理解與生成能力評估中準確率超過95%，遠超其他同類模型。

創新的實時繪畫板功能

本次升級還推出了實時繪畫板功能，利用新模型的實時生圖能力，用戶在繪製線稿或調整參數時，預覽區能夠同步生成上色效果。這一功能突破了傳統的 “繪製 - 等待 - 修改” 流程，極大地便利了專業設計師的創作過程。此外，實時繪畫板支持多圖融合，用戶可以上傳多個草圖，AI 將自動協調透視與光影，按照用戶的提示詞生成融合圖像，進一步豐富了 AI 生圖的互動體驗。

騰訊還透露，原生多模態圖像生成大模型正在研發中，新模型將在多輪圖像生成和實時交互體驗等方面表現出色，期待爲用戶帶來更爲豐富的創作體驗。

產品入口:https://hunyuan.tencent.com/

杭州機場推出全國首個AI大模型智能呼叫中心，服務體驗再升級

杭州蕭山國際機場於5月16日成功啓用全國民航首個基於 AI 大模型的智能呼叫中心，標誌着其96299熱線進入了一個全新的智能化時代。這一升級採用了前沿的 DeepSeek 大模型技術，旨在提升客戶服務的效率和質量。自2014年首次上線以來，96299熱線爲旅客提供24小時不間斷的接聽與在線諮詢服務。經過此次升級，AI 語音機器人能夠應對高峯期的來電量，有效分擔人工服務壓力，並自動實現智能問答。結合情感計算和多模態知識圖譜等技術，這個智能呼叫中心成功構建了行業首個 “感知 - 決策 - 交

Stability AI與Arm推出手機級音頻生成AI:7秒內創建11秒立體聲

Stability AI和Arm聯合發佈了一款名爲"穩定音頻開放小型"（Stable Audio Open Small）的緊湊型文本轉音頻模型，該模型能夠在約7秒內生成長達11秒的高質量立體聲音頻片段，且經過優化可在智能手機等移動設備上運行。這一突破基於加州大學伯克利分校研究人員開發的"對抗相對對比"（Adversarial Relativistic-Contrastive，ARC）技術。該模型在高端硬件如Nvidia H100GPU上的表現更爲驚人，能夠在僅75毫秒內完成44kHz立體聲音頻的生成，實現了近乎實時的音頻合成能力。與去年發佈的包含11億參數的原始Stable Audio

張朝陽：如果晚生 30 年，自己也會捲入到AI裏面

在最近召開的2025搜狐科技年度論壇上，搜狐創始人、董事局主席兼首席執行官張朝陽，與清華大學講席教授張亞勤及獵豹移動董事長兼 CEO 傅盛等三位科技領域的重量級嘉賓進行了深入的討論。論壇圍繞人工智能（AI）、人形機器人和腦科學等前沿科技展開，吸引了衆多關注。圖源備註：圖片由AI生成，圖片授權服務商Midjourney張朝陽在討論中表示，如果晚生30年，自己也會捲入到AI裏面，包括人形機器人，腦科學。他認爲，目前正是一個比特與分子、原子交匯的時代，物理世界和生物世界的

初創公司Firecrawl再次尋找AI代理員工，預算100萬美元

Y Combinator支持的初創公司Firecrawl再次啓動了招聘AI代理的計劃，爲此專門撥款100萬美元。該公司在YC招聘平臺上發佈了三個"僅限AI代理"的職位，包括內容創作代理、客服工程師和初級開發代理，每個職位月薪均爲5000美元。據Firecrawl創始人Caleb Peffer向TechCrunch透露，新職位發佈約一週內就收到了約50份申請。然而，正如二月份報道的那樣，Firecrawl的首次AI招聘嘗試未能找到合適人選。Firecrawl是一款爲法學碩士（LLM）學生提供網站數據抓取的工具。Peffer承認網絡爬蟲是AI生態系統中較爲敏感的領域

OpenAI 計劃在阿布扎比建造超大數據中心，規模遠超摩納哥