北京智譜華章科技有限公司近日宣佈,其開發的人工智能產品“清言”新增視頻通話功能,現已全面向用戶開放,並提供限時免費體驗。
這一新功能的推出標誌着“清言”AI產品在交互方式上的重大進步,用戶不再侷限於文字和語音交流,而是可以通過視頻與AI進行更直觀的互動。

“清言”AI產品通過視頻通話功能,能夠“看到”用戶所在的環境,理解用戶的表情和情緒,提供更加個性化和富有同理心的交流體驗。
這一功能的推出,不僅提升了用戶體驗,也展示了智譜華章科技在人工智能領域的創新能力。
在北京智譜華章科技有限公司的年度收官之際,公司發佈了其首個基於擴展強化學習技術訓練的推理模型——GLM-Zero的初代版本GLM-Zero-Preview。這款模型專注於提升人工智能的推理能力,尤其在數理邏輯、代碼編寫以及需要深度推理的複雜問題處理方面表現出色。與基座模型相比,GLM-Zero-Preview在保持通用任務能力的同時,專家任務能力得到了顯著提升,其在AIME2024、MATH500和LiveCodeBench評測中的表現與OpenAI o1-preview相當。
北京智譜華章科技有限公司宣佈,其旗下的CogVideoX系列模型推出了最新版本——CogVideoX v1.5,並已對外開源。自8月初發布以來,該系列模型憑藉其行業領先的技術和深受開發者喜愛的特性,已經成爲視頻生成領域的佼佼者。新版本CogVideoX v1.5在原有基礎上進行了顯著升級,包括增強了視頻生成能力,現在支持5/10秒、768P、16幀的視頻生成,並且I2V模型能夠支持任意尺寸比例,大幅提升了圖生視頻的質量和複雜語義理解。
在最近的Gartner IT研討會上,分析師預測到2027年,生成式人工智能(GenAI)解決方案將實現40%的多模態整合,顯著高於2023年的1%。多模態GenAI的整合能捕捉不同數據流之間的關係,並擴展在各類數據和應用中的好處,支持人類在不同環境中的多任務執行。Gartner的報告指出,多模態GenAI和開源大語言模型具有極高影響力,將在未來五年內爲企業帶來競爭優勢和快速市場響應。特定領域的GenAI模型和自主代理有望在未來十年實現主流應用。儘管目前GenAI處於“失望的低谷”,但隨着行業整合的開始,多模態GenAI轉型將增強企業應用,引入更多新功能。開源大語言模型爲企業提供了創新潛力,降低了對特定供應商的依賴。特定領域的GenAI模型針對特定行業或任務進行了優化,能夠改善企業內用例的對齊,並提升準確性和安全性。自主代理系統在沒有人類干預的情況下實現目標,推動業務運營的改善和客戶體驗的提升,同時可能改變組織內的工作模式。
比爾·蓋茨在AI耗電量的討論中提出不同觀點,強調AI對電力需求的擔憂被誇大,AI在科學發現和生產流程中的貢獻遠超其電力消耗。他舉例AI在改進鋼鐵生產、優化肉類加工和天氣預測等方面的作用。蓋茨還指出核能在解決氣候危機中具有潛力,儘管當前核能成本高,但通過改進技術,如泰拉能源(TerraPower)在開發更安全、經濟的核裂變技術方面的工作,未來核能有望提供廉價電力。
Fluxgym是一款面向AI愛好者的新型訓練工具,旨在降低模型訓練的門檻。它具有極低的硬件要求,僅需12GB顯存即可進行AI模型訓練,極大地擴大了參與人羣。通過結合簡潔的前端和強大的後端,Fluxgym提供了一個易於操作的界面,用戶只需完成簡單的三個步驟即可啓動訓練過程。其核心優勢在於對低配置設備的支持、簡化用戶界面和流暢的訓練流程,使得AI新手也能快速上手。Fluxgym的推出降低了AI訓練的進入壁壘,爲更多人打開了AI世界的大門,推動了FLUX Lora模型的發展,並可能激發新的應用和創新。