智譜AI開源新模型，老顯卡也能開啓視頻生成新時代

近日，智譜AI公司開源了全新的視頻生成模型CogVideoX-5B，它不僅在視頻生成的質量和視覺效果上超出了前代產品CogVideoX-2B，而且它的推理性能得到了大幅度的提升，使得早期的GTX1080Ti顯卡能夠運行上一代模型，而桌面端的"甜品級"顯卡，如RTX3060，更是可以輕鬆駕馭這款新模型。

CogVideoX-5B 與 CogVideoX-2B 詳細參數對比:

這個大規模的DiT（擴散變換器）模型，被設計用於執行文本到視頻的生成任務。其背後的技術包括3D因果變分自編碼器(3D causal VAE)，該技術通過將視頻數據壓縮到潛在空間中，並在時間維度上進行解碼，以達到高效的視頻重建。

此外，專家變換器（Expert Transformer）的運用，將文本嵌入和視頻嵌入相結合，採用3D-RoPE作爲位置編碼，通過專家自適應層歸一化處理兩個模態的數據，並使用3D全注意力機制進行時空聯合建模。

代碼:https://top.aibase.com/tool/cogvideox

模型下載:https://huggingface.co/THUDM/CogVideoX-5b

論文鏈接:https://arxiv.org/pdf/2408.06072

字節聯合高校出品！STAR 模型：提升視頻清晰度和分辨率

近日，南京大學的研究團隊與字節跳動、西南大學聯合推出了一項創新技術 ——STAR（Spatial-Temporal Augmentation with Text-to-Video Models），旨在利用文本到視頻模型，實現真實世界視頻的超分辨率處理。該技術結合了時空增強方法，能夠有效提高低分辨率視頻的質量，尤其適用於在視頻分享平臺上下載的低清晰度視頻。爲了方便研究者和開發者使用，研究團隊已經在 GitHub 上發佈了 STAR 模型的預訓練版本，包括 I2VGen-XL 和 CogVideoX-5B 兩種型號，以及相關的推理代碼。這些工具的推出標誌着在視頻處

印度版支付寶Paytm大裁員！超千名員工因 AI 自動化技術下崗

印度金融科技巨頭Paytm宣佈裁員1000名員工，涉及運營、銷售和工程團隊，主要原因是公司引入人工智能技術以提升運營效率，通過AI驅動的自動化消除重複性工作，以降低成本並提高效率。此次裁員並非首次，早在2021年，Paytm就因績效問題裁掉了部分員工。裁員主要涉及貸款團隊，儘管貸款業務表現良好，但團隊人數佔總員工的比例超過30%。爲應對成本壓力，公司決定縮減規模，已關閉小額貸款和“先買後付”服務。Paytm將重點轉向高額個人貸款和商戶貸款。儘管支付處理利潤和貸款發放增長推動第二季度收入增長32%，但公司仍面臨虧損壓力。

德勤：約三分之二公司正增加對生成式 AI的投入

德勤最新報告揭示，約三分之二的公司正增加生成式人工智能（Generative AI）投入，主要看重其在效率和生產力提升上的潛力。然而，多數項目仍處於試點或概念驗證階段，且僅38% 公司跟蹤員工生產力變化，54% 企業希望通過AI提高效率，但實際反饋不足。報告指出，儘管生成式AI項目中，僅有30% 實驗完全投入生產，企業開始關注通過AI推動創新、提升產品質量與改善客戶關係的新價值。數據、擴展性和風險成爲實施挑戰，而變革管理和組織整合是關鍵。報告還指出，41% 的受訪者在定義和衡量項目影響方面存在困難，僅16% 定期向CFO彙報成果。

小而美！港大最新推薦系統EasyRec 以文本洞察用戶心聲

EasyRec是一款基於語言模型的推薦系統，由香港大學團隊開發。其獨特之處在於通過文本行爲對齊框架分析用戶行爲故事中的情感和細節，預測用戶喜好，無需大量用戶數據。該系統結合對比學習和協同語言模型，能準確預測新用戶和新商品的喜好，特別是在零樣本推薦場景中表現出色。EasyRec的即插即用特性使其易於集成到現有推薦系統中，提升性能。論文展示了EasyRec在多個真實世界數據集上的優秀表現，證明了其在推薦準確性上的優勢。隨着技術的不斷髮展，EasyRec有望在商業推薦系統和學術研究中發揮更大作用。

日曆工具Clockwise推出全新AI界面Prism 讓會議安排更簡單