商湯科技推出Vimi視頻生成大模型 C端應用Vimi相機開放內測

在2024年世界人工智能大會（WAIC）上，商湯科技推出的可控人物視頻生成大模型——Vimi。Vimi模型利用商湯先進的大模型技術，能夠通過單張照片生成與目標動作一致的人物視頻，實現精準的表情和肢體控制。該模型支持多種驅動方式，包括視頻、動畫、聲音和文字，具有多年積累的面部跟蹤技術和對細節的精確控制能力，能夠生成高一致性、光影和諧的視頻內容。

Vimi的穩定性尤爲突出，能夠生成長達1分鐘以上的單鏡頭人物視頻，且畫面效果不會隨時間劣化。它還能根據人物動作調整環境場景，模擬鏡頭角度變化和頭髮抖動，提供逼真的視覺效果。此外，Vimi還支持光影變化模擬，爲視頻創作者提供豐富的創作自由度。

微信截圖_20240709140907.png

Vimi相機作爲基於Vimi大模型的首款C端應用，主要面向廣大女性用戶，滿足她們的娛樂創作需求。用戶上傳不同角度的高清人物圖片後，Vimi相機能自動生成數字分身和不同風格的寫真視頻，提供多樣化的生成風格。Vimi相機還支持通過單張圖片生成趣味人物表情包，玩法多樣，實現個性化創作。

目前，Vimi相機正開放內測，感興趣的用戶可以通過關注公衆號並填寫預約鏈接申請體驗。

Anthropic推出提示詞評估工具幫助開發者更快、更高效地優化提示詞質量

Anthropic發佈AI開發平臺新功能，以簡化AI應用開發流程。新亮點包括在控制檯生成、測試和評估AI提示的能力，自動生成測試用例和比較輸出功能，以及由Claude 3.5 Sonnet支持的提示生成器。開發者只需描述任務，Claude即可生成高質量提示。更新還引入測試套件生成功能，允許用戶添加或導入測試用例，並可一鍵運行所有測試，調整參數。包括響應評估工具和並排比較輸出選項，以改進提示並邀請專家評分，目標是加速和提高AI應用的性能優化。此更新爲目標人羣提供了更高效、便捷的AI開發方式，並促進了AI領域的創新和進步。

Stability AI推出Stable Assistant新功能增強創意與視覺體驗

Stability AI公司更新穩定助手功能，新增「搜索與替換」與「Stable Audio」，增強圖像編輯能力和音樂創作功能。搜索與替換功能允許用戶在上傳圖像中替換指定對象，提升創意編輯效率。Stable Audio則專注於生成高質量音樂，爲用戶提供個性化創作選項。此次更新使Stable Assistant更加強大，不僅在圖像編輯功能上得到提升，還在音樂創作領域展現新亮點。用戶可享受3天免費試用，持續關注公司動態和參與Discord社區，體驗平臺最新功能帶來的創新可能。該更新進一步鞏固了Stability AI在圖像與音頻生成技術領域的領先優勢。

革命性突破！斯坦福UCSD聯合打造TTT架構，5年磨一劍，Transformer時代終結？

TTT：全新提出的Test-Time-Training layers架構，由斯坦福、UCSD、UC伯克利和Meta的研究人員共同研發，一夜間顛覆了Transformer和Mamba的主導地位，爲語言模型帶來了革命性的改變。TTT架構創新性地通過梯度下降壓縮上下文，替代傳統注意力機制，具備訓練大規模語言模型（數十億token）的能力，同時保持穩定的線性複雜度且表現出超越傳統Transformer的記憶能力和效率。實驗結果表明，TTT層在短上下文和長上下文測試中均取得了優異性能，特別是在處理長上下文場景下，其性能優勢更爲顯著，將爲長視頻建模等應用領域的突破提供新機遇。經過五年持續研發，TTT層的成功是團隊持續創新與努力的結晶，有望爲AI領域尤其是長視頻處理技術帶來革新，開啓新的應用之路。

Stability AI發佈更寬鬆的Stable Diffusion3版權許可證

Stability AI 對其 Stable Diffusion3許可證進行放寬，迴應了最近的爭議，目的是平息用戶對其更新許可條款的反對。初始發佈包含限制性條件，導致社區不滿，尤其在CivitAI平臺上引起反響。面對批評，Stability AI 前身發佈了更爲寬容的社區許可證，允許免費使用SD3模型進行研究和非商業用途。其對企業用途提供額外的寬鬆範圍，至年收入低於100萬美元的企業，無須付費許可。超過此收入門檻，企業需申請付費企業許可證。值得注意的是，禁止使用Stable Diffusion3生成的圖像作爲新模型訓練數據，限制了原始模型的使用。Stability AI 保有材料所有權使用權的特定條款，明確允許用戶作爲衍生作品所有者，遵循限制情況下對模型調整以盈利。儘管採取了這些措施，AI社區的一家領導者Invoke AI的CEO表示保持警惕，認爲修改並不能解決問題，反而引入了複雜性。

商湯科技推出Vimi視頻生成大模型 C端應用Vimi相機開放內測

相關推薦

Anthropic推出提示詞評估工具幫助開發者更快、更高效地優化提示詞質量

Stability AI推出Stable Assistant新功能增強創意與視覺體驗

革命性突破！斯坦福UCSD聯合打造TTT架構，5年磨一劍，Transformer時代終結？

Byway 利用人工智能幫助旅行者放慢腳步選擇風景優美的路線

Stability AI發佈更寬鬆的Stable Diffusion3版權許可證

商湯科技推出Vimi視頻生成大模型 C端應用Vimi相機開放內測

相關推薦

Anthropic推出提示詞評估工具 幫助開發者更快、更高效地優化提示詞質量

Stability AI推出Stable Assistant新功能 增強創意與視覺體驗

革命性突破！斯坦福UCSD聯合打造TTT架構，5年磨一劍，Transformer時代終結？

Byway 利用人工智能幫助旅行者放慢腳步 選擇風景優美的路線

Stability AI發佈更寬鬆的Stable Diffusion3版權許可證

Anthropic推出提示詞評估工具幫助開發者更快、更高效地優化提示詞質量

Stability AI推出Stable Assistant新功能增強創意與視覺體驗

Byway 利用人工智能幫助旅行者放慢腳步選擇風景優美的路線