Stability AI發佈兩款日語語言模型


近日,VITA-MLLM 團隊宣佈推出 VITA-1.5,這是該團隊在 VITA-1.0基礎上推出的升級版本,致力於提升多模態交互的實時性與準確性。VITA-1.5不僅支持英語和中文,還在多項性能指標上實現了顯著提升,爲用戶提供了更流暢的交互體驗。在 VITA-1.5中,互動延遲大幅降低,從原來的4秒縮短至僅1.5秒,用戶在進行語音交互時幾乎感受不到延遲。此外,該版本在多模態性能方面也有顯著提高,經過評估,VITA-1.5在 MME、MMBench 和 MathVista 等多個基準測試中的平均性能從59.8提升至70.8,展現了出色的能力。VITA
Stability AI 正式發佈了新版 Stable Diffusion3.5 Large,並新增了三種 ControlNet 功能,分別是Blur、Canny和Depth。這一更新爲用戶提供了更強大的圖像生成能力,使得生成的圖像更加豐富和多樣化。根據 Stability AI 的介紹,這一模型的發佈是基於其社區許可協議,允許用戶在不商業化的前提下免費使用。無論是個人還是機構,都可以在科學研究等領域使用該模型,而無需支付費用。此外,對於年收入低於100萬美元的小型企業和創作者,Stability AI 也允許其在商業用途上免費使用該模型。這種寬鬆的使用
OpenAI 近日在視頻 AI 領域再次引發轟動,他們正在對今年2月發佈的 Sora 進行重大升級。根據《信息日報》的報道,這次升級的核心目標是顯著提升 Sora 的性能,使其能夠更快速地生成更長、更高質量的視頻內容。回顧 Sora 初版的表現,確實存在不少亟待解決的問題。最初版本生成一段視頻需要耗時超過10分鐘,這樣的效率顯然無法滿足實際應用需求。更嚴重的是,許多電影製作者對 Sora 的輸出質量頗有微詞。製片人 Patrick Cederberg 的經歷就是一個典型案例:爲了獲得一個可用的視頻,他不得不
谷歌今日宣佈推出全新升級的Gemini模型系列,包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。這次更新不僅大幅提升了性能,還帶來了令人驚喜的價格優惠,無疑將在AI開發圈掀起一陣熱潮。首先,最吸引眼球的是價格的大幅下調。新版模型的使用成本直接腰斬,降幅超過50%。與此同時,性能卻得到了顯著提升。Gemini1.5Flash的處理速率翻倍,而1.5Pro更是接近三倍。這意味着開發者可以以更低的成本獲得更快的輸出和更短的延遲,大大提高了開發效率。在性能方面,新版Gemini模型展現出全面的提升。特
英國人工智能公司 Stability AI 因其圖像生成器 Stable Diffusion 備受矚目,但卻在商業問題上屢遭波折。