歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、巨量引擎旗下AIGC工具“即創”正式版上線

巨量引擎的AIGC工具“即創”正式上線,提供多種內容生成方式,包括AI腳本生成、智能成片和數字人等。該平臺通過深度學習和自然語言處理,用戶只需輸入主題即可生成高質量文本和視頻內容。新增的爆款裂變和一鍵過審功能,幫助創作者快速響應市場變化,提升創作效率和內容合規性。

image.png

【AiBase提要:】

🌟 即創支持多種內容生成,提升創作效率。

📊 新增爆款裂變和一鍵過審功能,幫助創作者快速響應市場。

🎨 AI 技術引領內容創作革命,鼓勵創作者探索新工具。

詳情鏈接:https://top.aibase.com/tool/douyinjichuang

2、通義萬相推2.1視頻模型 大幅提升複雜運動能力

阿里旗下的通義萬相視頻生成模型在最新2.1版本中實現了重磅升級,推出了極速版與專業版,分別聚焦於高效性能和卓越表現力。這一版本在處理複雜運動和還原真實物理規律方面取得了顯著進步,提升了視頻的電影質感和指令遵循能力。

image.png

【AiBase提要:】

🚀 新版本分爲極速版與專業版,分別提升高效性能與表現力。

🐱 生成的視頻細節豐富,成功解決了“鬼畫符”問題,實現精準中英文文字生成。

🎬 運鏡效果如同電影大師,能夠自動調整鏡頭,提升視頻藝術性。

詳情鏈接:https://tongyi.aliyun.com/wanxiang/videoCreation

3、微軟正式開源超強小模型Phi-4

微軟在Hugging Face平臺上發佈了小型語言模型Phi-4,參數量爲140億,表現優異,超越了多款知名模型如GPT-4o和Llama-3.1。Phi-4在數學競賽AMC中獲得91.8分,並在MMLU測試中取得84.8分,展現了強大的推理能力。該模型採用創新的合成數據生成方法,支持長達16k的上下文長度,適用於消費級硬件。

image.png

【AiBase提要:】

🧩 微軟推出的Phi-4模型參數僅140億,卻在性能測試中超越了GPT-4o和Llama-3.1等多個知名模型。

📈 Phi-4在數學與推理能力方面表現突出,特別是在AMC和MMLU測試中取得了高分。

🌍 該模型已開源並支持商業用途,吸引了大量開發者和AI愛好者的關注。

詳情鏈接:https://huggingface.co/microsoft/phi-4

4、全新視頻修復技術 SeedVR:模糊變高清,可處理任意長度視頻

在數字媒體迅速發展的背景下,視頻質量的提升成爲了重要議題。南洋理工大學與字節跳動的研究團隊推出的SeedVR技術,利用創新的移動窗口注意力機制,顯著改善了視頻恢復效果,特別是在處理AI生成視頻時表現突出。該技術不僅能夠處理任意長度的視頻,還能有效修復畫面細節,爲用戶帶來更真實的視覺體驗。

image.png

【AiBase提要:】

🌟 SeedVR利用移動窗口注意力機制,成功提升對長視頻序列的處理能力。

🎥 該技術採用較大的窗口尺寸,顯著提高了高分辨率視頻的恢復質量。

🚀 結合多種現代技術手段,SeedVR在多個基準測試中表現卓越,尤其適用於AI生成的視頻。

詳情鏈接:https://iceclear.github.io/projects/seedvr/

5、Adobe 的 TransPixar 將煙霧、反射等透明效果無縫融入場景

Adobe Research與香港科技大學聯合開發的TransPixar系統,革新了視覺特效製作,尤其是在處理透明元素方面。該技術通過生成包含Alpha通道的視覺效果,顯著提高了製作效率,降低了成本。TransPixar的推出正值行業對高質量特效需求激增之際,預示着未來影視製作流程的變革。

【AiBase提要:】

🌟 TransPixar通過創新的AI技術,能夠在有限的訓練數據下生成高質量的透明效果,簡化特效製作流程。

💡 該系統不僅提升了大型製作團隊的工作效率,還爲小型工作室降低了製作成本,使其能夠實現複雜特效

🚀 TransPixar在實時應用領域展現出巨大潛力,能夠快速生成透明效果,適用於視頻遊戲和增強現實等場景。

6、字節聯合高校出品!STAR 模型:提升視頻清晰度和分辨率

南京大學研究團隊與字節跳動、西南大學聯合推出的STAR技術,通過文本到視頻模型實現視頻超分辨率處理,顯著提升低分辨率視頻質量。該技術結合時空增強方法,適用於視頻分享平臺上下載的低清晰度視頻。研究團隊已在GitHub發佈預訓練模型和推理代碼,使用過程簡單,推動了視頻處理領域的進步。

image.png

【AiBase提要:】

🌟 新技術 STAR 結合文本到視頻模型,實現視頻超分辨率,提升視頻質量。

🛠️ 研究團隊已發佈預訓練模型和推理代碼,使用過程簡單明瞭。

📩 提供聯繫方式,鼓勵用戶與研究團隊進行交流與探討。

詳情鏈接:https://github.com/NJU-PCALab/STAR

7、Stability AI 推出 SPAR3D:單圖像生成3D 對象一秒鐘搞定

在CES展會上,Stability AI推出了SPAR3D,這是一種創新的兩階段3D生成技術,能夠在不到一秒的時間內從單個圖像中生成精確的3D對象。SPAR3D不僅提供了高效的3D原型設計方式,還允許用戶實時編輯生成的3D對象,提升了創作靈活性。

image.png

【AiBase提要:】

⚡ 實時生成能力:SPAR3D能在一秒內從單張圖像生成完整的3D對象,並支持快速編輯。

🔍 精確的結構預測:提供準確的幾何形狀和360度視圖,包括隱藏區域,確保高分辨率輸出。

🚀 開放的使用政策:支持商業和非商業用途,用戶可通過多種方式獲取和使用該模型。

詳情鏈接:https://stability.ai/news/stable-point-aware-3d

8、2024年238款生成式人工智能服務在國家網信辦完成備案

國家互聯網信息辦公室於1月8日發佈公告,明確截止2024年12月31日,已有302款服務完成備案,其中238款爲2024年新增。這表明該領域快速發展,更多新服務獲得官方認可。公告還要求提供輿論屬性服務的企業進行備案,並提升已上線應用的透明度,確保合規性和安全性。

【AiBase提要:】

🌟2024年,共302款生成式人工智能服務在國家網信辦完成備案,新增238款。

🔍 提供輿論屬性服務的企業可通過屬地網信部門進行備案,確保合規性。

📝 已上線應用需公示所使用的已備案服務信息,提升透明度。

9、2024胡潤中國人工智能企業50強榜單:科大訊飛第二、商湯科技第三

2024胡潤中國人工智能企業50強榜單正式發佈,寒武紀以2380億人民幣估值位居榜首,展現出其在AI領域的強大實力。科大訊飛和商湯科技分別以1160億和500億的估值緊隨其後。榜單顯示,北京、上海和深圳是主要的AI企業集聚地,合計佔據80%的上榜企業。

【AiBase提要:】

🌟 寒武紀以2380億元估值位居榜首,科大訊飛和商湯科技分別排第二和第三。

🏙️ 北京、上海、深圳成爲人工智能企業的主要集聚地,合計佔據80%的上榜企業。

📊 該榜單側重非具身智能企業,評選範圍不包括機器人和智能家居等領域的公司。

10、你絕對想不到!重複這個簡單指令讓AI生成代碼快100倍

BuzzFeed的高級數據科學家麥克斯・伍爾夫進行了一項實驗,使用Claude3.5語言模型,通過反覆請求AI改進代碼,成功將原本657毫秒的運行時間縮短至6毫秒,提升了100倍的性能。實驗中AI展現出其對“更好代碼”的獨特理解,自動添加企業特性。

【AiBase提要:】

🌟 AI通過反覆指令提升代碼性能,原代碼運行時間從657毫秒降至6毫秒。

💡 AI在代碼中自動添加企業特性,展現出其對“更好代碼”的獨特理解。

🛠️ 提示工程依然重要,精確的請求可以加速結果生成,但仍需人工開發者進行驗證和修復。

11、英偉達發佈Groot Teleop 技術 允許通過Apple Vision Pro來訓練機器人

英偉達在CES展會上推出了一系列創新技術,旨在加速人形機器人的開發,尤其是在工業和製造領域。通過Isaac GR00T藍圖,開發者可以利用模仿學習生成大量合成運動數據,從而訓練人形機器人。這一技術不僅降低了數據收集的時間和成本,還通過Cosmos平臺生成物理意識視頻,推動物理人工智能的發展。

image.png

【AiBase提要:】

🚀 英偉達推出Isaac GR00T藍圖,利用模仿學習生成合成運動數據,加速人形機器人開發。

📊 Cosmos平臺經過18萬億數據訓練,生成物理意識視頻,促進物理人工智能發展。

🤝 多家機器人公司已採用Isaac GR00T技術,展現出良好的應用效果。

12、驚悚發明!工程師用 ChatGPT 製作機器人步槍,OpenAI 立刻出手

近期,工程師STS3D創造了一款機器人步槍,能夠通過ChatGPT指令進行瞄準和射擊,展現出令人驚歎的反應速度和準確性。這一發明引發了廣泛討論,尤其是關於將科幻技術變爲現實的擔憂。OpenAI迅速回應,指出該行爲違反了公司政策,禁止利用其服務開發武器。

【AiBase提要:】

🌐 OpenAI迅速切斷與開發機器人步槍工程師的關係,因其違反使用政策。

🤖 STS3D的機器人步槍可以根據ChatGPT的指令進行瞄準和射擊,展現出高準確性。

⚔️ 儘管OpenAI去年修改了政策,但仍禁止使用其服務開發任何形式的武器。

13、因用戶投訴,微軟回滾Bing AI圖像生成器升級、重返舊版DALL-E

微軟近期因用戶對Bing圖像生成器新版本的不滿,決定回滾至舊版DALL-E模型。用戶反饋新版本在圖像質量和細節處理上顯著下降,導致微軟搜索部門負責人Jordi Ribas承認並採取措施恢復舊版。

image.png

【AiBase提要:】

🌟 微軟因用戶投訴決定回滾 Bing 圖像生成器的新版本,旨在改善用戶體驗。

🎨 升級後的圖像生成效果不如預期,用戶反映細節和質量明顯下降。

🔧 Jordi Ribas 表示將重返舊版 DALL-E 模型,預計需幾周時間完成這一調整。