歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、可靈AI發佈1.5版本 視頻更穩更高清 人飛了臉都沒崩

可靈AI最新發佈的1.5版本帶來了令人印象深刻的新功能和改進,顯著提升了視頻生成的數量和質量,拓寬了AI在創意媒體領域的應用邊界。畫質大幅提升,支持10秒1080p高清視頻,文本響應度提升,審美提升,人物一致性加強,物體一致性改善。

【AiBase提要:】

🚀1.5版本視頻生成能力大幅提升,支持一次性生成最多4個視頻,圖生視頻功能支持生成長達10秒的1080p高清視頻。

🎨1.0版本新增了“運動筆刷”功能,提供更精確的運動控制和更生動的運動表現,拓展了視頻創作者的創意空間。

💡 文本理解能力顯著提升,1.5版本在畫面質量、動態表現和文本指令遵從效果等方面都有了顯著的效果提升,整體效果提升了95%。

詳情鏈接:https://top.aibase.com/tool/keling-ai

2、字節推音樂生成神器 Seed-Music 支持多樣化輸入和精確控制

最近,字節跳動推出了音樂創作新工具 Seed-Music,讓用戶通過多種方式生成音樂,如文字描述、音頻參考、樂譜甚至語音提示。這一神奇模型結合自迴歸語言模型和擴散模型,生成高質量音樂作品,同時提供精確控制。用戶可配樂歌詞、改編旋律,甚至上傳語音片段轉化爲歌聲,功能強大且高效。

【AiBase提要:】

🎵 Seed-Music結合自迴歸語言模型和擴散模型,生成高質量音樂作品,讓用戶精確控制音樂細節。

🎶 功能包括聲樂和器樂生成、歌聲合成、歌聲轉換和音樂編輯,滿足不同用戶需求。

🎼 Seed-Music架構分爲表示學習、生成和渲染模塊,通過多模態輸入生成高質量音樂。

詳情鏈接:https://team.doubao.com/en/special/seed-music

3、阿里通義千問開源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4

通義千問團隊宣佈開源Qwen2.5系列模型,包括通用語言模型Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math,預訓練在18T tokens數據集上,提升知識獲取、編程和數學能力。支持長文本處理,生成最多8K tokens內容,保持對29種以上語言的支持。提供多種規模版本,採用Apache2.0許可證。Qwen2-VL-72B模型性能媲美GPT-4,在指令執行、長文本生成、數據理解和結構化輸出方面有顯著改進。

image.png

【AiBase提要:】

🚀 Qwen2.5系列模型開源,包括通用語言模型和專業領域模型,提升知識獲取、編程和數學能力。

💡 模型支持長文本處理,生成最多8K tokens內容,對29種以上語言提供支持。

💻 Qwen2-VL-72B模型取得顯著改進,在指令執行、長文本生成、數據理解和結構化輸出方面表現優異。

詳情鏈接:https://modelscope.cn/studios/qwen/Qwen2.5

4、阿里通義萬相視頻生成模型“AI生視頻”功能正式上線

阿里巴巴旗下通義推出的通義萬相AI生視頻模型正式上線,具有強大的畫面視覺動態生成能力,支持多種藝術風格和影視級質感的視頻內容生成。該模型優化了中式元素表現,支持多語言輸入和可變分辨率生成,應用場景廣泛,提供免費服務並具有音頻生成功能,簡化視頻製作流程。

image.png

【AiBase提要:】

⚙️ 通義萬相AI生視頻模型具有強大的畫面視覺動態生成能力,支持多種藝術風格和影視級質感的視頻內容生成。

🌟 優化了中式元素表現,在生成國風內容方面具有獨特優勢,支持多語言輸入和可變分辨率生成,滿足不同用戶需求。

🎬 提供免費服務,支持視頻內容的音頻生成,簡化視頻製作流程,實現音畫同步,提高創作效率。

詳情鏈接:https://tongyi.aliyun.com/wanxiang/wanxvideo

5、騰訊出品!AI音頻模型 EzAudio AI,讓文本秒變逼真聲音

近日,約翰霍普金斯大學與騰訊 AI 實驗室聯合推出的 EzAudio 模型標誌着音頻技術的重大進步。該模型通過創新的架構和技術生成高質量音頻樣本,具備廣泛的應用潛力。隨着技術的發展,倫理和責任使用問題逐漸突顯,EzAudio 的公開研究代碼也爲未來的風險與收益提供了廣泛的檢驗機會。

image.png

【AiBase提要:】

🌟 EzAudio 是由約翰霍普金斯大學與騰訊合作推出的新型文本轉音頻生成模型,標誌着音頻技術的一次重大進步。

🎧 該模型通過創新的架構和技術,生成的音頻樣本在質量上優於現有開源模型,具備廣泛的應用潛力。

⚖️ 隨着技術的發展,倫理和責任使用的問題逐漸突顯,EzAudio 的公開研究代碼也爲未來的風險與收益提供了廣泛的檢驗機會。

詳情鏈接:https://huggingface.co/spaces/OpenSound/EzAudio

6、巨人網絡發佈自研角色大模型GiantGPT、語音大模型BaiLing-TTS

巨人網絡在2024年雲棲大會開幕式上展示了其在“遊戲+AI”領域的最新成果,包括GiantGPT和BaiLing-TTS等大模型應用,以及AI數字人和AI繪畫平臺巨人摹境等新技術。公司展示了高度優化的遊戲業務大模型和支持多種方言的語音大模型,同時發佈了全新品牌標識,開啓了AI繪畫平臺內測申請。巨人網絡還展示了高精度實時交互數字人技術,表達了持續深耕“遊戲+AI”領域的決心。

【AiBase提要:】

🎮 GiantGPT是專注於遊戲業務的垂直大模型,結合自有數據和互聯網公共數據進行訓練,深度優化基礎能力。

🗣 BaiLing-TTS是語音大模型,支持多種普通話方言混說,能生成多種方言語音。

🖌 巨人摹境AI繪畫平臺是一站式雲端平臺,支持團隊協作和美術內容批量化處理。

7、ChatGPT 高級語音模式或將於9月24日全面上線

ChatGPT的高級語音模式即將於9月24日全面發佈,爲用戶帶來前所未有的交互體驗。該功能生成逼真音頻響應,提升人機交互自然度和沉浸感。更新信息可靠性得到佐證,部分移動用戶或將在9月24日體驗升級後的語音模式。macOS版ChatGPT應用界面有變化,語音模式界面更豐富,新增便捷按鈕。部分用戶可與ChatGPT共享更多上下文信息,實現更連貫和個性化對話體驗。

【AiBase提要:】

⚙️ 高級語音模式將於9月24日全面發佈,提升交互體驗。

🔊 生成逼真音頻響應,增強人機交互自然度和沉浸感。

🌌 macOS版ChatGPT應用界面有變化,新增便捷按鈕,提供更豐富的視覺體驗。

8、YouTube引入DeepMind Veo模型 爲創作者想象插上翅膀

YouTube正式宣佈將Google DeepMind的Veo模型整合到其短視頻平臺YouTube Shorts中,開啓了短視頻創作的全新AI驅動時代。這一舉措不僅爲創作者提供了前所未有的創意工具,還徹底改變了用戶與平臺的互動方式。

【AiBase提要:】

✨ Dream Screen功能結合Imagen3和Veo模型,爲創作者打造智能創作環境。

🌟 YouTube通過SynthID技術保證AI生成內容的透明度和可信度。

💡 Made on YouTube2024計劃推出AI驅動的創作工具,如靈感助手和智能自動配音工具,支持內容創作者全方位。

9、2024AI智能體應用洞察半年報:AI類APP月活超6600萬

2024年AI智能體應用半年報顯示,AI類應用月活躍用戶數超過6600萬,展示了AI技術在應用層面的快速發展和普及。報告指出AI應用已形成八大玩法門類,商業化路徑已開啓。智能體服務解決用戶需求,微信生態重要渠道,智能體商業模式探索中。智能體在教育學習場景成熟,頭部智能體使用熱度較高。AI智能體應用成爲移動互聯網重要分支,爲用戶帶來豐富便捷體驗,爲行業發展提供新動力和方向。預計未來AI智能體應用將發揮更重要作用。

image.png

【AiBase提要:】

📊 AI類應用月活躍用戶數超過6600萬,展示AI技術快速發展和普及。

🎮 AI應用形成八大玩法門類,商業化路徑開啓。

📈 智能體服務解決用戶需求,微信生態重要渠道,商業模式探索中。

10、LinkedIn 悄然使用用戶數據訓練 AI,需雙重選擇退出

最近,LinkedIn被曝出在未事先通知用戶的情況下開始將用戶數據用於訓練生成式人工智能模型。用戶需在賬戶設置中關閉相關選項才能選擇退出,但僅影響未來數據使用。LinkedIn還提到其他機器學習工具需填寫額外表單才能完全退出數據使用。

【AiBase提要:】

🔒 LinkedIn默認將用戶數據用於訓練AI模型,用戶需主動選擇退出

✋ 用戶需在賬戶設置中關閉選項,僅影響未來數據使用

📄 除生成式AI外,LinkedIn還有其他機器學習工具,需填寫額外表單以完全退出數據使用

11、2300萬美元融資!Fal.ai讓50萬開發者瘋狂,每天生成5000萬媒體內容

Fal.ai是一家專注於AI生成音頻、視頻和圖像的雲平臺,最近成功融資2300萬美元。該平臺吸引了知名投資者和衆多開發者、企業客戶,展現出巨大潛力和市場需求。未來,Fal.ai將加強內容審覈和模型優化工作,以更好地應對生成技術帶來的挑戰。

image.png

【AiBase提要:】

🚀 Fal.ai成功融資2300萬美元,吸引多位投資者,展現出巨大市場潛力。

💡 該平臺專注於爲企業提供高效的AI生成媒體解決方案,吸引了衆多開發者和企業客戶。

🔍 Fal.ai將加強內容審覈和模型優化工作,以更好地面對生成技術的風險和挑戰。

12、辦公軟件的超級英雄?金山WPS AI會員人數破百萬,鴻蒙版全面開跑

金山辦公的WPS AI會員和大會員的年度付費用戶數量突破100萬,展示了人工智能在辦公領域的潛力和用戶認可度。與華爲合作推出WPS鴻蒙版本,跨平臺表現出色,提升用戶辦公體驗。AI會員服務佈局精心,推出AI助手和Linux12個人版,不斷提高用戶工作效率和拓展平臺覆蓋範圍。

【AiBase提要:】

🚀 WPS AI會員和大會員付費用戶數量突破100萬,彰顯人工智能在辦公領域的潛力和用戶認可度。

💡 與華爲合作推出WPS鴻蒙版本,實現多平臺賬號統一、跨端調用、跨屏協同等先進功能,提升用戶辦公體驗。

🔥 推出AI助手和Linux12個人版,引入多項AI驅動功能,如AI幫我寫、AI幫我改、AI寫公式和AI生成PPT,提高用戶工作效率。

13、開發者福音!Anthropic將推出Claude AI桌面應用

Anthropic即將推出全新的Claude AI桌面應用,爲開發者帶來更便捷的AI助手體驗。這將極大提高開發效率和創新可能。

【AiBase提要:】

🚀 Anthropic即將推出全新的Claude AI桌面應用,爲用戶帶來更便捷的AI助手體驗。

💡 Anthropic還在開發針對artifacts的創新功能,有望讓用戶直接將artifacts導出到VSCode編輯器中。

⚙️ 新功能操作方式類似於artifact remixing,通過生成深度鏈接的URL,簡化開發流程,提高工作效率。

14、阿里CEO稱AI最大想象力不在於手機:通義千問API調用價格下降97%

吳泳銘在2024雲棲大會開幕式上分享了對人工智能發展的見解,強調AI技術的快速迭代和生成式AI的潛力。

【AiBase提要:】

🔑 通義千問API調用價格大幅下降97%,調用費用僅需0.5元,阿里雲致力於降低成本。

🚀 AI技術在多模態能力、推理成本、技術可用性等方面取得巨大進步,超越摩爾定律。

💡 生成式AI的潛力在於創造新價值、提升全球生產力水平,可能比移動互聯網連接創造價值更大十到幾十倍。

15、Runway進軍好萊塢!與獅門影業達成合作

Runway與著名電影製作公司Lionsgate達成合作,開發定製AI視頻模型,引發影視行業震動。這次合作將爲影視製作領域帶來新突破,提升製作效率和創意發揮空間。

【AiBase提要:】

🌟 首個大型電影公司與AI視頻模型供應商直接簽訂協議,標誌着行業合作新紀元的到來。

🎬 Runway將利用Lionsgate兩萬部影視作品創建定製AI視頻製作模型,應用於故事板和特效製作。

🚀 Runway推出新API支持第三方開發者使用AI視頻功能,並舉辦短片創作比賽,展示對創作者的支持。