歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、廣電總局發佈“管理提示”整治AI“魔改”現象,經典影視遭惡搞

廣電總局針對AI“魔改”視頻現象發佈管理提示,強調治理措施以保護經典文化。近期多部經典影視劇被惡搞改編,引發公衆對傳統文化的關注。管理要求各省局督促短視頻平臺清理相關內容,並落實生成式AI內容審覈,以防止誤導和侵權。

【AiBase提要:】

🚫 廣電總局發佈提示,要求治理AI“魔改”視頻現象,保護經典文化。

🎥 多部經典影視劇被惡搞改編,影響公衆對傳統文化的認知與價值觀。

🔍 平臺需嚴格審覈生成式AI內容,避免誤導和侵犯版權。

2、海螺AI海外版上線超強AI語音克隆功能

海螺AI最近推出了其海外版的音頻克隆模塊,用戶只需10到60秒的音頻樣本即可完美復刻自己的聲音。這一技術突破在中文語音克隆領域引起了廣泛關注,許多用戶對其出色的音頻克隆效果感到驚喜。該系統不僅操作簡單,還支持多種語言和情緒選擇,極大地滿足了用戶的需求。

【AiBase提要:】

🌟 只需10到60秒音頻,海螺AI即可完美復刻用戶聲音,突破了中文語音克隆的瓶頸。

🎤 系統支持12種語言,用戶可選擇不同情緒,豐富語音表現。

💻 目前海螺AI音頻功能免費使用,用戶可輕鬆創建多個聲音模型。

詳情鏈接:https://www.hailuo.ai/audio

3、Runway Act One更新:將你的表演和聲音無縫融入視頻角色

Runway Act One的最新更新爲視頻製作帶來了革命性的變化,允許用戶將自己的表演和聲音直接應用於其他視頻角色,實現完美同步。這一技術突破不僅降低了創作門檻,還爲影視創作提供了前所未有的靈活性,創作者可以隨時隨地進行試鏡和表演轉移。

【AiBase提要:】

🎭 多維度表演轉移:動作、聲音和表情可以無縫移植到任何角色上。

📱 便捷試鏡:演員可隨時用手機拍攝,輕鬆將表演轉移到目標角色。

🖥️ AI結合:使用Midjourney等工具,創作者能將短視頻延展爲完整表演。

詳情鏈接:https://top.aibase.com/tool/runway

4、OpenAI 即將發佈全新 Sora 視頻生成器,支持多種生成方式

OpenAI 最近在倫敦 C21Media 大會上宣佈即將推出更新版的 Sora 視頻生成器,該版本將支持文字、圖像和視頻的多種生成方式,極大地提升了用戶的視頻創作體驗。新版本在效率和速度上都有顯著提升,預計將在12月的冬季推廣活動中正式發佈,同時可能還會推出 GPT-4.5等其他新功能。

【AiBase提要:】

🌟 更新版 Sora 視頻生成器將支持文字、圖像及視頻生成視頻,提升創作靈活性。

🚀 新版生成器在速度和效率上都有顯著提升,增強用戶體驗。

📅 預計將在12月的冬季推廣活動中發佈,可能同時推出 GPT-4.5等新功能。

5、超高清視頻修復工具VISION XL 模糊視頻一鍵變清晰

隨着科技的進步,VISION XL作爲一款視頻修復和超分辨率工具,以其卓越的性能和易用性脫穎而出。它不僅能夠修復視頻缺失部分和去除模糊,還能顯著提升視頻清晰度,最高可達四倍超分辨率。其基於潛在擴散模型的處理框架,減少了對額外預訓練模塊的依賴,使得高分辨率視頻的處理效率大幅提升。

image.png

【AiBase提要:】

✨ VISION XL能夠修復視頻缺失部分,去除模糊,提升清晰度,最高可達四倍超分辨率。

⚙️ 採用基於潛在擴散模型的處理框架,減少對額外預訓練模塊的依賴,提升處理效率。

🚀 僅需13GB顯存即可處理25幀視頻,處理時間不超過2.5分鐘,適合快速應用場景。

詳情鏈接:https://vision-xl.github.io/

6、馬斯克旗下社交網絡平臺X上線圖像生成器Aurora

埃隆·馬斯克的社交網絡X最近推出了新圖像生成器Aurora,旨在創造照片般真實的圖像。儘管上線後不久部分用戶無法訪問該功能,Aurora仍然允許用戶生成包括米老鼠在內的公共和版權人物圖像,且沒有限制。該工具在生成靜物和景觀圖像方面表現出色,但也存在一些不足,如圖像中的物體融合不自然和人像缺失手指等問題。

image.png

【AiBase提要:】

🌟 新圖像生成器Aurora上線,用戶可生成多種圖像。

🚫 部分用戶在上線後幾小時內無法訪問該功能。

💰 X社交平臺將Grok功能向所有用戶開放。

7、谷歌新發布Gemini-Exp-1206模型橫掃對手,超越ChatGPT成爲AI新王

谷歌最新推出的Gemini-Exp-1206模型在生成AI領域引起了廣泛關注,憑藉1379的高分在LMArena排行榜上超越了ChatGPT-4.0的1366分,展現了其卓越的綜合能力。儘管Gemini-Exp-1206在多項評估中表現出色,但在投票數量上仍落後於ChatGPT-4.0,顯示出後者在可靠性方面的優勢。

image.png

【AiBase提要:】

🌟 Gemini-Exp-1206在LMArena排行榜上取得1379分,超越ChatGPT-4.0的1366分。

🗳️ ChatGPT-4.0獲得21,929票,明顯高於Gemini-Exp-1206的5052票,顯示出其可靠性。

🔍 Gemini實驗模型爲開發者提供了前所未有的AI體驗機會,但仍處於測試階段,不適合生產使用。

詳情鏈接:https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn

8、NegToMe重新定義圖像生成:降低版權風險 提升多樣性改善視覺效果

NegToMe是一項顛覆性的圖像生成技術,利用圖像驅動的對抗性指導方法,突破了傳統負面提示的侷限,顯著提升了生成圖像的多樣性和質量。它通過降低生成內容與版權作品的相似度,解決了版權保護的問題,同時在跨域應用中也表現出色,爲創作者提供了更大的創意自由。未

image.png

【AiBase提要:】

🎨 NegToMe通過圖像驅動的對抗性指導方法,顯著提升了生成圖像的多樣性,尤其在種族和性別處理上表現突出。

🔒 該技術降低生成內容與版權作品的相似度,測試顯示相似性降低了34.57%,有效解決版權保護問題。

⚙️ NegToMe集成便捷,開發者只需少量代碼即可應用,推理時間幾乎不受影響,兼容多種擴散模型。

詳情鏈接:https://github.com/1jsingh/negtome

9、X向所有用戶開放Grok AI 普通用戶也可以白嫖生圖了

xAI最近宣佈其聊天機器人Grok已向全球用戶開放,提供了一個低成本的AI體驗機會。用戶在免費版本中受到一些使用限制,如每日圖像創作和信息發送數量的限制。這一舉措不僅吸引了更多用戶瞭解AI技術,也反映了xAI在推廣產品時的商業策略。

image.png


【AiBase提要:】

🖼️ Grok允許用戶每天最多創作或分析3張圖片。

💬 用戶在兩小時內只能發送10條信息,以控制使用頻率。

📈 xAI通過免費開放Grok來吸引用戶,未來可能推出更多付費功能。

10、Google Photos推出2024年度照片回顧:AI智能生成,記錄你的精彩瞬間

隨着數字科技的發展,Google Photos推出了2024年度照片回顧功能,利用AI技術爲用戶提供個性化的體驗。通過Gemini AI,用戶可以獲得智能生成的照片標註,回顧重要時刻和拍攝數據。儘管這一功能爲用戶帶來了分享美好回憶的機會,但也可能喚起一些不愉快的回憶。


【AiBase提要:】

🤖 AI技術生成個性化的照片標註,突出年度重要時刻。

📊 提供詳細的拍攝數據統計,方便用戶分享個人指標。

😢 可能喚起一些不愉快的回憶,AI尚未完全理解用戶的情感需求。

11、OpenAI 決定與軍方承包商合作,內部員工發聲反對!

OpenAI與安杜瑞爾的合作引發員工的強烈反響,許多人對技術在軍 事上的應用表示擔憂,要求更多透明度。儘管管理層強調合作僅限於防禦系統,但員工對這一界限表示懷疑。

【AiBase提要:】

🌐 OpenAI與安杜瑞爾的合作引發員工對AI軍 事應用的擔憂。

🛡️ 管理層強調合作僅限於防禦系統,但員工對技術應用的限制性表示懷疑。

📉 政策轉變顯示OpenAI開始接受其技術在軍 事領域的應用。

12、AI 專家:一次 ChatGPT 查詢相當於需要浪費半升水

生成式人工智能的快速發展帶來了環境問題,尤其是能源和水資源的消耗。凱特・克勞福德教授在講座中指出,若不採取可持續性措施,生成式人工智能的能耗將在一年內達到與日本相當的水平。

【AiBase提要:】

🌍 一次 ChatGPT 查詢會浪費半升水,提醒人們關注人工智能對水資源的影響。

⚡ 生成式人工智能的能耗可能在一年內達到日本的水平,需制定可持續發展計劃。

🤝 可持續性應成爲人工智能行業的首要任務,而不是競爭排名。