歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、微信:將打擊利用AI仿冒知名人士進行營銷宣傳行爲

微信珊瑚安全近期發佈公告,明確表示將嚴厲打擊利用AI技術仿冒知名人士進行不當營銷的行爲。平臺致力於維護網絡環境的安全與健康,已對532條違規內容進行處理,並關閉209個相關賬號。未來,微信將繼續加大對這類行爲的打擊力度。

微信截圖_20241216081617.png

【AiBase提要:】

🛡️ 微信強調將打擊利用AI仿冒知名人士進行不當營銷的行爲,致力於打造安全的網絡環境。

📊 截至目前,微信已處理532條違規內容,並關閉209個相關賬號,顯示出強大的治理能力。

🤝 微信呼籲用戶遵守法律法規,積極舉報違規行爲,以共同維護網絡的健康生態。

2、月之暗面Kimi視覺思考版上線:基於k1模型打造 可識別圖片內容

月之暗面旗下的人工智能助手Kimi最近推出了視覺思考版功能,能夠對用戶發送的圖片進行深入分析和觀察。該功能基於k1視覺思考模型,使Kimi能夠智能識別圖片內容並提供準確反饋。用戶可以直接向Kimi提問,例如關於照片拍攝地點或請求解答圖中的問題。

微信截圖_20241216083354.png

【AiBase提要:】

🖥️ Kimi的新視覺思考功能能夠對用戶發送的圖片進行細緻觀察和分析。

📸 用戶可以詢問Kimi關於拍攝照片的地點,Kimi將根據圖片內容作出猜測。

💡 用戶可以發送截圖請求Kimi幫助解答圖中的題目,提供更便捷的服務體驗。

3、階躍星辰Step-1o Audio千億參數端到端語音大模型上線 將接入躍問App

階躍星辰推出的Step-1o語音大模型是國內首個千億參數的端到端語音模型,標誌着語音技術的一次重大進步。該模型不僅能夠實現語音理解與生成的高度整合,還具備情商和智商的雙重優勢,能夠理解複雜的語義和情緒信息,提供高質量的專業建議。Step-1o的廣泛應用前景將爲各行業的語音交互技術帶來新的可能性。

微信截圖_20241216081425.png

【AiBase提要:】

🎤 Step-1o是國內首個千億參數的端到端語音大模型,具備強大的語音理解與生成能力。

🤖 該模型能夠理解複雜的語義和情緒信息,提供專業建議,展現出高智商和情商。

📱 Step-1o將接入躍問App,用戶可通過電話與其進行實時語音交流,拓展應用場景。

4、Pika2.0發佈:改進文本對齊功能 可隨意操控視頻內容元素

Pika近日推出了其最新的AI視頻生成工具Pika2.0,標誌着該平臺在創意AI領域的進一步發展。新版本提供了更多的控制權和可定製性,尤其是在文本對齊和運動渲染方面的顯著提升,使得用戶能夠更輕鬆地創建高質量視頻內容。Pika2.0的設計旨在滿足個人創作者和小型品牌的需求,預計將吸引更多用戶加入。

image.png

【AiBase提要:】

✨ Pika2.0引入改進的文本對齊功能,簡化用戶生成視頻的過程。

🚀 新的運動渲染技術提供更自然的動作表現,提升視頻質量。

🎨 平臺的新“場景成分”功能允許用戶自定義角色和背景,增強創作靈活性。

5、阿里通義實驗室語音生成大模型CosyVoice升級2.0版本

阿里巴巴通義實驗室的CosyVoice語音生成大模型已升級至2.0版本,顯著提升了語音生成的準確性、穩定性和自然體驗。新版本通過雙向流式語音合成技術,降低了合成延遲,並在發音準確性上取得了顯著進展。CosyVoice2.0還增強了音質與情感匹配,支持多種方言和角色扮演功能。

image.png

【AiBase提要:】

🚀 CosyVoice2.0實現了雙向流式語音合成,合成延遲可達150ms,提升響應速度。

📉 發音準確性顯著提升,錯誤率下降30%-50%,在hard測試集上取得最低字錯誤率。

🎤 支持多種方言和情感控制,提供更豐富的語言選擇及角色扮演功能。

詳情鏈接:https://github.com/FunAudioLLM/CosyVoice

6、張文宏被 AI “冒名” 帶貨

近日,一段關於張文宏的直播帶貨視頻引發廣泛關注,實際上是通過AI技術合成的深度僞造。許多網友誤以爲張文宏在帶貨,尤其是一些年長觀衆深信不疑並轉發信息。張文宏對此表示已多次投訴,提醒公衆對AI合成信息的警惕。此事件凸顯了公衆對新技術的認知滯後,尤其是老年人羣體容易受到誤導。

image.png

【AiBase提要:】

🌐 AI合成的張文宏在直播帶貨中引發熱議,部分網友誤信其身份。

🔍 大衆對新技術的認知滯後,容易受到虛假信息的影響。

🛡️ 加強技術防範措施和信息監測機制,提升公衆識別能力至關重要。

7、無問芯穹發佈首個端側全模態理解開源模型Megrez-3B-Omni,融資接近10億元

無問芯穹在AI領域取得了重要進展,推出了全球首個端側全模態理解開源AI模型Megrez-3B-Omni,標誌着其在技術創新上的領先地位。同時,公司還推出了純語言版本的模型,進一步豐富了產品線。無問芯穹致力於高效的AI計算優化,已支持多種主流模型,併成功完成近5億元的A輪融資。

image.png

【AiBase提要:】

🌟 無問芯穹推出全球首個端側全模態理解開源AI模型Megrez-3B-Omni,增強產品線。

💰 公司融資接近10億元,未來3-5年目標實現規模化盈利。

🤝 無問芯穹優化算力使用效率,與多家知名投資機構深度合作。

詳情鏈接:https://huggingface.co/Infinigence/Megrez-3B-Omni

8、百度文庫APP上線「AI考研寶典」支持AI拍圖寫作等衆多功能

隨着考研初試的臨近,百度文庫APP推出了全新的「AI考研寶典」,爲考研學子提供高效學習和備考支持。該平臺運用人工智能技術,通過創新工具幫助考生提升複習效率和考試分數。功能包括AI拍圖寫作、智能問答、英語作文美化等,極大便利了考生的學習過程,使他們能夠更好地應對考研挑戰。

image.png

【AiBase提要:】

📸 AI拍圖寫作功能可快速獲得答案詳解,提高解題效率。

📝 提供智能問答和AI文檔總結,幫助考生梳理知識點。

🌐 AI全網搜功能整合信息,提供結構化和圖示化回答。

9、馬斯克X平臺Grok AI升級:三倍速提升,來源引用傳統媒體更精準

xAI最近對其Grok AI聊天機器人進行了重大升級,推出了Grok-2版本,顯著提升了性能,速度是前版本的三倍,並在準確性和語言支持方面有了明顯改善。新版本不僅能處理X平臺上的帖子信息,還能引用外部網站的信息,特別是新聞來源,增強了回答的可靠性。此外,新增的Grok按鈕爲討論提供了上下文,幫助用戶更好地理解對話內容。

image.png

【AiBase提要:】

📈 Grok-2的速度是前版本的三倍,準確性和語言支持顯著提升。

📰 新版本能引用外部媒體的信息,並附上來源,增強回答的可靠性。

🔍 新增的 Grok 按鈕可以爲討論提供上下文,並解釋對話中的圖片。

10、武漢大學成立人工智能學院,小米集團期待深化合作

武漢大學人工智能學院的成立標誌着該校在人工智能領域的研究和教育邁上了新臺階。學院將專注於數理基礎、機器學習、智能自然科學和社會科學等領域。2025年將開始招收本科生及碩博研究生,致力於推動多領域交叉創新。同時,小米集團期待與學院深化合作,共同推動人工智能技術的發展。


【AiBase提要:】

🌟 武漢大學人工智能學院正式揭牌,由院士張平文擔任首任院長。

🎓 學院將於2025年開始招收本科生及碩博研究生,專注多領域交叉研究。

🤝 小米集團期待與學院深化合作,共同推動人工智能技術的應用與發展。

11、Nexa AI 發佈 OmniAudio-2.6B:用於邊緣部署的快速音頻語言模型

Nexa AI最近推出的OmniAudio-2.6B音頻語言模型,專爲邊緣設備的高效部署而設計。該模型通過將多個組件整合到一個統一框架中,顯著提升了處理速度和資源效率,適應了計算資源有限的環境。其在準確性和靈活性方面也表現出色,能夠滿足轉錄、翻譯等多種任務的需求。

【AiBase提要:】

⚡ 處理速度卓越:在2024Mac Mini M4Pro上,模型實現每秒35.23個令牌的處理速度,展現出顯著的速度優勢。

🌐 資源效率高:緊湊設計減少了對雲資源的依賴,適合功率和帶寬受限的設備,如可穿戴設備和汽車系統。

✅ 高準確性與靈活性:適用於轉錄、翻譯等多種任務,能夠提供精準的實時語音處理結果。

詳情鏈接:https://huggingface.co/NexaAIDev/OmniAudio-2.6B

12、OpenAI發佈ChatGPT宕機故障詳細報告:只因一個小更改導致

上週,OpenAI的ChatGPT和Sora等服務經歷了長達4小時10分鐘的宕機事件,影響了大量用戶。故障的根本原因是一個小的遙測服務變更,導致Kubernetes API操作過載,最終使得服務癱瘓。工程師們在關鍵時刻被鎖在控制面之外,無法及時處理問題。經過多輪努力,包括縮減集羣規模和增加資源,最終恢復了服務。

image.png

【AiBase提要:】

🔧 故障原因: 小的遙測服務變更導致K8S API操作過載,造成服務癱瘓。

🚪 工程師困境: 控制面崩潰使得工程師無法訪問,導致無法進行問題處理。

⏳ 恢復過程: 通過縮小集羣規模和增加資源等手段,最終恢復了服務。

詳情鏈接:https://status.openai.com/incidents/ctrsv3lwd797

13、谷歌 Chrome F12開發者工具新增 AI 功能 助力快速調試網頁代碼

谷歌在其 Chrome 瀏覽器的 F12開發者工具中新增了一項 AI 功能,旨在提升開發者的網頁調試效率。這一功能允許開發者在調試過程中隨時提問,AI 會根據代碼和上下文提供相關的解決方案。通過簡單的設置,開發者可以快速啓用這一功能,支持多種編程語言,極大地便利了開發者的工作。

image.png

【AiBase提要:】

✨ AI 功能在 Chrome F12開發者工具中新增,助力快速調試代碼。

💻 開啓 AI 功能簡單易操作,開發者可以隨時提問獲取幫助。

🌍 支持多種語言,AI 自動分析源代碼,提供針對性解決方案。