AI日報：微軟發佈iPhone可運行AI模型；全國首例AI聲音侵權案判了；Kimi創始人套現數千萬美金；中文聊天模型Llama3發佈

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、騰訊SaaS產品智能化升級全面接入混元模型

騰訊宣佈旗下協作SaaS產品全面接入混元模型，實現軟件服務智能化。騰訊樂享、騰訊電子籤、騰訊問卷等產品已實現智能化升級，爲用戶提供更智能、高效的服務。混元大模型已擴展至萬億級參數規模，在國內率先採用混合專家模型結構，性能表現優異。外部開發者和企業可以通過騰訊雲上API直接調用騰訊混元能力，解決用戶痛點。

【AiBase提要:】
🚀 騰訊SaaS產品實現智能化升級，提供更智能、高效的服務。
💡 混元大模型擴展至萬億級參數規模，性能在多方面表現優異。
🔗 外部開發者和企業可通過騰訊雲API調用混元能力，解決不同場景下的痛點。

2、微軟發佈iPhone可運行的ChatGPT級AI模型Phi-3系列挑戰OpenAI地位

微軟最新推出的Phi-3系列小型AI模型在AI領域引起轟動，尤其是Phi-3-mini模型在多項基準測試中超越了參數更大的Llama3模型。該系列模型能在iPhone14Pro和iPhone15上實現每秒12token的運行速度，達到了ChatGPT水平。微軟強調訓練數據的重要性，通過精心設計數據和訓練方法提升模型性能。

【AiBase提要:】
🚀 Phi-3-mini模型參數僅3.8B，性能超越8B參數的Llama3模型。
💡 Phi-3系列包括Phi-3-small和Phi-3-medium版本，性能優越。
🔍 微軟團隊通過精心設計訓練數據和獨特訓練方法提升了Phi-3系列模型的性能。
詳情鏈接:https://arxiv.org/pdf/2404.14219.pdf

3、全國首例AI聲音侵權案一審宣判自己聲音被AI化出售獲賠25萬元

這篇文章報道了全國首例AI聲音侵權案的一審判決結果，涉及配音師聲音被AI技術濫用的案件引起社會廣泛關注。法院裁定被告未經授權擅自使用配音師聲音開發AI產品構成侵權，需賠償25萬元。判決強調聲音作爲人格權益應受法律保護，爲聲音創作者提供了重要法律保障。

【AiBase提要:】
🔍 首例AI聲音侵權案一審判決結果：被告未經授權使用配音師聲音開發AI產品，需賠償25萬元。
💡 法院強調聲音作爲獨特人格權益應受法律保護，未經授權擅自使用聲音構成侵權行爲。
👩‍⚖️ 判決爲聲音創作者提供了重要法律保障，將堅決維護聲音權益並打擊侵權行爲。

4、中文聊天模型Llama3-8B-Chinese-Chat發佈

這篇文章介紹了基於Meta-Llama-3-8B-Instruct模型經過ORPO方法微調的中文聊天模型Llama3-8B-Chinese-Chat。該模型減少了中英混合回答和表情符號的使用，使得回答更正式和專業。它在理解中文問題意圖、提供恰當回答、拒絕不當請求等方面表現出色。

【AiBase提要:】
🔑 Llama3-8B-Chinese-Chat是基於Meta-Llama-3-8B-Instruct模型通過ORPO方法微調的中文聊天模型，減少了中英混合回答和表情符號的使用。
🌟 ORPO方法利用賠率比概念調整模型偏好設置，優化模型在特定任務中的表現，Llama3-8B-Chinese-Chat模型使用ORPO優化中英文生成偏好。
💡 Llama3-8B-Chinese-Chat模型在安全、道德、數學問題解答、寫作和編程示例等方面表現出色，提供更準確、專業的回答和示例代碼。
詳情鏈接:https://top.aibase.com/tool/llama3-8b-chinese-chat

5、Adobe發佈視頻超分辨率項目VideoGigaGAN

Adobe最近推出了視頻超分辨率項目VideoGigaGAN，該項目在視頻放大技術方面取得了顯著進展，能將視頻放大至原始分辨率的8倍，保持時間連貫性和高頻細節清晰度。這一技術將視頻處理帶入新階段，極大擴展了視頻內容的應用範圍和質量。

【AiBase提要:】
✨ VideoGigaGAN實現視頻放大至8倍原始分辨率，保持時間連貫性和高頻細節清晰度。
🔍 Adobe優化GigaGAN模型，增強視頻穩定性，展示卓越性能。
💡 VideoGigaGAN提升視頻視覺質量，適應不同風格視頻內容，具有廣泛的應用潛力。
詳情鏈接:https://top.aibase.com/tool/videogigagan

6、Midjourney發佈random功能可基於提示詞生成完全隨機的圖像風格

Midjourney發佈了一個有趣的功能，可以基於提示詞生成完全隨機的圖像風格。用戶可以通過隨機生成的圖像風格來探索不同的創作方向，同時還可以與其他用戶進行實時交流和分享，共同探討創作過程中的靈感和想法。這一功能的推出將進一步豐富用戶的圖像生成體驗，爲他們提供更多的創作選擇和交流平臺。

【AiBase提要:】
⚙️ 可基於提示詞生成完全隨機的圖像風格
💬 用戶可以通過Room功能進行實時交流和分享
🎨 探索不同的創作方向，豐富用戶的圖像生成體驗

7、AI獨角獸月之暗面創始人楊植麟套現數千萬美金官方迴應

楊植麟作爲月之暗面創始人，通過個人股份銷售套現數千萬美元，引起廣泛關注。公司成立僅一年便獲得鉅額融資，估值超過25億美元。月之暗面的成功不僅在估值上體現，旗艦產品Kimi Chat的成功也備受矚目。

【AiBase提要:】
🚀 月之暗面創始人楊植麟通過個人股份銷售套現數千萬美元，公司估值超過25億美元。
💡 月之暗面創立僅一年便迅速崛起，成爲中國大模型領域獨角獸之一。
💬 月之暗面旗艦產品Kimi Chat憑藉“長文本”功能在AI大模型領域脫穎而出，引發資本市場熱潮。

8、毫不猶豫！小扎自曝願開源100億美元模型直言2025年之前AGI不可能實現

在最新的播客訪談中，小扎展現了開源英雄形象，表示願意開源價值100億美元模型，強調開源降低成本促進創新，但也需綜合考慮經濟利弊。他對2025年之前AGI實現持悲觀態度，認爲能源短缺是瓶頸，解決可能需數十年。批評蘋果和谷歌獨佔移動生態，希望通過開源改變局面，防範競爭對手威脅。對於人工智能發展瓶頸，擔憂能源限制和數據中心挑戰，持保留態度未來AI模型能力提升。

【AiBase提要:】
💡 小扎願意開源價值100億美元模型，認爲開源降低成本促進創新，但需綜合考慮經濟利弊。
💡 對2025年之前AGI實現持悲觀態度，認爲能源短缺是瓶頸，解決可能需數十年。
💡 批評蘋果和谷歌獨佔移動生態，希望通過開源改變局面，防範競爭對手威脅。

9、字節跳動發佈圖像模型蒸餾算法Hyper-SD

這篇文章介紹了字節跳動的Lightning團隊發佈的新圖像模型蒸餾算法Hyper-SD，該算法在圖像處理和機器學習領域取得重要進展。通過創新的方法提升了模型性能，在保持模型精簡的同時提高了推理速度和效率。

【AiBase提要:】
⚙️ 分段軌跡一致性蒸餾：Hyper-SD技術確保了原始ODE軌跡的完整性。
🧠 人類反饋學習機制：引入人類反饋學習，提升模型表現，減少性能損失。
🔬 分數蒸餾技術：增強了模型在低步推理下的生成能力，進一步提升性能。
詳情鏈接:https://top.aibase.com/tool/hyper-sd

10、AI音樂生成工具AI Jukebox 輸入提示詞選擇曲風即可創作音樂

AI Jukebox是一款利用人工智能技術的音樂生成工具，通過Hugging Face平臺提供服務。它簡化音樂創作過程，智能化且用戶友好。用戶可以通過輸入提示詞指導AI生成特定風格音樂，實現智能化音樂創作。AI Jukebox鼓勵人機合作模式，爲音樂人和音樂愛好者提供靈感和創作工具，探索無限可能性。

【AiBase提要:】
🎵 本地化模型加載: 用戶打開AI Jukebox的網頁後，系統自動加載生成模型，無需複雜設置。
🎶 基於提示詞的音樂生成: 用戶通過輸入特定提示詞指導AI生成特定風格音樂，包括音樂類型、情感、樂器等描述。
🎼 人機合作模式: AI Jukebox鼓勵用戶與AI合作，探索新的音樂創作方式，提供靈感和創作工具。
詳情鏈接:https://top.aibase.com/tool/ai-jukebox

11、虛擬人聊天系統Live2D

這篇文章介紹了基於Unity開發的Live2D虛擬人聊天系統項目，利用Live2D技術展現動態虛擬人形象，提供流暢的動畫效果，增強用戶交互體驗。項目集成了Azure、OpenAI和APISpace等API支持自然語言處理和生成，實現實時文本交流。同時支持圖像處理和人臉檢測，高清分辨率顯示，以及自定義擴展功能。

【AiBase提要:】
👩‍💻 Live2D虛擬人形象集成，提供流暢的動畫效果，增強用戶體驗。
💬 實時聊天功能，虛擬人能理解並回應用戶文本輸入，實現實時交流。
🔍 圖像處理和人臉檢測，讓虛擬人更好地響應用戶視覺輸入。
詳情鏈接:https://top.aibase.com/tool/live2d-virtual-human-for-chatting-based-on-unity

12、港大與浙大聯合研發SC-GS模型

本文介紹了香港大學CVMI實驗室與3D大模型公司VAST以及浙江大學聯合研究團隊提出的SC-GS模型，該模型在數字資產創造和3D重建領域取得突破性成果。通過稀疏控制點實時交互編輯，實現了對動態場景的高效編輯和合成，展現了巨大潛力。

【AiBase提要:】
🌟 SC-GS模型在新視角合成領域掀起革命性浪潮，展現出對動態高斯的稀疏控制點進行實時交互編輯的能力。
🔑 用戶可以通過簡單的鼠標拖拽和鍵盤組合按鍵操作，輕鬆實現對重建動態場景的編輯。
💡 SC-GS模型通過神經網絡預測控制點運動狀態，驅動整個場景中的動態高斯進行變形，提升了動態新視角合成的性能。
詳情鏈接:https://top.aibase.com/tool/sc-gs

13、新視頻分割技術SAM 可高效識別移動物體

本文介紹了在視頻分割領域，研究團隊探索新的視頻對象分割技術，通過結合SAM模型和光流技術，提高了視頻分割性能。兩種模型展示了潛力，實現了顯著性能提升，並將分割技術擴展到整個視頻序列，實現物體追蹤。這些技術提升了視頻分割精度和效率，降低了計算複雜度，對多個應用場景具有重要意義。

【AiBase提要:】
⚙️ SAM與光流結合的模型展示了提高視頻分割性能的潛力。
🔍 SAM與RGB圖像結合的模型增強了模型對視頻中物體運動的識別和分割能力。
🚀 將基於幀的分割方法擴展到整個視頻序列，實現了物體在視頻連續幀中的身份追蹤。
詳情鏈接:https://www.robots.ox.ac.uk/~vgg/research/flowsam/

AI日報：微軟發佈iPhone可運行AI模型；全國首例AI聲音侵權案判了；Kimi創始人套現數千萬美金；中文聊天模型Llama3發佈

相關推薦

微軟大動作：8月將整合Copilot全端產品，精簡功能對標ChatGPT

微軟 Teams 8 月上線 AI 助手 Facilitator，會議實時答疑提升溝通效率

近 400 家地方報紙起訴 OpenAI 和微軟，指控侵犯版權

GitHub Copilot6月改用量化計費，使用量激增創單月曆史新高

降本近四成！微軟重磅發佈 Copilot Cowork 智能體，正面硬剛Claude

AI日報：微軟發佈iPhone可運行AI模型；全國首例AI聲音侵權案判了；Kimi創始人套現數千萬美金；中文聊天模型Llama3發佈

相關推薦

微軟大動作：8月將整合Copilot全端產品，精簡功能對標ChatGPT

微軟 Teams 8 月上線 AI 助手 Facilitator，會議實時答疑提升溝通效率

​近 400 家地方報紙起訴 OpenAI 和微軟，指控侵犯版權

GitHub Copilot6月改用量化計費，使用量激增創單月曆史新高

降本近四成！微軟重磅發佈 Copilot Cowork 智能體，正面硬剛Claude

近 400 家地方報紙起訴 OpenAI 和微軟，指控侵犯版權