歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、騰訊SaaS產品智能化升級 全面接入混元模型
騰訊宣佈旗下協作SaaS產品全面接入混元模型,實現軟件服務智能化。騰訊樂享、騰訊電子籤、騰訊問卷等產品已實現智能化升級,爲用戶提供更智能、高效的服務。混元大模型已擴展至萬億級參數規模,在國內率先採用混合專家模型結構,性能表現優異。外部開發者和企業可以通過騰訊雲上API直接調用騰訊混元能力,解決用戶痛點。
【AiBase提要:】
🚀 騰訊SaaS產品實現智能化升級,提供更智能、高效的服務。
💡 混元大模型擴展至萬億級參數規模,性能在多方面表現優異。
🔗 外部開發者和企業可通過騰訊雲API調用混元能力,解決不同場景下的痛點。
2、微軟發佈iPhone可運行的ChatGPT級AI模型Phi-3系列 挑戰OpenAI地位
微軟最新推出的Phi-3系列小型AI模型在AI領域引起轟動,尤其是Phi-3-mini模型在多項基準測試中超越了參數更大的Llama3模型。該系列模型能在iPhone14Pro和iPhone15上實現每秒12token的運行速度,達到了ChatGPT水平。微軟強調訓練數據的重要性,通過精心設計數據和訓練方法提升模型性能。
【AiBase提要:】
🚀 Phi-3-mini模型參數僅3.8B,性能超越8B參數的Llama3模型。
💡 Phi-3系列包括Phi-3-small和Phi-3-medium版本,性能優越。
🔍 微軟團隊通過精心設計訓練數據和獨特訓練方法提升了Phi-3系列模型的性能。
詳情鏈接:https://arxiv.org/pdf/2404.14219.pdf
3、全國首例AI聲音侵權案一審宣判 自己聲音被AI化出售獲賠25萬元
這篇文章報道了全國首例AI聲音侵權案的一審判決結果,涉及配音師聲音被AI技術濫用的案件引起社會廣泛關注。法院裁定被告未經授權擅自使用配音師聲音開發AI產品構成侵權,需賠償25萬元。判決強調聲音作爲人格權益應受法律保護,爲聲音創作者提供了重要法律保障。
【AiBase提要:】
🔍 首例AI聲音侵權案一審判決結果:被告未經授權使用配音師聲音開發AI產品,需賠償25萬元。
💡 法院強調聲音作爲獨特人格權益應受法律保護,未經授權擅自使用聲音構成侵權行爲。
👩⚖️ 判決爲聲音創作者提供了重要法律保障,將堅決維護聲音權益並打擊侵權行爲。
4、中文聊天模型Llama3-8B-Chinese-Chat發佈
這篇文章介紹了基於Meta-Llama-3-8B-Instruct模型經過ORPO方法微調的中文聊天模型Llama3-8B-Chinese-Chat。該模型減少了中英混合回答和表情符號的使用,使得回答更正式和專業。它在理解中文問題意圖、提供恰當回答、拒絕不當請求等方面表現出色。
【AiBase提要:】
🔑 Llama3-8B-Chinese-Chat是基於Meta-Llama-3-8B-Instruct模型通過ORPO方法微調的中文聊天模型,減少了中英混合回答和表情符號的使用。
🌟 ORPO方法利用賠率比概念調整模型偏好設置,優化模型在特定任務中的表現,Llama3-8B-Chinese-Chat模型使用ORPO優化中英文生成偏好。
💡 Llama3-8B-Chinese-Chat模型在安全、道德、數學問題解答、寫作和編程示例等方面表現出色,提供更準確、專業的回答和示例代碼。
詳情鏈接:https://top.aibase.com/tool/llama3-8b-chinese-chat
5、Adobe發佈視頻超分辨率項目VideoGigaGAN
Adobe最近推出了視頻超分辨率項目VideoGigaGAN,該項目在視頻放大技術方面取得了顯著進展,能將視頻放大至原始分辨率的8倍,保持時間連貫性和高頻細節清晰度。這一技術將視頻處理帶入新階段,極大擴展了視頻內容的應用範圍和質量。
【AiBase提要:】
✨ VideoGigaGAN實現視頻放大至8倍原始分辨率,保持時間連貫性和高頻細節清晰度。
🔍 Adobe優化GigaGAN模型,增強視頻穩定性,展示卓越性能。
💡 VideoGigaGAN提升視頻視覺質量,適應不同風格視頻內容,具有廣泛的應用潛力。
詳情鏈接:https://top.aibase.com/tool/videogigagan
6、Midjourney發佈random功能 可基於提示詞生成完全隨機的圖像風格
Midjourney發佈了一個有趣的功能,可以基於提示詞生成完全隨機的圖像風格。用戶可以通過隨機生成的圖像風格來探索不同的創作方向,同時還可以與其他用戶進行實時交流和分享,共同探討創作過程中的靈感和想法。這一功能的推出將進一步豐富用戶的圖像生成體驗,爲他們提供更多的創作選擇和交流平臺。
【AiBase提要:】
⚙️ 可基於提示詞生成完全隨機的圖像風格
💬 用戶可以通過Room功能進行實時交流和分享
🎨 探索不同的創作方向,豐富用戶的圖像生成體驗
7、AI獨角獸月之暗面創始人楊植麟套現數千萬美金 官方迴應
楊植麟作爲月之暗面創始人,通過個人股份銷售套現數千萬美元,引起廣泛關注。公司成立僅一年便獲得鉅額融資,估值超過25億美元。月之暗面的成功不僅在估值上體現,旗艦產品Kimi Chat的成功也備受矚目。
【AiBase提要:】
🚀 月之暗面創始人楊植麟通過個人股份銷售套現數千萬美元,公司估值超過25億美元。
💡 月之暗面創立僅一年便迅速崛起,成爲中國大模型領域獨角獸之一。
💬 月之暗面旗艦產品Kimi Chat憑藉“長文本”功能在AI大模型領域脫穎而出,引發資本市場熱潮。
8、毫不猶豫!小扎自曝願開源100億美元模型 直言2025年之前AGI不可能實現
在最新的播客訪談中,小扎展現了開源英雄形象,表示願意開源價值100億美元模型,強調開源降低成本促進創新,但也需綜合考慮經濟利弊。他對2025年之前AGI實現持悲觀態度,認爲能源短缺是瓶頸,解決可能需數十年。批評蘋果和谷歌獨佔移動生態,希望通過開源改變局面,防範競爭對手威脅。對於人工智能發展瓶頸,擔憂能源限制和數據中心挑戰,持保留態度未來AI模型能力提升。
【AiBase提要:】
💡 小扎願意開源價值100億美元模型,認爲開源降低成本促進創新,但需綜合考慮經濟利弊。
💡 對2025年之前AGI實現持悲觀態度,認爲能源短缺是瓶頸,解決可能需數十年。
💡 批評蘋果和谷歌獨佔移動生態,希望通過開源改變局面,防範競爭對手威脅。
9、字節跳動發佈圖像模型蒸餾算法Hyper-SD
這篇文章介紹了字節跳動的Lightning團隊發佈的新圖像模型蒸餾算法Hyper-SD,該算法在圖像處理和機器學習領域取得重要進展。通過創新的方法提升了模型性能,在保持模型精簡的同時提高了推理速度和效率。
【AiBase提要:】
⚙️ 分段軌跡一致性蒸餾:Hyper-SD技術確保了原始ODE軌跡的完整性。
🧠 人類反饋學習機制:引入人類反饋學習,提升模型表現,減少性能損失。
🔬 分數蒸餾技術:增強了模型在低步推理下的生成能力,進一步提升性能。
詳情鏈接:https://top.aibase.com/tool/hyper-sd
10、AI音樂生成工具AI Jukebox 輸入提示詞選擇曲風即可創作音樂
AI Jukebox是一款利用人工智能技術的音樂生成工具,通過Hugging Face平臺提供服務。它簡化音樂創作過程,智能化且用戶友好。用戶可以通過輸入提示詞指導AI生成特定風格音樂,實現智能化音樂創作。AI Jukebox鼓勵人機合作模式,爲音樂人和音樂愛好者提供靈感和創作工具,探索無限可能性。
【AiBase提要:】
🎵 本地化模型加載: 用戶打開AI Jukebox的網頁後,系統自動加載生成模型,無需複雜設置。
🎶 基於提示詞的音樂生成: 用戶通過輸入特定提示詞指導AI生成特定風格音樂,包括音樂類型、情感、樂器等描述。
🎼 人機合作模式: AI Jukebox鼓勵用戶與AI合作,探索新的音樂創作方式,提供靈感和創作工具。
詳情鏈接:https://top.aibase.com/tool/ai-jukebox
11、虛擬人聊天系統Live2D
這篇文章介紹了基於Unity開發的Live2D虛擬人聊天系統項目,利用Live2D技術展現動態虛擬人形象,提供流暢的動畫效果,增強用戶交互體驗。項目集成了Azure、OpenAI和APISpace等API支持自然語言處理和生成,實現實時文本交流。同時支持圖像處理和人臉檢測,高清分辨率顯示,以及自定義擴展功能。
【AiBase提要:】
👩💻 Live2D虛擬人形象集成,提供流暢的動畫效果,增強用戶體驗。
💬 實時聊天功能,虛擬人能理解並回應用戶文本輸入,實現實時交流。
🔍 圖像處理和人臉檢測,讓虛擬人更好地響應用戶視覺輸入。
詳情鏈接:https://top.aibase.com/tool/live2d-virtual-human-for-chatting-based-on-unity
12、港大與浙大聯合研發SC-GS模型
本文介紹了香港大學CVMI實驗室與3D大模型公司VAST以及浙江大學聯合研究團隊提出的SC-GS模型,該模型在數字資產創造和3D重建領域取得突破性成果。通過稀疏控制點實時交互編輯,實現了對動態場景的高效編輯和合成,展現了巨大潛力。
【AiBase提要:】
🌟 SC-GS模型在新視角合成領域掀起革命性浪潮,展現出對動態高斯的稀疏控制點進行實時交互編輯的能力。
🔑 用戶可以通過簡單的鼠標拖拽和鍵盤組合按鍵操作,輕鬆實現對重建動態場景的編輯。
💡 SC-GS模型通過神經網絡預測控制點運動狀態,驅動整個場景中的動態高斯進行變形,提升了動態新視角合成的性能。
詳情鏈接:https://top.aibase.com/tool/sc-gs
13、新視頻分割技術SAM 可高效識別移動物體
本文介紹了在視頻分割領域,研究團隊探索新的視頻對象分割技術,通過結合SAM模型和光流技術,提高了視頻分割性能。兩種模型展示了潛力,實現了顯著性能提升,並將分割技術擴展到整個視頻序列,實現物體追蹤。這些技術提升了視頻分割精度和效率,降低了計算複雜度,對多個應用場景具有重要意義。
【AiBase提要:】
⚙️ SAM與光流結合的模型展示了提高視頻分割性能的潛力。
🔍 SAM與RGB圖像結合的模型增強了模型對視頻中物體運動的識別和分割能力。
🚀 將基於幀的分割方法擴展到整個視頻序列,實現了物體在視頻連續幀中的身份追蹤。
詳情鏈接:https://www.robots.ox.ac.uk/~vgg/research/flowsam/