AI日報：阿里開源最新數學模型Qwen2-Math；豆包上線音樂功能；蘋果將推高級AI服務；谷歌機器人挑戰巴黎奧運

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、阿里開源最新數學模型Qwen2-Math 數學能力秒殺GPT-4o

阿里雲推出的Qwen2-Math系列大型語言模型在數學領域展現出強大的解題能力，超越了開源和閉源模型，成爲AI數學界的黑馬。該模型經過精心設計的數學專業語料庫深度預訓練，特別是Qwen2-Math-Instruct模型採用創新的訓練方法，提升了數學解題能力。未來，團隊計劃推出支持多語言的版本，並持續優化模型。Qwen2-Math的出現爲AI在數學領域的應用帶來新的可能性，將在教育、科研、工程等領域發揮重要作用。

【AiBase提要:】
⚙️ Qwen2-Math系列模型展現出強大的數學解題能力，超越開源和閉源模型，成爲AI數學界的黑馬。
📚 Qwen2-Math基於精心設計的數學專業語料庫深度預訓練，特別是Qwen2-Math-Instruct模型採用創新訓練方法提升了數學解題能力。
💡 阿里雲團隊計劃推出支持多語言的Qwen2-Math版本，並持續優化模型以解決更復雜數學問題。
詳情鏈接:https://top.aibase.com/tool/qwen2-math

2、字節跳動AI助手豆包app、電腦版上線音樂生成功能

最近，字節跳動旗下豆包AI助手推出了音樂生成功能，用戶可以輕鬆創作獨特的歌曲。這項服務提供多種音樂風格和情緒狀態，旨在滿足用戶的情感表達需求。豆包希望通過音樂激發創造力，讓用戶分享自己的故事，開啓音樂創作之旅。

【AiBase提要:】
🎶 用戶可在豆包app或電腦版中生成獨特歌曲，選擇曲風、氛圍和人聲，歌詞限制在200字以內。
🎵 提供11種不同音樂風格和多種情緒狀態選擇，包括民謠、嘻哈、R&B，用戶可選擇男聲或女聲演唱。
🎤 用戶可一鍵生成完整歌詞，下載並分享生成的歌曲和封面。音樂生成功能仍在不斷完善中，豆包鼓勵用戶用音樂分享故事，激發創造力。

3、摳摳搜搜!ChatGPT 現在允許免費用戶每天生成兩張由 DALL-E3製作的圖像

OpenAI宣佈，免費用戶現在每天可以使用DALL-E3模型生成最多兩張圖片，爲用戶帶來更多創作可能性。DALL-E3能利用ChatGPT生成的提示製作圖像，讓用戶更容易上手。新功能正在逐步推出，部分用戶已體驗到便捷的創作體驗，激發更多創作者的靈感。

【AiBase提要:】
🌟 ChatGPT的免費用戶每日可以生成兩幅DALL-E3圖片!
🎨 DALL-E3通過ChatGPT生成的提示，讓圖像製作變得更簡單。
📅 此功能正在逐步推出，部分用戶已能體驗到這一新功能。

4、蘋果公司推出套娃擴散模型MDM

蘋果公司最新推出的套娃擴散模型（MDM）展現了其強大的技術創新能力，通過套娃的概念實現了圖像和視頻的無縫生成，提升了圖像質量和生成效率，爲AI圖像生成領域帶來新的技術風潮。

【AiBase提要:】
🎨 MDM採用套娃擴散模型，實現不同分辨率下圖像處理，生成高質量圖像
🧠 MDM核心架構NestedUNet強化套娃概念，逐步處理小規模輸入，提高學習和生成效率
✨ MDM在高分辨率圖像生成上展現出色，具有零樣本泛化能力，拓展了AI圖像生成技術應用範圍
詳情鏈接:https://top.aibase.com/tool/ml-mdm

5、GPT-4o半夜突然發出怪叫?OpenAI發佈32頁安全報告

在一份新的“紅隊”報告中，OpenAI記錄了對GPT-4o模型優勢和風險的調查，並揭示了GPT-4o的一些奇特怪癖。報告描繪了通過各種緩解措施和保障措施變得更安全的AI模型的總體畫面。

【AiBase提要:】
🔍 GPT-4o在高背景噪音環境中會模仿用戶的語音
🔊 GPT-4o生成令人不安的非言語聲音和音效
🎵 GPT-4o可能侵犯音樂版權
詳情鏈接:
https://openai.com/index/gpt-4o-system-card/
https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/

6、字節跳動豆包大模型支持實時語音通話

字節跳動旗下雲服務平臺火山引擎宣佈，豆包大模型已支持實時語音通話新功能。火山引擎提供的對話式 AI 實時交互解決方案簡化了語音到文本和文本到語音的轉換過程，實現了高效的語音數據採集、處理和傳輸，提供了卓越的智能對話和自然語言處理能力。火山引擎的大模型多模態實時交互服務爲頭部 AI 虛擬人物聊天應用提供了 AI 實時語音能力，帶來了全新的互動體驗。

【AiBase提要:】
🔥 火山引擎提供實時語音通話新功能，簡化語音到文本和文本到語音轉換過程，提供高效的語音數據處理和傳輸。
🚀 火山引擎RTC基於音頻3A處理技術，解決“雙講”現象，確保語音識別準確性和實時性。
💡 火山引擎提供靈活、多樣化的接入方案，滿足不同企業的需求，爲企業帶來創新的AI實時音視頻體驗。

7、蘋果或將推出Apple Intelligence高級AI服務

蘋果公司計劃推出全新的Apple Intelligence服務，這將是其在人工智能領域的大膽嘗試。服務可能以每月高達20美元的價格向用戶開放，顯示了蘋果對AI技術的信心和在服務領域的擴展野心。儘管尚未得到官方確認，但若實現，用戶將享受到更高級、個性化的AI服務，鞏固蘋果在科技服務市場的領導地位。

【AiBase提要:】
🚀 蘋果計劃推出全新的Apple Intelligence服務，可能月費高達20美元。
💡 蘋果有意將人工智能技術成本轉嫁給用戶，顯示對AI技術的信心。
💰 可能整合進現有Apple One服務包中，進一步鞏固蘋果在科技服務市場的領導地位。

8、谷歌機器人挑戰巴黎奧運正反手靈活轉換，還打贏專業教練

作爲一名乒乓球愛好者，我對谷歌機器人Agent在乒乓球比賽中的表現感到驚歎。這款機器人不僅具備高超的技能，還能與人類選手展開激烈對決，展現出機器人技術的巨大潛力。

【AiBase提要:】
🏓 谷歌發佈首個達到人類競技水平的機器人Agent，挑戰乒乓球賽場。
🔥 機器人通過學習大量乒乓球狀態數據，掌握了正手上旋球、反手瞄準等技能，展現出高速運動和實時精確性。
🤖 機器人在與不同技能水平選手的比賽中取得一定成績，展現出與人類對手直接競爭的能力。
詳情鏈接:https://sites.google.com/view/competitive-robot-table-tennis/home

9、逐際動力發佈最新人形機器人CL-1可以幫快遞站搬貨了

逐際動力公司最新發布的人形機器人CL-1展示了出色的自主行走和執行任務能力，引領智能機器人領域發展。公司完成A輪融資，獲得資本市場認可，阿里巴巴等巨頭投資引人注目。CL-1成功展示了穩定抓取和搬運貨物的能力，預示着中國智能機器人競爭力增強。未來，逐際動力有望在智能製造和物流領域發揮更大作用，帶來創新和變革。

【AiBase提要:】
🤖 CL-1展示出色自主行走和任務執行能力
💰 逐際動力完成A輪融資，獲得數十億元人民幣資金
🚚 CL-1穩定抓取和搬運貨物，預示中國智能機器人競爭力增強

10、雷軍:小米旗艦設備國際版將接入谷歌AI大模型Google Gemini

雷軍宣佈小米旗艦設備國際版將整合谷歌AI大模型Google Gemini，旨在提供更智能和直觀的用戶體驗。這一舉措將使小米手機擁有先進的多模態AI能力，提升用戶體驗和功能性。

【AiBase提要:】
🔍 Google Gemini是先進的多模態AI模型，能深入理解圖像、音頻、視頻，並具備數學推理能力。
🚀 Gemini在多領域展現卓越性能，超過OpenAI的GPT-4模型，包括自然圖像理解、音頻處理、數學推理等方面。
📱 小米15系列國際版將搭載Google Gemini AI大模型，預計將在10月發佈，爲用戶帶來最新AI技術體驗。

11、新血液!OpenAI 任命卡內基梅隆大學教授爲董事會成員

OpenAI 近日宣佈任命卡內基梅隆大學的 Zico Kolter 教授爲董事會成員，爲公司未來發展注入新活力。Kolter 教授在安全和安全委員會中將發揮重要作用，助力項目安全性和決策過程。他的加入契合 OpenAI 使命，強調技術發展的安全保障。

【AiBase提要:】
🧑‍🏫 OpenAI 任命卡內基梅隆大學的 Zico Kolter 教授爲董事會成員。
🔒 Kolter 教授將加入董事會的安全和安全委員會，專注於項目的安全性。
🌐 Kolter 教授的研究方向與 OpenAI 的使命高度契合，預示着未來技術發展的安全保障。

12、谷歌雲調查顯示:86% 的企業通過生成 AI 實現了6% 的收入增長

最近，谷歌雲與國家研究集團聯合進行調查，發現使用生成 AI 的企業獲得顯著投資回報。企業在一年內看到回報，收入增長達6% 以上，AI 成爲業務增長驅動力。然而，部分員工認爲生產力未提升，缺乏相關培訓。企業需制定全面戰略，重視員工培訓。

【AiBase提要:】
🌟74% 的企業使用生成 AI 看到了一年的投資回報。
📈86% 的企業報告收入增長達到6% 或以上。
🧠63% 的企業認爲 AI 是業務增長的重要驅動力。

AI日報：阿里開源最新數學模型Qwen2-Math；豆包上線音樂功能；蘋果將推高級AI服務；谷歌機器人挑戰巴黎奧運

相關推薦

打通AI應用“最後一公里”：阿里雲秒悟Meoo CLI正式開源

一鍵部署上線：阿里雲發佈秒悟 Meoo CLI 開源工具

阿里雲發佈開源工具Meoo CLI:支持本地AI項目一鍵上線部署

阿里Qoder推出全託管平臺Cloud Agents，實現AI Agent一天內快速上線

“阿里雲·無錫青年創客AI加速計劃”發佈，開啓漫劇青年創業全鏈路賦能