歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、阿里開源最新數學模型Qwen2-Math 數學能力秒殺GPT-4o
阿里雲推出的Qwen2-Math系列大型語言模型在數學領域展現出強大的解題能力,超越了開源和閉源模型,成爲AI數學界的黑馬。該模型經過精心設計的數學專業語料庫深度預訓練,特別是Qwen2-Math-Instruct模型採用創新的訓練方法,提升了數學解題能力。未來,團隊計劃推出支持多語言的版本,並持續優化模型。Qwen2-Math的出現爲AI在數學領域的應用帶來新的可能性,將在教育、科研、工程等領域發揮重要作用。
【AiBase提要:】
⚙️ Qwen2-Math系列模型展現出強大的數學解題能力,超越開源和閉源模型,成爲AI數學界的黑馬。
📚 Qwen2-Math基於精心設計的數學專業語料庫深度預訓練,特別是Qwen2-Math-Instruct模型採用創新訓練方法提升了數學解題能力。
💡 阿里雲團隊計劃推出支持多語言的Qwen2-Math版本,並持續優化模型以解決更復雜數學問題。
詳情鏈接:https://top.aibase.com/tool/qwen2-math
2、字節跳動AI助手豆包app、電腦版上線音樂生成功能
最近,字節跳動旗下豆包AI助手推出了音樂生成功能,用戶可以輕鬆創作獨特的歌曲。這項服務提供多種音樂風格和情緒狀態,旨在滿足用戶的情感表達需求。豆包希望通過音樂激發創造力,讓用戶分享自己的故事,開啓音樂創作之旅。
【AiBase提要:】
🎶 用戶可在豆包app或電腦版中生成獨特歌曲,選擇曲風、氛圍和人聲,歌詞限制在200字以內。
🎵 提供11種不同音樂風格和多種情緒狀態選擇,包括民謠、嘻哈、R&B,用戶可選擇男聲或女聲演唱。
🎤 用戶可一鍵生成完整歌詞,下載並分享生成的歌曲和封面。音樂生成功能仍在不斷完善中,豆包鼓勵用戶用音樂分享故事,激發創造力。
3、摳摳搜搜!ChatGPT 現在允許免費用戶每天生成兩張由 DALL-E3製作的圖像
OpenAI宣佈,免費用戶現在每天可以使用DALL-E3模型生成最多兩張圖片,爲用戶帶來更多創作可能性。DALL-E3能利用ChatGPT生成的提示製作圖像,讓用戶更容易上手。新功能正在逐步推出,部分用戶已體驗到便捷的創作體驗,激發更多創作者的靈感。
【AiBase提要:】
🌟 ChatGPT的免費用戶每日可以生成兩幅DALL-E3圖片!
🎨 DALL-E3通過ChatGPT生成的提示,讓圖像製作變得更簡單。
📅 此功能正在逐步推出,部分用戶已能體驗到這一新功能。
4、蘋果公司推出套娃擴散模型MDM
蘋果公司最新推出的套娃擴散模型(MDM)展現了其強大的技術創新能力,通過套娃的概念實現了圖像和視頻的無縫生成,提升了圖像質量和生成效率,爲AI圖像生成領域帶來新的技術風潮。
【AiBase提要:】
🎨 MDM採用套娃擴散模型,實現不同分辨率下圖像處理,生成高質量圖像
🧠 MDM核心架構NestedUNet強化套娃概念,逐步處理小規模輸入,提高學習和生成效率
✨ MDM在高分辨率圖像生成上展現出色,具有零樣本泛化能力,拓展了AI圖像生成技術應用範圍
詳情鏈接:https://top.aibase.com/tool/ml-mdm
5、GPT-4o半夜突然發出怪叫?OpenAI發佈32頁安全報告
在一份新的“紅隊”報告中,OpenAI記錄了對GPT-4o模型優勢和風險的調查,並揭示了GPT-4o的一些奇特怪癖。報告描繪了通過各種緩解措施和保障措施變得更安全的AI模型的總體畫面。
【AiBase提要:】
🔍 GPT-4o在高背景噪音環境中會模仿用戶的語音
🔊 GPT-4o生成令人不安的非言語聲音和音效
🎵 GPT-4o可能侵犯音樂版權
詳情鏈接:
https://openai.com/index/gpt-4o-system-card/
https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/
6、字節跳動豆包大模型支持實時語音通話
字節跳動旗下雲服務平臺火山引擎宣佈,豆包大模型已支持實時語音通話新功能。火山引擎提供的對話式 AI 實時交互解決方案簡化了語音到文本和文本到語音的轉換過程,實現了高效的語音數據採集、處理和傳輸,提供了卓越的智能對話和自然語言處理能力。火山引擎的大模型多模態實時交互服務爲頭部 AI 虛擬人物聊天應用提供了 AI 實時語音能力,帶來了全新的互動體驗。
【AiBase提要:】
🔥 火山引擎提供實時語音通話新功能,簡化語音到文本和文本到語音轉換過程,提供高效的語音數據處理和傳輸。
🚀 火山引擎RTC基於音頻3A處理技術,解決“雙講”現象,確保語音識別準確性和實時性。
💡 火山引擎提供靈活、多樣化的接入方案,滿足不同企業的需求,爲企業帶來創新的AI實時音視頻體驗。
7、蘋果或將推出Apple Intelligence高級AI服務
蘋果公司計劃推出全新的Apple Intelligence服務,這將是其在人工智能領域的大膽嘗試。服務可能以每月高達20美元的價格向用戶開放,顯示了蘋果對AI技術的信心和在服務領域的擴展野心。儘管尚未得到官方確認,但若實現,用戶將享受到更高級、個性化的AI服務,鞏固蘋果在科技服務市場的領導地位。
【AiBase提要:】
🚀 蘋果計劃推出全新的Apple Intelligence服務,可能月費高達20美元。
💡 蘋果有意將人工智能技術成本轉嫁給用戶,顯示對AI技術的信心。
💰 可能整合進現有Apple One服務包中,進一步鞏固蘋果在科技服務市場的領導地位。
8、谷歌機器人挑戰巴黎奧運 正反手靈活轉換,還打贏專業教練
作爲一名乒乓球愛好者,我對谷歌機器人Agent在乒乓球比賽中的表現感到驚歎。這款機器人不僅具備高超的技能,還能與人類選手展開激烈對決,展現出機器人技術的巨大潛力。
【AiBase提要:】
🏓 谷歌發佈首個達到人類競技水平的機器人Agent,挑戰乒乓球賽場。
🔥 機器人通過學習大量乒乓球狀態數據,掌握了正手上旋球、反手瞄準等技能,展現出高速運動和實時精確性。
🤖 機器人在與不同技能水平選手的比賽中取得一定成績,展現出與人類對手直接競爭的能力。
詳情鏈接:https://sites.google.com/view/competitive-robot-table-tennis/home
9、逐際動力發佈最新人形機器人CL-1可以幫快遞站搬貨了
逐際動力公司最新發布的人形機器人CL-1展示了出色的自主行走和執行任務能力,引領智能機器人領域發展。公司完成A輪融資,獲得資本市場認可,阿里巴巴等巨頭投資引人注目。CL-1成功展示了穩定抓取和搬運貨物的能力,預示着中國智能機器人競爭力增強。未來,逐際動力有望在智能製造和物流領域發揮更大作用,帶來創新和變革。
【AiBase提要:】
🤖 CL-1展示出色自主行走和任務執行能力
💰 逐際動力完成A輪融資,獲得數十億元人民幣資金
🚚 CL-1穩定抓取和搬運貨物,預示中國智能機器人競爭力增強
10、雷軍:小米旗艦設備國際版將接入谷歌AI大模型Google Gemini
雷軍宣佈小米旗艦設備國際版將整合谷歌AI大模型Google Gemini,旨在提供更智能和直觀的用戶體驗。這一舉措將使小米手機擁有先進的多模態AI能力,提升用戶體驗和功能性。
【AiBase提要:】
🔍 Google Gemini是先進的多模態AI模型,能深入理解圖像、音頻、視頻,並具備數學推理能力。
🚀 Gemini在多領域展現卓越性能,超過OpenAI的GPT-4模型,包括自然圖像理解、音頻處理、數學推理等方面。
📱 小米15系列國際版將搭載Google Gemini AI大模型,預計將在10月發佈,爲用戶帶來最新AI技術體驗。
11、新血液!OpenAI 任命卡內基梅隆大學教授爲董事會成員
OpenAI 近日宣佈任命卡內基梅隆大學的 Zico Kolter 教授爲董事會成員,爲公司未來發展注入新活力。Kolter 教授在安全和安全委員會中將發揮重要作用,助力項目安全性和決策過程。他的加入契合 OpenAI 使命,強調技術發展的安全保障。
【AiBase提要:】
🧑🏫 OpenAI 任命卡內基梅隆大學的 Zico Kolter 教授爲董事會成員。
🔒 Kolter 教授將加入董事會的安全和安全委員會,專注於項目的安全性。
🌐 Kolter 教授的研究方向與 OpenAI 的使命高度契合,預示着未來技術發展的安全保障。
12、谷歌雲調查顯示:86% 的企業通過生成 AI 實現了6% 的收入增長
最近,谷歌雲與國家研究集團聯合進行調查,發現使用生成 AI 的企業獲得顯著投資回報。企業在一年內看到回報,收入增長達6% 以上,AI 成爲業務增長驅動力。然而,部分員工認爲生產力未提升,缺乏相關培訓。企業需制定全面戰略,重視員工培訓。
【AiBase提要:】
🌟74% 的企業使用生成 AI 看到了一年的投資回報。
📈86% 的企業報告收入增長達到6% 或以上。
🧠63% 的企業認爲 AI 是業務增長的重要驅動力。