歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、最貴!OpenAI重磅推出升級版AI模型o1-pro,生成價格是o1的十倍
OpenAI最近推出了新一代AI模型o1-pro,旨在提供更優質的推理能力,然而其高昂的定價引發了廣泛關注。o1-pro的輸入和生成價格分別是GPT-4.5和普通o1的兩倍與十倍,儘管如此,OpenAI對其性能寄予厚望,認爲其能夠滿足開發者對複雜任務的需求。
【AiBase提要:】
💡 OpenAI推出新AI模型o1-pro,旨在提升推理能力。
💰 o1-pro的定價極高,輸入費用是GPT-4.5的兩倍,生成費用是普通o1的十倍。
🤔 早期用戶反饋對o1-pro褒貶不一,但在編碼和數學問題上表現更可靠。
2、運動可控!階躍星辰 Step-Video-TI2V 圖生視頻模型開源
上海階躍星辰智能科技有限公司推出的Step-Video-TI2V模型在圖生視頻領域具有顯著的創新性。該模型基於30B參數的Step-Video-T2V,能夠生成高質量的視頻,並具備運動幅度和鏡頭運動的可控性,特別適合動畫創作和短視頻製作。通過優化生成一致性和動態性,該模型爲創作者提供了更靈活的選擇,能夠滿足多種尺寸和效果的需求。
【AiBase提要:】
🚀 Step-Video-TI2V模型基於30B參數,能夠生成5秒、540P分辨率的視頻,具有運動幅度和鏡頭運動可控的特點。
🎨 該模型在動漫效果方面表現優異,適合動畫創作和短視頻製作,支持多種尺寸生成。
🔧 通過引入圖像條件和AdaLN模塊,提升了生成視頻與原圖的一致性和動態控制能力。
詳情鏈接:https://yuewen.cn/videos
3、騰訊混元再出新動作!全新推理模型T1將於3月21日晚發佈
騰訊混元宣佈全新推理模型T1將於3月21日正式發佈,這標誌着其在人工智能大模型領域的技術迭代與產品升級。同時,騰訊混元大模型首次躋身Chatbot Arena全球Top15排行榜,顯示出其技術實力已達到國際領先水平。外界期待T1模型在推理能力上的提升,進一步鞏固騰訊在全球大模型競爭中的地位。
【AiBase提要:】
🚀 騰訊混元將於3月21日發佈全新推理模型T1,標誌着技術升級。
🏆 騰訊混元大模型首次進入Chatbot Arena全球Top15排行榜,顯示其技術實力。
🌍 外界期待T1模型在推理能力上的提升,鞏固騰訊在全球競爭中的地位。
4、成本僅爲十分之一!Open-Sora 2.0 開源視頻 AI 實現商業級畫質
HPC-AI Tech最近推出的Open-Sora2.0是一款革命性的視頻AI系統,其訓練成本僅爲傳統系統的十分之一,且輸出質量媲美商業級產品。該系統通過三階段訓練過程和高效的自動編碼器實現了顯著的訓練速度提升,儘管在分辨率和視頻時長上存在一定限制。Open-Sora2.0的推出可能會對視頻AI領域的成本結構產生深遠影響,推動開源和商業系統之間的競爭。
【AiBase提要:】
💡 Open-Sora2.0的訓練成本僅爲20萬美元,遠低於現有高質量視頻生成系統的數百萬美元成本。
⚙️ 該系統採用三階段訓練過程和視頻DC-AE自動編碼器,提供了5.2倍更快的訓練速度和超過十倍的視頻生成速度。
📈 Open-Sora2.0的VBench得分與OpenAI的Sora僅相差0.69%,在視覺質量和提示準確性等方面表現出色。
5、波士頓動力Atlas機器人再突破:動作能力逼近人類水平
波士頓動力公司近期展示了其人形機器人Atlas的最新動作能力,結合強化學習與動作捕捉技術,使Atlas能夠自我學習並展現出更自然、更靈活的類人動作。這一技術突破被認爲將推動人形機器人更貼近現實應用場景,尤其在工業、醫療和救援等領域的潛在應用。
【AiBase提要:】
🤖 Atlas通過強化學習和動作捕捉技術,實現了更自然的類人動作。
🚀 這一技術突破提升了機器人在複雜環境中的適應性和協調性。
🌐 波士頓動力與RAI Institute的合作爲人形機器人技術的商業化增添了更多可能性。
6、炸裂!人形機器人秀出“人類天花板”動作,宇樹G1首個完成側空翻,還敢叫板真人挑戰!
宇樹科技的G1人形機器人成功完成了高難度的側空翻,並穩穩落地,標誌着其在機器人運動能力方面的重大突破。這一成就不僅展示了G1的高可靠性和成功率,還引發了全球科技愛好者的廣泛關注。爲了進一步驗證其能力,宇樹科技還發起了“機器人側空翻真人挑戰賽”,鼓勵人類挑戰這一高難度動作,勝者將獲得G1機器人或等值禮物。
【AiBase提要:】
🤸♂️ 宇樹科技的G1機器人成功完成側空翻,成爲全球首款實現此動作的人形機器人。
🏆 宇樹科技發起“機器人側空翻真人挑戰賽”,鼓勵人類挑戰這一高難度動作。
🌍 比賽吸引了全球科技愛好者的關注,期待首位成功復刻機器人側空翻的真人。
7、Adobe推“Project Slide Wow”項目,數據一鍵變身吸睛PPT
在Adobe的年度數字創新大會上,推出的“Project Slide Wow”項目引起了市場的廣泛關注。這款生成式AI驅動的工具旨在將原始客戶數據快速轉化爲引人入勝的PowerPoint演示文稿,極大地簡化了數據分析師和市場營銷人員的工作。通過自動生成高質量的幻燈片和內置智能助手,用戶可以實時更新和調整演示內容,確保信息的準確性和時效性。
【AiBase提要:】
✨ 生成式AI工具能將原始數據快速轉化爲高質量PPT,極大簡化了製作過程。
🤖 內置智能助手可實時響應用戶需求,提供額外可視化和動態幻燈片生成。
📊 具備實時數據更新能力,確保演示信息始終保持最新,提升企業決策效率。
8、Orpheus TTS:情感表達貼近人類的新一代TTS模型
Orpheus TTS是一款新推出的開源文本轉語音模型,以其超低延遲和高情感表達能力引起了廣泛關注。該模型在實時對話場景中表現出色,能夠提供自然流暢的語音輸出,極大提升了智能語音交互的體驗。其開源特性也爲開發者提供了更多的定製化可能性,未來有望在多個領域中成爲標杆。
【AiBase提要:】
⚡ **超低延遲**: 默認延遲約200毫秒,通過優化可壓縮至25-50毫秒,滿足實時對話需求。
🎭 **情感表達**: 語音輸出自然流暢,支持豐富的語調變化,提升交互體驗。
🎙️ **實時輸出流**: 支持流式音頻生成,確保語音生成與輸入同步,適用於多種場景。
詳情鏈接:https://github.com/canopyai/Orpheus-TTS
9、LG開源EXAONE Deep模型,號稱韓國首個自研推理AI模型
LG AI Research最近開源了EXAONE Deep推理AI模型,標誌着AI進入了主動式AI的新紀元。該模型以320億參數展現出卓越的推理能力,尤其在邏輯推理和數學領域表現出色,獲得94.5分的高考數學成績,堪比學霸。
【AiBase提要:】
🧠 EXAONE Deep是韓國首個自研推理AI模型,具有獨立制定假設和推理驗證的能力。
📊 320億參數的EXAONE Deep在邏輯推理和數學領域表現卓越,特別是在韓國高考中獲得94.5分。
📱 LG還開源了輕量級和端側模型,分別保持95%和86%的性能,適用於智能手機、汽車等多個行業。
詳情鏈接:https://top.aibase.com/tool/exaone-deep
10、谷歌Chrome瀏覽器即將整合Gemini AI助手,操作更便捷!
在互聯網科技迅速發展的背景下,谷歌Chrome瀏覽器即將推出Gemini AI助手的深度整合。這一功能將極大提升用戶的在線體驗,使得操作更加便捷。用戶可以通過窗口前端的圖標直接調用Gemini助手,享受自定義快捷鍵和系統托盤圖標的支持,儘管目前不支持側邊欄固定模式。
【AiBase提要:】
✨ Gemini AI助手將深度整合進Chrome瀏覽器,提升用戶在線體驗。
🔧 用戶可通過窗口前端的圖標快速調用Gemini助手,支持自定義快捷鍵。
🗣️ Gemini助手支持語音搜索等功能,但目前不支持側邊欄固定模式。