歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、全球首款通用智能體爆火,Manus邀請碼被炒至5萬

全球首款通用智能體Manus引發了科技圈的廣泛關注。Manus具備獨立思考和執行復雜任務的能力,能夠交付完整成果,展現出強大的通用性。它不僅能處理日常事務,還能進行深入市場調研、個性化旅行規劃等多種任務。在二手交易市場,Manus邀請碼價格從999元到5萬元不等,甚至有的賣家表示不接受還價,顯示出該產品的稀缺性。

【AiBase提要:】

🚀 Manus具備獨立思考和執行復雜任務的能力,展現出強大的通用性和執行力。

📊 在多個領域如市場調研、旅行規劃等,Manus的應用案例顯示出其實用性和高效性。

🏆 Manus在GAIA基準測試中創下新紀錄,技術性能遠超同類產品,證明其領先地位。

詳情鏈接:https://manus.im/

2、阿里新開源推理大模型QwQ-32B,性能媲美DeepSeek-R1、顯存需求更小

阿里巴巴的Qwen團隊推出了開源大型語言模型QwQ-32B,旨在通過強化學習提升其在複雜問題解決任務中的性能。該模型以320億參數和131072tokens的擴展上下文長度爲基礎,能夠在數學和編程等基準測試中與更大參數的模型相媲美,同時顯存需求更低。

image.png

【AiBase提要:】

🚀 QwQ-32B採用強化學習技術,提升複雜問題求解能力。

💡 在數學、編程等基準測試中表現與更大參數模型相當,顯存需求更低。

🧠 具備擴展上下文長度和agentic capabilities,未來將繼續探索強化學習的潛力。

詳情鏈接:https://qwenlm.github.io/blog/qwq-32b/

3、OpenAI宣佈GPT-4.5逐步面向所有ChatGPT Plus用戶開放

OpenAI近期宣佈,最新的人工智能模型GPT-4.5將逐步向ChatGPT Plus用戶開放。儘管該模型在對話能力上有顯著提升,但在複雜推理方面仍存在不足。使用成本高達每百萬tokens150美元,引發了對其廣泛採用的擔憂。

【AiBase提要:】

💬 GPT-4.5是OpenAI最新推出的最大人工智能模型,將逐步向ChatGPT Plus用戶開放。

⚖️ 儘管GPT-4.5在對話能力上有顯著提升,但在複雜推理方面仍存在不足。

💰 使用GPT-4.5的成本高達每百萬tokens150美元,引發了對其廣泛採用的擔憂。

4、豆包上線深度推理模式:AI邏輯鏈條可視化,問答搜索新突破

字節跳動爲其AI助手豆包推出的“深度思考”推理模式,通過可視化的邏輯鏈條,提升了用戶對AI的信任度和透明性。這項技術基於豆包1.5模型,結合深度推理模型的技術突破,增強了AI的智能化和人性化,預示着在問答、搜索、寫作和閱讀領域的廣闊前景。

QQ20250306-112612.png

【AiBase提要:】

🔍 深度思考模式通過展示AI的完整邏輯鏈條,提升了用戶的交互體驗。

🤖 該模式基於豆包1.5模型,利用RL算法和工程優化,增強了AI的智能化。

📈 新功能預示着AI在各領域的廣闊發展前景,用戶體驗得到了顯著提升。

5、LTX-Video0.9.5發佈:支持商用許可 開源AI視頻生成邁向新高度

LTX-Video0.9.5版本的發佈標誌着開源AI視頻生成技術的重大進步。它不僅支持商用許可,允許企業和個人開發者在商業項目中應用該模型,還引入了關鍵幀條件支持,提升了視頻生成的靈活性和質量。此外,模型在分辨率和生成速度上也有顯著提升,進一步滿足了複雜敘事的需求。

【AiBase提要:】

🌟 最大亮點是支持商用許可,拓寬了應用前景。

🎥 引入關鍵幀條件支持,提升視頻生成靈活性。

📈 顯著提升分辨率和生成速度,滿足複雜敘事需求。

6、文本轉語音系統Spark-TTS:支持零樣本語音克隆與細粒度控制

Spark-TTS是一款先進的文本轉語音系統,憑藉其零樣本語音克隆和細粒度語音控制能力,引發了AI社區的廣泛關注。該系統基於Qwen2.5構建,簡化了音頻生成流程,提高了效率,並支持多語言生成,尤其適合有聲讀物製作。其技術架構採用BiCodec單流語音編解碼器,確保語音質量自然且可控,用戶可根據需求調整語音特性。

【AiBase提要:】

🎤 零樣本語音克隆:無需特定訓練數據即可生成說話者聲音,適合個性化應用。

⚙️ 細粒度語音控制:用戶可精確調整語速和音高,滿足不同需求。

🌍 跨語言生成:支持多種語言,保持高自然度和準確性,擴展全球適用性。

詳情鏈接:https://github.com/SparkAudio/Spark-TTS

7、谷歌發佈Whisk Animate預覽版:將圖像轉化爲8秒動畫短片

谷歌在其實驗性AI平臺Google Labs中推出了Whisk Animate的預覽版,允許用戶利用先進的Veo2模型將靜態Whisk圖像轉化爲8秒的動態視頻剪輯。這一新功能迅速引發社交媒體上的熱議,用戶反饋積極,展示了其在創意產業中的潛力。Whisk Animate的推出標誌着從靜態設計到動態內容的轉化變得更加簡單高效,進一步鞏固了谷歌在生成式AI領域的競爭優勢。

【AiBase提要:】

🎥 Whisk Animate利用Veo2模型將靜態圖像轉化爲8秒動態視頻,展示了動畫生成的靈活性。

🌟 用戶反饋積極,一些早期測試者稱其爲“非常驚豔”,顯示出其在創作中的潛力。

🖼️ Whisk Animate的推出爲創意產業提供了新的工具,簡化了短視頻創作和廣告設計的過程。

8、Cohere發佈全新多模態AI模型Aya Vision,提供32B和8B兩個版本

Cohere的非營利研究實驗室推出的Aya Vision是一款領先的多模態AI模型,能執行多種語言和視覺任務。該模型通過WhatsApp免費提供,旨在促進全球研究人員的技術獲取。Aya Vision有兩個版本,32B和8B,表現超越更大體量的競爭模型。此外,Cohere還推出了新的基準評估工具AyaVisionBench,以應對當前AI行業的評估危機。

image.png

【AiBase提要:】

🌟 Aya Vision模型被Cohere稱爲行業最佳,能夠執行多種語言和視覺任務。

💡 Aya Vision有兩個版本,分別爲32B和8B,表現超越體量更大的競爭模型。

🔍 Cohere還發布了新的基準評估工具AyaVisionBench,旨在改善AI模型評估問題。

詳情鏈接:https://cohere.com/blog/aya-vision

9、抖音集團擬尋求AI數據標註供應商

抖音集團於3月6日發佈公告,招募優質AI數據標註供應商,以滿足其快速增長的業務需求。此次招募主要面向擁有豐富垂直資源的企業,特別是在醫療、法律和教育等領域。參與公司需爲獨立法人,註冊資本不低於100萬元,並具備良好社會信譽,且不接受聯合體報名。這一戰略佈局旨在提升內容質量與數據服務能力,推動行業競爭與創新。

【AiBase提要:】

🌟 抖音集團招募AI數據標註供應商,註冊資本要求不低於100萬元。

📄 報名企業需爲獨立法人,具備良好社會信譽,不接受聯合體報名。

🚀 招募旨在滿足抖音在AI數據標註領域的快速增長需求,推動行業發展。

10、OpenAI推出 “博士級” AI代理,月費高達2萬美元

OpenAI最近宣佈推出一款名爲“博士級”的AI代理,旨在滿足金融、醫療和製造等行業的高端需求。該AI代理的月費高達2萬美元,提供多種服務類型,定價依據產品爲客戶創造的經濟價值。儘管高昂的費用引發了一些調侃,但OpenAI顯然將目標客戶鎖定在大型企業,而非個人用戶。

【AiBase提要:】

💰 該AI代理的月費在2000美元到2萬美元之間,定價依據其爲客戶創造的經濟價值。

🏢 OpenAI將目標客戶鎖定在大型企業,允許企業按員工席位支付費用,降低使用門檻。

✈️ AI代理旨在通過最少人類干預自動完成任務,例如自動查找航班信息並完成支付。

11、蘋果App Store即將推AI生成應用評論摘要,輕鬆獲取用戶反饋

蘋果公司宣佈將在即將發佈的iOS18.4中引入AI生成的應用評論摘要功能。該功能旨在爲用戶提供簡要的應用評論彙總,幫助他們快速獲取應用的亮點和關鍵信息。摘要將由大型語言模型生成,並每週更新一次,初期將在美國App Store上線。

image.png

【AiBase提要:】

🌟 蘋果將在iOS18.4中推出AI生成的應用評論摘要功能,幫助用戶快速瞭解應用反饋。

🔄 這些摘要將每週更新,初期在美國App Store上線,適用於英語評論數量足夠的應用。

⚠️ 該功能可能面臨被不良商家利用的風險,影響評論的真實性和公正性。

12、IBM 推出小型AI模型 Granite3.2,強調高效推理與實用性

IBM最近推出了Granite3.2大型語言模型,專注於爲企業和開源社區提供高效、實用的人工智能解決方案。該模型具備多模態和推理能力,提升了靈活性和成本效益,特別是在文檔處理和數據提取方面表現出色。Granite3.2還引入了思維鏈功能和小型化的安全模型Granite Guardian,確保在降低成本的同時保持高性能。

【AiBase提要:】

📊 Granite3.2引入視覺語言模型,提升文檔處理與數據提取能力。

💡 新模型具備思維鏈功能,能夠闡明推理過程,增強推理能力。

🔍 Granit Guardian 安全模型小型化30%,但性能未受影響,同時推出可言語化信心的風險評估功能。

詳情鏈接:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision