歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、快手可靈AI全面接入DeepSeek-R1,DeepSeek靈感版已上線

快手旗下的可靈AI近期全面接入DeepSeek-R1,爲用戶在視頻和圖片生成方面帶來了顯著便利。通過DeepSeek-R1,用戶能夠輕鬆將靈感轉化爲專業提示詞,從而降低創作門檻並提升效率。此外,DeepSeek靈感版與可靈AI的靈感詞庫功能聯動,幫助用戶更好地掌控視頻細節,使得即使是普通用戶也能創作出高質量的內容。這一系列創新舉措使得可靈AI在行業中繼續保持領先地位。

image.png

【AiBase提要:】

🌟快手可靈AI全面接入DeepSeek-R1,助力用戶將靈感轉化爲專業提示詞。

🔥可靈AI持續迭代升級,接入DeepSeek-R1後進一步降低創作門檻。

🎬DeepSeek靈感版與“靈感詞庫”聯動,提升用戶掌控視頻細節的能力。

2、百度發佈文心4.5與X1大模型,價格大幅降低引關注

百度最新推出的文心大模型4.5和X1,標誌着其在多模態理解和邏輯推理領域的重大進展。文心4.5以其顯著的價格優勢和卓越的性能超越了GPT-4.5,吸引了衆多開發者的關注。而X1則專注於中文知識問答和文學創作,具備強大的推理能力和多模態功能。

【AiBase提要:】

💡 文心4.5是百度首個原生多模態大模型,性能超越GPT-4.5,API調用價格僅爲後者的1%。

🧠 文心大模型X1專注於中文知識問答和邏輯推理,具備長思維鏈和多模態能力,能理解和生成圖片。

💰 文心4.5和X1的輸入輸出價格極具競爭力,標誌着百度在大模型領域的強勁佈局。

3、小米大模型團隊登頂音頻推理 MMAU 榜,受到DeepSeek-R1啓發

小米大模型團隊在音頻推理領域取得了顯著進展,利用強化學習算法成功提升了模型的準確率至64.5%,在國際權威的MMAU評測榜上名列前茅。該團隊的研究表明,強化學習的實時反饋機制在模型訓練中更爲有效,並且開源了相關技術,推動了學術界和產業界的進一步研究。

image.png

【AiBase提要:】

🔍 小米大模型團隊通過強化學習算法在音頻推理領域取得突破,準確率達到64.5%。

📈 MMAU 評測集是音頻推理能力的重要標準,當前人類專家準確率爲82.23%。

💡 研究結果表明,強化學習的實時反饋機制對模型訓練更爲有效,未來研究仍需深入探索。

詳情鏈接:https://github.com/xiaomi-research/r1-aqa

4、釘釘推出AI客服助理 可自動接入企業官網、公衆號等平臺

釘釘於2025年3月17日推出了AI客服助理,旨在提升企業客戶服務效率。該功能能夠自動接入企業官網及公衆號,支持多輪對話,精準理解用戶需求並提供專業回覆。自推出以來,已有700多家企業接入,具備7×24小時在線服務,響應速度快,且可通過多平臺部署,極大便利了企業與用戶的溝通。

image.png

【AiBase提要:】

💡 AI客服助理可自動接入官網和公衆號,提升企業服務能力。

🛠️ 只需三步配置,企業可快速上線AI助理,簡化知識體系構建。

🌐 支持多平臺部署,企業可通過多渠道爲用戶提供服務。

5、圖像效果轉換技術LBM:一鍵移除路人甲,還可調整光照

LBM(潛在橋樑匹配)是一款由gojasper團隊開發的圖像處理工具,能夠高效地實現圖像效果轉換。它不僅具備強大的對象移除能力,使得用戶能夠輕鬆去除照片中的不必要元素,還能靈活調整光線,營造出理想的氛圍。LBM的創新理念在於潛在空間的操作,使得圖像編輯變得更加簡單和高效,適合攝影愛好者和專業人士使用。

image.png

【AiBase提要:】

🖌️ LBM具備強大的對象移除能力,用戶只需輕點即可去除照片中的干擾元素,簡化了圖像編輯流程。

☀️ 該工具支持光照調整,用戶可以在陰天拍攝的照片中創造出陽光明媚的效果,提升照片的視覺吸引力。

🔧 LBM在法線和深度估計等多種圖像轉換任務中表現卓越,展現出其廣泛的應用潛力和可擴展性。

詳情鏈接:https://top.aibase.com/tool/lbm

6、Anthropic將發佈 Harmony 功能:讓 AI 助手無縫接入本地文件

Anthropic正在開發名爲Harmony的新功能,旨在將本地文件目錄集成到Claude的工作環境中。這一創新將使用戶能夠與文件進行更流暢的互動,AI助手可以直接讀取、索引和分析目錄中的內容。Harmony不僅支持文件的分析和修改,還提供基於關鍵詞的搜索功能,展現了強大的AI編碼助手潛力。

【AiBase提要:】

✅ Harmony功能將使用戶能夠無縫接入本地文件,提升AI的交互能力。

🔍 Claude在測試中成功識別了多個代碼安全漏洞,顯示出其強大的分析能力。

🧭 Anthropic還在開發Compass功能,可能會支持深度研究和信息整合。

7、開源圖片超分模型Thera:可以提升圖片清晰度,讓模糊從此“下崗”

Thera是一款由蘇黎世聯邦理工學院和蘇黎世大學開發的開源超分辨率模型,能夠以任意倍數提升圖片清晰度。它不僅能讓模糊照片恢復生機,還通過內置的物理觀測模型,減少圖像失真,呈現更自然的細節。

image.png

【AiBase提要:】

✨ Thera支持任意尺度的超分辨率放大,用戶可以自定義放大倍數,靈活應對各種需求。

🔍 內置物理觀測模型,模擬真實圖像形成過程,減少失真,呈現更真實細節。

🌍 作爲開源項目,Thera以Apache-2.0許可證提供,促進技術共享與發展,提供預訓練模型便於用戶使用。

詳情鏈接:https://top.aibase.com/tool/thera

8、谷歌Gemini2.0Flash去除圖片水印功能引版權擔憂

谷歌新推出的Gemini2.0Flash模型引發了關於去除圖片水印的爭議,尤其是涉及到Getty Images等知名圖片庫的內容。儘管該模型在圖像生成和編輯方面表現出色,但其缺乏使用限制引發了版權方面的擔憂。Gemini2.0Flash的功能似乎更爲強大,但在美國版權法下,未經同意去除水印的行爲仍然可能被視爲違法。

image.png

【AiBase提要:】

🚫Gemini2.0Flash可去除圖片水印,功能強大但引發版權爭議。

💬其他AI模型如Claude3.7Sonnet和GPT-4o拒絕去除水印,認爲此舉不道德且可能違法。

⚖️美國版權法下,未經原所有者同意去除水印通常被視爲違法,谷歌未對質疑作出及時迴應。

9、Cohere 發佈AI模型Command A,兩塊GPU就能高效運轉,企業部署成本降50%

Cohere推出的Command A模型以其僅需兩塊GPU的低硬件需求和高達50%的成本節省,打破了高性能AI的傳統門檻。其1110億參數的設計結合優化的Transformer架構,使得企業能夠在處理複雜任務時,享受超長的上下文窗口和多語種支持。

image.png

【AiBase提要:】

💻 Command A模型僅需兩塊GPU即可高效運轉,顯著降低了企業的硬件需求。

🌍 支持多達23種語言及地區方言,助力企業拓展全球市場。

💰 私有部署成本降低高達50%,爲企業帶來顯著的財務優勢。

詳情鏈接:https://huggingface.co/CohereForAI/c4ai-command-a-03-2025

10、首個國產Agent開發框架!倉頡社區發佈Cangjie Magic,原生支持鴻蒙等全平臺!

Cangjie Magic是一個創新的智能體開發框架,基於華爲自研的倉頡編程語言,旨在重塑智能體開發的方式。該框架通過獨特的Agent DSL架構、原生支持MCP通信協議和智能調度引擎,提供了全面的智能體生命週期管理。

image.png

【AiBase提要:】

🛠️ 獨創的Agent DSL架構,實現智能體建模的聲明式編程,提升開發效率。

🌐 原生支持MCP通信協議,確保智能體之間的高效通信與協作。

📱 計劃在第三季度實現對Android和iOS的智能體調用能力,拓展移動端應用場景。

詳情鏈接:https://gitcode.com/Cangjie-TPC/CangjieMagic

11、OpenAI 高管預測:AI 將於2025年底超越人類程序員

在最近的播客中,OpenAI 的首席產品官凱文・維爾表示,人工智能預計將在2025年底之前超越人類程序員,尤其是在編碼基準測試中。他強調了AI編碼模型的快速進步,並提到Anthropic及OpenAI的先進模型正在推動編碼的自動化。隨着推理能力的提升,AI在編程領域的表現也在不斷改善,未來幾乎所有代碼可能由AI生成。


【AiBase提要:】

🌟 AI預計將在2025年底超越人類程序員,成爲更優秀的編碼者。

💻 Anthropic和OpenAI的先進模型正在推動編碼自動化,未來幾乎所有代碼可能由AI生成。

🚀 OpenAI即將推出的新模型在競爭性編碼排名中不斷上升,標誌着AI在編程領域的持續進步。