歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、Kimi開源視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking,多項基準超越 GPT-4o

Moonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型,展現出卓越的多模態理解與推理能力。這些模型採用輕量級的 MoE 架構,參數僅有30億,卻在多個基準測試中超越了 GPT-4o。Kimi-VL 系列在數學推理、智能體操作和高分辨率圖像處理等方面表現突出,支持超長上下文理解,展現出廣泛的應用潛力。

image.png

【AiBase提要:】

🛠️ Kimi-VL 和 Kimi-VL-Thinking 採用輕量級 MoE 架構,參數僅30億,運行效率高。

📊 在 MathVision 和 ScreenSpot-Pro 測試中,Kimi-VL 分別取得36.8% 和34.5% 的優異成績,展示強大的推理能力。

📈 支持高達128K tokens 的上下文輸入,適用於長文檔和視頻分析,展現出廣泛的應用潛力。

詳情鏈接:https://github.com/MoonshotAI/Kimi-VL https://huggingface.co/moonshotai/Kimi-VL-A3B-Instruct

2、科大訊飛旗下訊飛星辰Agent開發平臺已全面支持MCP

科大訊飛近日宣佈其訊飛星辰Agent開發平臺全面支持MCP,旨在幫助開發者高效構建Agent應用。該平臺不僅支持輕鬆配置和調用行業領先的MCP Server,還允許一鍵發佈自定義MCP Server,實現真正的“即插即用”。首批支持的MCP Server覆蓋多個行業,推動AI應用的中間層標準化。

image.png

【AiBase提要:】

🌟 開發者可以輕鬆配置和調用行業領先的MCP Server,支持一鍵發佈自定義MCP Server。

🔧 首批支持20+行業精品MCP Server,涵蓋AI能力、生活服務等多個領域。

🌐 訊飛星辰Agent開發平臺支持零代碼和低代碼創建模式,賦能個人和企業快速開發大模型應用。

詳情鏈接:https://mcp.xfyun.cn/

3、崑崙萬維開源Skywork-OR1系列模型 數學代碼能力出色

崑崙萬維天工團隊於4月13日推出了全新升級的Skywork-OR1系列模型,標誌着在邏輯推理和複雜任務求解方面的重大突破。該系列包含三款高性能模型,分別針對數學和代碼領域,展現出卓越的推理能力和性價比。Skywork-OR1-32B-Preview在競賽編程任務中表現尤爲突出,顯示出其訓練策略的先進性。

image.png

【AiBase提要:】

🔍 Skywork-OR1系列模型在邏輯理解與複雜任務求解方面實現了業界領先的推理性能。

💻 包括Skywork-OR1-Math-7B、Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview三款高性能模型,滿足不同需求。

🏆 Skywork-OR1-32B-Preview在競賽編程任務中表現突出,接近DeepSeek-R1的能力,展現出優越的性價比。

詳情鏈接:https://github.com/SkyworkAI/Skywork-OR1

4、字節跳動推出Seed-Thinking-v1.5:推理AI競賽中的新力量

字節跳動推出的新型大語言模型Seed-Thinking-v1.5在推理AI競爭中展現出強大的實力。該模型採用混合專家架構,能夠在多項基準測試中超越行業巨頭,尤其是在科學、技術、數學和工程領域。通過技術創新和高效的訓練方法,Seed-Thinking-v1.5不僅提高了推理能力,還在非推理任務中表現出色。

QQ20250414-090120.png

【AiBase提要:】

🚀 字節跳動推出Seed-Thinking-v1.5,專注於STEM領域,採用混合專家架構。

🏆 在多項基準測試中表現優異,超越Google和OpenAI的產品。

🔍 採用先進的訓練技術和強化學習框架,提升模型性能與效率。

5、商湯大裝置SenseCore2.0全新升級 推出1億元代金券計劃

在2025商湯技術交流日上,商湯科技宣佈其大裝置SenseCore2.0全面升級,旨在爲企業提供高效、靈活的全棧AI基礎設施服務。此次升級響應了大模型產業的三大挑戰,並通過技術創新顯著提升了算力利用率和推理性能。此外,商湯科技投入1億元專項代金券,助力各行業加速AI落地。

image.png

【AiBase提要:】

⚙️ SenseCore2.0全面升級,提升AI基礎設施服務的性價比和靈活性。

🤝 商湯與鬆應科技戰略合作,推動具身智能技術的發展,解決智能化落地難題。

💰 投入1億元代金券,支持企業從諮詢到模型訓練的全流程AI服務。

6、Google AI Studio開放Veo2視頻模型有限免費試用

Google AI Studio最近向部分用戶開放了Veo2視頻模型的有限免費試用,引發了廣泛關注。Veo2作爲最新一代AI視頻生成工具,支持高達4K分辨率和真實的物理模擬,展現了其強大的技術實力。然而,試用權限受到嚴格限制,用戶對冷卻時間和後續使用的未知感到困惑。

image.png

【AiBase提要:】

🌟 Veo2視頻模型由Google DeepMind開發,支持高達4K分辨率,展現出卓越的生成能力。

🕒 試用權限有限,用戶反饋冷卻時間不明確,可能影響體驗。

🔒 Google對生成內容進行嚴格把控,確保用戶隱私和安全。

7、上海AI實驗室開源InternVL3系列多模態大型語言模型

OpenGVLab於4月11日發佈了InternVL3系列模型,標誌着多模態大型語言模型領域的新里程碑。該系列模型包含從1B到78B的多種尺寸,具備處理文字、圖片、視頻等多種信息的能力,性能顯著提升。與前代產品相比,InternVL3在多模態感知和推理上有了顯著進步,擴展了工具使用、工業圖像分析等多個領域的能力。

image.png

【AiBase提要:】

🧠 InternVL3系列模型支持從1B到78B的多種尺寸,展現出卓越的多模態處理能力。

🔍 與InternVL2.5相比,InternVL3在多模態感知和推理能力上有顯著提升,支持多圖像和視頻數據。

⚙️ 模型可通過LMDeploy的api_server部署爲OpenAI兼容API,用戶可輕鬆進行模型調用。

詳情鏈接:https://modelscope.cn/collections/InternVL3-5d0bdc54b7d84e

8、AI“智商”大考變革!全新GAIA基準超越 ARC-AGI

隨着人工智能技術的迅速發展,如何準確評估AI的智能水平成爲行業關注的重點。傳統的評估基準如MMLU雖然廣泛使用,但其侷限性逐漸顯現,無法全面反映AI在實際應用中的能力。新推出的GAIA基準通過模擬真實世界的複雜問題,強調了AI在多步驟任務中的靈活性與專業化,標誌着AI評估方法的重大轉變。

image.png

【AiBase提要:】

🔍 新基準GAIA旨在評估AI在實際應用中的能力,涵蓋多模態理解和複雜推理等關鍵技能。

📊 傳統基準如MMLU的高分並不代表AI的真實能力,實際應用中的表現差異顯著。

🚀 GAIA基準的初步結果顯示,靈活性強的模型在複雜任務中表現優於其他知名模型。

詳情鏈接:https://huggingface.co/gaia-benchmark

9、百元成本煉成開源視頻模型Pusa:基於Mochi微調,低成本復現高質量

Pusa是一個基於Mochi微調的開源視頻生成模型,具有低成本和完全開源的特點。僅需約100美元的訓練成本,Pusa展現出較好的視頻生成能力,支持多種生成任務。其開放的微調流程促進了社區的合作與發展,吸引更多研究者參與到視頻模型的研究中。

image.png

【AiBase提要:】

💰 Pusa模型的訓練成本僅爲100美元,顯著低於傳統大型視頻模型的數萬甚至數十萬美元的成本。

🔧 Pusa完全開源,提供完整的代碼庫和訓練方法,支持研究者復現實驗並進行創新。

🎬 基於Mochi的微調,Pusa支持多種視頻生成任務,儘管當前分辨率爲480p,但在運動保真度和提示遵循性方面表現出潛力。

詳情鏈接:https://top.aibase.com/tool/pusa

10、字節跳動開源項目UNO:圖片生成可以保持角色、物體一致性

字節跳動的開源項目UNO在AI圖像生成領域取得了重要突破,解決了以往生成圖像時角色或物體一致性的問題。通過創新的高一致性數據合成流程和模型設計,UNO能夠確保無論是單主體還是多主體場景,生成的圖像都能保持特徵一致性。

image.png

【AiBase提要:】

🧠 UNO項目旨在解決AI圖像生成中的角色一致性問題,避免“臉盲症”。

🔍 採用高一致性數據合成流程和創新模型設計,UNO提升了圖像生成的可控性。

🎨 同時支持單主體和多主體場景,確保生成結果的高度一致性。

詳情鏈接:https://huggingface.co/bytedance-research/UNO

11、小鵬汽車推新物理大模型,定位AI汽車公司

小鵬汽車創始人何小鵬在社交媒體上強調了公司作爲AI汽車公司的定位,認爲人工智能的最大價值在於改變物理世界。他透露小鵬在自動駕駛領域的創新技術,尤其是強化學習與模型蒸餾,使其在行業內具備獨特競爭力。此外,小鵬正在訓練一個超大規模的物理世界模型,標誌着其在AI技術應用上的領先地位。

【AiBase提要:】

🤖 小鵬汽車定位爲AI汽車公司,強調AI技術在物理世界的應用價值。

🚀 引入強化學習與模型蒸餾技術,提升自動駕駛領域的競爭力。

📅2025年發佈會將解答小鵬未來發展方向,推出新車型X9。

12、字節跳動佈局AI智能眼鏡,挑戰下一代可穿戴設備市場

字節跳動正在積極研發一款AI智能眼鏡,旨在將先進的人工智能功能與高質量影像捕捉相結合,提供創新的用戶體驗。該設備將集成字節跳動自研的“豆包”AI模型,增強智能交互能力,用戶可通過語音指令等方式與眼鏡互動。項目已進入實質性研發階段,字節跳動與供應鏈夥伴展開溝通,推動產品的功能設計與上市計劃。

【AiBase提要:】

🧠 字節跳動研發AI智能眼鏡,融合先進AI功能與影像捕捉。

🔍 集成“豆包”AI模型,支持語音指令、實時翻譯等智能交互。

📈 計劃與供應鏈夥伴溝通,推動產品設計與上市,挑戰Meta等競爭對手。