AI日報：通義千問開源Qwen3向量模型；字節跳動圖像編輯模型SeedEdit 3.0；ElevenLabs推v3語音模型

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、通義千問正式發佈Qwen3-Embedding系列模型

我作爲一名AI助手，對通義千問團隊推出Qwen3-Embedding系列模型感到非常興奮。這款新模型不僅在多語言文本理解和檢索任務上表現出色，而且提供了靈活的配置選項和強大的多語言支持，展現了其在文本處理領域的領先地位。

【AiBase提要:】
📚 Qwen3-Embedding系列基於Qwen3基礎模型，提供從0.6B到8B參數規模的三種配置，適用於不同場景下的性能與效率需求。
🌍 支持超過100種語言，具備強大的多語言、跨語言及代碼檢索能力，採用雙塔和單塔結構設計。
🌟 在MTEB多語言榜單中得分70.58，性能超越衆多商業API服務，展現卓越的文本表徵和排序能力。
詳情鏈接:https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

2、字節跳動發佈圖像編輯模型SeedEdit3.0細節保持能力進一步提升

SeedEdit3.0是基於 Seedream3.0開發的圖像編輯模型，通過多樣化數據融合和專用獎勵模型，大幅提升了主體保持、背景細節處理及指令遵循能力，尤其在人像編輯、背景更換和複雜光影處理方面表現卓越。

【AiBase提要:】
✨ 引入高效數據融合策略與專用獎勵模型，顯著提升圖像編輯保持效果。
🌟 支持4K分辨率編輯，處理複雜場景如人像、光影變換時展現強大細節處理能力。
🚀 推理加速至10秒級，23類編輯任務評測領先，可用率提升至56.1%。
詳情鏈接:https://seed.bytedance.com/seededit

3、地表最強AI語音來了!Eleven v3Alpha版震撼發佈，會說話還能‘演戲’

ElevenLabs推出的Eleven v3Alpha版以其卓越的情感表達、多語言支持和自然對話能力成爲TTS領域的里程碑，重新定義了文本轉語音技術。

【AiBase提要:】
🌟 Eleven v3Alpha版引入音頻標籤，可精確控制情感、語速並添加音效，使語音更真實且富有表現力。
🌐 支持70多種語言，具備多角色對話能力，適用於影視配音、教育及客戶服務等多場景。
🚀 技術升級後，文本理解與對話生成能力顯著提升，自動標籤功能簡化創作流程，助力非專業人士輕鬆生成高質量語音內容。

4、Anthropic 發佈專爲國家安全定製的 AI 模型，獲亞馬遜和谷歌支持

Anthropic 推出 Claude Gov 模型套件，專爲國家安全機構設計，增強涉密材料處理能力，獲得亞馬遜和谷歌戰略支持，但面臨 Reddit 的法律訴訟。

【AiBase提要:】
🌐 Claude Gov 模型套件專爲國家安全機構設計，提升涉密材料處理能力。
🤝 產品獲亞馬遜和谷歌支持，僅限最高安全許可機構使用。
⚖️ Anthropic 面臨 Reddit 提起的法律訴訟，指控其未經授權使用用戶數據訓練模型。

5、可靈AI月度付費金額連續兩個月超1億元，用戶規模破2200萬

可靈AI在推出10個月後年化收入運行率突破1億美元，P端付費訂閱會員貢獻主要收入，全球用戶規模突破2200萬。

【AiBase提要:】
✨ 可靈AI年化收入運行率突破1億美元，僅10個月達成。
💰 P端付費訂閱會員貢獻近70%營業收入。
👥 全球用戶規模突破2200萬，爲企業客戶提供API服務。

6、Meta發佈Aria Gen2技術細節:四攝像頭加持，續航8小時挑戰蘋果Vision Pro

Meta首次全面披露Aria Gen2研究眼鏡的技術細節，相比初代產品，它在硬件設計、傳感器技術和AI處理能力等方面實現了全面升級。

【AiBase提要:】
四攝像頭加持，全局快門傳感器解決運動失真問題，深度測量精度顯著提高。
新增接觸式麥克風，鼻託內置結構聲傳導技術，嘈雜環境下仍能清晰拾音。
AI處理能力大幅增強，支持六自由度位置追蹤、眼動追蹤及3D手部追蹤，爲未來AR交互奠定基礎。

7、愛詩科技PixVerse國內版“拍我AI”正式上線

愛詩科技旗下的PixVerse國內版“拍我AI”正式上線，支持網頁端和移動端，並提供API開放平臺，大幅降低視頻製作成本與時間。

【AiBase提要:】
拍我AI通過AI特效和WoW發射器助力用戶輕鬆創作個性化視頻內容。
國內版支持V4.5版本，提供便捷的視頻生成解決方案，滿足多種需求。
拍我AI開放平臺與多家頭部企業合作，爲企業用戶提供高效視頻生成工具。
詳情鏈接:https://pai.video

8、富國銀行大膽預測:2030年 ChatGPT 廣告收入將達千億美元

富國銀行分析師預測，到2030年ChatGPT將佔據全球搜索廣告市場30%份額，年收入接近1000億美元，這將對谷歌的主導地位構成挑戰。

【AiBase提要:】
截至2030年，ChatGPT預計佔據全球搜索廣告市場30%份額，年收入接近1000億美元。
目前，谷歌在搜索廣告領域佔據超90%市場份額，但預計到2030年將降至約60%。
ChatGPT的商業化進程可能受到與手機制造商合作及反壟斷裁決的推動。

9、王自如感謝董明珠雷軍將以AI測評UP主身份二次創業

知名科技博主王自如宣佈復更並更名爲‘王自如AI’，專注AI內容創業，助力傳統產業數字化轉型，同時分享了在格力的經歷及對董明珠和雷軍的感激。

【AiBase提要:】
🚀6月6日，王自如的B站賬號復更並更名爲‘王自如AI’，開啓AI測評UP主的二次創業。
💼 他曾在格力重塑銷售體系，得益於董明珠和雷軍的鼓勵，懷揣理想繼續前行。
💡 選擇AI領域創業是因爲看到其巨大潛力，認爲能快速獲得回報。

10、智源發佈RoboOS2.0與RoboBrain2.0:首個支持MCP機制的機器人

在北京智源大會上，北京智源人工智能研究院發佈了具身智能操作系統RoboOS2.0與大模型RoboBrain2.0，開源推動具身智能生態發展。

【AiBase提要:】
首個支持MCP機制的機器人操作系統RoboOS2.0，降低開發門檻並提升多機器人協作能力。
RoboBrain2.0任務規劃準確率提升74%，在空間推理與智能調度方面表現卓越。
已與多家企業合作，共同構建開放、協同的智能機器人生態體系。

11、谷歌重磅新作!Portraits讓你與虛擬專家對話，解鎖溝通與領導力祕籍

谷歌推出的Portraits是一款基於AI技術的創新產品，用戶能與虛擬專家實時互動學習溝通與領導力等技能，具有高度個性化和交互性的特點。

【AiBase提要:】
🌟沉浸式對話學習體驗，與虛擬專家互動掌握實用技能。
🌐AI驅動個性化學習，動態調整內容確保針對性。
🌍應用場景廣泛，從職場到教育，助力個人與職業發展。

12、OpenAudio 發佈開源 TTS 模型 S1-Mini:0.5B 參數打造超自然 AI 語音

Fish Audio 推出基於 S1模型的輕量化版本 S1-Mini，參數僅0.5B，卻具備高表現力和多語言支持，開源後大幅降低開發門檻，爲教育、娛樂等領域帶來創新可能。

【AiBase提要:】
🌟 輕量化設計:0.5B 參數，適配邊緣設備，支持14種語言與50+情感表達。
🌐 開源賦能:免費下載，降低開發門檻，促進全球技術普及與創新。
🚀 性能卓越:媲美行業巨頭，尤其在多語言和複雜對話場景表現突出。
詳情鏈接:https://huggingface.co/fishaudio/openaudio-s1-mini

13、AI驅動本地視頻編輯工具Diffusion Studio Pro，號稱“CapCut + Cursor”結合

AI驅動的視頻編輯工具Diffusion Studio Pro正式亮相，以其強大的AI功能和本地化設計受到廣泛關注。它結合了CapCut和Cursor的優勢，提供多模態AI賦能的非線性編輯體驗，同時支持免費使用，極大降低了創作門檻。

【AiBase提要:】
🌟 多模態AI賦能非線性編輯，內置智能代理側邊欄實現自動化工作流，顯著提升創作效率。
🔒 本地優先設計保護隱私，免費無限層級模式吸引獨立創作者和小型團隊。
🌍 支持廣泛應用場景，從短視頻到專業製作，提供從創意到上線的全鏈條支持。

14、智源研究院推出Emu3等‘悟界’系列大模型

在第七屆‘北京智源大會’上，智源研究院發佈了‘悟界’系列大模型，包括Emu3、見微 Brainμ、RoboOS2.0、RoboBrain2.0和OpenComplex2，涵蓋多模態智能技術，推動人工智能應用落地。

【AiBase提要:】
🚀 Emu3作爲原生多模態世界模型，整合視覺、聽覺和觸覺數據，提升機器對世界的理解能力。
🧠 見微 Brainμ結合神經科學成果，爲機器智能發展提供生物學支持。
🤖 RoboOS2.0和RoboBrain2.0推動具身智能協作框架，加速機器人技術進步。

15. Luma Labs 發佈 Modify Video:AI 視頻後期一鍵改風格、換場景

Luma Labs 推出 Modify Video 工具，利用 AI 技術簡化視頻後期製作，實現風格重塑、場景替換等功能。

【AiBase 提要:】
🌟 風格重塑:通過文本改變視頻藝術風格。
🌍 場景替換:將背景換爲新的場景，增強視覺效果。
🎭 角色編輯:調整人物外觀和表演，無需重新拍攝。

AI日報：通義千問開源Qwen3向量模型；字節跳動圖像編輯模型SeedEdit 3.0；ElevenLabs推v3語音模型

相關推薦

聯想 ThinkPad P1 AI 2026 正式發佈：重塑超便攜高性能移動工作站標杆

打破低價神話？DeepSeek V4 下月上線將引入峯谷定價機制

算力短缺瓶頸顯現:谷歌限制Meta訪問Gemini AI模型

算力界的“巨無霸”來了：美團開源萬億參數模型 LongCat-2.0

真金白銀的抉擇！美國科技巨頭爲何悄然轉向中國大模型？

AI日報：通義千問開源Qwen3向量模型；字節跳動圖像編輯模型SeedEdit 3.0；ElevenLabs推v3語音模型

相關推薦

聯想 ThinkPad P1 AI 2026 正式發佈：重塑超便攜高性能移動工作站標杆

打破低價神話？DeepSeek V4 下月上線將引入峯谷定價機制

算力短缺瓶頸顯現:谷歌限制Meta訪問Gemini AI模型

算力界的“巨無霸”來了：美團開源萬億參數模型 LongCat-2.0

​真金白銀的抉擇！美國科技巨頭爲何悄然轉向中國大模型？

真金白銀的抉擇！美國科技巨頭爲何悄然轉向中國大模型？