AI日報：阿里開源Qwen-Image-Edit；淘寶“AI萬能搜”功能灰度測試；小紅書發佈DynamicFace人臉生成技術

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、阿里開源 Qwen-Image-Edit：中文渲染秒殺 GPT-4o，精準文本編輯+語義外觀雙控

Qwen-Image-Edit 是阿里通義千問團隊推出的圖像編輯模型，憑藉其強大的文本編輯能力和雙重編碼機制，在中文渲染和圖像編輯領域表現出色，具有廣泛的應用前景。

【AiBase提要:】
🔥 突破性文本編輯能力，支持中英文精準渲染，尤其在中文場景下表現卓越。
🧠 雙重編碼機制確保語義與外觀的平衡，提升圖像編輯的準確性和視覺一致性。
🚀 開源賦能全球AI創作生態，提供多種平臺和工具支持，推動技術普及與應用。
詳情鏈接:https://github.com/QwenLM/Qwen-Image

2、淘寶“AI萬能搜”功能灰度測試，探索電商新購物模式

淘寶正在灰度測試名爲“AI萬能搜”的新功能，利用大模型技術重構電商搜索體驗。該功能通過自然語言理解爲用戶提供購物攻略、口碑評測和優惠諮詢等服務，並展示AI的思考過程。

【AiBase提要:】
✨ AI萬能搜基於大模型技術，提升用戶購物決策效率。
🛒 功能聚焦穿搭指南、送禮清單、選購攻略和問口碑四大場景。
🔍 用戶可清晰看到AI的思考邏輯，包括獲取信息、查詢需求和分析總結。

3、小紅書發佈DynamicFace人臉生成技術，實現高質量圖像視頻人臉融合

小紅書AIGC團隊發佈了名爲DynamicFace的可控人臉生成技術，這項技術針對圖像和視頻領域的人臉融合任務進行優化，能夠實現高質量與高度一致性的人臉置換效果。該技術不僅在娛樂社交領域有廣泛應用前景，在影視製作、虛擬形象生成等專業領域也具有重要價值。

【AiBase提要:】
🧠 DynamicFace技術強調可控性，允許用戶對人臉生成過程進行精確控制。
🎥 該技術在圖像和視頻兩個維度都實現了優化，特別是在保持高度一致性方面表現突出。
🔒 小紅書在推出這一技術的過程中，如何平衡創新與安全將是業界關注的重點。

4、Gemini API重磅升級！URL Context功能上線，網站內容直接變現新模式來襲！

Gemini API推出了URL Context功能，允許開發者直接在API中嵌入網頁鏈接，簡化了內容獲取流程，併爲內容提供商和開發者帶來了新的商業機會。該功能提升了開發效率，同時可能催生新的商業模式，如類似AdSense的聯盟機制。

【AiBase提要:】
🌍 URL Context功能讓開發者可以直接在提示中提供網頁鏈接，模型自動訪問並解析內容，提升開發效率。
💰 使用URL Context時，提取的內容將計入輸入Tokens費用，需權衡成本與內容量。
🤝 新的商業模式可能通過聯盟機制實現，內容提供商可從Tokens費用中分得利潤，激勵高質量內容生成。
詳情鏈接:https://ai.google.dev/gemini-api/docs/url-context?hl=zh-cn

5、Nvidia 推出新型小型開放模型 Nemotron-Nano-9B-v2，支持智能推理開關

Nvidia 發佈了新型小型語言模型 Nemotron-Nano-9B-v2，該模型在多個基準測試中表現優異，並支持用戶靈活控制推理功能。其參數量爲90億，優化於單個 Nvidia A10 GPU，適用於多語言任務和代碼生成。

【AiBase提要:】
🌟 Nemotron-Nano-9B-v2 是一款新型小型語言模型，支持用戶靈活控制推理功能。
⚙️ 模型基於混合架構，能夠高效處理長序列信息，適用於多語言任務。
📊 以開放模型許可證發佈，允許商業用途和衍生模型的創建。
詳情鏈接:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

6、馬斯克發佈Grok Imagine 0.1版本，野心打造宇宙最強想象力放大器

馬斯克在X平臺宣佈其AI公司xAI推出的圖像生成功能Grok Imagine目前爲0.1測試版，並表達了對其未來發展的雄心壯志。該功能旨在與DALL-E、Midjourney等主流AI圖像生成工具競爭，同時希望成爲用戶拓展創意思維的創新平臺。

【AiBase提要:】
🔥 Grok Imagine是xAI推出的圖像生成功能，目標是與DALL-E、Midjourney等競爭。
🚀 馬斯克公開承認當前版本仍需改進，但對未來發展充滿信心。
💡 功能定位爲“想象力放大器”，旨在幫助用戶拓展創意思維和想象邊界。

7、Vercel v0 iOS版發佈：AI驅動的移動開發新篇章

Vercel推出了其AI驅動開發工具v0的iOS版本，爲移動開發者提供了全新的構建體驗。該工具通過自然語言提示生成全棧Web應用，顯著提升了開發效率，並在React和Next.js框架中表現出色，贏得了廣泛認可。

【AiBase提要:】
🚀 Vercel v0 iOS版正式推出，爲移動開發者帶來全新構建體驗。
💡 利用自然語言提示生成全棧Web應用，提升開發效率。
🌐 現已開放候補名單註冊，歡迎開發者搶先體驗。
詳情鏈接:https://v0.app/ios

8、理想汽車發佈MindGPT 3.1智能體模型，每秒200字符輸出速度提升5倍

理想汽車發佈MindGPT3.1智能體模型，顯著提升了AI助手的實時處理和多任務協調能力，同時在數學計算、代碼編程等關鍵維度表現全面超越前代版本，展現了其在AI大模型領域的技術實力。

【AiBase提要:】
🧠 MindGPT3.1將智能體能力深度融入大模型架構，支持邊想邊搜功能。
⚡ 每秒輸出速度最高可達200個tokens，性能提升近5倍。
💻 代碼能力增強，可實現貪吃蛇遊戲、彈球控制等經典編程案例。

9、AI 技術簡化動漫製作流程，ToonComposer實現自動上色和生成動畫

ToonComposer 是一項基於生成式 AI 技術的創新工具，能夠顯著簡化動畫製作流程。用戶只需提供一張草圖和一幀彩色圖像，即可生成完整的卡通視頻，節省高達70% 的人工工作時間。該技術還支持關鍵幀控制和區域控制功能，提升了創作效率。

【AiBase提要:】
🎨 ToonComposer 通過生成式 AI 技術，簡化了動畫製作流程，用戶僅需一張草圖和一幀彩色圖像即可生成完整動畫。
⏳ 該系統可節省高達70% 的人工工作時間，讓創作者專注於創意。
🖌️ 提供區域控制功能，用戶可自由標記草圖區域，系統會智能填充，提升創作效率。
詳情鏈接:https://lg-li.github.io/project/tooncomposer/

10、ElevenLabs發佈全新視頻到音樂生成流程

ElevenLabs推出了視頻到音樂生成流程和AI學生包，爲內容創作者和學生提供了更高效、經濟的創作工具。這些更新進一步鞏固了ElevenLabs在AI音頻領域的領先地位。

【AiBase提要:】
🎥 視頻到音樂生成流程：基於視頻內容自動生成定製化配樂。
🎓 AI學生包：提供免費積分和折扣工具，支持教育領域應用。
🌐 技術與商業突破：擴展多模態能力，並推動AI音頻生態升級。

AI日報：阿里開源Qwen-Image-Edit；淘寶“AI萬能搜”功能灰度測試；小紅書發佈DynamicFace人臉生成技術

相關推薦

AI日報：Anthropic發佈Claude Opus 4.6；千問“春節大免單”首日火爆；騰訊推出“火龍漫劇”

阿里開源 Qwen-Image-Edit：中文渲染秒殺 GPT-4o，精準文本編輯+語義外觀雙控

「6月30日AI日報」百度開源文心大模型4.5系列；通義千問多模態生成模型Qwen VLo

「6月27日AI日報」騰訊開源輕量級混元-A13B模型；可靈AI推“視頻音效”功能

「6月26日AI日報」可靈AI推全球首部AIGC單元劇；谷歌開源AI智能體Gemini CLI