歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、Anthropic旗下Claude AI推出桌面客戶端

Anthropic公司推出了AI聊天機器人Claude的桌面應用程序,提升用戶體驗,使用戶能更便捷地與Claude互動。同時,移動端應用也新增了語音輸入功能,增強用戶交互體驗。

image.png

【AiBase提要:】

🚀 提升用戶體驗,推出桌面應用程序,方便用戶與Claude互動。

🎤 移動端應用新增語音輸入功能,用戶可以通過語音與Claude交流。

💻 競爭對手如ChatGPT和Perplexity已推出桌面應用,Anthropic公司保持競爭力。

詳情鏈接:https://claude.ai/download

2、OpenAI公司推出ChatGPT search搜索功能

OpenAI公司推出了名爲ChatGPT search的新功能,用戶可以通過對話界面快速獲取最新的網絡搜索結果,無需跳轉到傳統搜索引擎,提供實時信息如體育比分、新聞、股票報價等。該功能簡化了用戶獲取有用答案的過程,使用戶可以以自然、對話的方式提問,並獲得更好的答案。

【AiBase提要:】

🔍 ChatGPT search功能讓用戶通過對話界面快速獲取最新網絡搜索結果,提供實時信息如體育比分、新聞、股票報價等。

🔄 用戶可以選擇讓ChatGPT搜索網絡或手動點擊搜索圖標進行搜索,使獲取信息更便捷。

🌐 OpenAI與新聞和數據提供商合作,爲搜索結果添加最新信息和新的視覺設計,強調歸因可信新聞源的信息,擴大出版商的影響力。

3、谷歌 Gemini API 推出 “連接實時搜索” 功能 提升AI響應準確性

谷歌 AI 工作室與 Gemini API聯合推出了“與谷歌搜索的實時連接”功能,旨在幫助開發者提升AI模型的響應準確性。這一功能能從谷歌搜索中獲取最新信息,減少虛假信息,提供透明且最新的回答。同時支持動態檢索,開發者可根據需要靈活激活實時數據檢索,提高回答質量。

image.png

【AiBase提要:】

🌐 新功能 “與谷歌搜索的實時連接” 旨在提高AI模型的響應準確性。

💰 Gemini API定價爲每1000個查詢35美元,支持實時數據檢索。

🔄 開發者可根據需求靈活激活實時數據檢索,提高回答質量。

4、帶圖層的AI生圖軟件來了!Blendbox Alpha 版發佈

Blendbox Alpha版是一款革命性的AI圖像生成軟件,重新定義了藝術家創作的方式。通過引入圖層概念,用戶可以像使用PS一樣控制圖像生成,擺脫了過度依賴提示詞的創作方式。藝術家可以實時調整紋理、光影、顏色方案和對象位置,實現高度的創作自由。

【AiBase提要:】

🎨 Blendbox Alpha版重新定義了AI藝術創作方式,讓藝術家重新掌控創作過程。

🔧 Blendbox通過模塊化的圖像控制功能,允許用戶調整單個元素,加快創作迭代速度。

🖼 Blendbox的圖像更改是局部進行的,藝術家可以針對特定區域和元素進行調整,保持圖像整體性。

詳情鏈接:https://www.blendbox.ai/

5、告別“假臉”模特!阿里EcomID重磅來襲

阿里巴巴最新發佈的AI人像生成項目EcomID帶來了顯著突破,完美繼承了InstantID和PulID的優勢,實現了創新。該工具在圖像生成效果、文本到圖像功能、用戶體驗等方面都有突出表現,重新定義了AI圖像生成的品質標準。

image.png

【AiBase提要:】

🚀 EcomID在技術層面採用創新的架構設計,借鑑了PuLID的ID-Encoder和交叉注意力組件,降低了ID embedding對文本embedding的干擾。

💡 EcomID的亮點在於卓越的圖像生成效果,保持穩定的身份特徵,完整保留了文本到圖像的功能,極大提升了生成圖像的真實感。

⚙️ SDXL-EcomID爲ComfyUI用戶帶來全新使用體驗,支持基礎和換臉兩種工作流程,提供高級定製功能,展現出極強的適應性。

詳情鏈接:https://github.com/alimama-creative/SDXL_EcomID_ComfyUI

6、D-ID推超逼真AI虛擬頭像:進行視頻訓練就能復刻頭部和軀幹動作

D-ID推出兩款新型虛擬頭像Express和Premium+,旨在提升內容創作的質量和效率,滿足企業在市場營銷、銷售和客戶支持等領域的需求。公司致力於打造超逼真的虛擬頭像,提供實時互動能力,以增強用戶體驗。個性化視頻活動顯著提升企業點擊率和轉化率。

image.png

【AiBase提要:】

🌟 D-ID推出Express和Premium+兩款新型虛擬頭像,提升內容創作效率。

🤖 Premium+頭像具備實時互動能力,適合網絡研討會和翻譯應用。

📈 個性化視頻活動顯著提升企業的點擊率和轉化率。

7、AI音樂生成平臺Suno推出Personas功能

Suno推出的Personas功能讓用戶可以複製自己鍾愛的音樂風格,一鍵生成帶有個人特色的AI音樂,打造專屬音樂IP。這項突破性功能允許用戶提取保存某首歌曲的核心元素,包括人聲特點、音樂風格和情感氛圍,讓創作保持一致的個人特色。

【AiBase提要:】

⚙️ 用戶可以複製自己鍾愛的音樂風格,一鍵生成帶有個人特色的AI音樂,打造專屬音樂IP。

🎵 Personas功能允許用戶提取保存某首歌曲的核心元素,包括人聲特點、音樂風格和情感氛圍,讓創作保持一致的個人特色。

🔗 用戶可以選擇將自己的Persona設爲公開或私密,擁有獨立頁面,展示在創作者的資料庫和個人主頁中,增加音樂創作的社交價值。

詳情鏈接:https://top.aibase.com/tool/suno-ai

8、ElevenLabs推開源小項目X-to-Voice:一鍵將Twitter賬號轉化爲個性化虛擬形象

ElevenLabs最近發佈了開源項目X-to-Voice,利用聲音設計API和動態頭像技術,智能分析Twitter用戶資料,生成個性化虛擬形象。項目高度個性化定製,用戶只需輸入賬號名稱即可獲得獨特聲音配置和動畫頭像。技術整合了聲音生成、動態頭像製作等多項尖端技術,提供全新社交表達方式。

image.png

【AiBase提要:】

🔊 個性化聲音生成和動態頭像製作

🤖 技術整合包括聲音設計API和Taedra工具

🌐 項目部署在Vercel平臺,提供簡單用戶體驗

詳情鏈接:https://github.com/elevenlabs/elevenlabs-examples/tree/main/examples/text-to-voice/x-to-voice

9、Meta 重磅發佈!MobileLLM 模型全面開放,研究人員免費獲取!

Meta 最近宣佈其 MobileLLM 模型現已向研究人員開放,用戶可在 Hugging Face 平臺上免費下載並使用這些模型,這一舉措推動移動設備上的大型語言模型研究和開發,爲開發者和學術界提供更廣泛的工具與資源。

image.png

【AiBase提要:】

🌟 Meta 的 MobileLLM 模型現已在 Hugging Face 平臺上免費提供,供研究人員下載與測試。

🤖 MobileLLM 旨在推動移動設備上的大型語言模型研究,降低使用門檻。

📈 企業與開發者被鼓勵通過 AI 技術優化流程,以實現更好的業務績效。

詳情鏈接:https://huggingface.co/collections/facebook/mobilellm-6722be18cb86c20ebe113e95

10、夸克發佈“靈知”學習大模型 全面升級“AI搜題”讓新題、難題都有解

夸克全面升級“AI搜題”產品,提升搜題與解題速度與能力,助力用戶提升學習效率。夸克AI能力落地於學習場景,讓學習更智能。夸克“靈知”學習大模型實力強勁,解決用戶痛點,產品能力得到全新發展。

image.png

【AiBase提要:】

🚀 夸克全面升級“AI搜題”產品,加速學習產品創新,提升用戶學習效率。

💡 夸克“AI搜題”是全網首家完成全面AI化升級的搜題產品,支持各類題目搜尋與專業內容解答。

🧠 夸克“靈知”學習大模型在性能評測中表現優異,具備領先的推理能力和知識正確性。

11、字節祭出開源祕密武器HybridFlow,大模型訓練速度飆升20倍,成本砍到腳脖子!

大模型(LLM)如GPT、Llama等在人工智能領域掀起了革命,但高效訓練符合人類價值觀仍是難題。字節跳動豆包團隊開源HybridFlow框架,爲RLHF帶來新可能性。HybridFlow結合單控制器和多控制器模式,靈活高效執行RLHF數據流,吞吐量提升20.57倍,推動LLM技術發展。

image.png

【AiBase提要:】

🚀 HybridFlow框架創新結合單多控制器模式,解耦複雜計算數據依賴,靈活高效執行RLHF數據流。

💡 HybridFlow支持多種RLHF算法,如PPO、ReMax、Safe-RLHF,提供模塊化API,簡化算法實現和擴展。

⚙️ HybridFlow的3D-HybridEngine組件支持高效模型權重重組,減少內存冗餘和通信開銷,提升訓練效率。

詳情鏈接:https://arxiv.org/pdf/2409.19256

12、谷歌地圖終於開掛!Gemini加持解鎖多項神技,網友:這纔是真正的智能導航

谷歌地圖近日宣佈通過Gemini生成式AI模型進行重大升級,提供智能導航和全新場所發現體驗,展示技術實力和用戶體驗持續努力。

image.png

【AiBase提要:】

🌟 谷歌地圖整合Gemini AI模型,提供智能推薦功能,用戶可用自然語言詢問建議,系統智能篩選符合需求的場所。

🚗 導航體驗全面優化,顯示車道、人行橫道和路標信息,提供準確車道選擇建議,支持街景和AR實景導航模式。

🌍 新功能包括天氣干擾報告、沉浸式視圖擴展至全球150個城市,Waze導航應用也接入Gemini AI,提升用戶體驗。