歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、奧特曼發草莓圖引發猜測暗示OpenAI將發佈新模型 “Strawberry”

山姆・奧特曼在社交媒體發佈關於夏季花園的照片,引發關於新模型 “草莓” 的猜測。網友熱議草莓項目可能即將到來,期待其突破性質。

image.png

【AiBase提要:】

🍓 奧特曼發佈草莓相關照片,引發猜測和熱議。

🗣️ 新模型 “匿名聊天機器人”推理能力優於現有模型,可能與 “草莓” 項目相關。

🚀 “草莓” 項目旨在使AI具備自主互聯網搜索和深度研究能力,被認爲是可能的突破。

2、百度網盤發佈AI修圖攝影行業解決方案

百度網盤在2024年8月推出針對攝影行業的解決方案,集存儲備份、AI修圖和高效交付於一體,旨在幫助影樓提高效率、降低成本並增強業務增長。該解決方案通過一站式服務,實現了存儲備份、內部協同、AI修圖和一鍵交付,成功解決了影樓的管理、效率和成本問題。

image.png

【AiBase提要:】

⚙️ 一站式服務:存儲備份、內部協同、AI修圖和一鍵交付,提高影樓管理效率。

💡 連鎖影樓優勢:提升內部協同效率,客片分類存儲和多人協作照片流轉,批量初修、客戶選片和客片交付。

🔬 百度雲朵引擎技術:9大人像分析檢測能力、86項人像與圖像美化能力、1000+視覺技術專利,提供個性化AI修圖服務。

詳情鏈接:https://www.wjx.cn/vm/hMDEeN7.aspx

3、美圖發佈美圖雲修Pro版 上線AI批量調色、AI批量精修等功能

美圖公司旗下的美圖雲修Pro版引入了AI批量調色、AI批量精修等新功能,爲商業攝影行業提供更全面的修圖解決方案。AI工作流實現了從轉檔、修圖到交付的自動化處理,顯著提高工作效率。已有3萬餘家商業攝影機構選擇使用美圖雲修,年修圖量超過5億張,精修效率提升12倍。

image.png

【AiBase提要:】

✨ AI批量調色、AI批量精修功能提升修圖效率

💡 智能修圖API服務支持即傳、即修、即用

🚀 使用美圖雲修實現商業模式高效轉型、節省成本

4、360AI企業瀏覽器升級 支持AI搜索、辦公助手和AI應用商店

360企業安全瀏覽器是一款爲企業提供綜合安全辦公解決方案的瀏覽器,具備智能辦公和安全防護功能,支持靈活部署以滿足不同企業需求。它提供AI辦公助手、360AI搜索和文檔、音視頻分析等AI應用,構建高效辦公環境,全面安全防護,聚合應用,實現智能化辦公。通過跨平臺兼容性支持多種操作系統,提供200條管控策略,爲企業提供安全、高效、智能化的辦公環境。

image.png

【AiBase提要:】

⚙️ 智能辦公: 集成360AI搜索、AI辦公助手和AI應用商店,提高工作效率。

🔒 全面安全防護: 提供多層防護措施,包括瀏覽器原生安全、Web數據安全和用戶行爲安全。

🚀 聚合應用: 提供高質量的開發保障,實現統一訪問入口和跨平臺兼容性,加強安全性,簡化配置流程。

詳情鏈接:https://top.aibase.com/tool/360-qiyeanquanliulanqi

5、騰訊混元大模型:斬獲“圖生文”多模態理解國內大模型第一

騰訊混元大模型在8月SuperCLUE-V測評中榮獲國內大模型排名第一,展現出在多模態理解領域的卓越表現。其綜合優勢得益於對圖像識別精確度和現實世界理解力的深入考驗。騰訊混元大模型技術底座支持AI原生應用騰訊元寶,已擴展至萬億級參數規模,具備國內領先水平的多模態理解能力。

【AiBase提要:】

🏆 騰訊混元大模型榮獲國內大模型排名第一,展現綜合優勢

🔍 評測結果顯示,騰訊混元大模型在多模態理解基礎和應用能力上表現突出

💡 騰訊混元大模型已擴展至萬億級參數規模,採用MoE結構,多模態理解能力達國內領先水平

6、Comfy Org重大進展:ComfyUI已支持騰訊混元DiT與Flux模型

Comfy Org 最近取得了重大進展,引入了新的模型支持和技術升級,加強了核心執行引擎,展現了對技術創新和用戶體驗的承諾。這些更新使得 ComfyUI 在 AI 領域變得更加可靠和強大。

image.png

【AiBase提要:】

🚀 新增模型支持: Flux 模型集成爲用戶提供了示例工作流和模型下載鏈接,顯著增強了 AI 圖像生成能力。

🔥 Hunyuan DiT 模型支持豐富了 ComfyUI 的多語言支持能力,表現出色在理解中文提示方面。

💡 前端技術升級將帶來更強大和可維護的代碼庫,支持新前端功能的快速開發。

詳情鏈接:https://blog.comfy.org/august-2024-flux-support-new-frontend-for-loops-and-more/

7、Reddit用戶實測:GTP-4o在國際象棋上擊敗Gemini1.5pro

在最近的實驗中,Reddit用戶@zefman搭建了一個平臺,讓不同的語言模型實時對戰國際象棋,其中GPT-4o表現出色成爲最強選手。實驗展示了不同模型的思考過程,提供了有趣的互動體驗。

image.png

【AiBase提要:】

🌟 GPT-4o在國際象棋對戰中表現出色,成爲最強的語言模型。

♟️ 實驗允許不同模型實時對弈,展示了它們的思考過程。

🔄 性能較弱的模型有時會選擇錯誤的走法,但實驗提供了重新選擇的機會,保持遊戲進行。

8、全景圖像生成新方法PanoFree:無需調優生成多視角圖片

PanoFree是一種無需調優的多視角圖像生成技術,通過迭代變形和修補解決了一致性和僞影問題,提升了時間效率和內存使用效率,結果多樣性更高。

image.png

【AiBase提要:】

🌟 無需調優的多視角圖像生成方法

🚀 通過迭代變形和修補解決一致性和僞影問題

💡 時間效率和內存使用大幅提升,結果多樣性更高

詳情鏈接:https://top.aibase.com/tool/panofree

9、ExAvatar: 通過簡短視頻克隆人像並轉化爲3D數字形象

ExAvatar是由DGIST和Meta公司的Codec Avatars Lab聯合研發的一項技術,能夠通過捕捉視頻中的動作和表情,轉化爲栩栩如生的3D數字形象。這項技術解決了以往技術中的難題,提高了動畫的自然度和渲染效果。

【AiBase提要:】

🌟 全身3D驅動: 支持身體、手和麪部的全面動畫,生成多種姿勢和表情。

💡 混合表示法: 結合3D高斯和表面網格,確保幾何和外觀一致性,減少僞影。

🚀 高質量渲染: 採用先進算法和技術,實現高質量動態表現和渲染效果。

詳情鏈接:https://top.aibase.com/tool/exavatar

10、Mistral AI推出新開發工具 用戶可自主優化和構建智能Agents

Mistral AI最新推出的開發工具爲用戶和開發者提供了更強大、更靈活的AI模型優化和應用能力,受到廣泛關注和期待。用戶可以通過La Plateforme微調模型,使用Agents平臺構建智能Agents,同時新版本SDK支持Python和Typescript,提供更多選擇和靈活性。

【AiBase提要:】

✨ 用戶可通過La Plateforme微調模型,更好利用數據進行優化。

🔧 Agents平臺幫助用戶詳細調整模型,構建智能Agents。

🚀 新版本SDK支持Python和Typescript,集成和使用更加便捷。

11、Napkin:利用AI輕鬆將文本轉化爲可視化圖形

在信息爆炸的時代,Napkin是一款利用AI技術的視覺化平臺,能夠將文本轉化爲各種可視化圖形,幫助用戶更輕鬆地表達創意和思想。儘管具有創新潛力,但也存在一些挑戰和改進空間。

image.png

【AiBase提要:】

🧠 利用AI技術的視覺化平臺,幫助用戶將文本轉化爲各種可視化圖形。

🚀 提供定製化功能,用戶可以調整圖標、顏色、字體等元素,導出多種文件格式或URL鏈接。

⚙️ 需要進一步優化AI技術處理模糊內容的能力,提升視覺設計水平和個性化程度。

詳情鏈接:https://top.aibase.com/tool/napkin-ai

12、OpenAI ChatGPT應用收入創新高 7月淨收入2800萬美元

OpenAI旗下ChatGPT移動應用在今年7月創下單月收入新高,淨收入達2800萬美元,主要得益於推出的GPT-4omni 模式。該模式帶來了處理文本、語音和視頻的新能力,提供更快的響應速度,使人工智能交互更加自然。儘管增速有所放緩,但整體保持健康增長態勢,預計未來幾個月收入將繼續增長。

【AiBase提要:】

💰 ChatGPT應用7月淨收入達2800萬美元,較5月環比增長40%。

📱 蘋果App Store貢獻83%的收入,較6月增長20%。

🚀 GPT-4omni 模式爲ChatGPT帶來處理文本、語音和視頻的新能力,提供更快的響應速度,用戶交互更自然。