AI日報：類GPT-5新模型將上線？奧特曼發草莓照片引熱議；美圖發佈美圖雲修Pro版； ComfyUI已支持騰訊混元DiT與Flux模型

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、奧特曼發草莓圖引發猜測暗示OpenAI將發佈新模型 “Strawberry”

山姆・奧特曼在社交媒體發佈關於夏季花園的照片，引發關於新模型 “草莓” 的猜測。網友熱議草莓項目可能即將到來，期待其突破性質。

【AiBase提要:】
🍓 奧特曼發佈草莓相關照片，引發猜測和熱議。
🗣️ 新模型 “匿名聊天機器人”推理能力優於現有模型，可能與 “草莓” 項目相關。
🚀 “草莓” 項目旨在使AI具備自主互聯網搜索和深度研究能力，被認爲是可能的突破。

2、百度網盤發佈AI修圖攝影行業解決方案

百度網盤在2024年8月推出針對攝影行業的解決方案，集存儲備份、AI修圖和高效交付於一體，旨在幫助影樓提高效率、降低成本並增強業務增長。該解決方案通過一站式服務，實現了存儲備份、內部協同、AI修圖和一鍵交付，成功解決了影樓的管理、效率和成本問題。

【AiBase提要:】
⚙️ 一站式服務:存儲備份、內部協同、AI修圖和一鍵交付，提高影樓管理效率。
💡 連鎖影樓優勢:提升內部協同效率，客片分類存儲和多人協作照片流轉，批量初修、客戶選片和客片交付。
🔬 百度雲朵引擎技術:9大人像分析檢測能力、86項人像與圖像美化能力、1000+視覺技術專利，提供個性化AI修圖服務。
詳情鏈接:https://www.wjx.cn/vm/hMDEeN7.aspx

3、美圖發佈美圖雲修Pro版上線AI批量調色、AI批量精修等功能

美圖公司旗下的美圖雲修Pro版引入了AI批量調色、AI批量精修等新功能，爲商業攝影行業提供更全面的修圖解決方案。AI工作流實現了從轉檔、修圖到交付的自動化處理，顯著提高工作效率。已有3萬餘家商業攝影機構選擇使用美圖雲修，年修圖量超過5億張，精修效率提升12倍。

【AiBase提要:】
✨ AI批量調色、AI批量精修功能提升修圖效率
💡 智能修圖API服務支持即傳、即修、即用
🚀 使用美圖雲修實現商業模式高效轉型、節省成本

4、360AI企業瀏覽器升級支持AI搜索、辦公助手和AI應用商店

360企業安全瀏覽器是一款爲企業提供綜合安全辦公解決方案的瀏覽器，具備智能辦公和安全防護功能，支持靈活部署以滿足不同企業需求。它提供AI辦公助手、360AI搜索和文檔、音視頻分析等AI應用，構建高效辦公環境，全面安全防護，聚合應用，實現智能化辦公。通過跨平臺兼容性支持多種操作系統，提供200條管控策略，爲企業提供安全、高效、智能化的辦公環境。

【AiBase提要:】
⚙️ 智能辦公: 集成360AI搜索、AI辦公助手和AI應用商店，提高工作效率。
🔒 全面安全防護: 提供多層防護措施，包括瀏覽器原生安全、Web數據安全和用戶行爲安全。
🚀 聚合應用: 提供高質量的開發保障，實現統一訪問入口和跨平臺兼容性，加強安全性，簡化配置流程。
詳情鏈接:https://top.aibase.com/tool/360-qiyeanquanliulanqi

5、騰訊混元大模型:斬獲“圖生文”多模態理解國內大模型第一

騰訊混元大模型在8月SuperCLUE-V測評中榮獲國內大模型排名第一，展現出在多模態理解領域的卓越表現。其綜合優勢得益於對圖像識別精確度和現實世界理解力的深入考驗。騰訊混元大模型技術底座支持AI原生應用騰訊元寶，已擴展至萬億級參數規模，具備國內領先水平的多模態理解能力。

【AiBase提要:】
🏆 騰訊混元大模型榮獲國內大模型排名第一，展現綜合優勢
🔍 評測結果顯示，騰訊混元大模型在多模態理解基礎和應用能力上表現突出
💡 騰訊混元大模型已擴展至萬億級參數規模，採用MoE結構，多模態理解能力達國內領先水平

6、Comfy Org重大進展:ComfyUI已支持騰訊混元DiT與Flux模型

Comfy Org 最近取得了重大進展，引入了新的模型支持和技術升級，加強了核心執行引擎，展現了對技術創新和用戶體驗的承諾。這些更新使得 ComfyUI 在 AI 領域變得更加可靠和強大。

【AiBase提要:】
🚀 新增模型支持: Flux 模型集成爲用戶提供了示例工作流和模型下載鏈接，顯著增強了 AI 圖像生成能力。
🔥 Hunyuan DiT 模型支持豐富了 ComfyUI 的多語言支持能力，表現出色在理解中文提示方面。
💡 前端技術升級將帶來更強大和可維護的代碼庫，支持新前端功能的快速開發。
詳情鏈接:https://blog.comfy.org/august-2024-flux-support-new-frontend-for-loops-and-more/

7、Reddit用戶實測:GTP-4o在國際象棋上擊敗Gemini1.5pro

在最近的實驗中，Reddit用戶@zefman搭建了一個平臺，讓不同的語言模型實時對戰國際象棋，其中GPT-4o表現出色成爲最強選手。實驗展示了不同模型的思考過程，提供了有趣的互動體驗。

【AiBase提要:】
🌟 GPT-4o在國際象棋對戰中表現出色，成爲最強的語言模型。
♟️ 實驗允許不同模型實時對弈，展示了它們的思考過程。
🔄 性能較弱的模型有時會選擇錯誤的走法，但實驗提供了重新選擇的機會，保持遊戲進行。

8、全景圖像生成新方法PanoFree:無需調優生成多視角圖片

PanoFree是一種無需調優的多視角圖像生成技術，通過迭代變形和修補解決了一致性和僞影問題，提升了時間效率和內存使用效率，結果多樣性更高。

【AiBase提要:】
🌟 無需調優的多視角圖像生成方法
🚀 通過迭代變形和修補解決一致性和僞影問題
💡 時間效率和內存使用大幅提升，結果多樣性更高
詳情鏈接:https://top.aibase.com/tool/panofree

9、ExAvatar: 通過簡短視頻克隆人像並轉化爲3D數字形象

ExAvatar是由DGIST和Meta公司的Codec Avatars Lab聯合研發的一項技術，能夠通過捕捉視頻中的動作和表情，轉化爲栩栩如生的3D數字形象。這項技術解決了以往技術中的難題，提高了動畫的自然度和渲染效果。

【AiBase提要:】
🌟 全身3D驅動: 支持身體、手和麪部的全面動畫，生成多種姿勢和表情。
💡 混合表示法: 結合3D高斯和表面網格，確保幾何和外觀一致性，減少僞影。
🚀 高質量渲染: 採用先進算法和技術，實現高質量動態表現和渲染效果。
詳情鏈接:https://top.aibase.com/tool/exavatar

10、Mistral AI推出新開發工具用戶可自主優化和構建智能Agents

Mistral AI最新推出的開發工具爲用戶和開發者提供了更強大、更靈活的AI模型優化和應用能力，受到廣泛關注和期待。用戶可以通過La Plateforme微調模型，使用Agents平臺構建智能Agents，同時新版本SDK支持Python和Typescript，提供更多選擇和靈活性。

【AiBase提要:】
✨ 用戶可通過La Plateforme微調模型，更好利用數據進行優化。
🔧 Agents平臺幫助用戶詳細調整模型，構建智能Agents。
🚀 新版本SDK支持Python和Typescript，集成和使用更加便捷。

11、Napkin:利用AI輕鬆將文本轉化爲可視化圖形

在信息爆炸的時代，Napkin是一款利用AI技術的視覺化平臺，能夠將文本轉化爲各種可視化圖形，幫助用戶更輕鬆地表達創意和思想。儘管具有創新潛力，但也存在一些挑戰和改進空間。

【AiBase提要:】
🧠 利用AI技術的視覺化平臺，幫助用戶將文本轉化爲各種可視化圖形。
🚀 提供定製化功能，用戶可以調整圖標、顏色、字體等元素，導出多種文件格式或URL鏈接。
⚙️ 需要進一步優化AI技術處理模糊內容的能力，提升視覺設計水平和個性化程度。
詳情鏈接:https://top.aibase.com/tool/napkin-ai

12、OpenAI ChatGPT應用收入創新高 7月淨收入2800萬美元

OpenAI旗下ChatGPT移動應用在今年7月創下單月收入新高，淨收入達2800萬美元，主要得益於推出的GPT-4omni 模式。該模式帶來了處理文本、語音和視頻的新能力，提供更快的響應速度，使人工智能交互更加自然。儘管增速有所放緩，但整體保持健康增長態勢，預計未來幾個月收入將繼續增長。

【AiBase提要:】
💰 ChatGPT應用7月淨收入達2800萬美元，較5月環比增長40%。
📱 蘋果App Store貢獻83%的收入，較6月增長20%。
🚀 GPT-4omni 模式爲ChatGPT帶來處理文本、語音和視頻的新能力，提供更快的響應速度，用戶交互更自然。

AI日報：類GPT-5新模型將上線？奧特曼發草莓照片引熱議；美圖發佈美圖雲修Pro版； ComfyUI已支持騰訊混元DiT與Flux模型

相關推薦

OpenAI官宣重啓機器人業務，奧特曼公開招募工程師短期專注基礎設施研發

應對AI網絡攻擊新威脅！OpenAI向日本金融機構開放GPT-5.5 Cyber模型

老用戶心碎！OpenAI官宣退役o3 與GPT-4. 5 大模型

官方域名也淪陷？LLMShare新型黑客攻擊曝光：ChatGPT共享頁變釣魚入口

日本基礎設施企業 Datasection 攜手 OpenAI