AI日報：谷歌Gemini 1.5 Flash可免費使用；哩布哩布完成數億元融資；蘋果AI新功能將推遲至iOS 18.1版本

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、告別P圖困擾!Diffree直接通過文字描述就可無痕添加物體

在這個AI技術飛速發展的時代，Diffree作爲一項能讓設計師和攝影師們歡呼雀躍的AI圖像處理技術，通過文本引導實現在圖片中無縫添加新物體，降低了圖像編輯門檻，讓每個人都能成爲創造者。

【AiBase提要:】
🎨 Diffree利用文本引導功能，根據簡單文字描述在圖像中添加新物體，實現無縫融合。
🔍 基於"文本到圖像"模型，Diffree通過訓練學會生成圖像內容，利用"Stable Diffusion"擴散模型預測新物體位置。
✨ Diffree不僅能單次添加物體，還能多次添加並保持背景一致性，在實驗證明中表現優越，降低了圖像編輯難度。
詳情鏈接:https://top.aibase.com/tool/diffree

2、谷歌推Alchemist技術實現圖片材質精準編輯

谷歌研究團隊最近推出了一項突破性技術Alchemist，使用戶能夠精確編輯圖片中物品的材質屬性，無需專業技能。這項技術基於經過微調的Text-to-Image生成模型，通過合成數據集和修改模型架構實現精細控制。實驗結果顯示技術有效改變物品外觀，應用前景廣闊。儘管存在侷限性，但研究團隊對其潛力充滿信心，有望爲圖像編輯領域帶來革命性變革。

【AiBase提要:】
✨ 突破性技術Alchemist實現精準編輯圖片材質屬性，無需專業技能。
🌟 實驗結果顯示技術有效改變物品外觀，應用前景廣闊。
💡 研究團隊對Alchemist技術的潛力充滿信心，有望爲圖像編輯領域帶來革命性變革。
詳情鏈接:https://prafullsharma.net/alchemist/

3、Google Gemini重大更新Gemini1.5Flash可免費使用

Google近日宣佈了其AI助手Gemini的一系列重大更新，旨在提高用戶體驗並擴大其應用範圍。更新涵蓋了性能提升、新功能引入以及用戶羣體的擴展。Gemini1.5Flash版本帶來了免費版Gemini的全面升級，提升了響應速度、推理能力和圖像理解。

【AiBase提要:】
✨ Gemini1.5Flash版本全面升級，提升性能和功能。
🔗 文件上傳功能即將推出，便於處理複雜任務。
🌐 Gemini功能將推廣到更多平臺和地區，支持更多語言。

4、蘋果新AI功能或將推遲至iOS18.1版本發佈

蘋果公司備受期待的新AI功能 Apple Intelligence 可能無法趕上iOS18的首次發佈。儘管用戶對於新功能的推遲可能感到失望，但這也展現了蘋果注重產品穩定性和完善度的態度。

【AiBase提要:】
📅 新AI功能可能推遲至iOS18.1版本發佈，Beta測試將在本週開始。
📉 升級版Siri等其他AI更新或推遲至2025年才能與用戶見面。
📈 蘋果公司在整合AI技術到產品中時更注重穩定性和完善度，而非急於趕上發佈日期。

5、Llama4啓動訓練 Meta科學家揭祕Llama3.1訓練背後的故事

在播客節目Latent Space中，Meta的科學家Thomas Scialom揭開了Llama3.1的研發祕籍，透露了Llama4的神祕面紗。文章深入探討了Llama3.1的誕生背後的平衡挑戰與技術突破，展示了Meta在AI領域的領先地位和未來展望。

【AiBase提要:】
🔍 Llama3.1的誕生是參數規模、訓練時間與硬件限制的完美平衡，挑戰GPT-4o，展現了Meta的技術實力。
🔑 在研發過程中重視訓練數據總量，選擇增加訓練token數，通過15T的token海洋實現知識深度與廣度的飛躍。
💡 創新地選擇合成數據進行後訓練，嘗試多種模型評估與改進方法，展示了Meta在AI技術上的探索與突破。

6、亞馬遜雲發佈Amazon Q Apps:允許用戶構建自己的生成式 AI 應用程序

在亞馬遜雲科技紐約峯會上，亞馬遜雲科技發佈了Amazon Q Apps服務，爲用戶提供便捷的生成式AI應用程序構建方式。這項服務將AI技術應用變得更加簡單易用，爲用戶提供了更多機會探索AI應用的可能性。

【AiBase提要:】
🚀 Amazon Q Apps服務讓用戶可以根據簡單描述創建應用程序，無需技術背景也能使用。
💻 Amazon Q Developer集成到Amazon SageMaker Studio，爲機器學習模型開發帶來便捷。
🔒 Amazon Bedrock更新了功能，幫助用戶輕鬆訪問高性能大語言模型和構建安全、隱私的生成式AI應用程序。

7、AI離人類有多遠?一個晾衣問題暴露GPT-4致命缺陷

在Quanta Magazine的播客中，華盛頓大學計算機教授Yejin Choi與主持人Steven Strogatz展開了關於人工智能的深刻對話，探討AI是否需要具備身體和情感才能發展出與人類相似的常識。雖然大型語言模型（LLM）在語言能力上取得進展，但在理解基本常識方面仍存在挑戰。Choi教授的實驗室致力於教授AI常識，認爲AI應該擁有情商和意識，以更人性化地與人類互動。

【AiBase提要:】
🧠 LLM表現接近人類智能，但訓練方式與人類不同
🤖 AI在理解基本常識方面存在挑戰，如ChatGPT回答問題出錯
📚 Choi教授實驗室研究教授AI常識，通過提供聲明性知識幫助神經網絡學習
詳情鏈接:https://www.quantamagazine.org/will-ai-ever-have-common-sense-20240718/

8、AI圖像生成平臺LiblibAI完成數億元融資創國內行業新高

LiblibAI是國內領先的AI圖像生成平臺，最近完成了數億元人民幣的三輪融資，創下國內AI圖像賽道的最大總融資紀錄。公司快速發展得益於明確的產品戰略和強大的社區生態，面臨的挑戰是平衡先進模型發展速度與用戶需求。團隊成員來自知名高校，具備豐富的互聯網和設計行業背景，爲公司的持續創新提供支持。

【AiBase提要:】
🚀 LiblibAI完成數億元融資，創下國內AI圖像賽道最大總融資紀錄。
💡 公司快速發展得益於明確的產品戰略和強大的社區生態，積累近1000萬專業AI圖像創作者。
⚖️ 面臨的挑戰是平衡先進模型發展速度與用戶需求，團隊強調用AI-native思維設計產品。

9、Hierarchical3D Gaussian:實時渲染大規模高質量3D場景

在虛擬現實和計算機圖形學領域，Hierarchical3D Gaussian方法突破了傳統瓶頸，實現了高質量3D場景的實時渲染，提升了視覺效果和處理效率。該方法採用分塊訓練和層級優化技術，具有廣泛應用潛力。

【AiBase提要:】
🌟 突破傳統瓶頸: Hierarchical3D Gaussian解決了超大數據集渲染的瓶頸問題，提升了視覺效果和處理效率。
🚀 高效訓練與渲染: 採用分塊訓練和層級優化技術，使得超大規模場景的實時渲染成爲現實。
📈 廣泛應用潛力: Hierarchical3D Gaussian能處理數萬張圖像的複雜場景，並適應各種資源條件，展現了顯著的實用性。
詳情鏈接:https://top.aibase.com/tool/hierarchical-3d-gaussian