微軟開源圖片模型ART，可生成多圖層透明圖片

在圖像生成領域，多層圖像生成技術正逐漸改變用戶與生成模型的互動方式，允許用戶隔離、選擇並編輯特定的圖像層。近日，微軟研究人員推出了一種名爲 “Anonymous Region Transformer”（ART）的新型技術，它能夠根據全球文本提示和匿名區域佈局，直接生成可變多層透明圖像。

ART 的設計靈感來源於 “圖式理論”，通過採用匿名區域佈局，使生成模型可以自主決定哪些視覺信息與哪些文本信息對齊。這一方法與以往的語義佈局形成鮮明對比。傳統的語義佈局通常需要明確的對應關係，而 ART 的匿名區域佈局則提供了更大的靈活性。

值得注意的是，ART 引入了一種逐層區域裁剪機制，該機制只選擇與每個匿名區域相關的視覺信息，從而顯著降低了注意力計算的成本。這種方法不僅加快了生成速度，使其比全注意力方法快12倍以上，還有效減少了圖層之間的衝突，能夠處理50個以上不同層次的圖像生成。

此外，ART 還提出了一種高質量的多層透明圖像自編碼器，支持以聯合方式直接編碼和解碼可變多層圖像的透明度。這一創新設計爲精確控制和可擴展的層生成提供了新的可能性，進一步推動了交互式內容創作的發展。

項目:https://art-msra.github.io/

劃重點:
🌟 ART可根據全球文本提示和匿名區域佈局，直接生成多層透明圖像。
⚡️ 採用逐層區域裁剪機制，顯著提高了圖像生成效率，比傳統方法快12倍。
💡 新型高質量自編碼器支持多層透明圖像的精確控制與生成，推動交互式內容創作。

谷歌Colab推出數據科學助手，簡化數據分析工作

最近，谷歌推出了一項新功能 —— 數據科學助手（Data Science Agent），該助手基於其先進的 Gemini 技術，能夠根據用戶簡單的自然語言描述生成完整的工作筆記本。這一創新不僅提升了數據分析的效率，還讓開發者能將更多精力放在深入洞察上，而不是繁瑣的設置上。谷歌 Colab 是一個免費、基於雲的 Jupyter Notebook 環境，用戶可以在瀏覽器中直接編寫和運行 Python 代碼。它爲用戶提供了免費的 Google Cloud GPU 和 TPU 的訪問權限，使得運行人工智能模型變得更加高效，並簡化了項目的協作流程。去

Bonobos創始人轉戰社交領域，AI助力線下交友應用Pie崛起

Bonobos在線時尚零售商的創始人安迪·鄧恩（Andy Dunn）已將目光從時尚轉向社交，他的最新項目Pie是一款專注於現實生活中人際連接的社交應用。憑藉1150萬美元的A輪融資，Pie的月活躍用戶已超過13萬，儘管目前僅在舊金山和芝加哥提供服務。然而，隨着用戶數量的增長，如何解決線下活動參與者衆多，難以有效社交的問題成爲了Pie面臨的新挑戰。爲了解決這一難題，Pie收購了兩位創始人Samir Mahafzah和Sam Stubbs，他們開發了一款名爲Sparked Connections的AI驅動測驗工具。該工具通過性格測試，預測參

音樂創作領域投下核彈！DiffRhythm 炸裂問世：10 秒 AI 神曲，人聲伴奏一鍵搞定！

還在對着音樂軟件 “摳腳” 編曲? OUT 啦! 音樂創作領域迎來 “核爆級” 突破! 全球首個基於擴散模型的端到端音樂模型 DiffRhythm 橫空出世，直接把音樂創作的門檻 “夷爲平地”! 你只需要 “動動嘴皮子”，輸入歌詞和風格，10秒鐘後，一首包含人聲和伴奏的完整歌曲就 “新鮮出爐”! DiffRhythm 這次是真的 “放大招” 了! 它徹底顛覆了傳統的音樂創作模式，實現了端到端自動生成完整歌曲，全程無需任何人工干預! 你不再需要像 “老黃牛” 一樣 “吭哧吭哧” 地編曲、混音，只需簡

亞馬遜重磅出擊，成立智能代理 AI 團隊

根據路透社的報道，亞馬遜最近在其雲計算部門 AWS 內部成立了一個新的團隊，專注於開發智能代理 AI。這種系統旨在幫助用戶自動化生活中的某些任務，從而提高效率和便利性。AWS 的首席執行官馬特・加爾曼在一封發給員工的郵件中表示，智能代理 AI 有潛力成爲 AWS 下一個數十億美元的業務。負責該新團隊的是斯瓦米・西瓦蘇布拉馬尼亞姆，他是一位資深的 AWS 高管，曾領導公司在人工智能和數據領域的工作。隨着科技行業逐漸向智能代理 AI 轉型，亞馬遜也加入了這一趨勢。就在上週，

硅基流動:下線部分未備案模型，用戶請注意遷移