歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、阿里發佈 FLUX.1-Turbo-Alpha:基於FLUX.1-dev、8步提煉Lora

阿里媽媽創意團隊發佈了基於FLUX.1-dev模型訓練的FLUX.1-Turbo-Alpha,採用8步蒸餾Lora模型,多頭判別器顯著提高蒸餾質量,支持多種FLUX相關應用。推薦引導尺度設置爲3.5,Lora尺度爲1,未來將推出更低步數版本。模型可與Diffusers框架結合使用,通過幾行代碼加載模型生成高質量圖像。訓練過程在超過100萬幅圖像上進行,採用對抗訓練方法,具備6.3以上美學評分,分辨率高於800。FLUX.1-Turbo-Alpha的推出推動了人工智能技術的普及與應用。

image.png

【AiBase提要:】

🌟 基於FLUX.1-dev,採用8步蒸餾和多頭判別器,提升圖像生成質量。

🖼️ 支持文本到圖像生成及修復控制網,用戶可輕鬆創建多種有趣場景。

📊 訓練過程採用對抗訓練,訓練數據超過100萬張圖像,確保模型高質量輸出。

詳情鏈接:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

2、告別繁瑣對齊!F5-TTS 讓文本轉語音變得輕鬆自如!

最近,來自上海交通大學、劍橋大學和吉利汽車研究院的研究團隊推出了一種全新的文本到語音(TTS)系統,名爲 F5-TTS。這種系統的特別之處在於,它採用了一種無自迴歸的方法,結合了流匹配與擴散變換器(DiT),成功簡化了傳統 TTS 模型中的複雜步驟。

image.png


【AiBase 提要:】

🌟 F5-TTS 是一種新型無自迴歸文本到語音系統,簡化了傳統 TTS 模型的複雜性。

⚡ 該系統結合 ConvNeXt 和 DiT,提高文本與語音的對齊效果,提升合成質量。

🔒 研究團隊關注倫理問題,建議引入水印和檢測機制以防濫用。

項目入口:https://github.com/SWivid/F5-TTS

體驗地址:https://huggingface.co/spaces/mrfakename/E2-F5-TTS

3、OPPO 文檔 AI新功能曝光!支持蘋果 iWork 格式轉換、文檔翻譯、掃描文檔等!

OPPO 官方今日發佈了一條預熱消息,宣佈即將推出全新的文檔應用。根據預熱消息,這款應用將支持多項功能,包括“文件隨心開”、“AI 隨心幫寫”、“格式隨心轉換”和“文檔隨心搜索”。

62170c0fgy1hulyjyf19oj20u01tydll.jpg

【AiBase 提要:】

📝 OPPO 即將推出全新文檔應用,支持多項 AI 功能。

🔄 應用可進行蘋果 iWork 格式轉換,提升兼容性。

📄 提供文檔掃描和翻譯功能,優化文檔處理體驗。

4、螞蟻CodeFuse IDE0.6版發佈 支持編輯器診斷問題 AI 修復

螞蟻CodeFuse IDE0.6版本發佈,新增編輯器診斷問題AI修復功能和內斂補全特性,提升代碼編寫便捷性和效率。IDE支持主流編程語言,提供代碼編寫建議、問題修復等功能。

image.png

【AiBase提要:】

🚀 IDE新增編輯器診斷問題AI修復功能,開發者可通過懸停觸發智能修復按鈕解決錯誤信息。

⚙️ 優化代碼智能補全體驗,支持下拉補全和內斂補全同時出現,用戶可通過Tab鍵快速採納內斂補全。

💻 CodeFuse IDE基於螞蟻自研大模型和OpenSumi框架開發,提供智能終端、單元測試生成等功能。

詳情鏈接:https://github.com/codefuse-ai/codefuse-ide

5、蘋果的 “多模態煉丹爐” 又升級!MM1.5增強文本密集、多圖理解

蘋果公司最近爲其多模態人工智能模型MM1推出了重大更新,將其升級爲MM1.5版本。這次升級不僅僅是簡單的版本號變更,而是全方位的能力提升,使得模型在各個領域都展現出了更強大的性能。MM1.5的核心升級在於其創新的數據處理方法,包括高清晰度的OCR數據和合成圖像描述的使用,以及優化的視覺指令微調數據混合。

image.png

【AiBase提要:】

🚀 MM1.5採用以數據爲中心的訓練方法,優化了訓練數據集,在文字識別、圖像理解和執行視覺指令等方面表現顯著提升。

💡 MM1.5涵蓋了從10億到300億參數的多個版本,包括密集型和專家混合(MoE)變體,即使是較小規模的模型也能達到令人印象深刻的性能水平。

🔍 MM1.5的能力提升主要體現在文本密集型圖像理解、視覺指代和定位、多圖像推理、視頻理解以及移動UI理解等方面,拓展了應用場景。

詳情鏈接:https://arxiv.org/pdf/2409.20566

6、合成數據有毒!Meta團隊證實:1%數據就能讓大模型完全崩潰

最近AI圈子發生了一件怪事,就像一個吃播博主突然開始吃自己做的菜,越吃越上癮,菜也越來越難吃。這事兒說起來還挺嚇人,專業的術語叫模型崩潰(model collapse)。模型崩潰是AI模型在訓練過程中,如果大量使用自己生成的數據,就會陷入惡性循環,導致模型生成的質量越來越差,最終完犢子。

image.png

【AiBase提要:】

🔍 模型崩潰現象:AI模型在訓練中過度依賴合成數據導致生成質量下降,最終崩潰。

💡 解決方案:優先使用真實數據,謹慎使用合成數據,控制模型規模,避免模型崩潰。

📈 實驗發現:即使使用1%的合成數據也可能導致模型崩潰,模型規模越大,崩潰現象更嚴重。

詳情鏈接:https://arxiv.org/pdf/2410.04840

7、獲獎AI畫作《太空歌劇院》版權申請遭拒

最近,合成媒體藝術家Jason Allen因創作的作品《太空歌劇院》遭到版權辦公室拒絕註冊引發爭議。Allen不滿決定上訴,認爲作品中有大量人類創作成分,應獲版權保護。AI生成的作品是否應獲得版權保護成爲焦點,引發關於AI藝術創作版權法律的討論。

【AiBase提要:】

🌟 Allen認爲作品中有大量人類創作成分,應獲得版權保護。

🤖 版權辦公室認爲AI生成作品缺乏足夠人類創作,拒絕註冊。

📜 Allen的上訴可能推動AI藝術創作版權法律的進一步討論。

8、臺積電第三季度利潤增長40%,AI 熱潮助推需求激增

最近,臺積電宣佈預計第三季度淨利潤將大幅增長40%,受益於AI芯片需求激增。公司客戶包括蘋果、英偉達等知名企業,推動AI技術發展。市場對臺積電未來表現樂觀,營收和資本支出計劃均有提升。

【AiBase提要:】

💰 臺積電第三季度淨利潤預計將達到2982億新臺幣,較去年同期增長40%。

📈 臺積電的客戶正在推出新產品,推動其業績超預期增長。

🌍 臺積電加大投資建設新工廠,未來資本支出預計在300億至320億美元之間。

9、Anthropic CEO:AI將助力人類抗擊疾病5-10年內人類壽命可延長至150歲

在Anthropic的CEO達里奧·阿莫代伊的文章中,他大膽預測了人工智能(AI)在未來的發展。儘管公衆對AI的風險有所擔憂,但他認爲AI的積極潛力巨大,可以爲人類社會帶來前所未有的進步。阿莫代伊強調了處理AI風險的緊迫性,並警告過度誇大技術可能帶來的誤導。他展望了AI在生物學、健康、神經科學、心理健康、經濟、貧困和智者國度等領域的變革。

【AiBase提要:】

🔬 生物學和健康: AI能加速醫學進步,控制傳染病、降低癌症死亡率、治療遺傳病,預計人類壽命可翻倍至150歲。

🧬 生物自由: AI賦予人類更多生物學特徵控制權,包括生育和外貌選擇。

🧠 神經科學和心理健康: AI應用改善精神疾病理解和治療,提升心理健康。

10、蘋果可能會在明年推出售價2000美元的 Vision 頭顯

蘋果公司計劃推出新型 Vision 頭顯,價格約爲2,000美元,採用更便宜的材料和性能更低的處理器。該設備不包含 EyeSight 功能,是蘋果混合現實計劃的一部分。蘋果還將推出第二代 Vision Pro、智能眼鏡和帶攝像頭的 AirPods,以及價格實惠的類似 iPad 的屏幕和帶機械臂的桌面設備。儘管混合現實計劃並未取得巨大成功,蘋果仍堅持推進相關產品的開發。

image.png

【AiBase提要:】

🔍 蘋果計劃推出價格約爲2,000美元的新型 Vision 頭顯,採用更便宜的材料和性能更低的處理器。

🚀 蘋果將在未來推出第二代 Vision Pro、智能眼鏡和帶攝像頭的 AirPods,推動混合現實領域的發展。

💡 蘋果還計劃推出價格實惠的類似 iPad 的屏幕和帶機械臂的桌面設備,作爲智能家居戰略的一部分。

11、谷歌在美國搜索廣告市場份額或將跌破50%

谷歌在美國搜索廣告市場份額可能在2025年跌破50%,面臨新競爭者挑戰。新興競爭者如TikTok、亞馬遜和人工智能初創公司Perplexity正搶佔市場份額。亞馬遜在搜索廣告開支中增長迅速,對谷歌構成壓力。人工智能的發展改變搜索廣告格局,谷歌計劃在AI搜索摘要中插入廣告。搜索廣告市場正經歷深刻變革。

【AiBase提要:】

📉 谷歌搜索廣告市場份額預計將在2025年跌破50%,面臨新競爭者的挑戰。

📱 TikTok和亞馬遜正迅速崛起,搶佔谷歌的市場份額。

🤖 谷歌計劃在AI搜索摘要中加入廣告,爲品牌提供新的投放渠道。

12、聯想發佈ThinkSmart Core Gen2專爲視頻會議打造 AI助力高效協作!

聯想推出的ThinkSmart Core Gen2爲智能協作領域帶來突破,搭載英特爾Core Ultra處理器,強大的AI處理能力提升會議效率,重新定義會議空間和工作方式,實現智能協作體驗。

image.png

【AiBase提要:】

💡 ThinkSmart Core Gen2搭載英特爾Core Ultra處理器,集成神經處理單元,AI處理能力強大,能耗降低40%。

💼 支持Microsoft Teams Rooms和Zoom Rooms,提供AI增強功能,包括智能框選、自動語音識別、智能姿態標籤等。

🔒 提供高度自動化和前瞻性管理,預裝ThinkSmart Manager軟件和ThinkShield解決方案確保全方位安全保護。