AI日報：MJ推模型個性化功能；ComfyUI完成SD3 Medium模型適配；字節上線AI交友“小黃蕉”；微信輸入法內測AI功能

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、Midjourney推出模型個性化功能

Midjourney最近推出了一項創新的模型個性化功能，允許用戶根據審美偏好微調MJ模型，使生成的圖像更貼近個人喜好。個性化模型通過分析用戶喜歡的圖片來實現，學習用戶獨特審美，滿足用戶品味。用戶需對至少 200 張圖片進行評分或點贊，啓用個性化功能後，在提示後添加特定代碼分享個性化效果。

【AiBase提要:】
🎨 模型個性化功能允許用戶根據審美偏好微調MJ模型，使生成圖像更符合個人喜好。
🔍 個性化模型通過分析用戶過往喜歡的圖片，學習用戶獨特審美，提高生成圖像準確性。
💡 用戶需對至少 200 張圖片進行評分或點贊，啓用個性化功能後，在提示後添加特定代碼分享個性化效果。
詳情鏈接:https://www.midjourney.com/rank

2、爲了迎接即將開源的SD3 Medium 模型 ComfyUI已提前完成適配

SD3Medium 模型即將開源，爲了迎接這一重要時刻，ComfyUI已經提前進行了適配工作，做好了迎接新模型的準備。屆時，大家生圖可以體驗更真實的質感，更好的構圖，更優的性能以及更出色的微調能力。

QQ截圖20240611174410.jpg

【AiBase提要:】
📈 SD3 Medium 模型即將開源，ComfyUI已完成提前適配工作。
🖼️ SD3 Medium 在圖像生成方面取得顯著進步，能夠生成細節豐富且高度逼真的圖像。
💡 SD3 Medium 在生成高質量、細節豐富的圖像方面具備強大能力。
詳情：
https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e

3、微信輸入法內測AI功能只要按這個鍵就可以獲取AI回答

微信輸入法內測版本新增AI助手功能，按“=”獲取AI生成回答。emoji和顏文字推薦支持。增強對時間、日期輸入格式支持。

【AiBase提要:】
🤖微信輸入法新增AI助手功能，按“=”獲取AI生成回答。
🤖更新加強對emoji和顏文字的支持，增強對時間、日期輸入格式的支持。
🤖目前內測版本僅面向Windows用戶，iOS、Android和Mac平臺可能會推出。

4、字節上線AI虛擬交友聊天產品小黃蕉可生成照片，接近真人對話場景

近日，一款名爲“小黃蕉”（英文名Chatwiz）的AI虛擬交友聊天產品上線，其特點是能夠生成照片，且對話過程非常接近真人。經查證，該產品的工商主體爲北京臻鼎科技有限公司(番茄小說)，而其背後的實際控制者是字節跳動公司。

QQ截圖20240611160830.jpg

【AiBase提要：】
⭐ 小黃蕉是AI虛擬交友聊天產品，能生成照片，對話接近真人。
⭐ 字節跳動積極佈局AI大模型，推出多款AI產品和服務。
⭐ “小黃蕉”展現了字節跳動在AI應用領域的持續探索和創新。

5、科大訊飛：將於 6 月 27 日發佈訊飛星火V4.0 展示最新智能語音技術

科大訊飛將於 6 月 27 日發佈訊飛星火V4.0，展示最新的端到端智能語音技術成果，包括一句話復刻、高噪音場景語音識別和多方言多語種免切換功能。劉慶峯透露，科大訊飛在全雙工技術和超擬人合成技術方面處於國際領先水平。未來，科大訊飛將專注於遠場高噪音多人說話場景、高表現力個性化場景等領域的研發。

【AiBase提要:】
🚀 訊飛星火V4. 0 將展示最新的端到端智能語音技術成果，包括一句話復刻、高噪音場景語音識別和多方言多語種免切換功能。
💡 科大訊飛在全雙工技術和超擬人合成技術方面達到國際領先水平。
🔮 未來，科大訊飛將專注於遠場高噪音多人說話場景、高表現力個性化場景等領域的研發。

6、蘋果宣佈新AI功能後股價創歷史新高

蘋果公司股價週二收盤時上漲超過7%，創下歷史新高。這次反彈爲蘋果今年的表現帶來了一線希望，展示了市場對蘋果新的人工智能功能的積極態度。

【AiBase提要:】
📈 蘋果股價週二上漲超過7%，創歷史新高，市值有望達到3. 18 萬億美元，僅次於微軟。
📱 新的人工智能功能提高了蘋果設備的吸引力，包括改進的 Siri 虛擬助手和多項AI功能。
💡 開發者活動後，分析師上調對蘋果股票的目標價，預計新功能將刺激秋季新iPhone系列的購買。

7、Follow-Your-Emoji：通過捕捉人物表情變化生成表情豐富的動畫

Follow-Your-Emoji是一項突破性技術，通過提取視頻中人物的面部特徵生成全新的面部動畫。這項技術精確捕捉面部特徵和瞳孔點，排除面部輪廓干擾，實現更自然、更生動的動畫效果。應用廣泛，娛樂、教育、商業領域皆可受益。

【AiBase提要:】
👤 用戶提供照片，技術生成視頻動畫，捕捉微妙表情變化。
🔒 身份保持，參考頭像身份特徵得到保留，不會丟失。
😊 表情豐富，生成各種表情，包括瞳孔運動，讓動畫更生動、真實。
詳情鏈接:https://top.aibase.com/tool/follow-your-emoji

8、在線AI圖像編輯器Freepik Designer

Freepik Designer是一款創新的在線AI圖像編輯器，爲用戶提供了簡單易用的設計工具，無需專業設計技能即可快速上手。它的AI工具集成讓設計過程更高效，同時提供豐富的模板庫，滿足不同設計需求。

【AiBase提要:】
🎨 簡單易用的設計工具，無需專業設計技能即可快速上手
🖼️ 提供豐富的模板庫，滿足不同設計需求
💡 內置AI工具集成，提升設計效率和質量
詳情鏈接:https://top.aibase.com/tool/freepik-designer

9、埃隆・馬斯克撤回對 OpenAI 的訴訟

埃隆・馬斯克撤回了對 OpenAI 的訴訟，指控其違約。馬斯克認爲 OpenAI 放棄了非營利性使命，轉向商業利益。OpenAI 否認指控，稱其“不連貫”和“荒謬”。

【AiBase提要:】
🔍 埃隆・馬斯克撤回對 OpenAI 的訴訟。
💡 馬斯克指責 OpenAI 放棄非營利性使命，轉向商業利益。
🔒 OpenAI 否認指控，稱其“不連貫”和“荒謬”。

10、Yandex推出的開源工具YaFSDP 突破LLM訓練效率瓶頸

Yandex開源的YaFSDP工具爲全球AI社區帶來了突破性的LLM訓練優化方法，顯著提升訓練速度，節省大量GPU資源，使自主LLM訓練更具可行性。Yandex承諾持續貢獻全球AI社區發展，YaFSDP開源是其承諾的體現。

【AiBase提要:】
✨ YaFSDP是Yandex開源的高效大型語言模型訓練優化方法，可提升LLM訓練速度26%。
💡 YaFSDP專注於優化GPU通信效率和內存使用，在訓練參數規模達到 300 億至 700 億時表現出色。
🌟 採用YaFSDP訓練 700 億參數模型可節省約 150 臺GPU資源，成本節約可達 50 萬至 150 萬美元。

11、速度提高 410 倍！TiTok僅需 32 個token就能重建與生成圖片

近期，生成模型的發展突顯了圖像標記化在高分辨率圖像高效合成中的關鍵作用。TiTok是基於Transformer的一維標記化框架，將圖像標記化爲一維潛在序列，極大提高了生成效率和質量。它在處理高分辨率圖像時表現出色，生成速度顯著提高，同時保持高質量樣本輸出。

【AiBase提要:】
⚙️ 圖像token化降低計算需求，增強生成效率和有效性。
🔍 TiTok將圖像標記化爲一維潛在序列，用少至 32 個離散token表示256× 256 圖像。
💡 TiTok在ImageNet基準測試中表現優異，生成速度提高 410 倍，同時保持高質量樣本輸出。

12、MIT開發新算法DenseAV：通過觀看視頻學習語言含義

在MIT開發的新算法DenseAV中，研究人員利用機器理解動物的交流方式，通過觀看視頻學習語言的含義。該算法能夠無監督學習單詞的含義和聲音的位置，實現跨模態連接的自然區分。團隊希望應用於理解新語言和發現不同信號之間的模式關聯。

【AiBase提要:】
🧠 DenseAV是雙編碼器接地架構，學習高分辨率、語義意義和視聽對齊的特徵。
🔍 無監督學習發現單詞含義和聲音位置的關聯，自動區分語言和聲音。
🌐 在跨模態檢索方面優於以前的模型ImageBind，應用於學習大量視頻和理解新語言。
詳情鏈接:https://top.aibase.com/tool/denseav

13、讓AI更合乎倫理：Source.Plus 提供高質量AI訓練數據

Spawning 致力於爲藝術家提供更多對其作品在線使用的控制權，Source.Plus 項目推出的數據集包含近 4000 萬個公有領域圖片和採用 Creative Commons CC0 許可的圖片，爲AI模型的訓練提供高質量的數據。該平臺爲藝術家和創作者提供了更精細的作品使用權限管理，爲AI技術的發展和應用注入新活力。

【AiBase提要:】
🔍 數據搜索與整理：用戶可快速搜索各種媒體數據，整理標註以滿足訓練需求。
🌟 高質量訓練數據：經篩選審覈的數據保證安全質量，合法同意使用。
💡 應用場景廣泛：適用於各種AI模型訓練，提高準確性和魯棒性。
詳情鏈接:https://top.aibase.com/tool/source-plusSource.Plus

14、Mistral AI獲得6. 4 億美元B輪融資

Mistral AI近期宣佈獲得6. 4 億美元的B輪融資，估值提升至近 60 億美元。這一輪融資由General Catalyst領投，多家知名投資機構和公司參與，加速了Mistral在人工智能領域的發展和國際商業化進程。

【AiBase提要:】
🚀 Mistral AI獲得6. 4 億美元B輪融資，估值提升至近 60 億美元。
💡 General Catalyst領投，多家知名投資機構和公司參與，加速了Mistral在人工智能領域的發展和國際商業化進程。
💰 生成式AI市場預計未來十年內將以每年42%的複合增長率達到1. 3 萬億美元，Mistral此次融資將加速商業化進程，拓展分銷渠道。

15、自迴歸圖像生成模型LlamaGen

LlamaGen 是一項顛覆性創新，展示了即使在沒有視覺信號歸納偏差的情況下，自迴歸模型也能實現領先的圖像生成性能。該技術爲圖像生成領域帶來新可能性，爲未來研究提供新思路。

【AiBase提要:】
🔑 LlamaGen 提出了具有 16 倍降採樣比、0. 94 的重建質量和97% 碼書利用率的圖像分詞器，在 ImageNet 基準測試上表現優異。
🚀 LlamaGen 推出了一系列類別條件圖像生成模型，範圍從111M到3.1B參數，在 ImageNet256× 256 基準測試上取得了2. 18 的 FID，超越了流行的擴散模型。
💡 LlamaGen 推出了文本條件圖像生成模型，具有775M參數，在 LAION-COCO 的兩階段訓練後，展現出高質量的美學圖像和優秀的視覺質量與文本對齊性能。
詳情鏈接:https://top.aibase.com/tool/llamagen

16、未經同意人工智能利用兒童照片引發隱私安全挑戰

這篇文章揭露了人工智能圖像生成器在訓練數據集中未經允許使用巴西兒童個人照片的嚴重問題，引發了兒童隱私和安全的嚴峻挑戰。文章呼籲政府和科技公司承擔責任，保護兒童數據不被濫用，制定相應的保護措施。

【AiBase提要:】
🔒 未經允許使用兒童照片：人工智能圖像生成器訓練數據集中存在大量未經允許使用的巴西兒童個人照片，涉及兒童整個童年時期的珍貴片段。
⚠️ 兒童隱私風險：照片中包含兒童的姓名和位置信息，使其身份易被追蹤，可能導致欺凌、釣魚等風險，甚至生成不當內容。
⚖️ 呼籲保護措施：人權組織呼籲政府明確禁止未經允許使用兒童個人數據訓練AI系統，加強兒童數據保護，設計追責途徑。