AI日報：王炸！ElevenLabs推聲音設計功能；全能型圖像生成模型OmniGen問世；快50倍！OpenAI推全新模型sCM

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、ElevenLabs推出AI語音生成工具Voice Design

ElevenLabs最新推出的AI語音生成工具Voice Design開創了AI配音領域的新紀元，通過簡單的文本描述即可創建個性化語音，爲用戶提供了直觀的文本提示功能，支持調節多個語音參數，包括年齡、性別、口音、語調和音高，同時突破性地支持創作角色化語音，爲內容創作者提供了前所未有的聲音定製自由。

【AiBase提要:】
🔊 用戶只需描述所需聲音特徵，系統快速生成符合要求的語音。
🎭 Voice Design支持創作角色化語音，捕捉並還原虛擬角色的聲音特徵。
🌐 AI語音定製化進入全新階段，爲遊戲開發、有聲內容製作等領域提供強大的創意工具。
詳情鏈接:https://elevenlabs.io/voice-design

2、吊打ControlNe?全能型圖像生成模型OmniGen問世，簡單提示實現圖像生成與精細編輯

OmniGen是一款全新的圖像生成模型，與以往工具不同的是，它具備多種能力，包括文本到圖像生成、圖像編輯等，用戶只需提供簡單提示詞即可控制圖像生成與精細編輯，無需使用ControlNe等插件。該模型架構簡化，結合了變分自編碼器和預訓練的Transformer模型，訓練數據集龐大多樣，表現優秀。

【AiBase提要:】
⚙️ OmniGen具備多種能力，包括文本到圖像生成、圖像編輯，用戶體驗極佳。
🔥 OmniGen採用簡化架構，結合變分自編碼器和Transformer模型，訓練數據集龐大多樣，效果出色。
🌟 OmniGen在多項測試中表現驚豔，文本到圖像生成能力與市面先進模型相當，圖像編輯能力優秀。
體驗入口:https://huggingface.co/spaces/Shitao/OmniGen

3、科大訊飛星火4.0Turbo大模型發佈

科大訊飛在全球1024開發者節上展示了訊飛星火4.0Turbo大模型，超越了之前版本和GPT-4Turbo，在數學和編程能力上表現出色，效率提升50%。同時推出了星火代碼7B版本和超擬人數字人，實現了語義貫穿的自然交互體驗。

【AiBase提要:】
✨ 訊飛星火4.0Turbo在數學和編程能力上超越了GPT-4Turbo，整體效率提升50%。
🔥 在14項主流測試中取得9項第一名成績，展現出卓越的性能表現。
💡 推出星火代碼7B版本和超擬人數字人，實現了多模態交互和更真實的交互體驗。

4、OpenAI推全新模型sCM，內容生成速度提升50倍，生圖只需0.1秒

OpenAI的研究團隊發佈了一項令人振奮的研究成果，介紹了全新的連續時間一致性模型（sCM），其生成多媒體內容的速度實現了飛躍，相較傳統擴散模型提高了50倍。sCM在不到0.1秒內生成一幅圖像，僅需兩步採樣即可生成高質量樣本，未來應用廣泛，潛力巨大。

【AiBase提要:】
📈 速度提升50倍，圖像生成時間縮短至0.1秒
🖼️ 僅需兩步採樣，sCM能生成高質量樣本，效率顯著提高
⚙️ 未來應用廣泛，包括實時圖像、音頻和視頻生成，潛力巨大
詳情鏈接:https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

5、谷歌開源AI文本水印工具SynthID

谷歌最近開源了文本水印工具SynthID，旨在幫助開發者更好地識別AI生成的文本。這一舉措對應對虛假信息和不當內容具有重要意義，同時推動了AI技術的發展和應用。

【AiBase提要:】
📜 SynthID開源，助力開發者識別AI生成文本。
🛠️ 水印技術在應對虛假信息和不當內容中愈發重要。
💡 谷歌的SynthID能微調文本生成的概率分數，形成水印。
詳情鏈接:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn

6、iOS18.2beta1已經向開發者發佈包含集成的 ChatGPT

蘋果最近發佈了 iOS18.2的第一個開發者測試版，增加了一些新的 Apple Intelligence 功能，包括 Genmoji 表情符號、Image Playground 圖像生成、AI 驅動的寫作功能、ChatGPT 集成和 Visual Intelligence 等。蘋果的 Apple Intelligence 功能旨在提供更智能、個性化的體驗，但某些功能如讓 Siri 瞭解屏幕內容尚未實現。

【AiBase提要:】
🌟 iOS18.2Beta1中 Siri 正式接入 ChatGPT，增強自然語言理解能力。
🎨 新增的 Genmoji 和 Image Playground 功能允許用戶生成個性化的表情符號和圖像。
📱 Visual Intelligence 功能支持通過 iPhone16相機進行智能搜索，提升信息獲取效率。

7、14歲少年沉迷聊天機器人後不幸離世，Character.AI 和谷歌面臨訴訟

這篇文章報道了一名14歲少年因沉迷於與Character.AI的聊天機器人互動而選擇結束生命，引發了一場訴訟。文章揭露了Character.AI被指控存在失職和誤導行爲，涉及提供未經許可的心理治療以及過度擬人化的聊天機器人設計。同時，Character.AI宣佈了一系列新的安全措施以保護未成年用戶，減少心理健康風險。

【AiBase提要:】
🔍 訴訟揭露Character.AI和谷歌被指存在失職和誤導行爲，引發關注和討論。
💬 被指控提供未經許可的心理治療，聊天機器人設計過度擬人化，引發道德和法律爭議。
🔒 Character.AI宣佈新安全措施，包括修改未成年人模型、加入免責聲明等，提升用戶保護措施。

8、OpenAI 科學家:20秒思考能比10萬倍數據更有效!

在最近的 TED AI 大會上，OpenAI 的研究科學家諾亞姆・布朗介紹了 OpenAI 新發布的 o1模型，強調了系統二思維對於改變各行業決策方式的重要性。布朗指出，20秒的思考時間能帶來比10萬倍數據更好的效果，而 o1模型在多個領域展現出卓越性能。他強調 AI 需要超越數據處理，進入更深思熟慮的系統二思維。

【AiBase提要:】
🧠 系統二思維是未來 AI 發展的關鍵，能提升決策質量。
⏳20秒的思考時間能帶來比10萬倍數據更好的效果。
💡 OpenAI 新發布的 o1模型在多個領域展現出卓越的性能。

9、研究人員開發了新 LLM 越獄方法，成功率高達65%

近日，網絡安全公司 Palo Alto Networks 的 Unit42研究團隊發佈了一項令人矚目的研究，揭露了一種名爲 “Deceptive Delight”的新型越獄方法。該方法能夠在僅僅兩到三次交互中，成功誘導大型語言模型（LLM）生成有害內容，其成功率高達65%，爲保護 LLM 的安全性敲響了警鐘。

【AiBase提要:】
🔍 新型越獄方法兩到三次交互中誘導 LLM 生成有害內容，成功率高達65%。
📈 不同模型的成功率差異明顯，單一模型成功率最高可達80.6%。
🛡️ 建議增加內容過濾器和清晰的系統提示，提升安全性。

10、蘋果發佈三款適用於Apple Intelligence的API

蘋果公司最新發佈的開發者測試版帶來了多項新的 Apple Intelligence 功能，包括 Genmoji、Image Playground、Visual Intelligence、Image Wand 和 ChatGPT 集成合，極大地增強了用戶體驗。此次更新還推出了三個關鍵功能的 API，幫助開發者將蘋果的小型模型生成 AI 集成到應用程序中。雖然擴展了英語本地化支持多個國家，但未來將支持更多語言，對中國和歐盟用戶可能存在不確定性。