松下推出 “OmniFlow” 多模態生成AI實現文本、圖像與音頻的自由轉換

松下控股公司（Panasonic HD）聯合美國松下研發公司(PRDCA)及加州大學洛杉磯分校(UCLA)的研究人員，成功開發出名爲 “OmniFlow” 的多模態生成 AI。這項技術的亮點在於其具備 “任意對任意” 的生成能力，可以實現文本、圖像和音頻之間的自由轉換，極大地提升了多模態生成 AI 的應用潛力。

近年來，多模態生成 AI 的研究越來越受到關注，尤其是結合音頻的生成技術。然而，傳統方法在數據獲取上存在侷限，尤其是在同時處理文本、圖像和音頻數據時，所需的訓練數據量和成本大幅增加。針對這一難題，OmniFlow 通過靈活結合針對不同數據格式的生成 AI（如文本與音頻、文本與圖像），即使在小樣本情況下，也能學習到高精度的 “任意對任意” 模型，從而顯著降低了數據採集的成本。

OmniFlow 的技術創新已獲得國際認可，並將在2025年計算機視覺與模式識別會議（CVPR）上進行展示。該技術的核心在於，它能夠通過連接和處理三種不同數據特徵，學習更爲複雜的數據關係，而不是簡單地對輸入數據進行平均處理。這種方法讓 OmniFlow 在生成過程中不僅保留了各模態的特點，也提升了表達能力。

在評估實驗中，OmniFlow 在 “文本轉圖像” 和 “文本轉音頻” 的生成任務中，表現優於其他傳統方法，展現出最佳的性能。實驗結果顯示，與其他 “任意對任意” 生成方法相比，OmniFlow 所需的訓練數據量可減少至1/60，這一顯著的優勢讓其在多模態 AI 領域脫穎而出。

展望未來，OmniFlow 有望在工廠、生活方式等多個領域進行應用，能夠生成各種專門針對特定場景的數據。松下控股將繼續推動 AI 的社會化應用，致力於開發能爲客戶生活與工作帶來便利的 AI 技術。

松下全新 OmniFlow 多模態大模型，實現文本、圖像與音頻自由切換

隨着人工智能技術的不斷進步，多模態數據處理逐漸成爲熱門話題。近日，全球知名電器品牌松下推出了其最新研發的多模態大模型 ——OmniFlow。這一模型能夠在文本、圖像和音頻等多種模態之間進行高效轉換，實現任意到任意的生成任務，爲用戶帶來了更加靈活的體驗。OmniFlow 的設計理念基於模塊化，允許模型的各個組件獨立進行預訓練。這種方式不僅提高了訓練效率，還避免了傳統模型在整體訓練中資源浪費的問題。具體來說，文本處理模塊可以在海量文本數據上進行訓練，提升對語

Manus推出文生視頻功能，力圖與OpenAI的Sora一較高下

AI 初創公司 Manus 近日宣佈推出其全新的 “文生視頻” 功能，旨在爲用戶提供通過簡單文本指令生成視頻的便捷體驗。該功能目前已經面向 Basic、Plus 和 Pro 會員用戶開放搶先體驗。Manus 在社交媒體平臺 X 上表示，用戶只需輸入文本命令，其智能系統便能在幾分鐘內將這些指令轉換成結構清晰、故事連貫的視頻，展示了其在 AI 視頻生成領域的強大能力。此項新功能的推出，讓人不禁想起 OpenAI 早前發佈的 Sora，後者也提供了類似的文本到視頻轉換服務。Sora 的使用需要通過 ChatGPT 的付費賬戶

Reddit起訴Anthropic非法抓取數據訓練Claude:要求刪除所有含Reddit內容的AI模型

Reddit已在舊金山高等法院對人工智能公司Anthropic提起訴訟，指控其未經許可系統性抓取Reddit帖子訓練Claude語言模型，違反平臺用戶協議和商業使用規定。這起訴訟凸顯了AI訓練數據獲取的法律爭議，以及內容平臺與AI公司之間日益緊張的關係。Reddit要求法院強制Anthropic刪除所有包含Reddit內容的AI模型和數據集，並禁止其將基於Reddit數據訓練的AI模型用於商業用途。技術保護措施遭繞過根據訴訟文件，Anthropic無視Reddit的用戶協議規定，繞過了robots.txt文件和基於IP的速率限制等技術保障措施。更

OpenAI宣佈付費ChatGPT用戶突破300萬，增長勢頭強勁

在最近的在線直播活動中，OpenAI 隆重宣佈其付費 ChatGPT 商業訂閱用戶數量已經突破300萬。這一數字的迅速增長顯示了人工智能技術在商業領域中的強大吸引力與廣泛應用，短短四個月內便新增了100萬用戶，充分反映了市場對智能聊天工具的需求日益增加。自2023年8月推出 ChatGPT Enterprise 以來，OpenAI 的多款商業產品相繼問世，其中包括2024年1月推出的 ChatGPT Team 和2024年5月推出的 ChatGPT Edu。這些產品的推出爲企業用戶提供了更多的選擇，極大地促進了付費用戶的增長。在2024年9月時，OpenAI 宣佈

法國AI巨頭Mistral推出企業編碼助手，正面挑戰GitHub C0pilot霸主地位

法國人工智能公司Mistral AI週三發佈全新企業編碼助手Mistral Code，通過獨特的本地部署和深度定製能力，向微軟GitHub Co pilot主導的企業軟件開發市場發起最強有力的挑戰。這款新產品將Mistral最新AI模型與集成開發環境插件相結合，專門爲具有嚴格安全要求的大型企業設計內部部署選項。與傳統軟件即服務編碼工具不同，Mistral Code允許企業在自有基礎設施中部署完整AI技術棧，確保專有代碼永不離開公司服務器。"我們最重要的特點是提供更多定製服務，並在本地爲模型提供服務，"Mistral AI研究