大型預訓練語言模型通過RAIN方法實現自我評估和安全防禦

站長之家

Published in AI News · 1 minute read · Jul 19, 2025

研究表明，大型預訓練語言模型（LLM），如GPT-3，具有出色的能力，可以理解和回答人類提出的問題，協助編碼工作等。最近，研究人員引入了RAIN方法，使LLM能夠自我評估和改進，無需額外數據和微調。這一方法不僅提高了LLM的性能，還降低了對敵對攻擊的成功率，爲AI生成更協調和安全的響應。這項研究爲調整LLM以滿足人類偏好提供了一種新的方法，無需額外信息或繁瑣的微調。

谷歌Gemini 2.0版正式發佈：2.0 Flash現已支持多模態輸出

谷歌公司及其母公司Alphabet的首席執行官桑達爾·皮查伊宣佈，公司推出了最新人工智能模型——Gemini2.0，這標誌着谷歌在構建通用AI助理領域邁出了重要一步。Gemini2.0在多模態輸入處理和原生工具使用方面展現了顯著進步，使得AI代理能夠更深入地理解周圍世界，並在用戶監督下代表用戶採取行動。

IBM突破性技術:光束取代銅線,AI訓練效率提升5倍

在數字時代，計算機芯片越來越小，但計算問題卻變得越來越大。隨着AI模型的不斷髮展，數據中心的能耗和計算需求正呈指數級增長。IBM近日推出的光學技術突破，有望徹底改變這一現狀。傳統數據中心面臨兩大技術瓶頸:銅線傳輸和電子傳輸速度的侷限。目前，大多數CPU都處於大量空閒狀態，僅僅是在等待數據包傳輸。這意味着計算資源的巨大浪費。圖源備註：圖片由AI生成，圖片授權服務商MidjourneyIBM的創新方案是使用光學技術替代傳統銅線。具體而言，公司開發了一種名爲聚合物光波

AI 視頻分析應用 Lloyd 上線三個月用戶突破5萬

四年曆史的 AI 初創公司 EndlessAI 最近推出的 iOS 應用 Lloyd 在悄然上線僅三個月後，已吸引了超過5萬用戶。loyd 的獨特之處在於，它利用自主研發的視頻流和編碼技術，將用戶的實時視頻與 AI 模型相結合，支持從自行車維修到講睡前故事等多種任務。目前，有41% 的用戶每天都會使用這個應用。儘管 Lloyd 尚未達到 ChatGPT 在2023年初兩個月內突破1億用戶的壯舉，但 EndlessAI 的首席執行官 Roi Ginat 和執行主席 Thomas Pompidou 對此感到十分振奮。他們表示，計劃在2025年初向第三方開發者開放平臺，並於

小紅書博主用AI創作衛生巾之歌獲贊1.4萬

在女性權益與產品質量的交叉點上，一首由AI生成的《衛生巾之歌》近日在社交媒體引發熱議。小紅書博主"女說女話"用富有力量的歌詞，將女性羣體在日常生活中面臨的尷尬和不便淋漓盡致地呈現出來。這首歌通過數字化的方式，精準地還原了女性一生中在生理期的艱辛旅程:小紅書@女說女話每月5天持續約40年總計約2400天使用約1.5萬片衛生巾花費不菲質量卻令人堪憂歌詞直白地指出了衛生巾產品存在的現實問題:長度不達標、安全性存疑，甚至可能導致穿着尷尬。這些細節戳中了衆多女性

遊戲裏的大喵佔領上海地標小紅書博主AI創意圖網絡刷屏

近日，一組充滿想象力的AI圖像在社交媒體瘋狂刷屏，將遊戲中的可愛角色"大喵"巧妙地融入上海城市景觀，引發網友熱烈討論。小紅書博主"曲元"用AI技術爲大家呈現了一系列超現實的城市奇景。這隻萌系角色彷彿擁有了魔法般的存在形式:在黃浦江上如充氣大船般漂流，悠閒地坐在東方明珠塔下曬太陽，還在武康大樓前"打卡"，甚至變身毛絨版飛機。這些充滿童趣的影像瞬間獲得4.3萬點贊，網友驚歎"暖媽們的創意太絕了"。事實上，這已經不是"曲元"首次玩轉IP與城市地標的跨界創意。此前