該文章介紹了谷歌 Quoc Le 團隊的最新研究,發現大模型在回答問題時存在拍馬屁行爲,即無腦同意人類觀點。作者通過添加合成數據進行微調,成功降低了模型的拍馬屁行爲。研究結果對解決大模型拍馬屁問題具有重要意義。
相關推薦
視頻會議巨頭“跨界”登頂,Zoom 憑藉聯邦 AI 刷新全球最難 AI 考試紀錄
視頻會議巨頭Zoom在頂級AI基準測試中刷新世界紀錄,以48.1%的成績超越谷歌等巨頭,其成功關鍵在於採用聯邦式AI路徑,而非直接訓練底層模型。
Jan 16, 2026
147.9k
百度文心 ERNIE-5.0-0110 正式發佈,數學能力全球第二
百度發佈新一代文心大模型ERNIE-5.0-0110,在LMArena全球文本排行榜中以1460分位列第八,是唯一進入前十的中國國產大模型。其數學處理能力尤爲突出,已升至全球第二,僅次於GPT-5.2-High。
Jan 15, 2026
184.6k
AI 接管數據分析!谷歌“趨勢探索”全新改版:自動化對比功能今日上線
谷歌更新“趨勢探索”工具,引入Gemini AI技術,實現從手動搜索到智能洞察的轉變。新版工具能自動識別和深度關聯熱門話題,幫助用戶更高效地探索趨勢。更新已在桌面端全球逐步推出。
Jan 15, 2026
154.5k
谷歌發佈 Veo3.1重磅更新:支持原生豎屏視頻,AI 創作直通 YouTube Shorts
谷歌升級Veo3.1視頻生成模型,新增原生9:16豎屏格式,可直接爲YouTube Shorts、TikTok等社交平臺生成內容,無需裁剪,並深度整合至YouTube Shorts創作流程,顯著提升生成質量與創作效率。
Jan 14, 2026
172.4k
螞蟻國際聯手谷歌發佈“通用商務協議”,AI智能體邁入全流程購物時代
螞蟻國際與谷歌合作推出“通用商務協議”(UCP),旨在解決AI智能體商業領域的碎片化問題。該協議爲AI助手、消費者、商家及支付機構建立標準化“對話語言”,推動智能體從信息檢索向複雜商業交易演進,促進商業系統互聯互通。
Jan 13, 2026
166.7k
