告別AI“幻覺”？Vectara推出守護代理，聲稱能精準“糾錯”

人工智能（AI）在企業中的應用日益廣泛，但其固有的“幻覺”風險——即生成不真實或無根據的信息——一直是阻礙大規模部署的關鍵挑戰。儘管行業內涌現了衆多旨在減少幻覺的技術和方法，如檢索增強生成(RAG)、數據質量提升、護欄機制以及推理驗證等，但效果往往有限。近日，一家名爲Vectara的公司推出了一種全新的解決方案:“Vectara 幻覺矯正器”，旨在通過監護代理自動識別、解釋和糾正AI產生的幻覺，爲企業級AI應用帶來新的希望。

AI教育演講人工智能 (3)

Vectara 最初是 RAG 技術的早期倡導者。RAG 通過從提供的內容中提取信息來減少幻覺，但並非萬無一失。與現有方案側重於檢測或預防不同，Vectara 的監護代理採取了主動糾正的策略。這種守護代理本質上是監控 AI 工作流程並實施保護措施的軟件組件，它以代理式 AI 的方式應用糾正，在保留整體內容的同時進行精準修改，並提供詳細的修改原因解釋。Vectara 聲稱，該系統已成功將小型語言模型（參數小於70億）的幻覺率降低到1% 以下。

Vectara 首席產品官 Eva Nahari 強調，隨着企業更多地採用代理式工作流程，幻覺帶來的負面影響將成倍放大，這正是他們推出守護代理的原因，旨在構建更值得信賴的企業級 AI。

爲了進一步推動幻覺矯正技術的發展，Vectara 還發布了一個名爲 HCMBench 的開源評估工具包。該基準提供了一個標準化的方法來評估不同幻覺矯正模型的效果，支持多種評估指標，旨在幫助整個社區評估幻覺矯正聲明的準確性，包括 Vectara 自身的方案。

Vectara 的創新方法爲企業應對 AI 幻覺風險提供了一個新的思路。相較於僅僅檢測或在高風險場景中放棄使用 AI，企業現在可以考慮部署能夠主動糾正錯誤的方案。這種方法尤其適用於對準確性要求極高的高價值工作流程。當然，企業在引入此類自動糾正機制的同時，仍應考慮保留一定的人工監督能力，並利用 HCMBench 等基準工具進行充分評估。隨着幻覺矯正技術的不斷成熟，企業有望在更多以前受限的領域安全地部署 AI，同時確保關鍵業務運營所需的準確性。

逆天改命！Flow-GRPO 讓圖像生成模型秒變 “大神”

家人們，今天必須給你們嘮嘮科研界的一項超酷新成果 ——Flow-GRPO!這東西可不得了，它就像是給圖像生成模型打了一針 “超級進化劑”，直接讓它們從 “青銅” 一路飆升到 “王者”。想知道它是怎麼做到的嗎?快搬好小板凳，聽我細細道來!圖像生成模型的 “成長煩惱”現在的圖像生成模型，比如基於流匹配（Flow matching）的那些，理論基礎那叫一個紮實，生成的高質量圖像也讓人眼前一亮。但它們也有自己的 “小煩惱”，遇到複雜場景，像要安排好多物體、處理各種屬性和關係，或者

中國版Cursor！騰訊推出 AI 編程助手 CodeBuddy

騰訊推出了一款新的代碼助手插件 ——CodeBuddy3.0。這款產品與微信小程序的開發工具實現了深度整合，標誌着騰訊在開發者生態中的又一重要佈局。CodeBuddy 並不是一個獨立的集成開發環境（IDE），而是一個可安裝在各種開發工具中的插件，方便開發者在不同的編碼平臺上使用。CodeBuddy主要亮點之一是其創新的 Craft 模式。該模式使得 AI 能夠自主理解用戶需求，並完成多文件的代碼生成和改寫。用戶只需通過簡單的自然語言指令，AI 便能自動生成可執行的應用項目。這意味着開發者不再僅僅

Devv2.0正式開啓 Private Beta:AI 驅動的開發者工具迎來全新升級

2025年5月13日，人工智能驅動的開發者工具平臺 Devv 正式宣佈其2.0版本進入 Private Beta 階段。這一消息標誌着 Devv 在過去兩年間的重大轉型，從最初的 AI 搜索引擎進化爲一款更智能、更高效的開發者生產力工具，旨在通過生成和部署代碼的創新方式，重新定義開發者工作流程。從搜索到生成:Devv2.0的戰略轉型Devv 最初於2023年推出，定位爲一款面向開發者的 AI 搜索引擎，旨在幫助開發者快速查找技術答案。然而，隨着人工智能技術的飛速發展和 AI 編程範式的變革，Devv 團隊敏銳地捕捉到市場需

Google將Gemini智能助手引入Android Auto，提升駕車體驗

在最近的 AndroidShow 活動上，Google 宣佈將在未來幾個月內將其生成式人工智能助手 Gemini 整合進所有支持 Android Auto 的汽車中。公司高層表示，這一創新將顯著提升駕駛的效率與樂趣。Android for Cars 的副總裁帕特里克・布雷迪在與媒體的虛擬會議中指出，Gemini 的引入將是車載體驗歷史上最重大的變革之一。Gemini 的功能將體現在兩個主要方面:首先，它將作爲一款更爲強大的智能語音助手，讓駕駛員和乘客可以通過自然語言與其進行互動。用戶可以簡單地說出需求，例如發送短信、播放音樂，

騰訊混元攜手科研機構推出首個多模態統一CoT獎勵模型並開源