研究稱，流行的人工智能基準 LMArena 據稱有利於大型供應商

Salesforce AI Research發佈多項創新，旨在解決企業AI系統在強大智能與穩定執行力之間的差距，即“鋸齒狀智能”。核心目標是構建更智能、可信、適用於企業應用的AI代理，並向“企業通用智能”（EGI）邁進。

研究重點在於量化和解決AI性能不一致性，推出了SIMPLE數據集作爲公開基準。更重要的是，Salesforce推出了CRMArena，一個模擬真實CRM場景的基準測試框架，用於全面評估AI代理在服務、分析和管理等角色中的表現。早期測試顯示，現有領先AI座席在函數調用成功率方面仍有提升空間。

人工智能 AI教育

在模型層面，Salesforce發佈了SFR-Embedding，一種在文本嵌入基準測試中領先的新模型，旨在更深入地理解上下文。同時推出了針對代碼搜索優化的SFR-Embedding-Code。此外，還推出了xLAM V2（大型動作模型），專注於預測和執行任務序列，尤其適用於需要與企業系統交互的自主代理。

爲解決企業對AI安全性的擔憂，Salesforce推出了SFR-Guard模型，增強了其信任層，爲AI代理的行爲提供保障。同時推出了ContextualJudgeBench，用於評估基於LLM的判斷模型。在多模態領域，推出了TACO模型，通過思維行動鏈解決複雜的多步驟問題，並在相關基準測試中取得顯著性能提升。

Salesforce強調與客戶的共同創新，客戶反饋是塑造企業AI路線圖的關鍵。通過應用Atlas推理引擎等先進技術，AI性能已得到顯著提升。

Salesforce的研究正值企業加速採用AI的關鍵時刻，其關注點在於將先進功能與可靠性能相結合。與追求更大模型的行業趨勢不同，Salesforce更側重於解決現實世界的業務需求。相關技術將在未來幾個月內逐步推出，首先應用於數據雲，併爲Agentforce的未來版本提供支持。Salesforce認爲，在企業AI競爭中，一致性和可靠性將最終勝出。

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

在圖像生成領域，Midjourney 近期推出了一項名爲 “Omni-Reference”（全向參考）的新功能，爲用戶帶來了更大的創作自由。這一全新圖像引用系統不僅是 V6版本中 “角色參考” 功能的升級版，更是賦予用戶在創作過程中對圖像元素的精準控制。核心功能:全向參考與多元素支持Omni-Reference通過先進的圖像參考系統，爲用戶提供了前所未有的創作控制力。AIbase梳理了其主要亮點: 精準元素指定:用戶可上傳參考圖像（如人物、動物、武器或車輛），通過提示明確要求“將此元素放入圖像”，生成

OpenAI宣佈放棄營利轉型，致力於讓 AGI 造福全人類

在成立十年之際，OpenAI 宣佈了一項重大組織結構調整，旨在讓通用人工智能（AGI）真正服務於全人類。創始人 Sam Altman 及其團隊決定將公司的營利部分轉型爲 “公共利益公司”(PBC)，這意味着公司將更加註重公共利益而非僅僅追求利潤。這一轉變的核心理念依然是讓 AGI 成爲人類歷史上最強大的工具，幫助每一個人創造價值。根據 OpenAI 最新的公告，非營利組織仍將對公司的整體運作進行監督與控制，而轉型後的 PBC 將在此框架下運營。OpenAI 明確表示，這一新結構旨在保持公司的初衷，並

Anthropic 推出 AI for Science 計劃，助力生命科學研究者實現更快科學發現

AI 公司 Anthropic 於5月6日正式宣佈啓動其全新計劃 ——AI for Science。這一項目旨在爲選定的研究人員提供大量免費的 API 積分，以促進科學研究與發現的進展。Anthropic 認爲，人工智能的先進推理和語言能力能夠極大地加速科學進步。藉助這些技術，研究人員可以更有效地分析複雜的數據，提出假設，設計實驗，並清晰地傳達研究成果。公司表示，AI 技術的運用將有助於縮短科學發現所需的時間和資源，從而幫助人類解決一些最爲緊迫的挑戰。圖源備註：圖片由AI生成，圖片授權服務商Midjourn

研究稱，流行的人工智能基準 LMArena 據稱有利於大型供應商

相關推薦

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

Grok語音模式全面上線馬斯克更改X暱稱造勢

OpenAI宣佈放棄營利轉型，致力於讓 AGI 造福全人類

iOS18.6或爲中國用戶啓用AI功能國行蘋果AI或由阿里百度技術支持

Anthropic 推出 AI for Science 計劃，助力生命科學研究者實現更快科學發現

研究稱，流行的人工智能基準 LMArena 據稱有利於大型供應商

相關推薦

Midjourney V7推出全新功能 “Omni-Reference”，讓圖像生成更靈活

Grok語音模式全面上線 馬斯克更改X暱稱造勢

OpenAI宣佈放棄營利轉型，致力於讓 AGI 造福全人類

iOS18.6或爲中國用戶啓用AI功能 國行蘋果AI或由阿里百度技術支持

Anthropic 推出 AI for Science 計劃，助力生命科學研究者實現更快科學發現

Grok語音模式全面上線馬斯克更改X暱稱造勢

iOS18.6或爲中國用戶啓用AI功能國行蘋果AI或由阿里百度技術支持