智源研究院推出包含文生視頻模型對戰評測服務：FlagEval大模型角鬥場

2024年9月4日，北京智源人工智能研究院（BAAI）宣佈推出全球首個包含文生視頻的模型對戰評測服務——FlagEval大模型角鬥場。

這一服務面向用戶開放，覆蓋了國內外約40款大模型，並支持語言問答、多模態圖文理解、文生圖、文生視頻等四大任務的自定義在線或離線評測。FlagEval大模型角鬥場的推出，不僅提供了簡單理解、知識應用、代碼能力、推理能力等多種預設問題的評測，還首次引入了主觀傾向階梯評分體系，以更精確地揭示模型性能差異。

微信截圖_20240905084138.png

該服務採取匿名機制進行評測，確保評測過程的公正性。用戶可以通過網頁端或國內首個移動端訪問入口參與評測，體驗高效的模型對戰評測。FlagEval大模型角鬥場的評分結果將即時公示，形成角鬥場榜單，展現各模型的對戰能力。

智源研究院表示，將對模型對戰評測的全鏈路數據進行開源，以促進大模型評測生態的發展。FlagEval大模型角鬥場的推出，進一步拓展了智源在模型評測領域的技術佈局和工具方法的研發，爲人工智能領域的研究和應用提供了新的測試和評估工具。

體驗地址:https://flageval.baai.ac.cn/#/home

WAIC2026 大會火力全開！大模型概念股 MINIMAX 與智譜股價狂飆超 8%

在即將召開的2026世界人工智能大會前，港股AI大模型概念股集體走強。7月15日，MINIMAX-W飆升12.52%，智譜漲8.81%，羣核科技漲6.11%。上漲動力源於大會利好及大行上調權重股目標價。本屆WAIC2026將於7月17日至20日在上海舉行，聚焦人工智能三大核心。

69%美國受訪者支持強制AI巨頭轉讓50%股權以平抑失業衝擊

民調顯示，69%美國成年人支持強制大型AI企業將50%股權移交公共主權財富基金。該結果呼應參議員桑德斯提出的《美國人工智能主權財富基金法案》，計劃對美國最大AI公司實施50%公共持股，以此構建規模達7萬億美元的公共信託基金。

智源研究院推出包含文生視頻模型對戰評測服務：FlagEval大模型角鬥場

相關推薦

WAIC2026 大會火力全開！大模型概念股 MINIMAX 與智譜股價狂飆超 8%

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

69%美國受訪者支持強制AI巨頭轉讓50%股權以平抑失業衝擊

200 餘名頂尖專家含 16 位諾獎得主聯合呼籲：必須引導AI朝着有利於人類的方向發展

PixVerse 完成 4.39 億美元 C 輪擴展融資估值飆升至 20 億美元

智源研究院推出包含文生視頻模型對戰評測服務：FlagEval大模型角鬥場

相關推薦

WAIC2026 大會火力全開！大模型概念股 MINIMAX 與智譜股價狂飆超 8%

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

69%美國受訪者支持強制AI巨頭轉讓50%股權以平抑失業衝擊

200 餘名頂尖專家含 16 位諾獎得主聯合呼籲：必須引導AI朝着有利於人類的方向發展

PixVerse 完成 4.39 億美元 C 輪擴展融資 估值飆升至 20 億美元

PixVerse 完成 4.39 億美元 C 輪擴展融資估值飆升至 20 億美元