百川智能聯合天津大學推出“Sibyl System”Agent框架登頂大模型複雜任務榜單GAIA

百川智能與天津大學合作推出了"Sibyl System"智能體框架，並在GAIA Leader Board上取得了第一名的成績。GAIA是Meta、Huggingface和AutoGPT於2023年11月提出的全新評測方案，主要評測Agent在複雜任務執行方面的能力和方案。這個評測方案揭示了現有模型的能力缺陷，併爲模型和Agent的研發提供了改進方向。

GAIA的測試題目更接近真實世界，要求AI具備推理、多模態理解（文本、圖片、音/視頻）、網頁瀏覽和使用工具等能力。這些題目對人類來說不難理解，但對模型來說極具挑戰性。例如，GPT-4在測試中的成功率僅爲15%，而人類實驗者可以達到92%。完成這些題目通常需要較長的邏輯鏈路和時間，涉及多個步驟和工具。

微信截圖_20240724082043.png

"Sibyl System"框架的設計特點包括:

類人的瀏覽器界面替代檢索增強生成。
問答替代對話，使用無狀態的問答函數，簡化系統架構。
僅使用網頁瀏覽器和Python環境這兩個通用工具，減少對專用工具的依賴。
從System1到System2，引入“陪審團”機制，通過多代理辯論進行自我批評和修正，利用全局工作區中的信息提高響應的準確性。

Sibyl System是一個結構簡單但功能強大的基於大型語言模型的Agent框架，能夠通過使用少量工具解決複雜的推理問題。它通過引入Global Workspace和Multi-Agent機制，以及基於瀏覽器的通用信息獲取渠道，降低了系統複雜度，同時擴展瞭解決問題的複雜度，實現了模型從“快思考”到“慢思考”的轉變。Sibyl System還具有很好的可擴展性和易於調試的特點，可以輕鬆替換其他模型的Agent模塊，提升模型的能力。

技術報告:https://arxiv.org/pdf/2407.10718

馬斯克預計特斯拉FSD年底前在華獲批 Robotaxi 10 月 10 日發佈

特斯拉2024年第二季度財報數據顯示，公司營收255億美元，雖同比微增2%，但淨利潤大幅降至14.94億美元，盈利能力明顯趨弱，降幅達45%，每股收益同比下跌46%，未達市場預期。其中，汽車業務營收198.78億美元，下滑7%，發電和儲能業務營收30.14億美元，猛增100%，服務及其他業務營收同比增長21%。然而，汽車總產量降至410831輛，同比下降14%，總交付量也減少5%。同時，運營利潤爲16.05億美元，同比下降33%，毛利率降至18%，營運成本支出同比大漲39%，研發成本高達10.74億美元。特斯拉預計2024年汽車銷量增長低於2023年水平，FSD預計12.6版本發佈後將在全球推出，並計劃在10月10日公佈Robotaxi計劃。爲降低成本與提升效率，特斯拉將繼續優化製造流程、加大軟件相關利潤投資。與此同時，新車計劃有望在2025年上半年開始生產，利用新一代平臺技術實現產品躍升。

OpenAI推出GPT-4o mini微調功能每天免費200萬訓練Tokens

近日，人工智能領軍企業OpenAI宣佈爲其新型小規模模型GPT-4o mini推出微調功能，旨在提升模型在特定應用場景中的表現。這一舉措將爲開發者和企業用戶帶來更多定製化的AI解決方案。據OpenAI官方消息，從即日起至 9 月 23 日，用戶每天可免費微調GPT-4o mini，最高可達 200 萬訓練Tokens。超出部分將按每百萬Tokens 3. 00 美元收費。 9 月 24 日之後，所有微調訓練將統一按每百萬Tokens 3. 00 美元計費。

扎克伯格：Llama 3.1有望成爲開源AI的Linux

Meta公司首席執行官馬克·扎克伯格近日宣佈了Llama3.1的正式發佈，並表示這可能是開源AI領域的一個重要里程碑。Meta此次推出了三個不同規模的Llama3.1模型，其中最引人注目的是擁有4050億參數的大型模型。扎克伯格稱這是"目前最先進的開源模型"，在某些領域甚至可以與領先的閉源模型相媲美。

快手：添加AIGC內容“作者聲明”不會影響作品流量

快手推出AI生成內容"作者聲明"功能，旨在減少誤解。此功能鼓勵在使用AI自動生成文本、圖片、視頻等創作前，創作者添加內聲明。即日起，發佈內容時依據手冊操作。聲明在內容發行中註明AI生成內容，解決創作者疑慮：添加聲明不影響作品流量，但需遵循國家法律與平臺規則。如更新快手APP至最新版本仍無法操作，可尋求幫助。該功能旨在與創作者共同利用AI技術，明確內容來源，共建多元化、真實、有趣的社區環境。

Meta推出開源大語言模型Llama 3.1 405B，性能堪比GPT-4

近日，Meta公司宣佈開源其最新大語言模型Llama3.1405B。這一重磅消息標誌着經過一年的精心籌備，從項目規劃到最終審覈，Llama3系列模型終於與公衆見面。Llama3.1405B是一個具有1280億參數的多語言工具使用模型。該模型在8K上下文長度預訓練後，進一步通過128K上下文長度持續訓練而成。根據Meta的說法，這個模型在多項任務中的表現可與業界領先的GPT-4相媲美。

百川智能聯合天津大學推出“Sibyl System”Agent框架 登頂大模型複雜任務榜單GAIA