AI大模型真的引領了國內的“資本盛宴”嗎?是,也不是

來源:

來源:
DeepMind聯合創始人Demis Hassabis在播客中指出當前人工智能能力被誇大,但其長期潛力,特別是通用人工智能(AGI)方面,仍被低估。公衆對AI的關注形成雙刃劍效應,既展示了其未來在日常生活中的積極作用,也帶來了大量噪音。哈薩比斯讚賞AI模型通過語言學習推斷現實世界信息的能力,但對公衆對AI短期能力的過高期待表示擔憂。他認爲AI的長期潛力,尤其是AGI,將爲人類帶來巨大益處,如疾病治療、清潔能源和氣候變化應對。DeepMind項目預計在2030年前完成,但強調了防止AI濫用和失控的緊迫性,呼籲國際社會加強監管合作。哈薩比斯設想AI開發最後階段將需要全球頂尖專家共同應對挑戰。
Midjourney對網頁版圖像編輯功能進行了重大升級,推出全新整合界面,集局部重繪、圖像比例調整及提示詞編輯等功能於一體,顯著提升了操作效率和用戶交互體驗。這一更新旨在迴應用戶需求,迴應了近期在AI繪圖領域面臨的競爭壓力,特別是FLUX.1工具的出色表現。Midjourney通過升級來優化核心圖像生成能力,增強功能創新,以保持用戶基礎和市場競爭力。新版網絡編輯器的推出,旨在提供更流暢高效的創作環境,面對FLUX.1等新競爭者的挑戰,Midjourney強調持續創新與優化用戶體驗的重要性。
騰訊優圖實驗室與上海交通大學合作,發佈了一篇詳盡綜述,聚焦於提升大模型性能的關鍵環節——指令調優的數據集評估與選擇。該研究旨在幫助大模型掌握自然語言處理的精髓,通過分析數據質量、多樣性和重要性三個維度,指導如何構建高效、多樣且關鍵的數據集。研究指出,數據質量直接影響指令調優效果,多樣性確保模型泛化能力,重要性評估優化訓練過程。面對現有挑戰,如數據選擇與模型性能關聯性弱及評估標準不統一,專家呼籲建立專門基準與提高選擇管道的可解釋性,以適應不同任務需求。這項研究爲大模型發展提供了寶貴資源和方向,預示着大模型未來將更加智能,更好地服務於人類。
Geekbench AI是一款全新的跨平臺工具,旨在評估設備在AI密集型工作負載下的性能,通過測試CPU、GPU和NPU,判斷設備處理機器學習應用的能力。它支持多種AI框架,如ONNX、CoreML、TensorFlow Lite和OpenVINO,並從速度和準確性兩個維度評估性能,提供全精度、半精度和量化精度三個分數。此外,Geekbench AI的測試結果包含了準確性測量,以評估工作負載輸出與真實結果的接近程度。該工具已在Windows、macOS、Linux、Android和iOS平臺上發佈,用戶可下載試用。隨着AI技術的發展,Geekbench AI的出現改變了評估設備性能的方式,爲設備AI能力的評估提供了新標準。然而,AI性能測試仍處於早期階段,其與實際用戶體驗的關聯及準確反映不同AI應用場景下的設備表現還需進一步觀察。
Geekbench AI是一款全新跨平臺工具,用於評估設備處理密集型工作負載的性能,特別關注機器學習任務。它通過測量CPU、GPU和NPU性能,提供全精度、半精度和量化評分,並納入準確度評估。支持多種機器學習框架,包括ONNX、CoreML、TensorFlow Lite和OpenVINO。此工具在Windows、macOS、Linux、Android和iOS上均可使用,旨在全面評估設備在不同任務中的表現。