知名基準測試工具Geekbench推出了一款全新的跨平臺工具,旨在評估設備在AI密集型工作負載下的性能表現。這款名爲Geekbench AI的工具通過測試設備的CPU、GPU和NPU(神經網絡處理器)性能,來判斷其處理機器學習應用的能力。
Geekbench的開發商Primate Labs此前一直在以Geekbench ML的名義開發這款軟件,並於2021年推出了預覽版。如今,他們將其更名爲Geekbench AI,這一改變似乎順應了當前AI技術的熱潮。爲了全面探索不同硬件在各種AI相關任務中的表現,Geekbench AI從速度和準確性兩個維度評估性能,並支持多種框架,包括ONNX、CoreML、TensorFlow Lite和OpenVINO。

Geekbench AI的測試結果包含三個分數:全精度、半精度和量化精度。Primate Labs表示,這些分數還包含了準確性測量,用於評估工作負載輸出與真實結果的接近程度,即"模型執行預期任務的準確性"。
目前,Geekbench AI已經在Windows、macOS、Linux、Android和iOS平臺上發佈,用戶可以下載試用。然而,要全面瞭解這些測試分數與實際任務性能的關聯,我們還需要更多時間來測試搭載本地AI功能的設備,如Copilot Plus PC和各種新型智能手機。
與傳統的幀率或加載時間測試不同,Geekbench AI的出現意味着我們可能需要開始關注預測文本的準確性,或者生成式AI圖像編輯器的表現等新指標。這反映了AI技術正在深刻改變我們評估設備性能的方式。
Geekbench AI的推出無疑爲設備AI能力的評估提供了一個新的標準。隨着越來越多的設備集成AI功能,這類測試工具的重要性將日益凸顯。它不僅能幫助消費者更好地瞭解和比較不同設備的AI性能,也爲硬件廠商提供了優化AI性能的參考指標。
然而,我們也應該認識到,AI性能測試仍處於早期階段。Geekbench AI的測試結果如何與實際用戶體驗相關聯,以及如何準確反映不同AI應用場景下的設備表現,都還需要進一步觀察和驗證。
未來,我們可能會看到更多類似的AI性能測試工具出現,它們將從不同角度評估設備的AI能力。這種趨勢也反映了AI技術正在成爲評判設備性能的一個重要維度,與傳統的CPU、GPU性能同等重要。
