OpenAI最新推出的o1模型在AI領域掀起了一陣波瀾。這個曾被公司內部戲稱爲"草莓"的模型,爲ChatGPT用戶帶來了體驗AI"思考"過程的新機遇。然而,這個備受期待的模型究竟是否真的值得一試?答案似乎是:有喜有憂。
o1模型在某些方面確實展現了顯著的進步。它在推理和解決複雜問題上的表現令人印象深刻,特別是其"多步推理"能力。這種能力允許模型在回答問題前先進行"思考",將大問題拆解成小步驟,並嘗試識別每個步驟的正確性。這種方法雖然並非全新概念,但o1的實現使其成爲了可行的技術。
然而,o1模型也存在一些明顯的缺陷。與GPT-4o相比,o1在工具使用、多模態能力和處理速度上都有所不足。更值得注意的是,o1的使用成本約爲GPT-4o的四倍,這無疑會影響其廣泛應用。OpenAI甚至坦言,對於大多數日常任務,GPT-4o仍然是更好的選擇。
o1模型在實際應用中展現了其獨特價值。例如,在幫助規劃感恩節晚餐這樣的複雜任務中,o1能夠提供詳細、周到的建議,考慮到諸如烤箱管理、成本控制等多個因素。然而,在處理簡單問題時,o1卻顯得有些"過度思考",給出冗長而不必要的回答。
業內專家對o1模型的評價褒貶不一。紐約大學的AI模型研究教授Ravid Shwartz Ziv認爲,儘管o1令人印象深刻,但整體提升並不顯著。ReWorkd的研究工程師Rohan Pandey則表示,o1的推理能力雖然強大,但並不代表一種革命性的進步。
o1模型的定價策略也引發了討論。除了常規的輸入輸出費用外,用戶還需要爲模型的"思考過程"支付額外的"推理標記"費用。這種定價模式強調了謹慎使用o1的必要性,以避免在簡單問題上產生不必要的高額費用。
儘管存在這些侷限性,o1模型仍然展示了AI在複雜推理方面的潛力。它可能成爲幫助用戶審視重大決策的有力工具,特別是在需要深入分析和多角度考慮的場景中。然而,o1是否值得其高昂的價格,仍然是一個有待商榷的問題。
OpenAI的CEO Sam Altman也對外界過高的期望進行了降溫,強調o1並非通用人工智能,仍然存在諸多缺陷和侷限性。這種坦誠的態度也反映了AI行業對技術進步的理性認知。