2025 年 2 月 27 日,OpenAI正式發佈了其最新聊天模型GPT-4.5,這一消息迅速在Twitter(現爲X平臺)上引發了廣泛討論。作爲OpenAI迄今爲止最強大的對話模型,GPT-4. 5 在性能上實現了顯著突破,但其高昂的價格也讓用戶和開發者們議論紛紛。與此同時,業內人士針對其能力與現有模型的對比展開了激烈爭論。
價格暴漲:一次問答堪比吃頓火鍋
GPT-4. 5 的定價相較於此前的GPT-4o高出 13 至 30 倍。具體而言,其API價格爲每百萬輸入Token75 美元,每百萬輸出Token150 美元。網友@verysmallwoods戲稱:“一頓操作下來,一次問答能吃頓火鍋了!”相比之下,GPT-4o的輸入價格爲每百萬Token5 美元,輸出價格爲 15 美元,而國內競爭對手如DeepSeek仍在通過“錯峯降價”搶佔市場份額。如此大幅的價格提升讓不少用戶直呼“離譜”,甚至有開發者表示,OpenAI可能需要重新評估是否繼續提供這一版本的API。
網友@AlchainHust更爆料稱,當他將GPT-4. 5 的價格信息輸入GPT-4o並詢問其看法時,GPT-4o竟然表示“不可能是真的,太離譜了”,並質疑數據的來源。這一互動引發了網友的調侃,同時也凸顯了GPT-4. 5 定價的爭議性。
模型能力:直觀理解提升,幻覺減少
儘管價格令人咋舌,GPT-4. 5 在性能上的表現依然是關注的焦點。GPT-4. 5 通過擴展無監督學習,顯著提升了對世界的直觀理解和知識廣度,並減少了模型常見的“幻覺”問題。與依賴推理鏈的o1 系列不同,GPT-4. 5 更多依靠大規模數據和計算能力來優化性能。在SimpleQA基準測試中,GPT-4. 5 的準確率達到62.5%,幻覺率降至37.1%,優於GPT-4o、o1 以及o3-mini的表現。這一進步被認爲是其“情商”更高的體現,尤其是在處理複雜對話和開放性問題時更爲自然流暢。
然而,@AlchainHust卻指出,儘管GPT-4. 5 在性能上有所提升,但在多項模型評測基準(benchmark)上“毫無亮點”,似乎與其高昂價格不成正比。相比之下,競爭對手如Anthropic的Claude 3.5 Sonnet(據稱GPT-4. 5 價格是其 25 倍)在性價比上更具優勢。
規模化智能的極致嘗試
OpenAI將GPT-4. 5 定位爲“僅通過擴大規模的預訓練把智能拉到極致”的模型。據twitter用戶透露,這一策略得到了OpenAI前首席科學家Ilya Sutskever此前的預測驗證,即通過增加數據和算力,模型性能曲線能夠持續上升。目前,GPT-4. 5 已對Pro用戶開放體驗,Plus和Team用戶則需等到下週才能使用。然而,高昂的成本也讓OpenAI內部對其商業化前景產生疑慮,甚至可能影響後續API的供應計劃。
市場反響與未來展望
從X平臺的用戶反饋來看,GPT-4. 5 的發佈既帶來了驚喜,也引發了質疑。一方面,其在理解力和對話質量上的提升被認爲是AI技術邁向新高度的標誌;另一方面,價格的飛漲讓許多中小型開發者和普通用戶望而卻步。與此同時,國內廠商如DeepSeek的低價策略正在加劇市場競爭,OpenAI的高端路線能否持續獲得認可仍是一個未知數。
總的來說,GPT-4. 5 的亮相無疑爲AI領域注入了新的話題。它的能力提升是否足以支撐其高昂定價?它與GPT-4o、o1 乃至其他廠商模型的差距究竟有多大?這些問題或許只有在更多用戶體驗和評測數據發佈後才能得出結論。在這場“性能與價格”的博弈中,OpenAI的下一步棋局值得密切關注。