AI挑戰醫療專業考試:GPT-4在日本物理治療師考試中表現亮眼

最新發表在《Cureus》雜誌上的一項同行評審研究顯示，OpenAI的GPT-4語言模型在未經任何額外訓練的情況下，成功通過了日本國家物理治療考試。

研究人員向GPT-4輸入了1，000個問題，涵蓋記憶、理解、應用、分析和評估等方面。結果顯示，GPT-4總體上正確回答了73.4%的問題，通過了所有五個測試部分。然而，研究也揭示了AI在某些領域的侷限性。

GPT-4在一般問題上表現出色，正確率達80.1%，但在實際問題上僅爲46.6%。同樣，它在處理純文本問題（80.5%正確）方面遠優於帶有圖片和表格的問題(35.4%正確)。這一發現與先前關於GPT-4視覺理解侷限性的研究結果一致。

值得注意的是，問題難度和文本長度對GPT-4的性能影響不大。儘管該模型主要使用英語數據訓練，但在處理日語輸入時也表現良好。

研究人員指出，雖然這項研究展示了GPT-4在臨牀康復和醫學教育方面的潛力，但仍需謹慎看待。他們強調，GPT-4並不能正確回答所有問題，未來還需要評估新版本以及該模型在書面和推理測試中的能力。

此外，研究人員提出，像GPT-4v這樣的多模態模型可能在視覺理解方面帶來進一步的改進。目前，谷歌的Med-PaLM2、Med-Gemini等專業醫療AI模型，以及Meta基於Llama3的醫療模型都在積極開發中，旨在在醫療任務中超越通用模型。

然而，專家們認爲，醫療AI模型要廣泛應用於實踐可能還需要很長時間。當前模型的誤差空間在醫療環境中仍然過大，需要在推理能力上取得顯著進步，才能安全地將這些模型整合到日常醫療實踐中。

旗艦模型需求激增，OpenAI緊急解鎖GPT-5.6Sol算力限制

面對GPT-5.6 Sol需求的48小時爆發式激增，OpenAI宣佈臨時取消Plus、Pro和Business用戶的5小時使用限制，以釋放集中算力。產品負責人表示，Codex與ChatGPT Work高強度使用下，平臺已重置所有用戶的一次性額度，保障編程與智能體工作流不中斷。同時，OpenAI正對GPT-5進行全面優化。

被寄予厚望的AI瀏覽器夭折，OpenAI正式宣佈關停Atlas

OpenAI近日宣佈關停上線僅九個月的AI瀏覽器Atlas。該產品去年高調問世，主打AI代理自動完成訂票、購物等任務的智能瀏覽體驗，曾宣稱要顛覆網絡瀏覽並演變爲AI操作系統。然而Atlas上線後暴露出嚴重網絡安全漏洞，導致產品迅速折戟，最終黯然退場。

蘋果正式起訴OpenAI指控其竊取商業機密，涉及前高管及核心AI硬件項目

2026年7月10日，蘋果向加州北區地方法院起訴OpenAI，指控竊取商業祕密並違約。訴狀指出，前蘋果設計副總裁、現OpenAI首席硬件官唐·譚指使系統性竊密，在招聘中濫用蘋果機密項目代號，並誘使求職者泄密。該訴訟標誌兩大科技巨頭的AI競爭全面白熱化。

大模型公司造手機搶跑OpenAI:階躍星辰7月13日發首款AI智能體終端

階躍星辰將於7月13日召開發佈會，主題“Agent時代真正的智能體”，預計推出新一代智能體終端產品，或涵蓋AI終端品牌、智能體系統及首款AI智能體手機。此舉與OpenAI押注新一代AI終端的方向一致，顯示行業加速佈局智能體硬件。

AI挑戰醫療專業考試:GPT-4在日本物理治療師考試中表現亮眼

相關推薦

旗艦模型需求激增，OpenAI緊急解鎖GPT-5.6Sol算力限制

被寄予厚望的AI瀏覽器夭折，OpenAI正式宣佈關停Atlas

蘋果正式起訴OpenAI指控其竊取商業機密，涉及前高管及核心AI硬件項目

大模型公司造手機搶跑OpenAI:階躍星辰7月13日發首款AI智能體終端

OpenAI發佈GPT-5.6，深綁微軟Copilot365破除“分道揚鑣”傳聞