Anthropic發佈了新一代大模型系列Claude 3,表現出自我認知能力,引起AI社區轟動。此舉引發AI領域對於評估模型真實能力和侷限性的思考。分析表明Claude 3 Opus在多項基準測試中超越GPT-4和Gemini 1.0 Ultra,展現出強大性能。在長文本處理、中英互譯、邏輯推理、數學理解、編程等方面進行深度測評,展現出綜合能力。