最近、OpenAIが発表したo3モデルが、写真の撮影場所を正確に推測できる能力で大きな注目を集めています。この機能は、Django Webフレームワークの創設者であるSimon Wilson氏によって初めてテストされ、彼は自身のブログでo3の推論プロセスを詳しく記録し、その体験を「超現実的で不安になる」と表現しました。Wilson氏は、道路と家屋が少し写っているだけで、目立ったランドマークのない、一見普通の写真を撮影しました。この写真をo3にアップロードすると、モデルは複雑な分析を開始しました。
o3の分析プロセスは驚くべきものでした。最初は写真を「見ていないふりを」しますが、すぐに「視力」を取り戻し、ぼやけたナンバープレートの情報に注目します。ナンバープレートは判読しにくいのですが、o3は拡大処理によって徐々に重要な情報を見つけ出しました。約7分間の推論の後、o3は最終的に撮影場所を特定することに成功しました。最初の推測であるCambriaは実際の位置から約320キロメートル離れていましたが、次の推測であるEl Granadaは完全に正確でした。
o3と比較して、ClaudeやGeminiなどの他のモデルは推論能力が比較的粗雑で、「不正行為」さえ行っているように見えました。Simon Wilson氏は、o3の独特の点は、思考プロセスにおいて画像処理とコード作成を統合できることであり、これにより画像処理においてより柔軟で正確な結果が得られると指摘しています。
興味深いことに、o3は写真から場所を分析できるだけでなく、ユーザーの地理的な位置も直接知ることができます。テストの結果、EXIFデータがなくても、数千キロメートル離れた場所の写真から正確に位置を特定することができました。これについてWilson氏は、o3の能力は「CSI科学捜査班」を彷彿とさせると述べており、写真処理において繰り返し拡大と比較を行い、非常に分析的な思考プロセスを示しています。
しかし、o3の強力な能力は、プライバシーの懸念も引き起こします。現在、AIは普通の1枚の写真から簡単にあなたの位置を特定できるため、ソーシャルメディアで写真を共有することの潜在的なリスクについて考えさせられます。技術の進歩は素晴らしいことですが、私たちは警戒心を高め、個人情報の保護に努める必要があります。