OpenAI は近日、先進的な個人情報(PII)のマスキングモデルであるPrivacy Filterを発表しました。このモデルはすでに Apache2.0ライセンス で Hugging Face と GitHub で公開されており、開発者にローカルで動作し、高度なカスタマイズが可能なプライバシー保護ツールを提供することを目的としています。

深い意味理解で機械的マッチングから脱却

従来のルールマッチングツールとは異なり、Privacy Filter は深く言語を理解する能力を持っています。これは、文脈に基づいて非構造化テキスト内のセンシティブな情報を正確に識別できるということです。これにより、個人のプライベートデータを効果的に隠蔽しつつ、テキスト中の公開されている有用な情報を最大限に保持することができます。

QQ20260427-141717.jpg

軽量なMoEアーキテクチャで優れたパフォーマンスを実現

技術アーキテクチャにおいて、このモデルは非常に高い柔軟性と効率性を示しています:

  • 混合エキスパート(MoE)設計: 総合パラメータ数は 15億 ですが、一度の推論では約 5,000万 のパラメータがアクティブになります。これにより、ノートパソコンやブラウザなどリソースが制限されたエッジデバイスでもスムーズに動作します。

  • 超長文脈サポート: 128,000トークン の文脈窓を持つことで、双方向トークン分類アーキテクチャと制限付きビタビアルゴリズムを使用し、長文の処理における一貫性と精度を確保しています。

  • 高精度の識別: PII-Masking-300k ベンチマーク修正版において、このモデルは 97.43%のF1スコア を達成し、そのうち再現率は98.08%に達しています。

包括的なプライバシー分類システム

Privacy Filter は、8つの主要なセンシティブ情報タイプを正確に識別およびラベル付けできます:

  1. 基本的なアイデンティティ: 氏名、住所、メールアドレス、電話番号。

  2. ネットワーク資産: URLリンク。

  3. 金融セキュリティ: アカウント情報(銀行口座、クレジットカードなど)。

  4. 機密証憑: パスワード、APIキーなど。

  5. 時間敏感: 日付情報。

応用例:クラウドLLMの「ローカルファイアウォール」

OpenAIはこれをプリフィルタ層として位置づけています。ユーザーがテキストをクラウドの大規模言語モデルに送信する前に、データはローカルでPIIの検出とマスキングが行われます。このような「データがデバイスを離れずに処理される」方式により、ユーザーがプライバシー情報をAIツールに誤って貼り付けるリスクが効果的に解消されます。