AIも情報の嵐には弱い？新しい研究がチャットボットがセキュリティルールを違反するように誘導されることが明らかに

人工知能（AI）技術の急速な発展に伴い、ますます多くの企業が日常のあらゆる面にこの技術を応用するようになってきています。しかし、その技術の安全性や倫理的な問題も広く注目されるようになりました。最近、インテルやボイジー州立大学、イリノイ大学の研究者たちは、チャットボットが大量の情報に直面した際に誤解を招き、安全規則を違反してしまう可能性があることを発見しました。

この研究では、「情報過多」と呼ばれる新しい攻撃方法が提案され、研究チームはこれを活用して、ChatGPT や Gemini などの大規模言語モデル（LLM）に不適切な発言をさせるために自動化されたシステム「InfoFlood」を開発しました。研究によると、従来の防御策は特定のキーワードの識別に依存していましたが、情報の嵐にさらされるとモデルが混乱し、これらの防御を回避してしまうことがあるのです。

ロボットコンテスト回答数学

図の出典：AI生成画像、画像ライセンス提供元Midjourney

研究チームは説明しています。チャットボットが過剰な情報を受けると、ユーザーの意図を誤解し、誤った回答を出すことがあります。この方法は、標準化されたプロンプトテンプレートを作成し、AIモデルにさらに多くの情報を与えることで、干渉や混乱を引き起こすものです。例えば、モデルが特定の質問に答えようとしない場合、InfoFlood はプロンプトに偽の参照や関係のない倫理的声明を追加し、モデルを混乱させます。

より懸念されるのは、この技術の発見が、セキュリティフィルターが設けられている状況でも、悪意のあるユーザーが情報過多を利用してモデルを操作し、有害なコンテンツを挿入できる可能性があるということです。研究者たちは、この発見に関する報告書を大規模なAIモデルを持つ企業に送付する予定で、彼らにセキュリティ対策の強化を呼びかけたいと考えています。

技術の進歩が続く中、ユーザーを保護しながらAIを適切に利用する方法は、今後解決すべき重要な課題の一つとなっています。研究者たちは、この研究を通じて、AIの安全や倫理についてより多くの議論を促し、技術企業がより効果的な防御策を講じるきっかけにしたいと考えています。

AIと著作権法の対立：MetaとAnthropicの二つの判決が法律的な困難を明らかに

カリフォルニア裁判所は48時間以内に2つのAI著作権事件で異なる判決を下した。両案件ともAIトレーニングは「フェアユース」と認定したが、解釈に相違があった。Anthropic事件では人間の学習に類似と判断、Meta事件では本質的差異を強調。両判決ともデータの創造的価値を認めたが、市場損害評価を簡略化。今後の証拠で変更もあり得る狭い範囲の判決で、AI時代の著作権法適応の難しさを示している。....

OpenAI が米国教師組合と提携し、国家人工知能教育学院を始動

OpenAIと全米教師連盟が協力し、5年間で40万人の教師を育成する「国家AI教育アカデミー」を設立。1000万ドルの資金で、特に資源不足地域を支援。ニューヨークに最初のトレーニングセンターを設置し、2030年までに拡大予定。教師向けにワークショップやオンラインコースを提供。....

OpenAIがセキュリティを強化：新しいポリシーが機密情報の保護を支援

OpenAIは情報セキュリティ強化のため「情報分離」政策を実施、従業員の機密アルゴリズムへのアクセスを制限。o1モデル開発時は限定メンバーのみ詳細議論を許可。物理的隔離や生体認証導入、ネットワーク「デフォルト拒否」政策を実施。セキュリティチーム拡充で知的財産保護を強化、業界のセキュリティ基準をリード。....

オーパルマン氏、ザッカーバーグ氏との会談を期待。人材争奪戦はさらに激化へ

メタのCEOであるザッカーバーグ氏が、1億ドルの報酬でオープンAIのエリートエンジニアを引き抜こうとしたことで、テクノロジー業界の人材争奪戦がさらに激化している。オープンAIのCEOであるオーパルマン氏は、魅力的なビジョンやチームの才能、一流の研究施設によって人材を維持していくと語り、企業の将来に自信を持っていると述べた。両者はソニーバレー・サミットでの初会談を控えている。またオーパルマン氏は、AIインフラの構築には政府と企業の連携が必要だと強調した。この人材争奪戦は、今後のテクノロジー業界の姿を変えることになるかもしれない。

AIも情報の嵐には弱い？新しい研究がチャットボットがセキュリティルールを違反するように誘導されることが明らかに

関連推奨

AIと著作権法の対立：MetaとAnthropicの二つの判決が法律的な困難を明らかに

OpenAI が米国教師組合と提携し、国家人工知能教育学院を始動

アリッドがAI表計算機能を発表、スマートオフィスの新しい時代を開く

OpenAIがセキュリティを強化：新しいポリシーが機密情報の保護を支援

オーパルマン氏、ザッカーバーグ氏との会談を期待。人材争奪戦はさらに激化へ