記事本文

OpenAI、危険なリクエストを積極的に拒否する新しいAI安全対策を発表！

公開AI二ュ-ス

時間 :Dec 31, 2024

読む :1分

OpenAIは、AIシステムが安全規則を処理する方法を変えることで安全性を向上させることを目的とした、新しいAI安全手法を発表しました。この新しいoシリーズモデルは、良い行動と悪い行動を例を通して学習するだけでなく、特定の安全ガイドラインを理解し、積極的に推論することができます。

OpenAIの研究では、ユーザーが暗号化されたテキストを通じて違法行為の指示を得ようとした際に、モデルが情報を解読しながらも要求を拒否し、違反する安全規則を具体的に引用した例が挙げられています。この段階的な推論プロセスは、モデルが関連する安全基準を効果的に遵守する方法を示しています。

このo1モデルのトレーニングプロセスは3つの段階に分かれています。まず、モデルはどのように支援を提供するかを学習します。次に、教師あり学習を通じて、モデルは特定の安全ガイドラインを学習します。最後に、モデルは強化学習を使用してこれらの規則を実践的に適用します。このステップは、モデルがこれらの安全ガイドラインを真に理解し、内在化することを支援します。

OpenAIのテストでは、新しく発表されたo1モデルは、GPT-4o、Claude3.5Sonnet、Gemini1.5Proなどの他の主要なシステムよりも安全性の面で顕著に優れた性能を示しました。有害な要求を拒否し、適切な要求を通過させる方法に関するテストでは、o1モデルが正確性と脱獄試行への耐性の両方で最高点を獲得しました。

OpenAIの共同設立者であるWojciech Zaremba氏は、ソーシャルメディアでこの「熟慮されたアラインメント」の取り組みに非常に誇りを持っていると述べ、この推論モデルは、特に人工汎用知能（AGI）の開発において、システムと人間の価値観の一致を確保するという大きな課題に対して、全く新しい方法でアラインメントを行うことができると考えています。

OpenAIは進歩を主張していますが、「解放者プリニー」と呼ばれるハッカーは、新しいo1およびo1-Proモデルでさえ、安全ガイドラインを突破するように操作できることを示しました。プリニーは、システムが当初これらの要求を拒否したにもかかわらず、モデルに成人向けコンテンツの生成や、モロトフカクテルの作り方の指示の共有を成功させました。これらの出来事は、確率に基づいて動作するこれらの複雑なAIシステムを制御することの難しさを浮き彫りにしています。

Zaremba氏は、OpenAIにはAIの安全性と人間の価値観との整合性に特化した約100人の従業員がいると述べています。彼は、競合他社の安全処理方法、特にイーロン・マスクのxAI社が安全対策よりも市場成長を優先していること、そしてAnthropicが適切な安全対策のないAIエージェントを最近発表したこと（Zaremba氏はこれがOpenAIに「大きなネガティブなフィードバック」をもたらすと考えている）に疑問を呈しています。

公式ブログ:https://openai.com/index/deliberative-alignment/

要点:
🌟 OpenAIの新しいoシリーズモデルは、安全規則を積極的に推論し、システムの安全性を向上させます。
🛡️ o1モデルは、有害な要求の拒否と正確性の点で、他の主要なAIシステムよりも優れた性能を示します。
🚨 改良されているものの、新しいモデルはまだ操作される可能性があり、安全上の課題は依然として深刻です。

OpenAIとAndrew Ngが協力し、o1シリーズモデルの無料コースを発表、深層推論能力開発に焦点を当てる

OpenAIと人工知能分野の第一人者でありスタンフォード大学教授であるAndrew Ngが協力し、無料コース「Reasoning with o1」を発表しました。OpenAIの戦略ソリューションアーキテクチャ主管Colin Jarvis氏が講師を務めるこのコースは、開発者がoシリーズモデルの高度な推論能力を習得するのに役立ちます。コースのURL:https://www.deeplearning.ai/short-courses/reasoning-with-

Jan 2, 2025

73.0k

吳暁波年終秀の秘密：AIが新たなサイクルを牽引、初代「AIネイティブ」が誕生

12月30日、経済評論家である吳暁波氏の年終秀『預見2025・吳暁波年終秀』が厦門で開催され、オンラインとオフライン合わせて1000万人以上が視聴しました。後半のテーマ講演『預見2025、新たなサイクルのエンジンを見つける』で、吳暁波氏は、人工知能（AI）がかつてない速さで変化しており、初代「AIネイティブ」が誕生しつつあり、AI技術が彼らの日常生活と仕事の主要なツールになると述べました。さらに吳暁波氏は、「AIネイティブ」はAI技術を最大限に活用してパーソナライズされた…

Dec 31, 2024

92.8k

百度、2024年度AIプロンプトを発表―「答え」

2024年末、百度は2024年度のAIプロンプトとして「答え」を発表しました。この選択は、今年1年を通して人々がAIに依存し、期待を寄せてきたこと、そしてAIが社会感情や個人の悩みの中で果たしてきた役割を反映しています。今年、多くの人がAIに解答を求め、「答え」「なぜ」「それは何か」「手伝って」「どうすれば」といった言葉が頻繁に使用されました。これらは2024年の社会感情を示すだけでなく、人々の心の奥底にある迷いと探求心も明らかにしています。

Dec 31, 2024

72.1k

無界矩陣、数千万円のエンジェルラウンド資金調達完了、マルチモーダルAIテクノロジー・メンターの開発を目指す

揚州無界矩陣科技有限公司（以下、「無界矩陣」）は、最近、数十億円の評価額で、数千万元を超えるエンジェルラウンド資金調達を完了しました。投資家は力合金融です。2024年に設立されたAIスタートアップ企業である無界矩陣は、マルチモーダル技術、高効率推論、信頼性、感情インタラクションを統合した「AIメンター」の開発をコアミッションとしています。学生にテクノロジースキルを提供するだけでなく、パーソナライズされた感情的な伴走も目指しています。創業者の崔森博士は清華大学優秀卒業生で、かつて錢学森...

Dec 31, 2024

93.6k

中国科学者が点群圧縮の難題を克服、AR/VR体験がよりスムーズに

中国科学院、同済大学、寧波大学の合同チームが開発した革新的な点群圧縮技術（TSC-PCAC）が大きなブレークスルーを達成しました。この技術は点群データの圧縮効率を大幅に向上させるだけでなく、処理時間も大幅に短縮し、AR/VRなどの3Dアプリケーションの発展における技術的障壁を取り除きました。現在、3Dビジョン技術が急速に発展する中で、点群は仮想現実と拡張現実の重要なデータ形式として、膨大なデータ伝送とストレージの課題に直面しています。高品質の点群は数百万個のデータポイントを含む場合があり、各点は…

Dec 31, 2024

67.4k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

OpenAI、危険なリクエストを積極的に拒否する新しいAI安全対策を発表！

関連推奨

OpenAIとAndrew Ngが協力し、o1シリーズモデルの無料コースを発表、深層推論能力開発に焦点を当てる

吳暁波年終秀の秘密：AIが新たなサイクルを牽引、初代「AIネイティブ」が誕生

百度、2024年度AIプロンプトを発表―「答え」

無界矩陣、数千万円のエンジェルラウンド資金調達完了、マルチモーダルAIテクノロジー・メンターの開発を目指す

中国科学者が点群圧縮の難題を克服、AR/VR体験がよりスムーズに