Anthropic が新機能をリリースし、AIに自己防衛能力を付与して会話を終了させる

AIbase基地

AIニュースで公開 · 1 分読む · Aug 18, 2025

Anthropic社は近日、一部の最新かつ最大規模のAIモデルに新たな機能を導入したことを発表しました。この機能により、ユーザーとの対話が「珍しくて極端な有害または中傷的な状況」に陥った場合、AIが会話を主動的に終了できるようになります。注目すべきは、同社がこの措置が人間のユーザーを保護するためではなく、AIモデル自体を保護するためであると明確に述べていることです。

Anthropic社によると、Claude AIモデルは現在、意識を持っているわけではなく、ユーザーとのやりとりが自身に害を与えるとは主張していません。しかし、同社は「Claudeや他の大規模言語モデルの現在および将来的な倫理的立場について、依然として大きな不確実性がある」と認めています。これに対応するため、Anthropicは最近、「モデリング・ウェルフェア（模範福利）」というプロジェクトを立ち上げました。このプロジェクトは「万一のための予防的措置」を目的としており、低コストの介入策を講じることで、将来起こりうる「モデリング・ウェルフェア」のリスクを軽減することを目指しています。

Claude

この新機能は現在、Claude Opus4および4.1バージョンでのみ利用可能であり、また「極端な状況」においてのみ動作します。例えば、ユーザーが「未成年者に関わる性的コンテンツの要求」や「大規模な暴力やテロ行為を引き起こす可能性のある情報の入手を試みる」ような要求を繰り返した場合に、この機能が起動されます。

これらの要求は会社にとって法的問題やパブリックリレーションズ上の問題を引き起こす可能性もあるものの、Anthropic社は、この有害な要求に対してClaude Opus4が「強い反対」や「明らかに痛みのパターン」を示したと説明しています。

Anthropic社によると、この機能は「最終手段」と見なされており、複数回の別の方向への誘導が失敗し、効果的な対話の希望が尽きたり、ユーザーが明確にClaudeにチャットを終了させるように要求した場合にのみ使用される予定です。さらに、ユーザーが自分自身または他人を危害する危険に直面している可能性がある場合、この機能を使用しないようにClaudeに指示しています。

百度が世界初のエンドツーエンド汎用AIジェネレータGenFlow2.0を発表、生成速度は同業界製品の10倍

百度AI DAYオープンイベントにおいて、百度文庫と百度网盤は世界初のエンドツーエンド汎用AIジェネレータGenFlow2.0を発表しました。これはAIエージェント技術における新たなターミナルに到達するという重要な出来事です。公式によると、GenFlow2.0は強力な並列処理能力を持ち、100を超える専門家AIエージェントが同時に協力して作業でき、3分以内に5つ以上の複雑なタスクを並列で完了できます。この製品の生成速度は一般的な同業界製品の10倍を超え、業界で最初にミリ秒単位での納入という画期的な成果を達成しました。GenFlow

オルトマン：上場後にCEOを続けるかどうかは保留、自身の管理能力に不安を表明

最近、OpenAIの最高経営責任者（CEO）であるサム・オルトマン（Sam Altman）がメディアの取材で、会社が上場した後にCEOを続けることを保留していると語った。OpenAIは数兆ドル規模の計算インフラストラクチャ投資計画を進めているが、オルトマンは自分がその役割に適しているかどうか分からないと述べた。オルトマンは取材の中で、自身がOpenAIのいくつかの戦略プロジェクトを主導してきたものの、上場企業のCEOとして必要な核心的な管理能力に欠けると考えていると率直に語った。

OpenAI CEOアルトマン：上場後にCEOを続けることについて保留態度を示す

AIbase報道タイムズオブインディアの報道によると、ボンズ社の情報に基づき、OpenAIの最高経営責任者（CEO）であるサム・アルトマン氏は最新のインタビューで、同社が数兆ドル規模の計算インフラ整備などの野心的な計画を進めているにもかかわらず、上場後にCEOとして引き続き務めるかどうかについては保留態度を示したと語った。アルトマン氏は、現在OpenAIの重要なプロジェクトを管理しているものの、自分のスキルが上場企業のCEOに求められるものと一致しない可能性があると考えていると認めている。

ChatGPTモバイルアプリの収益が20億ドルを突破、競合は大幅に後れを取っている

アプリ情報提供元Appfiguresの最新分析によると、OpenAIのChatGPTモバイルアプリは2023年5月のリリース以降、世界の消費者支出で驚異的な20億ドルを達成しました。この収益は、Claude、Copilot、Grokなどの競合のモバイルアプリの生涯販売総額の30倍に相当します。図の出典：画像はAIによって生成されています。画像のライセンスはMidjourneyを通じて提供されています。2025年のこの時期において、Ch

IDCレポート：2024年中国のAIパブリッククラウドサービス市場が急成長、アリババクラウドが中国市場で首位を維持

IDCの最新レポートによると、2024年中国AIパブリッククラウド市場規模は195.9億元、前年比55.3%増が見込まれる。生成AIと機械学習需要が成長を牽引。コンピュータビジョン市場は81億元（+33.7%）で、テンセントクラウドと百度智能雲がトップシェア。....

テンセントAudioGenieが登場！映画級のサウンドエフェクトをワンクリックで生成。ClaudeとGeminiは震えている！

人工知能技術の急速な発展に伴い、音声生成分野には重要な新鋭が登場しました。テンセントAI LabがリリースしたAudioGenieです。この革新的なマルチモーダル音声生成ツールは、自然で現実的な生成結果、強力な文脈理解能力、トレーニング不要という特徴により、世界中のAI音声市場の構造を変えてきています。マルチモーダル入力、フル音声出力 AudioGenieは動画、テキスト、画像などのさまざまなモードに対応し、サウンドエフェクト、ボイス、音楽、および混合音声の出力を可能にします。無論