AI医療が深水区に入る：研究は生成的モデルが臨床的推論を独立して担うには至っていないことを指摘

米国マサチューセッツ総合病院のMESHインキュベーターチームが行なった、生成型人工知能（AI）の臨床的推論能力に関する最新研究によると、医療分野におけるAIの浸透が進む中でも、現実的な診療を模擬した論理的な連鎖においては依然として重要な欠点が存在していることが明らかになった。関連する研究成果は権威ある学術雑誌「JAMA Network Open」に掲載され、現在主流のモデルが独立して臨床診療を行う能力を持っていないことを明確に指摘している。

この研究では、ChatGPT、DeepSeek、Claude、Gemini、Grokを含む21種類の大規模言語モデルを対象とし、29の既知の臨床症例を用いて複数ラウンドのテストを行なった。実験では、患者の症状、検査データ、画像結果を段階的に提示することで、医師の動的な診療プロセスを高いレベルで模倣した。その結果、完全な情報が得られた状態では、すべてのモデルが正しい最終診断を示す正確性が90%を超えていた。しかし、臨床的推論の中心となる「鑑別診断」においては、80%以上のモデルが不十分な性能を示し、いくつかの潜在的な疾患に対して体系的な分析や選別ができなかった。

この違いを定量化するために、研究チームはPrIME-LLMという統合評価指標を導入し、初期診断から検査決定、治療計画策定までの全プロセスをカバーする。評価の結果、各モデルの総合スコアは64%から78%の間であり、AIが情報が整っているときに「答えを明らかにする」のは得意であるものの、情報が不十分な場合でのオープンな論理的推論には長けていないことを示している。

OpenAIと提携！三菱UFJ金融グループが従業員全員のAI化転換を推進

三菱UFJ金融グループ（MUFG）は、約3万5千人の従業員にChatGPT Enterpriseを全面的に導入し、AIナイブ企業への深層的な転換を開始したことを発表した。2024年10月にOpenAIと提携して以来、このグループは生成的AIを利用して金融業務を再構築し、小売顧客体験を向上させ、人間の思考力と創造力を拡大することを目的としてきた。この取り組みは、同社がAI駆動型の業務新段階に入る重要な出来事であることを示している。

悪意ある開発者によるClaudeの使用によるマルウェアパッケージ:670を越える汚染されたnpmパッケージがオープンソースエコシステムのセキュリティを脅かす

悪意のある開発者がAnthropicのAIモデルClaudeを利用して悪質なコードを作成し、npmリポジトリに670以上の悪意スクリプトを含むパッケージを公開。パッケージ管理エコシステムが汚染され、大規模言語モデルがマルウェア自動開発に悪用されるリスクが浮き彫りとなり、サイバーセキュリティ業界に警鐘を鳴らしている。....

自分の名前さえ正しく綴れない？グーグルのAI検索が頻繁にトラブルを引き起こし、ユーザーが一斉にアンインストールを始めた

Googleは「AI Overview」検索機能をアップグレードし、従来の検索エンジンを対話型に変えようとしたが、大きな失敗に直面。ユーザーテストで、AIが「poop」の「r」の数を誤ったり、「journalism」を「journadism」と誤記したり、親会社名「Google」のスペルを間違えるなど、基本的な文字処理の欠陥が露呈し、広く疑問視されている。....

チューリングテストの結果が明らかに：GPT-4.5の勝率は人間を上回り、AIは完璧な嘘をつくことを学んだ

イギリスの数学者チューリングが1950年に提唱したチューリングテストの想定は、76年後、カリフォルニア大学サンディエゴ校の研究チームによって『米国科学アカデミー紀要』に掲載された論文で実証された。認知科学者であるカメロン・ジョーンズ教授とベン・バーゲン教授は、厳密な古典的な三人称チューリングテストを通じて、初めて明確な実証データを提供し、コンピューターサイエンス史における画期的な瞬間を意味している。

AI医療が深水区に入る：研究は生成的モデルが臨床的推論を独立して担うには至っていないことを指摘

関連推奨

OpenAIと提携！三菱UFJ金融グループが従業員全員のAI化転換を推進

悪意ある開発者によるClaudeの使用によるマルウェアパッケージ:670を越える汚染されたnpmパッケージがオープンソースエコシステムのセキュリティを脅かす

自分の名前さえ正しく綴れない？グーグルのAI検索が頻繁にトラブルを引き起こし、ユーザーが一斉にアンインストールを始めた

ネットファストフードは精神的な飢えなのか？AI生成記事が人間の創作を全面的に圧倒

チューリングテストの結果が明らかに：GPT-4.5の勝率は人間を上回り、AIは完璧な嘘をつくことを学んだ