最近の研究で、GPT-4が視覚認識の課題において不十分な結果を示したことが分かりました。その原因は、課題で使用された画像がトレーニングデータセットで非常に一般的だったため、GPT-4が真の視覚認識能力ではなく、記憶を頼りに解答した可能性があるからです。これは、大規模モデルが特定のタスクで優れた性能を示す場合でも、慎重な評価が必要であり、トレーニングデータセットでの成功を基にモデルの汎化能力を過大評価してはならないことを示しています。モデルの汎化能力と敵対的サンプルに対する堅牢性の向上は、現在の重要な研究課題の一つです。同時に、トレーニングデータセットのみでモデルをテストすることの危険性にも注意する必要があります。モデルの汎化能力をより正確に評価するには、より広範なサンプルを用いて検証することが不可欠です。
関連推奨
AIモデルが2冊の本を使って著名な作家のスタイルで作品を生成し、著作権法に関する新たな議論を引き起こす
AIが2冊の本で微調整するだけで作家の文体を模倣でき、専門家の模倣作品よりも高評価を得た。50作家(ハン・ガン、ラシュディ含む)を対象に159名(専門家28名)が評価。....
OpenAIが裏で操作されていると指摘され、有料ユーザーがモデルのグレードダウンを経験
OpenAIは最近、秘密裡にモデルを切り替えたことで物議を醸している。有料ユーザーは通知されることなく、自身のGPT-4/5が低性能フィルターモデルgpt-5-chat-safetyやgpt-5-a-t-miniに自動的に置き換えられ、特にセンシティブな内容に関して応答品質が急激に低下したと報告している。この行動はユーザーから選択権や知る権利を侵害しているとの疑問を引き起こし、プラットフォームの透明性の欠如を浮き彫りにしている。
グーグルの新研究:合成データが、大規模言語モデルの数学的推論能力を8倍向上
最近、Google、カーネギーメロン大学、MultiOnの研究チームは、大規模言語モデルのトレーニングにおける合成データの応用に関する新たな研究を発表しました。AI開発研究機関Epoch AIの報告によると、現在、公開されている高品質なテキストトレーニングデータは約300兆トークンですが、ChatGPTなどの大規模モデルの急速な発展に伴い、トレーニングデータの需要は指数関数的に増加しており、2026年までに枯渇する可能性があると予測されています。そのため、合成データがますます重要になってきています。
ChatGPT、ジブリ人気に便乗し有料ユーザー2000万人を突破
ChatGPTは最近、新たな画像生成機能により空前のユーザー増加を迎え、インターネット上で大きな話題となっています。SensorTowerのデータによると、先週のアクティブユーザー数、アプリ内課金売上高、ダウンロード数は全て過去最高を記録し、市場におけるChatGPTの堅調なパフォーマンスを示しています。GPT-4のローンチ以降、ChatGPTは多くのユーザーを惹きつけ、画像生成ツールを使って日常生活の名場面や写真をスタジオジブリ風のアニメーションに変換しています。
ChatGPTの新しいAI画像機能、無料ユーザーへの公開が遅延
OpenAIのCEOであるサム・アルトマンがソーシャルメディアで発表したところによると、ChatGPTの新しい画像機能のリリースが遅れるとのことです。その理由は、ユーザーからの需要が同社の予想をはるかに上回っているためです。アルトマン氏は「ChatGPTの画像機能は、私たちの予想(既に高い予想でした)をはるかに超える人気となっています。」と述べています。今週火曜日、OpenAIはGPT-4oのネイティブな画像生成機能をリリースしたばかりで、ユーザーは画像のアップロードと修正が可能になり、この機能はまもなく全ユーザーに提供されると発表していました。
