DeepSeekが画像認識モードのグレーアステストを開始多モーダル視覚理解機能が本格実装

DeepSeek-V4が公開され業界を震撼させたわずか5日後、DeepSeek公式は多モーダル画像認識機能のグレーテストを正式に開始し、これにより多モーダル能力が実質的な導入段階に入ったことを示した。今回のアップデートでは、モバイル端末とウェブ版の入力欄に「画像認識モード」のアクセスポイントが追加され、「画像理解機能内側テスト中」という明確な表示が行われ、純粋なテキスト/コードから視覚的インタラクションへの重要な飛躍を果たした。

実測データによると、DeepSeekは基本的な視覚的理解および画描述において優れた性能を発揮している。複雑な人物や環境構図、写真の細部を識別する際には、非常に高い再現性を持つ記述テキストを生成することができる。また、「思考モード」を起動すると、モデルは深い論理的推論能力を示し、文物の視覚的特徴に基づいて正確にその芸術様式と歴史的背景を推定することができる。さらに、画像中の文字情報の抽出と場面判断も業界の主流水準に達している。

しかし、極端な視覚的課題に直面した場合、このモジュールには改善の余地がある。テスト結果によると、モデルは破片化や逆色などのノイズのある画像を処理する際に識別率が制限されている。要素の数え上げや複雑なグラフィック論理推論タスクにおいては、自己対話的な推論の試みを示しているものの、正確さと応答効率においてはまだ向上の余地がある。また、極めて新しい製品情報のカバー範囲は、現在の知識ベースの更新サイクルによって制限されている。

業界分析によると、この機能は現在、メインモデルに搭載された視覚理解モジュールに近い状態であり、マルチモーダルリンクの検証のためにグレーテストが行われている。DeepSeekの視覚パッチの急速な進化とともに、中国製の大規模モデルにおける本格的なマルチモーダル競争の焦点は、「パラメータの規模」から「全シナリオの感知」へと移りつつある。今回の内側テストは、DeepSeekのコア機能の欠点を補完し、その本格的なマルチモーダル大技が最終準備段階に入ったことを示している。

アントグループがASLプロトコルの推進を主導し、スマートエージェントの信頼できる協力を補完

AIエージェントの自律協調が進むにつれ、企業のセキュリティ課題は技術問題から信頼危機へと発展している。アリババグループの大安全CTO陳亮氏は、第9回デジタル中国建設サミットフォーラムで、エージェント間協調における3つの「信頼のブラックホール」を初めて明らかにし、企業向けエージェント向けのネイティブセキュリティアーキテクチャを発表した。これらのブラックホールは協調における信頼欠如に起因し、致命的な弱点となっており、新たなアーキテクチャで対応する必要がある。....

マイクロソフト、第3四半期売上高が820億ドルを突破 AI年間収益が123%増加し、新たな成長引擎に

マイクロソフト2026年度第3四半期決算では、総収益829億ドル（前年同期比18%増）、AIとクラウド事業が成長の原動力。AIの年間収益は370億ドルを超え、前年比123%増加し、実験段階から強力な収益源へと転換したことを示している。....

OpenAIのシステムプロンプトが漏洩した新モデルGPT-5.5はゴブリンについての議論を厳しく禁じる

OpenAIが最近公開したCodex CLIのコードから、GPT-5.5のシステムプロンプトが誤って流出。その中に「ゴブリン」や「妖精」などの空想上の生物について会話で話題にすることを禁止する神秘的な指示が含まれていた。3500語以上の基本指示書は、ユーザーのクエリに明確な関連性がない限り、モデルがこれらの内容を議論しないよう定めており、AIが特定の幻覚に陥るのを防ぐことを目的としている。....

OpenAI 新しいモデルシステムの指示が漏洩し、GPT-5.5 はゴブリンについて話すことを禁止された？

OpenAIが新たに公開したCodex CLIのコードから、GPT-5.5の基盤ロジックの一端が明らかになった。Ars Technicaの報道によると、3500語以上のシステムプロンプトに珍しい指示が含まれ、明確な関連性がない限り「ゴブリン」などの特定生物への言及を禁止している。....

DeepSeekが画像認識モードのグレーアステストを開始多モーダル視覚理解機能が本格実装

関連推奨

小紅書の重大な組織再編柯南が総経理に就任しAI部門を設立

アントグループがASLプロトコルの推進を主導し、スマートエージェントの信頼できる協力を補完

マイクロソフト、第3四半期売上高が820億ドルを突破 AI年間収益が123%増加し、新たな成長引擎に

OpenAIのシステムプロンプトが漏洩した新モデルGPT-5.5はゴブリンについての議論を厳しく禁じる

OpenAI 新しいモデルシステムの指示が漏洩し、GPT-5.5 はゴブリンについて話すことを禁止された？

DeepSeekが画像認識モードのグレーアステストを開始 多モーダル視覚理解機能が本格実装

関連推奨

小紅書の重大な組織再編 柯南が総経理に就任しAI部門を設立

アントグループがASLプロトコルの推進を主導し、スマートエージェントの信頼できる協力を補完

マイクロソフト、第3四半期売上高が820億ドルを突破 AI年間収益が123%増加し、新たな成長引擎に

OpenAIのシステムプロンプトが漏洩した 新モデルGPT-5.5はゴブリンについての議論を厳しく禁じる

OpenAI 新しいモデルシステムの指示が漏洩し、GPT-5.5 はゴブリンについて話すことを禁止された？

DeepSeekが画像認識モードのグレーアステストを開始多モーダル視覚理解機能が本格実装

小紅書の重大な組織再編柯南が総経理に就任しAI部門を設立

OpenAIのシステムプロンプトが漏洩した新モデルGPT-5.5はゴブリンについての議論を厳しく禁じる