4月25日、アリババ傘下のクォークAIスーパーボックスは、革新的な機能「拍照問クォーク(写真でクォークに質問)」を発表しました。この新機能は、高度な画像認識と推論モデルに基づき、物理世界で遭遇する様々な問題をより正確に理解し、回答します。
日常生活では、特に複雑な物体、表、図形を扱う際、言葉で正確に説明するのが難しい状況がよくあります。「拍照問クォーク」機能は、画像内の人物、物体、細部を正確に認識し、ユーザーのニーズを深く理解し、関連する問題を連想することで、より正確な回答を提供します。
例えば、遺物の写真を検索する場合、この機能は自動的に遺物の歴史的背景を関連付けることができます。商品の写真をアップロードすると、淘宝網(タオバオ)の同型商品へのリンクにワンクリックでジャンプできます。人物、動物、植物、建築物、風景、食べ物、美術品、商品、外国語資料、故障コードなど、クォークは数秒で認識できます。
さらに、「拍照問クォーク」機能は、検索、スキャン、画像編集、翻訳、創作など、複数の機能を統一されたインターフェースに統合しています。複雑な画像の場合、最大10枚の画像を一度にアップロードして、深層推論を行い、様々な複雑なタスクを実行できます。
クォークは現在、検索、健康、学習、旅行、商品、創作など、複数の分野を網羅する100以上の専門エージェントと原子機能を備えています。旅行中、「拍照問クォーク」を使用して、遺物の解説や観光地の攻略情報を取得できます。仕事では、データチャートの分析、コードロジックの最適化、作業サマリードキュメントの作成を支援できます。健康分野では、健康診断レポートをアップロードすると、指標の異常分析と回復プランの提案を行うことができます。
エンターテイメントシーンでは、「拍照問クォーク」は、ゲームの指導、スクリーンショットによるドラマの検索、カップルのプロフィール画像のペアリングなど、楽しい機能をサポートしており、高画質化、透かし除去、原文のソース追跡などもワンクリックで実行できます。また、複数の言語での質問と翻訳解釈にも対応しています。