画像マッチングはコンピュータビジョンの基礎的なタスクであり、近年、深層学習に基づくマッチングモデルが普及しつつあります。深層学習に基づく手法の汎化性の問題を解決するために、厦門大学、Intel、DJIの研究者らは、GIM: Learning Generalizable Image Matcher from Internet Videos を提案しました。GIMは、マッチングモデルがインターネット動画から強力な汎化能力を学習することを可能にし、あらゆるマッチングモデルの訓練に適用できます。また、著者らは初のZero-shot Evaluation Benchmark(ZEB)を提案し、評価結果からGIMがマッチングモデルの汎化性能を大幅に向上させることが示されました。
関連推奨
AIの父であるヒントン:テクノロジー企業は短期的な利益だけを追求し、人類はスーパーアイコンの赤ちゃんとなるかもしれない
AIの父ヒントン氏は、現在のテクノロジーリーダーが短期的利益に偏重し、技術の最終的な影響への考察が不足していると警告。業界の推進力が分散しているため、長期的リスクを見落とす可能性があると指摘。....
Mar 23, 2026
203.2k
DeepSeek V4が来週発売: ネイティブな音声・映像・画像生成をサポートし、国内のコンピューティング能力に対応
深度求索は来週、画像・動画・テキスト生成をネイティブサポートする多モーダル大規模モデルV4をリリース。国内の高性能低コストオープンソース多モーダルモデル市場の空白を埋める。1月のR1推論モデル以来の初の大型アップデート。初期は簡易技術説明を提供、1ヶ月後に詳細なエンジニアリングレポートを公開。V4は華為・寒武紀と基盤エコシステムで連携済み。....
Feb 28, 2026
679.3k
世界中のAI医療画像市場が急成長:2032年には130億ドルを突破する見込み
世界のAI医療画像市場は2024年の16億ドルから2032年には130億ドルに拡大予測(CAGR29%)。慢性疾患増加による精密診断需要の高まり、深層学習などの技術進歩、政府・資本支援が成長を牽引。....
Nov 12, 2025
148.0k
百度文心大モデルX1.1の発表:ディープラーニング能力がさらに向上
百度はWAVE SUMMITで文心大モデルX1.1を発表。事実性、指示追従、エージェント性能が向上。個人は公式サイト・アプリ、企業は百度智能雲で利用可能。....
Sep 9, 2025
185.5k
NVIDIAとArc研究所、世界最大のバイオAIモデルEvo2を発表、ゲノム研究開発を促進
Arc InstituteとNVIDIAは、スタンフォード大学、カリフォルニア大学バークレー校、カリフォルニア大学サンフランシスコ校の研究者らと協力し、世界最大のバイオAIモデルEvo2を発表しました。128,000以上のゲノムデータ、9.3兆個のヌクレオチドに基づいてトレーニングされたEvo2は、最強の生成AI言語モデルに匹敵する規模を誇ります。深層学習能力により、Evo2は様々な生物の遺伝子配列を迅速に識別できます。
Feb 20, 2025
198.5k
