画像マッチングはコンピュータビジョンの基礎的なタスクであり、近年、深層学習に基づくマッチングモデルが普及しつつあります。深層学習に基づく手法の汎化性の問題を解決するために、厦門大学、Intel、DJIの研究者らは、GIM: Learning Generalizable Image Matcher from Internet Videos を提案しました。GIMは、マッチングモデルがインターネット動画から強力な汎化能力を学習することを可能にし、あらゆるマッチングモデルの訓練に適用できます。また、著者らは初のZero-shot Evaluation Benchmark(ZEB)を提案し、評価結果からGIMがマッチングモデルの汎化性能を大幅に向上させることが示されました。
関連推奨
百度文心大モデルX1.1の発表:ディープラーニング能力がさらに向上
百度はWAVE SUMMITで文心大モデルX1.1を発表。事実性、指示追従、エージェント性能が向上。個人は公式サイト・アプリ、企業は百度智能雲で利用可能。....
NVIDIAとArc研究所、世界最大のバイオAIモデルEvo2を発表、ゲノム研究開発を促進
Arc InstituteとNVIDIAは、スタンフォード大学、カリフォルニア大学バークレー校、カリフォルニア大学サンフランシスコ校の研究者らと協力し、世界最大のバイオAIモデルEvo2を発表しました。128,000以上のゲノムデータ、9.3兆個のヌクレオチドに基づいてトレーニングされたEvo2は、最強の生成AI言語モデルに匹敵する規模を誇ります。深層学習能力により、Evo2は様々な生物の遺伝子配列を迅速に識別できます。
精度80%!Meta、非侵襲型ブレイン・コンピュータ・インターフェースを開発、思考だけで文字入力
ソーシャルメディア大手Metaは最近、脳の神経信号を読み取って文字入力が可能な新しいデバイスを開発したと発表しました。この研究成果はMetaの科学者らによる2つの研究で詳細に説明されており、高度な脳スキャン技術と深層学習AIモデルを用いて、タイピング時の脳波信号を解読し、完全な文章を再構築することに成功しました。具体的には、この技術はMEG(磁気脳波計)と呼ばれるスキャナーに依存しており、脳から発せられる微弱な磁気信号を捉えることができます。埋め込みを必要とする…
DeepSeek、年収100万で採用!インターンシップ月給10万円超え
著名なAI企業DeepSeekは、ユーザー数の急増に伴い、積極的に人員拡大を進めています。ある求人プラットフォームによると、杭州深度求索人工智能(AI)基礎技術研究有限公司(DeepSeek)は、深層学習研究員、コアシステム開発エンジニア、ベテランUIデザイナーなど、複数の職種の求人情報を公開しており、勤務地は北京または杭州となっています。
テンセントクラウドTIプラットフォームにDeepSeekシリーズモデルが登場 無料体験とワンクリック展開に対応
テンセントクラウドTIプラットフォームは先日、671Bパラメーターの「フルバージョン」V3とR1オリジナルモデル、そしてDeepSeek-R1を蒸留して得られた70B~1.5Bパラメーターのシリーズモデルを含む、注目を集めるDeepSeekシリーズモデルの正式提供開始を発表しました。この取り組みは、開発者に強力なAIツールを提供し、大規模モデル技術の普及と応用を促進します。
