Meta社は先日、Ray-Banスマートグラスに3つの新機能、リアルタイムAI、リアルタイム翻訳、Shazamを追加すると発表しました。リアルタイムAIとリアルタイム翻訳機能は現在、Metaのアーリーアクセスプログラム参加者のみ利用可能ですが、Shazam機能は米国とカナダの全ユーザー向けに公開されています。


Meta社は先日、Ray-Banスマートグラスに3つの新機能、リアルタイムAI、リアルタイム翻訳、Shazamを追加すると発表しました。リアルタイムAIとリアルタイム翻訳機能は現在、Metaのアーリーアクセスプログラム参加者のみ利用可能ですが、Shazam機能は米国とカナダの全ユーザー向けに公開されています。

2025年のコンシューマー・エレクトロニクス・ショー(CES)で、サムスンは人気のスマートフォンやタブレット機能をテレビ製品に導入すると発表しました。それがリアルタイム翻訳(Live Translate)機能です。この機能は、視聴者にリアルタイムの番組翻訳サービスを提供し、さまざまな言語を話す視聴者がより簡単に番組を楽しめるようにすることを目的としています。リアルタイム翻訳機能は7つの言語に対応しますが、現時点では具体的な言語は明らかになっていません。この技術は、音声ではなく字幕を翻訳することで機能します。202…
バイトダンスが最新開発したCLASIシステムは、言語間のコミュニケーションを円滑にする強力なツールであり、リアルタイム翻訳用に設計されています。その中核技術は、強力な言語モデルと情報検索システムであり、ほぼリアルタイムでのネイティブレベルの翻訳を実現します。正確でスムーズな翻訳だけでなく、専門用語の理解やコンテキストの記憶による翻訳の一貫性も確保します。CLASIは「自己学習」能力も備えており、コンテキストを理解することで、音声の不明瞭さや表現の曖昧さを解消し、適切な翻訳を提供します。さらに、「有効情報比率(VIP)」指標を導入し、翻訳の評価も行います。
Slackは先日、Salesforceと深く連携したAgentforce AIアシスタントを発表しました。コンテキストインテリジェンスを通じて企業の生産性を向上させることを目指しています。この統合はSalesforce Agentforce 2.0の重要な構成要素となり、12月17日に正式リリースされる予定です。独占インタビューで、Slackの最高製品責任者Rob Seaman氏は、Slackプラットフォームは通常、組織の構造と、その時々の状況を反映していると述べています。
動画解析において、物体の持続性は、完全に遮蔽された場合でも物体が存在し続けるという重要な手がかりです。しかし、現在の物体セグメンテーション手法の多くは、可視(モダリティ)物体のみを対象としており、非可視(可視+不可視)物体への対処が不足しています。この問題に対し、研究者たちは拡散事前確率に基づく二段階手法であるDiffusion-Vasを提案しました。これは動画における非可視セグメンテーションとコンテンツ補完の効果を高めることを目的としており、動画内の指定された目標を追跡し、拡散モデルを用いて遮蔽された部分を補完することができます。
Metaは先日、オープンソースのAIバーチャル試着フレームワーク「Leffa」を発表しました。このフレームワークは、新しい画像を生成することでユーザーの試着体験を向上させることを目的としており、ユーザーは参照画像に基づいて、異なる服装やポーズを切り替えることができます。従来の方法と比較して、Leffaは細部の保持と画像の歪みの低減において優れたパフォーマンスを発揮します。Leffaの登場は、オンラインショッピングやバーチャル試着に新たな可能性をもたらします。ユーザーは参照画像をアップロードするだけで、システムはその画像に基づいて新しいスタイリング効果を生成します。