速度410倍向上！TikTok、わずか32トークンで画像の再構成と生成が可能に

近年、生成モデルの発展により、高解像度画像の効率的な合成において、画像のトークン化が重要な役割を果たすことが明らかになりました。画像トークン化は、画像を潜在表現に変換することで、画素を直接処理する場合に比べて計算コストを削減し、生成プロセスの効率性と有効性を向上させます。しかし、従来の方法（VQGANなど）は、固定された2D潜在グリッドを用いたトークン化を行うことが多く、隣接領域が類似していることがよくある画像固有の冗長性を管理することに課題がありました。

この問題を克服するために、研究者らはTransformerベースの1次元トークン化フレームワークであるTiTokを導入しました。この革新的な方法は、画像を1次元の潜在シーケンスとしてトークン化します。TiTokはコンパクトな1次元トークナイザーであり、256×256の画像をわずか32個の離散トークンで表現できます。そのため、サンプリングプロセスが大幅に高速化され（例えば、DiT-XL/2よりも410倍高速）、同時に競争力のある生成品質が得られます。

TiTokは、従来技術よりもコンパクトな潜在表現を提供し、より効率的で効果的な表現を実現します。例えば、256×256×3の画像は、わずか32個の離散トークンに圧縮でき、従来の方法で得られる256個または1024個のトークンよりもはるかに少なくなります。コンパクトであるにもかかわらず、TiTokは最先端の方法と同等の性能を実現しています。

具体的には、同じジェネレータフレームワークを用いて、TiTokはImageNet256×256ベンチマークで1.97のgFIDを達成し、MaskGITベンチマークの4.21を大幅に上回りました。TiTokの優位性は、より高解像度の画像を処理する場合にさらに顕著になります。

ImageNet512×512ベンチマークでは、TiTokは最先端の拡散モデルであるDiT-XL/2（gFID 2.74対3.04）を上回っただけでなく、画像トークン数を64分の1に削減し、生成速度を410倍向上させました。TiTokの最適化されたバージョンは、高品質なサンプルを生成しながら、DiT-XL/2（gFID 2.13対3.04）を大幅に上回り、生成速度を74倍向上させました。

TiTokの適用範囲は、コンピュータビジョン、画像処理、芸術創作など、高解像度画像の効率的な合成が必要な様々な分野に及びます。

リーアン・カイティアンがテンシ AI Proを発表：政府機関および企業向けに設計された信頼できるAIパートナー

リーアンはテンシ AI Proを発表しました。この製品は政府機関および企業のオフィス用AIパートナーとして定位されており、シンチュウ（中国製ソフトウェア）業界をAI時代へと進展させます。製品は操作ロジックを「ツールを中心に」から「タスクを中心に」へと転換し、麒麟オペレーティングシステムと深く統合されており、「ダブル画面」機能を提供します。ユーザーは4本の指でスライド操作を行うことで簡単に切り替えることができます。

名創優品がAIイノベーション部を設立：スマートエージェントの開発とグローバル選定アルゴリズムの最適化に注力

名創優品はAIイノベーション部を設立し、デジタルテクノロジーセンターに所属しており、スマートエージェント技術を通じてグローバルな業務意思決定と内部協働の智能化を推進し、経営意思決定のスマート化とスマートエージェントのコア能力の構築に焦点を当てています。

ChatGPTユーザーが10億人に達し、女性ユーザーの割合が初めて50％を上回る

OpenAIのデータによると、ChatGPTの世界中の週間アクティブユーザー数が10億人を突破し、ユーザー構造に顕著な変化が見られる。初期の20％だった女性ユーザーの割合は50％を超えており、男性を初めて上回る。約5億人の女性が定期的に利用している。これはAI技術が急速に普及していることを示している。

CerebrasとOpenAIが200億ドルのチップ協定に調印し、IPO計画を発表

AIチップ会社であるCerebrasは、OpenAIと3年間で1億ドルを超える大規模な取引を締結しました。この規模は年初の契約の2倍であり、OpenAIが同社技術に対して高い信頼を持っていることを示しています。OpenAIはCerebrasのデータセンター開発に約10億ドルを提供するとともに、最大10％の少数株式購入権を取得し、戦略的協力を深化させることになりました。

科大訊飛がAstronClawのアップグレード版を発表:9製品を新規発売し、ソフトウェアとハードウェア一体化されたAIエージェント構造を提供