南洋理工と北京大学が共同でオープンソースの長期間記憶を持つ世界モデルWORLDMEMをリリースし、仮想シーンの一貫性を向上

AIbase基地

AIニュースで公開 · 1 分読む · Jul 23, 2025

最近、南洋理工大学、北京大学王選コンピュータ技術研究所および上海人工知能実験室の研究者たちは、「WORLDMEM」という長期間記憶を持つ世界モデルをオープンソースで公開しました。この新しいモデルは、視点の変化や時間の経過によっても3D空間の一貫性を維持できるようにすることを目的としており、ユーザー体験を大幅に向上させることを図っています。

WORLDMEMのコアは、革新的なメモリ機構です。この機構は、複数のメモリユニットを含むデータベースを構築し、それぞれのユニットには特定の時間に関連するシーン情報と状態データが保存されています。この機構により、モデルは過去に観測したシーンから情報を効果的に抽出し、視点や時間が変化した場合でも正確なシーンを再構築することが可能です。これにより、従来の短時間の文脈ウィンドウの制限を超えることができ、環境の詳細を長期的に保持することが可能になります。

新規シーンを生成する際、WORLDMEMのメモリ機構は膨大なメモリデータベースから現在のシーンに最も関連性のある情報を迅速に検索します。このプロセスには複雑な推論とマッチングが含まれ、抽出された情報が現在の時間、視点、シーンの状態と一致することを保証します。例えば、仮想キャラクターが環境内で移動した後、元の場所に戻った場合、モデルは以前のメモリフレームを迅速に見つけて、シーンの一貫性と整合性を確保します。

さらに、WORLDMEMは動的更新機能を持っています。仮想世界が進化するにつれて、新しいシーンと情報が継続的にメモリデータベースに追加されます。この特性により、モデルは最新の環境状態を正確に記録でき、シーン生成の質を向上させます。このモデルは条件付き拡散トランスフォーマーのアーキテクチャを採用しており、外部のアクション信号を統合して、仮想世界の第一人称視点の生成を実現しています。これにより、キャラクターが仮想環境内で柔軟に移動したり、インタラクティブに行動したりすることが可能になります。

WORLDMEMは拡散強制技術を使用してトレーニングされており、時間軸上で長期的なシミュレーションが可能です。このトレーニング方法により、シーン生成の整合性が保証され、モデルはさまざまなアクション命令やシーンの変化に対応できるようになります。アクション信号を埋め込み空間に投影し、ノイズ除去の時間ステップ埋め込みと組み合わせることで、モデルはアクション信号への反応能力を向上させています。

WORLDMEMのリリースは、仮想環境シミュレーション技術において重要な進歩であり、今後の仮想現実アプリケーションに対して強力な支援を提供しています。

オープンソースのURL: https://github.com/xizaoqu/WorldMem

ポイント:
🌍 WORLDMEMは、仮想環境における一貫性と整合性を向上させるオープンソースの長期間記憶を持つ世界モデルです。
🔍 モデルの核心的なメモリ機構は、シーン情報の効果的な保存と抽出が可能で、従来の方法の制限を突破しています。
🔄 WORLDMEMは動的更新機能を持っており、環境の変化に伴ってシーン生成の品質を継続的に最適化することができます。

OpenAIがイギリス政府と包括的協力覚書を締結し、AIの公共サービスへの応用を調査

OpenAIはイギリス政府とAI協力覚書を締結し、司法、安全、教育などの公共部門で先進的なAI技術を導入する予定である。協定はCEOのアーティマンとサイバーセキュリティ担当大臣のケイルによって署名され、政府の効率向上と専門的な解決策の開発を目指している。この協力には公衆向けのAI啓発計画も含まれており、しかし政府が民間企業の技術に過度に依存する懸念が指摘されている。現在、OpenAIはイギリスで100人以上の従業員を抱えており、グーグルも同様の協力関係を発表した。世論調査ではイギリス国民のAIに対する態度は二極化しており、31%は期待と懸念を同時に抱え、30%はより関心を持っている。

XREAL、ARスマートグラスXREAL One Proを発表：57°の超広視野角で没入体験を突破

XREALはARスマートグラスXREAL One Proを発表しました。独自開発のX Prism光学エンジン技術を採用し、57°の超広視野角を実現し、表示領域が63%向上しています。X1空間計算チップを搭載し、3ミリ秒の超低遅延を達成し、複数のデバイスと互換性があります。海外では1万件以上の予約を受け、国内価格は4299元で、7月上旬に発送予定です。

AI実力対決：OpenAIとグーグルが国際数学オリンピックで金メダルを獲得！

2025年の国際数学オリンピックでは、OpenAIとグーグルのAIモデルがともに金メダルを獲得し、6問中5問を正解する成績を収め、多くの高校生選手を上回りました。両社は昨年まで人工的な変換を必要とした正式なシステムではなく、非公式なシステムを使って問題を直接処理しました。これにより前年度より大幅な進歩を遂げました。グーグルはOpenAIの結果を公式評価なしに事前に発表したことを疑問視していますが、OpenAIは元IMOのメダリストを招聘して第三者による採点を行ったと応えています。この技術的突破の背後にある議論は、AI分野における競争の激しさを浮き彫りにしています。

テンセントクラウドがCodeBuddy AI IDEをリリース：自然言語で要件を提示、1行もコードを書かずに済む

テンセントクラウドは正式にCodeBuddy AI IDEをリリースしました。このツールは、製品、デザイン、開発を統合したワンストップのAI全領域エンジニアとして世界初と評価されています。業界全体からの注目を集めています。CodeBuddy AI IDEは独自の働き方により、ユーザーが自然言語での対話で要件を提示するだけで、製品企画からデザインプロトタイプ、フロントエンド・バックエンドのコード作成、そして本番環境へのデプロイまでを自動的に処理します。これにより「対話こそがプログラミング」というビジョンが実現されています。CodeBuddy AI IDEは

南洋理工と北京大学が共同でオープンソースの長期間記憶を持つ世界モデルWORLDMEMをリリースし、仮想シーンの一貫性を向上

関連AIニュース

DuckDuckGoが新機能をリリース：検索結果のAI生成画像を簡単に非表示に！

OpenAIがイギリス政府と包括的協力覚書を締結し、AIの公共サービスへの応用を調査

構想からリリースまでわずか几步？テンセントCodeBuddy IDEが開発の論理を逆転させ、デザイン図を一括してコードに変換

XREAL、ARスマートグラスXREAL One Proを発表：57°の超広視野角で没入体験を突破

AI実力対決：OpenAIとグーグルが国際数学オリンピックで金メダルを獲得！

テンセントクラウドがCodeBuddy AI IDEをリリース：自然言語で要件を提示、1行もコードを書かずに済む