【AI日報】へようこそ!ここは毎日あなたが人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用について理解を深めていただきます。

新規のAI製品クリックして詳細を確認https://app.aibase.com/zh

1. ツイッター(ByteDance)がストーリーメムシステムを開発、AI動画生成におけるキャラクター一貫性の問題を解決

ツイッターと南洋理工大学の研究チームは、AIで動画を作成する際のキャラクターと環境の不一致問題を解決するための「StoryMem」システムを開発しました。このシステムはキーフレームを保存し、後続のシーン生成時に参照することで、キャラクターと環境の一貫性を維持します。研究結果によると、StoryMemはシーン間の一貫性を28.7%向上させたものの、複雑なシーンでは課題があり、明確なキャラクター説明が必要です。

image.png

【AiBase要約:】

🌟 StoryMemシステムは、AI動画生成におけるキャラクターおよび環境の不一致問題を効果的に解決できます。

📊 キーフレームを保存することにより、StoryMemは既存モデルよりもシーン間の一貫性において28.7%向上しています。

🛠️ 複雑なシーンを処理する際には課題があります。キャラクターの明確な説明が必要です。

詳細リンク:https://kevin-thu.github.io/StoryMem/

2. 月の暗面がマルチモーダル新モデルを発表、Kimi K2アップグレード版は第1四半期に登場予定

月の暗面は、2026年第1四半期にマルチモーダルモデルK2.1/K2.5をリリースする計画を発表しました。このモデルは、テラパラメーターオープンソースモデルKimi K2を基盤としてアップグレードされ、マルチモーダル処理とエージェント機能が強化されます。同社は現在、100億元以上の現金準備金を持ち、継続的な研究開発に十分な資金を確保しています。

image.png

【AiBase要約:】

🚀 月の暗面は、2026年第1四半期にマルチモーダルモデルK2.1/K2.5をリリースする予定です。

🧠 新モデルは、テラパラメーターのオープンソースモデルKimi K2に基づいてアップグレードされ、「考える」と「ツールを使って協力する」ことができるThinkingモデルをサポートします。

💰 月の暗面は100億元以上の現金準備金を持っています。

3. AIグラスの新王者登場!「魂のコンピュータ」Pickle 1、あなたの人生すべてを記憶できる

Pickle1は、AR表示と高度なAIを統合したスマートグラスであり、「魂のコンピュータ」として定位されています。ユーザーの視覚と音声文脈を継続的に収集し、無限の記憶、感情の理解、積極的な相互作用を実現します。

image.png

【AiBase要約:】

🧠 Pickle1は、ユーザーの生活習慣を主に学習し、日常体験を検索可能な「記憶のバブル(memory bubbles)」に変換します。

👓 Pickle1は軽量設計で、一日中着用可能で、両目フルカラーAR表示とクアルコムSnapdragon AIエンジンをサポートします。

🔒 Pickle1はデータをローカルで処理し、ハードウェア隔離暗号化を使用して、ユーザーのプライバシーを確保します。

詳細リンク:https://www.pickle.com/

4. 清華大学とOpenBMBが共同でUltraEval-Audioをリリース:音声モデル評価フレームワークをオープンソース公開

UltraEval-Audioは、清華大学NLP研究所、OpenBMB、そしてマイクロバトルが共同で開発した音声モデル評価フレームワークです。最新バージョンv1.1.0では、人気のある音声モデルの一括再現機能が追加され、TTS、ASR、Codecなどの専門モデルのサポートも拡大されました。このフレームワークのオープンソース化により、研究者の音声モデル開発効率が著しく向上し、関連分野の研究進展が促進されます。

image.png

【AiBase要約:】

🌟 UltraEval-Audioは音声モデル向けに設計された評価フレームワークであり、複数の機関が共同で開発しました。

🚀 最新バージョンv1.1.0では、一括再現機能が追加され、より多くの専門モデルの評価が可能です。

📈 オープンソース化により、研究者の開発効率が向上し、音声モデル分野の発展が促進されます。

詳細リンク:https://github.com/OpenBMB/UltraEval-Audio

5. OpenAIが「音声優先」未来に賭ける!複数チームを統合して音声モデルを再構築、初のAI音声ハードウェアは来年登場予定

記事では、OpenAIが音声インタラクション分野における戦略的配置を分析し、音声システムの再構築を通じて人機対話が画面終了時代に入り、音声優先のハードウェア製品を探る endeavour を強調しています。

image.png

【AiBase要約:】

🎙️ OpenAIは音声戦略を再構築し、2026年に音声優先の個人用デバイスをリリースする予定です。

🔊 新しい音声モデルは、より自然な音声合成とリアルな会話中断を実現します。

📱 OpenAIは、スクリーンレスのスマートスピーカー、AIグラスまたはウェアラブルデバイスを計画しており、ユーザーの「スマートパートナー」になることを目指しています。

6. 無限にGeminiの枠を超える魔法のツールAntigravity!複数アカウントをワンタッチで切り替えて、AI制限の悩みから解放

Antigravity Toolsは、オープンソースのデスクトップアプリケーションで、インテリジェントなアカウント管理とシームレスな切り替え機能により、ユーザーがGemini、Claudeなどの上位モデルの使用時間を無限に拡張する手助けをします。

image.png

【AiBase要約:】

🧠 実時間の残額監視:アプリは複数のAIアカウントの残額と健康状態を全体的に監視できます。

🔄 最適なアカウントを自動推薦:システムはリアルタイムアルゴリズムに基づき、残額が多いアカウントを選び、ワンタッチでシームレスに切り替えることができます。

🌐 多種プロトコル互換性:Webセッションを標準APIインターフェースに変換し、異なるベンダーのプロトコルの違いを解決します。

詳細リンク:https://github.com/lbjlaq/Antigravity-Manager

7. 元象がXVERSE-Entの大規模モデルをオープンソース公開!広範なエンタメシーンを対象にし、中国語・英語の両言語対応、業界特化モデルの空白を埋める

元象科技は、広範なエンタメ業界向けに特化した大規模モデル「XVERSE-Ent」をオープンソース公開しました。このモデルは、SNSでの交流、ゲームの物語、文化創作などにおいて優れた性能を示しており、さまざまなニーズに対応する多パラメーターバージョンを提供しています。

image.png

【AiBase要約:】

🎮 広範なエンタメシーンに最適化されており、SNS交流、ゲーム物語、文化創作をサポートします。

🧩 多パラメーターバージョンを提供し、導入が簡単で商用利用にも友好なオープンソース協定を採用しています。

🌐 中国語・英語の両言語対応しており、大量の中国語ネット小説と多言語映像テキストが含まれています。

8. アップルが「AI機能が削除されている可能性がある」とのコメントに対し正式に回答:第三者ソフトウェアで制限を回避しないように注意、アカウントリスクに注意

アップルは、国行版Appleスマート機能の灰度テストに関する噂に対して正式に返答し、現在はまだリリースされていないことを明確にし、ユーザーに第三者ソフトウェアによってAI機能を強引に有効化しないように注意を促しました。

image.png

【AiBase要約:】

アップル公式は、国行版Appleスマート機能はまだリリースされていないことを確認し、公式公告に従ってください。

Appleスマート機能はハードウェア性能に高い要求があり、iPhone15Pro以降の機種のみが対応しています。

アップルはユーザーに第三者ソフトウェアでAI機能を強引に有効化しないように警告し、アカウントと資金の安全リスクを防ぐ必要があります。