【AIニュース】へようこそ!毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術トレンドやイノベーティブなAI製品の応用を理解するお手伝いをいたします。

新鮮なAI製品:クリックして詳細を確認https://top.aibase.com/

1. 注目のリリース!月の暗面が1兆パラメータのオープンソース大規模モデルKimi K2を発表

月の暗面がリリースしたKimi K2の大規模言語モデルは、パラメータの規模とエージェントの能力において優れています。ミックス・オブ・エキスパートアーキテクチャを採用し、自主的なツール呼び出しとコード実行能力を持ち、オープンソース戦略を通じて多様なシナリオでの応用が進んでおり、汎用的なインテリジェンス分野における競争力が示されています。

image.png

【AiBase要約:】

🧠 Kimi K2はミックス・オブ・エキスパートアーキテクチャを採用しており、パラメータ数は1兆で、強力な計算能力を備えています。

💻 Kimi K2は自主的にツールを呼び出し、コードを実行できる能力があり、複雑なタスクの処理効率を向上させます。

🚀 月の暗面はベースモデルとAPIサービスのオープンソース化を発表し、多様なシナリオでの応用を推進しています。

2. 智源がRoboBrain 2.0とRoboOS 2.0を全面オープンソース化し、10のベンチマークを更新

智源研究院は身体的知能システムの最新成果として、RoboBrain 2.0とRoboOS 2.0を発表しました。RoboBrain 2.0は強力な時空間認知能力を持ち、複雑なタスクを実行でき、多くの権威あるベンチマークテストで画期的な成績を収めました。RoboOS 2.0は世界初の身体的知能SaaSオープンソースフレームワークであり、マルチエージェント協働をサポートし、ロボットが群衆知能へと進化するのを促進しています。

image.png

【AiBase要約:】

🧠 RoboBrain 2.0は強力な時空間認知能力を持ち、複雑なタスクを効率的に実行できます。

🤖 RoboOS 2.0は本体間の協働を実現し、マルチエージェント協働をサポートし、群衆知能の発展を促進します。

📊 新技術により、ロボットの複雑な環境での理解と意思決定能力が大幅に向上しました。

詳細リンク:https://github.com/FlagOpen/RoboBrain2.0

3. 通義千問Qwen Chatのデスクトップクライアントがリリースされ、MCPの一括呼び出しが可能に

Qwen Chatのアップデートにより、より直感的なインタラクティブ体験と豊富な機能サービスが提供され、多数の強力な機能が追加され、デスクトップアプリケーションもリリースされ、ユーザーが技術原理を深く理解するためのリソース取得経路も提供されています。

image.png

【AiBase要約:】

🧠 新たな強力な機能が追加され、例えば深層学習や画像生成などが含まれます。

💻 デスクトップアプリケーションをサポートし、スムーズな接続が可能です。

🌐 技術原理を深く理解するためにリソース取得経路が提供されています。

4. 影視級TTSの神器が登場!IndexTTS2はゼロサンプルクローン+感情制御で、声優業界の革命的突破!

この記事では、IndexTTS2というテキストから音声への変換モデルの複数の革新機能について紹介しています。完全なローカル配置、ゼロサンプルの音声クローン、感情制御、正確な時間制御などがあり、映画制作や音声インタラクション分野での巨大な可能性を示しています。

image.png

【AiBase要約:】

✅ 完全なローカル配置により、使用のハードルとコストが低下します。

🔄 ゼロサンプルの音声クローンにより、音色とリズムを正確に再現します。

🎨 全球初の感情クローンとテキストの感情制御により、音声の表現力を高めます。

詳細リンク:https://index-tts.github.io/index-tts2.github.io/

5. HuggingFaceが小型スマートロボットを発売、5時間で売上額が百万を超え、299ドルから購入可能

HuggingFaceはスマートロボット分野に参入し、オープンソースのデスクトップロボットReachy Miniをリリースし、迅速に人気を博しました。5時間で売上額が13万ユーロを超えたことから、スマートロボット分野における大きな影響力が示されています。

image.png

【AiBase要約:】

🤖 HuggingFaceはオープンソースのデスクトップロボットReachy Miniをリリースし、5時間で売上が百万を超えました。

💡 Reachy Miniの有線版と無線版はそれぞれ299ドルと499ドルで、機能モジュール化設計により教育とテストの潜在力を備えています。

🌐 HuggingFaceはオープンソース哲学とコミュニティ駆動方式を通じて、ユーザーに多くの可能性と創造の空間を提供しています。

6. 実時間ビデオ生成の新進展:Meta StreamDiTは単一GPUで動作し、1秒間に16フレームの高品質なビデオを生成

Metaとカリフォルニア大学バークレー校の研究者らは、StreamDiTを開発しました。これは、1秒間に16フレームの512p解像度のビデオをリアルタイムで作成するAIモデルです。カスタムアーキテクチャと高速化技術により、効率的なフレームごとの生成が可能となり、動的ビデオ生成分野での顕著な優位性を示しています。

image.png

【AiBase要約:】

🎥 StreamDiTはフレームごとのリアルタイムビデオストリーム生成を実現し、インタラクティブ体験を向上させます。

⚙️ 移動バッファ技術を採用し、処理速度と画像品質を最適化します。

🚀 動的ビデオ生成において既存の方法よりも優れており、大きなポテンシャルを示しています。

7. PixVerse「拍我AI」に多重要素フレーム生成機能が追加

PixVerse(拍我AI)は最初と最後のフレームモジュールに「多重要素フレーム生成」機能を追加し、AIビデオ作成が物語的表現の新しい段階に入ったことを示しています。ユーザーは最大7枚の画像を重要なフレームとしてアップロードし、AIがフレーム間の意味関係を自動解析し、滑らかな動きとシーンの変換パスを構築します。これはショートドラマの分鏡や製品プレゼンテーションなどのシナリオに適用されます。

image.png

【AiBase要約:】

🖼️ 多重要素フレーム生成機能が追加され、ビデオ作成の物語性が向上しました。

🎥 AIは重要なフレーム間の意味関係を自動解析し、自然な動きとシーンの変換を実現します。

🚀 作成効率を向上させ、物語性が必要なシナリオ、例えばショートドラマや製品展示などに適しています。

8. テスラがGrok AIアシスタントをリリース:AMD Ryzenプロセッサ搭載車両のみ対象

テスラがリリースしたGrok AIアシスタントは、ドライブ体験を向上させる目的で設計されていますが、AMD Ryzenプロセッサを搭載した車両のみに適用されます。このアシスタントの現在の機能は限られており、今後のソフトウェアアップデートで徐々に拡張される予定です。

image.png

【AiBase要約:】

🚀 Grok AIアシスタントはAMD Ryzenプロセッサ搭載のテスラ車両のみに対応しています。

🔍 設定内でシステムハードウェアを確認してGrok機能を使用できます。

🚗 Grokは今後のソフトウェアアップデートを通じて機能と応用を拡大していきます。

9. OpenAIがオープンソース大規模モデルのリリースを延期、安全テストを重視

OpenAIがオープンソース大規模モデルのリリースを延期した主な理由は、さらに時間をかけて安全テストを行う必要があるためです。Sam Altmanは、モデルの重みが公開されると取り消せないため、安全性確保が最優先事項であると強調しています。延期は残念ですが、ユーザーは一般的に理解し、この決定を支持しており、安全テストの重要性を認識していると考えられています。

image.png

【AiBase要約:】

🌟 OpenAIはオープンソース大規模モデルのリリースを延期し、より多くの安全テストが必要だと発表しました。

🛡️ Sam Altmanは、リリース後にモデルを取り消すことができないと強調し、安全性確保が最優先事項であると述べています。

🔍 この延期にはユーザーが理解を示しており、安全テストの重要性が軽視されていないと感じています。

10. Liquid AIがLFM2をオープンソース:エッジAIの新王者、スピードと効率の二重突破!

Liquid AIは次世代のLiquid Foundation Models(LFM2)をオープンソース化しました。このモデルはエッジデバイスに最適化され、スピード、エネルギー効率、性能の面で新たな基準を樹立しました。構造的アダプティブ演算子アーキテクチャにより、訓練効率と推論速度が顕著に向上し、指示の追従や関数コールなどのタスクで優れた性能を発揮し、ローカルおよびエッジAIアプリケーションの理想的な選択肢となっています。

image.png

【AiBase要約:】

🧠 LFM2は革新的な構造的アダプティブ演算子アーキテクチャを採用し、訓練効率と推論速度を向上させています。

⚡ LFM2の推論速度はQwen3の2倍であり、訓練速度は前のモデルより3倍向上しています。

🔒 LFM2は長文の文脈処理をサポートし、プライバシーが敏感なローカルAIアプリケーションに適しています。

詳細リンク:https://huggingface.co/collections/LiquidAI/lfm2-686d721927015b2ad73eaa38

11. AIの時間旅行の新プレイが話題!12歳が23歳になった姿を見てみよう

この記事では、SNSで「時間旅行」チャレンジを引き起こしたAI技術について紹介しています。ChatGPTや抖音のエフェクトなどのツールを使い、写真の中の自分や他人を「年齢を増やす」ことができるのです。結果は時折笑えることもあるかもしれませんが、このようなエンターテイメント性のある技術体験は、多くのユーザーに参加を促しています。

image.png

【AiBase要約:】

🤖 AI技術は「時間旅行」チャレンジに使われており、写真の中の人を「年を取る」ことができます。

📸 ChatGPTや抖音のエフェクトを使って、面白い「時間旅行」の効果を体験できます。