データセンター間のイノベーション：Moonshot AI と清華大学が PrfaaS アーキテクチャを提案

大規模言語モデル（LLM）が推論プロセスにおいて計算リソースの需要が増すにつれて、従来のサービスアーキテクチャはボトルネックに直面しています。Moonshot AI と清华大学の研究チームは最近、データセンターおよびコンピューティングリソースの制限を打破するための新しいアーキテクチャ「プリフィル・アズ・サービス（PrfaaS）」を発表しました。

現在、大規模言語モデルの推論プロセスは通常、プリフィルとデコードの2つのステージに分かれています。プリフィルステージはモデルが入力を処理し、キーバッファーキャッシュ（KVCache）を生成する高計算集約的なプロセスであり、デコードステージはモデルが順番に出力を生成するメモリバンド幅集約的なプロセスです。従来のアーキテクチャでは、この2つのステージを同じデータセンター内で行う必要があり、これにより計算とバンド幅の制限が生じます。

PrfaaS は、プリフィルタスクを専用の高性能計算クラスタにオフロードし、生成された KVCache を一般的なイーサネットを通じてローカルなデコードクラスタに送信することで、データセンター間での効率的なサービスを実現しています。研究によると、このアーキテクチャは処理性能で顕著な向上を示しており、従来のモデルと比較してサービススループットが54%向上しています。実際のケーススタディでは、このアーキテクチャは低い遅延と高い効率を示しています。

PrfaaS アーキテクチャの設計は、計算、ネットワーク、ストレージの3つのサブシステムを別々に管理し、正確なルーティングメカニズムによって長時間のリクエストを効率的に転送し、従来の方法でリソース配分の不均衡によって引き起こされる混雑問題を回避しています。また、このシステムは異なるトラフィックパターンの変化に対応するための二段階スケジューリングメカニズムを導入しており、さらにリソースの利用を最適化しています。

データセンター間の推論の需要が増加し、新しいハードウェアが次々と登場する中、PrfaaS は将来的なAIアプリケーションに対する新たなソリューションを提供するでしょう。

OpenAIはトランプ大統領のAI行政命令を支持：モデル公開前に政府によるセキュリティ評価を受け入れる意思

OpenAIはトランプ大統領が署名したAIモデル公開前の審査に関する大統領令に従うと表明。グローバル担当責任者がSXSWで命令に署名し評価に参加する意向を示し、責任を真摯に受け止め、強力な技術を持つ企業として慎重に行動する必要性を強調した。....

OpenAIのCEOサム・オルトマン：積極的なAIが今後のトレンドとなる

OpenAIのCEOサム・アルトマンはAI製品の三段階発展理論を提唱：第一段階はチャットモデル（ChatGPT）、第二段階はエージェントベースのシステム（Codex）、第三段階は「積極的なAI」でバックグラウンドで自動実行。現在のエージェント段階が最大の製品カテゴリーだが、ユーザー利用には限界がある。....

AI音楽創作の新しいトレンド：杭州の男性が1か月で数十万円を稼ぐ 40秒で一首の曲を生成

杭州のあるクリエイターがAI音楽ツールを活用し、画像をアップロードして40秒で完全な楽曲を生成。多彩なジャンルとリアルなボーカルで真偽を見分けがたい。低コストで大量制作し、音楽・ショート動画プラットフォームに配信、月収10万元以上を達成。AI技術の音楽創作における商業的可能性を示している。....

ゼロから楽理の基礎を学び、AIを使って曲を作成し、月収10万円以上を達成した男性。40秒で全曲風の楽曲を生成可能

浙江省杭州市の男性が、音楽の基礎知識がないにもかかわらず、AIツールを活用して月収十数万元を達成し、注目を集めている。彼はアイデアや鼻歌を提供するだけで、AIが作詞、作曲、編曲、歌唱を自動で行い、音楽制作のハードルを大幅に下げた。生成AIが音楽分野で示す革新的な効率性と変革を象徴している。....

MiniMax は新しいモデルの料金体系の変更により謝罪します：コミュニケーションが不十分だったことを認知し、古いユーザーに対する補償と返金計画を発表しました