YandexがLLM訓練の効率性向上を実現するオープンソースツールYaFSDPを発表

ロシアのテクノロジー大手Yandexは先日、独自開発の大規模言語モデル（LLM）トレーニング最適化手法であるYaFSDPツールをグローバルなAIコミュニティにオープンソースとして公開しました。これは、現在業界で最も効率的な手法と言われています。広く使用されているFSDP技術と比較して、YaFSDPはLLMトレーニング速度を最大26％向上させることができ、AI開発者や企業は大量のGPUリソースを節約できる見込みです。

YaFSDP（Yandex Full Sharded Data Parallel）は、FSDPをベースに強化されたバージョンで、GPU通信効率とメモリ使用率の最適化に重点を置いており、LLMトレーニングにおけるボトルネックを解消します。事前トレーニング、アライメント、ファインチューニングなど、通信負荷の高いタスクにおいて、YaFSDPは卓越した性能向上を示し、特にパラメータ規模が300億～700億に達する場合にその効果は顕著です。

AI、人工知能、ロボット、2024d9dc94358d8e

画像出典：AI生成画像、画像ライセンス提供元Midjourney

Yandexの上級開発スペシャリストでYaFSDPチームメンバーのMikhail Khruschev氏は次のように述べています。「YaFSDPは、LLaMAアーキテクチャに基づく広く使用されているオープンソースモデルに最適です。私たちは継続的な最適化を行い、様々なモデルアーキテクチャやパラメータサイズでの多機能性を拡張することで、より幅広い場面でのトレーニング効率向上を目指しています。」

推定によると、700億パラメータのモデルをトレーニングする場合、YaFSDPを使用することで約150台のGPUリソースを節約でき、これは月額50万～150万ドルの計算コストの削減に相当します。このコスト削減により、中小企業や個人開発者にとって、独自のLLMトレーニングがより現実的なものになるでしょう。

同時に、YandexはグローバルなAIコミュニティの発展に貢献し続けることを約束しており、YaFSDPのオープンソース化はその約束を実行に移したものです。これまでに、同社はCatBoost高性能勾配ブースティングライブラリ、AQLM極限モデル圧縮アルゴリズム、Petalsモデルトレーニング簡素化ライブラリなど、多くの高く評価されているオープンソースAIツールを公開しています。

業界アナリストは、LLMの規模が拡大するにつれて、トレーニング効率の向上が人工知能の発展の鍵となると指摘しています。YaFSDPなどの技術的ブレークスルーは、AIコミュニティがより迅速に大規模モデルの研究を進め、自然言語処理やコンピュータービジョンなどの分野における応用可能性を探求するのに役立つでしょう。

工業情報省など3省が連携して『人工知能端末のスマート化レベル』国家標準を発布

5月8日、工業情報省、市場監督管理総局、商務部は共同で『人工知能端末のスマート化レベル』国家標準を発布し、統一した評価システムを構築しました。この基準は「2+N」アーキテクチャを採用し、スマート端末の定義、レベル付けのロジックおよび試験方法を明確にしています。L1対応レベルからL4協調レベルの4段階の能力スケールを設け、L4レベルは技術の進展とともに後ほど改善されます。

MozillaがAIを活用してFirefox 271のセキュリティ脆弱性を発見

MozillaのエンジニアはAnthropicのClaude Mythos AIモデルを活用し、Firefox 150バージョンで271件のセキュリティ脆弱性を発見・修正した。うち180件は高リスクと評価され、通常のWeb閲覧でも影響を受ける可能性がある。他に80件の中リスクと11件のその他レベルの脆弱性が含まれる。....

報告：世界中でAIの利用が急増し、豊かな国と貧しい国の格差が拡大

マイクロソフト2026年の報告によると、世界中の17.8%の就業適齢人口が生成型AIを使用しているが、先進国と開発中諸国との間にギャップが広がっている。先進国では15〜64歳の人々の27.5%がそのツールを使用しているが、開発中諸国ではわずか15.4%にとどまっている。このギャップは2025年後半に比べて1.5ポイント拡大した。主な理由はインターネットへのアクセス、デジタルスキル、電力供給の違いである。

OpenAI、3種類のリアルタイム音声モデルをリリース GPT-5レベルの推論能力が実用化

OpenAIがGPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisperの3つのリアルタイム音声モデルを発表し、Realtime APIに統合。GPT-Realtime-2は最も賢いAI音声モデルで、音声対話における高遅延、自然な割り込みの困難さ、多言語サポートの課題を解決することを目指す。....

YandexがLLM訓練の効率性向上を実現するオープンソースツールYaFSDPを発表

関連推奨

上海でAIセキュリティ監督の試行が始まる

工業情報省など3省が連携して『人工知能端末のスマート化レベル』国家標準を発布

MozillaがAIを活用してFirefox 271のセキュリティ脆弱性を発見

報告：世界中でAIの利用が急増し、豊かな国と貧しい国の格差が拡大

OpenAI、3種類のリアルタイム音声モデルをリリース GPT-5レベルの推論能力が実用化