上海人工知能研究所は先日、低コストの大規模モデル訓練ツールキット「XTuner」を発表しました。これは様々なハードウェアに対応しており、開発者はわずか8GBのコンシューマー向けビデオメモリで、特定のニーズに合わせた「専用の大規模モデル」を訓練することができます。これにより、訓練コストのハードルが大幅に低くなります。XTunerは、書生・浦語、Llamaなど複数のオープンソースの大規模モデルに対応し、増分事前学習、指示微調整などのタスクを実行できます。同時に、使いやすさと設定可能性を両立しており、増分事前学習、シングルターン&マルチターン対話指示微調整、ユーティリティ指示微調整の標準化されたワークフローを内蔵しているため、開発者はデータ自体に集中できます。XTunerは、上海人工知能研究所が推進する大規模モデルの研究開発と応用における包括的なオープンソースシステムの実用的なツールとしての地位をさらに強化し、業界全体で技術の進歩を促進します。
関連推奨
OpenAIがNeptuneを買収、実験監視ツールがGPTのイテレーション速度を倍に
OpenAIが実験管理企業Neptuneを買収し、その監視・デバッグツールをトレーニング技術スタックに統合。モデル開発のリアルタイム可視性を向上させ、実験追跡と自動アラート機能を共同で最適化する。....
Dec 4, 2025
155.4k
テンセントクラウド、星脈ネットワーク2.0を発表 大規模モデルのトレーニング速度を20%向上
テンセントクラウドは最近、大規模モデルのトレーニング効率を向上させることを目的としたアップグレード版の星脈ネットワーク2.0を発表しました。以前のバージョンでは、大規模モデルの計算結果の同期通信時間が50%以上を占め、効率が低下していました。新バージョンの星脈ネットワーク2.0では、複数の側面でアップグレードが実施されました。
Jul 1, 2024
106.7k
中興通訊、大規模モデル訓練に対応した最新のAIサーバーを発表
中興通訊は、中小規模モデルのトレーニングと推論ニーズに対応した最新のAIサーバーを発表しました。G5シリーズサーバーを発表し、今年中には大規模モデルのトレーニングに対応した最新のAIサーバーを発表する予定です。
Oct 12, 2023
114.3k
AI大規模モデル訓練の裏側、データ産業チェーンが形成されつつある
データは新たな生産要素として、データ産業チェーンを形成しつつあります。大規模モデルの訓練には膨大な高品質なデータが必要であり、データは将来の大規模モデル企業のコアコンピタンスの一つとみなされています。データの計算と取引は、権利確定、セキュリティ管理など多くの課題に直面しています。
Aug 9, 2023
88.0k
データが示す:ChatGPT PlusがAIサブスクリプションサービスの顧客維持率でトップに
ウォールストリートジャーナルの報道によると、ChatGPT PlusはあらゆるAIサブスクリプションサービスの中で驚異的なユーザーエンゲージメントを示しており、6ヶ月後の有料ユーザー維持率は71%に達し、業界トップとなっています。Earnest Analyticsが提供したこのデータによると、それに続くのはAnthropicのClaude Proサービスで、維持率は62%。GoogleのGemini Advancedは60%の維持率で3位となっています。Perplexi…
Jan 17, 2025
155.5k
