上海人工知能研究所は先日、低コストの大規模モデル訓練ツールキット「XTuner」を発表しました。これは様々なハードウェアに対応しており、開発者はわずか8GBのコンシューマー向けビデオメモリで、特定のニーズに合わせた「専用の大規模モデル」を訓練することができます。これにより、訓練コストのハードルが大幅に低くなります。XTunerは、書生・浦語、Llamaなど複数のオープンソースの大規模モデルに対応し、増分事前学習、指示微調整などのタスクを実行できます。同時に、使いやすさと設定可能性を両立しており、増分事前学習、シングルターン&マルチターン対話指示微調整、ユーティリティ指示微調整の標準化されたワークフローを内蔵しているため、開発者はデータ自体に集中できます。XTunerは、上海人工知能研究所が推進する大規模モデルの研究開発と応用における包括的なオープンソースシステムの実用的なツールとしての地位をさらに強化し、業界全体で技術の進歩を促進します。
関連推奨
OpenAIがNeptuneを買収、実験監視ツールがGPTのイテレーション速度を倍に
OpenAIが実験管理企業Neptuneを買収し、その監視・デバッグツールをトレーニング技術スタックに統合。モデル開発のリアルタイム可視性を向上させ、実験追跡と自動アラート機能を共同で最適化する。....
Dec 4, 2025
142.3k
テンセントクラウド、星脈ネットワーク2.0を発表 大規模モデルのトレーニング速度を20%向上
テンセントクラウドは最近、大規模モデルのトレーニング効率を向上させることを目的としたアップグレード版の星脈ネットワーク2.0を発表しました。以前のバージョンでは、大規模モデルの計算結果の同期通信時間が50%以上を占め、効率が低下していました。新バージョンの星脈ネットワーク2.0では、複数の側面でアップグレードが実施されました。
Jul 1, 2024
79.6k
中興通訊、大規模モデル訓練に対応した最新のAIサーバーを発表
中興通訊は、中小規模モデルのトレーニングと推論ニーズに対応した最新のAIサーバーを発表しました。G5シリーズサーバーを発表し、今年中には大規模モデルのトレーニングに対応した最新のAIサーバーを発表する予定です。
Oct 12, 2023
100.2k
AI大規模モデル訓練の裏側、データ産業チェーンが形成されつつある
データは新たな生産要素として、データ産業チェーンを形成しつつあります。大規模モデルの訓練には膨大な高品質なデータが必要であり、データは将来の大規模モデル企業のコアコンピタンスの一つとみなされています。データの計算と取引は、権利確定、セキュリティ管理など多くの課題に直面しています。
Aug 9, 2023
79.6k
元象、インテリジェントデジタルヒューマンプラットフォーム「元象日播」を発表 同一音声で多様なシーンに対応
この度、深セン元象信息科技有限公司は、最先端のインテリジェントデジタルヒューマンプラットフォーム「元象日播」を発表しました。ブランドのプレゼンテーションとコンテンツ制作に革新的なソリューションを提供します。高い自然度を誇るカスタマイズ機能、リアルタイムインタラクション機能、ワンクリックで配信を開始できる利便性を備え、既に多くの業界から注目を集めています。
Jan 24, 2025
146.0k
