上海人工知能研究所は先日、低コストの大規模モデル訓練ツールキット「XTuner」を発表しました。これは様々なハードウェアに対応しており、開発者はわずか8GBのコンシューマー向けビデオメモリで、特定のニーズに合わせた「専用の大規模モデル」を訓練することができます。これにより、訓練コストのハードルが大幅に低くなります。XTunerは、書生・浦語、Llamaなど複数のオープンソースの大規模モデルに対応し、増分事前学習、指示微調整などのタスクを実行できます。同時に、使いやすさと設定可能性を両立しており、増分事前学習、シングルターン&マルチターン対話指示微調整、ユーティリティ指示微調整の標準化されたワークフローを内蔵しているため、開発者はデータ自体に集中できます。XTunerは、上海人工知能研究所が推進する大規模モデルの研究開発と応用における包括的なオープンソースシステムの実用的なツールとしての地位をさらに強化し、業界全体で技術の進歩を促進します。
関連推奨
OpenAIがNeptuneを買収、実験監視ツールがGPTのイテレーション速度を倍に
OpenAIが実験管理企業Neptuneを買収し、その監視・デバッグツールをトレーニング技術スタックに統合。モデル開発のリアルタイム可視性を向上させ、実験追跡と自動アラート機能を共同で最適化する。....
Dec 4, 2025
132.1k
テンセントクラウド、星脈ネットワーク2.0を発表 大規模モデルのトレーニング速度を20%向上
テンセントクラウドは最近、大規模モデルのトレーニング効率を向上させることを目的としたアップグレード版の星脈ネットワーク2.0を発表しました。以前のバージョンでは、大規模モデルの計算結果の同期通信時間が50%以上を占め、効率が低下していました。新バージョンの星脈ネットワーク2.0では、複数の側面でアップグレードが実施されました。
Jul 1, 2024
74.9k
中興通訊、大規模モデル訓練に対応した最新のAIサーバーを発表
中興通訊は、中小規模モデルのトレーニングと推論ニーズに対応した最新のAIサーバーを発表しました。G5シリーズサーバーを発表し、今年中には大規模モデルのトレーニングに対応した最新のAIサーバーを発表する予定です。
Oct 12, 2023
110.4k
AI大規模モデル訓練の裏側、データ産業チェーンが形成されつつある
データは新たな生産要素として、データ産業チェーンを形成しつつあります。大規模モデルの訓練には膨大な高品質なデータが必要であり、データは将来の大規模モデル企業のコアコンピタンスの一つとみなされています。データの計算と取引は、権利確定、セキュリティ管理など多くの課題に直面しています。
Aug 9, 2023
90.7k
ザッカーバーグ:Meta、コードを書けるAIを開発中、将来的には中堅エンジニアの代替も
MetaのCEO、マーク・ザッカーバーグが最近のインタビューで、同社が人工知能(AI)を開発中で、2025年には中堅エンジニア並みのコード作成能力を持つようになると明かしました。この発表は、AIが技術職を代替する可能性について業界で大きな議論を巻き起こしています。ザッカーバーグはポッドキャスト司会者のジョー・ローガンとの対談で、Metaは「アプリ内の多くのコード、そしてAI自身も、主にAIによって生成される」という目標に向けて取り組んでいると述べています。
Jan 21, 2025
118.9k
