記事本文

淘天グループと愛橙科技が巨大言語モデル訓練フレームワークMegatron-LLaMAをオープンソース化

公開AI二ュ-ス

時間 :Sep 13, 2023

読む :1分

淘天グループと愛橙科技は、大規模言語モデルのトレーニング性能向上、トレーニングコスト削減、そしてLLaMAコミュニティとの互換性を目的とした大規模モデルトレーニングフレームワーク「Megatron-LLaMA」をオープンソース化しました。このフレームワークは、32枚のGPUを用いたトレーニングにおいて176%の高速化を実現し、ネットワーク不安定性に対しても高い耐性を示します。Megatron-LLaMAは、最適な設定の自動選択、モデル構造変更への対応、そして様々なハードウェア環境下での最高性能トレーニングソリューションに焦点を当てています。

MiniMaxが新世代の大規模モデルを発売予定　パラメータ数は2.7兆

ミニマックス（MiniMax）が2.7兆パラメータの次世代大規模モデルを近日発表予定。複雑なタスク処理と論理推論の課題解決を狙う。同社の基礎技術への注力と、パラメータ拡張で高度な知能を追求する業界の野心を示す。....

Jul 9, 2026

260.5k

OpenAIの人員変動：元研究者である田永龍が騰訊に就職し、視覚言語モデルの開発に専念

OpenAIの元研究者である田永龍が騰訊の大規模言語モデル部に加わり、視覚言語モデルの開発に注力している。この動きは、騰訊がマルチモーダルな大規模言語モデル戦略を強化するための重要な採用と見られ、先端人材の争奪戦が激しくなっていることを示している。

Jul 9, 2026

212.7k

AIでAIを管理：Redditが自動化システムをアップグレードし、1日2300万件のスパム情報をブロック

Redditはアップグレードされた大規模言語モデルと自動化ツールを組み合わせ、高精度で隠蔽されているAI生成スパムコンテンツ、偽の行動や人為的な宣伝を監視・撲滅し、コミュニティのコンテンツの真実性を守っています。

Jul 7, 2026

192.0k

Anthropicが高性能大規模モデルClaude Sonnet 5を発表：性能はエントリーモデルに匹敵し、価格は大幅に低下

Anthropicが新中級モデルであるClaude Sonnet 5を発表しました。このモデルはコストパフォーマンスに優れており、旗舰モデルのOpusシリーズと非常に近い性能を実現しています。このモデルはこれまでで最も強力な代理機能を持ち、複雑なタスクを自主的に計画し、出力を自己チェックし、ブラウザや端末などの外部ツールを柔軟に呼び出すことができます。推論、プログラミング、知識関連のタスクにおいて優れたパフォーマンスを示します。

Jul 1, 2026

316.6k

コスト削減と効率向上の大きな動き：Metaが大規模にAIを活用してコンテンツ監査を担当

ザッカーバーグのAI推進の下、Metaは大規模言語モデルで人手審査の置き換えを加速し、AIをコンテンツ・広告の審査に深く統合。現在約50%の審査をAIが担い、コストと効率の最適化を図る。....

Jun 26, 2026

168.6k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご