淘天グループと愛橙科技は、大規模言語モデルのトレーニング性能向上、トレーニングコスト削減、そしてLLaMAコミュニティとの互換性を目的とした大規模モデルトレーニングフレームワーク「Megatron-LLaMA」をオープンソース化しました。このフレームワークは、32枚のGPUを用いたトレーニングにおいて176%の高速化を実現し、ネットワーク不安定性に対しても高い耐性を示します。Megatron-LLaMAは、最適な設定の自動選択、モデル構造変更への対応、そして様々なハードウェア環境下での最高性能トレーニングソリューションに焦点を当てています。
関連推奨
智譜がGLM-5を発表:コード生成からエンジニアリング構築へのAgentic Ready時代へ
智谱が新たな基盤モデルGLM-5をオープンソース化。コード生成から複雑なシステム開発までを自律的に遂行する能力を実現し、世界ランキングで4位、オープンソースモデルでは1位を獲得。Claude Opus4に匹敵する性能と優れたエンジニアリング能力を備える。....
AI版のApp Storeが登場?アマゾンがコンテンツライセンス市場に参入:出版業者が大規模言語モデルから使用料を徴収する時代が開幕
アマゾンはAIコンテンツ市場を立ち上げる計画であり、出版業者が直接テクノロジー企業にコンテンツの著作権を販売し、大規模言語モデルの訓練データに関する著作権トラブルを解決し、コンテンツライセンスの規格化を推進しようとしている。
2億5500万ドルの資金調達:AI研究室Fundamentalが進化し、Nexusモデルで大規模なモデル分析能力を再構築
AIスタートアップのFundamentalが隠密状態を終え、2億5500万ドルのAラウンド資金調達を発表しました。この資金調達後の評価額は12億ドルに達しました。今回の資金調達はOak HC/FTなどの複数の機関が主導し、PerplexityやDatadogのCEOも個人として参加しました。会社のコア製品である基礎モデル「Nexus」は、ChatGPTなど主流の大規模言語モデルと競合することを目的としています。
カーネギー・メロン大学が新たなAIシステムを開発:指揮者のようにリアルタイムで3Dプリンティングの欠陥を修正
カーネギー・メロン大学の研究チームは、大規模言語モデルを基盤とした3Dプリンティングのリアルタイムエラー修正システムを開発しました。このシステムは交響楽団のように設計されており、一つの「指揮者」というエージェントが4つの専門的なエージェントを調整します。これは、印刷プロセスにおける微細なパラメータ変動によるエラーを自動的に検出および修正し、従来のオープンループシステムでは失敗する可能性があった問題を解決します。
研究が明らかにした就職の冬はChatGPTの登場よりも早く、AIの波動は2022年初頭から現れていた
研究によると、AIによる雇用への影響はChatGPTのリリース以前から始まっていた。ビッグデータ分析により、2022年初頭にはAI関連職の需要が既に減少傾向にあり、一般の認識より数ヶ月早かったことが明らかになった。....
