この記事では、国内の大規模言語モデル製品である360智脳のパフォーマンスについて解説します。C-Eval評価ランキングにおける順位、各細分項目のスコア、様々な評価における成績などを含みます。さらに、360智脳の開発経緯、強力なアルゴリズム開発チームによるサポート、そして大規模言語モデルの6つの主要要素における戦略についても紹介します。全体として、360智脳は大規模言語モデルのトップグループに位置し、目覚ましい商業的成果を収めています。
関連推奨
ウィキペディア、AIに「去れ」:LLMによるコンテンツ生成を禁止。違反者は処罰の可能性も
ウィキペディアは公式に、大規模言語モデルを用いて記事の内容を生成または再編集することを禁止し、以前のAIに対する曖昧な態度を終了しました。新しいポリシーはボランティア編集者によって圧倒的な支持を得ました。これは、情報の信頼性を維持し、AIによる正確でないまたは模倣されたコンテンツを防ぐためです。
Mar 27, 2026
378.5k
ウィキペディアが編集の新規則を発表:投票で承認され、AIによる記事の生成または再作成を厳しく禁止
ウィキペディア、3月26日の投票で新編集ポリシーを正式導入。大規模言語モデルによる記事生成・改変を明確に禁止し、内容の正確性確保と人間編集者の主導権強化を図る。....
Mar 27, 2026
160.1k
4000億パラメータを生で処理に成功!iPhone 17 Proが巨大モデルのローカル実行に挑戦 しかし速度は0.6トークン
iPhone 17 Proが4000億パラメータの大規模モデルを実行し、ハードウェア制限を突破。12GBメモリで通常200GB必要なモデルを、フラッシュメモリ転送と混合専門家モデル技術により実現。....
Mar 24, 2026
239.7k
技術最適化はさらに磨きをかける必要がある:メタ、Llama4のリリース計画を5月に延期
Metaは技術的課題による性能最適化の遅れからLlama4のリリースを5月に延期。同モデルはMetaのAI戦略の要であり、延期はOpenAIなどとの競争に影響する可能性。....
Mar 13, 2026
225.7k
xAIがGrok4.20を発表:推論性能が大幅に向上 不確定性率78%で業界記録を樹立
2026年3月12日、xAIは新世代の大規模言語モデルGrok4.20 Betaを発表しました。このモデルは価格の競争力がある一方で、非常に高い事実の信頼性により業界記録を達成しました。推論機能を有効化したインテリジェンス指数評価では、Grok4.20は48点を獲得し、前バージョンより6点上昇しました。ただし、総合ベンチマークスコア(57点)はGemini3.1Pro PreviewやGPT-5.4に少し劣るものの、AA全知テストでは優れた成績を収め、非幻覚率が78%に達しました。
Mar 13, 2026
308.2k
