カンブリア記がDeepSeek-V4を成功裏に適合させ、AIモデルの効率的な実行を推進

カンブリア社は、最新のオープンソースAIモデルであるDeepSeek-V4に対するDay 0対応を成功裏に完了したと発表しました。この取り組みにより、モデルがリリース当日から安定した動作が可能となり、ユーザーにより効率的なAI体験を提供します。カンブリア社は独自開発した高性能な統合演算子ライブラリTorch-MLU-Opsを使用し、モデル内のCompressorやmHCなどのモジュールを特定の加速を行いました。この技術導入により、推論効率が大幅に向上しました。

推論フレームワークにおいては、カンブリア社はvLLM（Variable Length Language Model）技術を採用し、TP、PP、SP、DP、EPなど多様な並列計算方式を全面的にサポートしています。また、通信計算並列処理、低精度量子化、PD分離配置などの最適化も実現しました。これらの措置により、遅延制約を満たしつつ、処理速度が顕著に向上しました。

さらに、カンブリア社はハードウェア特性を深く掘り下げ、MLUのアクセスと並べ替えを最適化することで、スパースAttentionやIndexerなどの構造の実行を高速化しました。高帯域幅と低通信遅延の特徴により、異なるワークロードシーンにおける通信割合を最小限に抑えることができ、分散型推論の利用効率を有効に向上させました。

注目すべき点として、DeepSeek-V4モデルは百万文字を超える超長文脈をサポートしており、エージェント能力、世界知識および推論性能において国内・国外のオープンソース領域で先進的な水準に達しています。ユーザーは公式ウェブサイトまたは公式アプリを通じて、最新のDeepSeek-V4とインタラクティブに接することができ、超長文脈記憶による新鮮な体験を楽しむことができます。同時にAPIサービスも更新され、開発者は新しいモデルを簡単に呼び出すことができます。

このような一連の最適化と対応作業は、モデル性能を向上させるだけでなく、今後のAI技術応用のために堅固な基盤を提供し、カンブリア社が人工知能分野で持つ強力な実力を示しています。

ポイント：
🌟 カンブリア社はDeepSeek-V4のDay 0対応を完了し、モデルリリース当日に安定して動作します。
🚀 自社開発の高性能演算子ライブラリと推論フレームワークの最適化により、推論効率が顕著に向上します。
📈 DeepSeek-V4は百万文字を超える超長文脈をサポートし、先進的なAI体験を提供します。

騰訊クラウド TokenHub が DeepSeek-V4 のプレビュー版をリリース、百万レベルのコンテキストをサポート

騰訊クラウドは、TokenHubプラットフォームで DeepSeek-V4 のプレビュー版 API を導入し、百万レベルのコンテキスト長をサポートしており、自然言語処理能力が大幅に向上しています。価格は DeepSeek の公式と一致しており、高コストパフォーマンスなサービスを提供し、国際サイトのシンガポールノードでも同時にリリースされ、グローバルユーザーをカバーしています。

カンブリア記がDeepSeek-V4全シリーズモデルのDay0対応を発表し、最適化コードをオープンソース化

カンブリア記はDeepSeek-V4全シリーズモデルの「Day0」対応を完了しました。vLLM推論フレームワークを基盤に、285BパラメータのFlash版と1.6TパラメータのPro版をカバーしています。自社開発のTorch-MLU-Ops演算ライブラリにより、スパースアテンションや圧縮構造を最適化し、モデル公開当日にカンブリア記のハードウェアで安定して動作することを確保しました。関連コードはGitHubにオープンソースされました。

DeepSeek-V4がリリース！パフォーマンスは頂級の非公開モデルに迫る。百万の文脈を備え、1元から

DeepSeekは4月24日、次世代大規模モデルDeepSeek-V4を発表。性能はトップ級クローズドモデルに匹敵し、オープンソースAIのマイルストーンに。100万トークンの超長文脈対応で、長文書分析、コード生成、マルチタスクに最適。軽量版Flashと標準版も同時リリース。....

DeepSeek-V4のベータ版が正式リリースされました：1Mに及ぶ長文のコンテキストが全員に利用可能に

深度求索がDeepSeek-V4シリーズプレビュー版を公開・オープンソース化。100万字超の長文コンテキストを実現し、エージェント協調や知識推論で国内トップレベルに。Pro版（1.6Tパラメータ、アクティブ49B）とFlash版を提供。Proはトップクローズドモデルに匹敵、Flashは効率性を重視。....

初めての年間黒字転換後、寒武紀が大手企業との競争に正面対応：汎用チップはさらに高い技術の普遍性を備える