北京百川智能科技有限公司は先日、企業が低コストで大規模モデルのプライベート展開を実現し、効率性を向上させることを目的としたワンストップソリューションを発表しました。このソリューションには、全チェーンにわたる高品質な汎用トレーニングデータ、Baichuan4-TurboとBaichuan4-Airの2つのモデル、そして全チェーンにわたる領域強化ツールチェーンが含まれており、企業の様々なシナリオにおけるニーズを満たすことができます。

Baichuan4-TurboとBaichuan4-Airの2つのモデルは、企業の独自データとの混合微調整により、最大96%という高い多様なシナリオでの利用率を実現しており、業界をリードする水準です。百川智能科技のソリューションは、元のモデルデータの分布と高度に一致する高品質な汎用トレーニングデータを提供し、ハイパーパラメータの動的探索や適応的配分などのアルゴリズムと組み合わせることで、モデルのパフォーマンスを大幅に向上させています。

微信截图_20241031144641.png

コスト面では、Baichuan4-Turboの展開コストとBaichuan4-Airの推論コストは、業界の同等製品の中で最低レベルです。Baichuan4-Turboは、テキスト生成、知識質問応答、多言語処理などのコア機能において顕著な向上を見せており、わずか2枚の4090 GPUで展開でき、推論コストはBaichuan4の15%に過ぎません。一方、Baichuan4-Airの推論コストはBaichuan4のわずか1%で、100万トークンのコストはわずか0.98元と、企業の運用コストを大幅に削減します。

Baichuan4-Airは、百川智能科技が初めて採用したMoE(Mixture of Experts)モデルであり、そのPRI(Pyramid、Residual、Interval)アーキテクチャは、MLPとAttentionの内部構造を維持したまま、専門家の数と活性化戦略を最適化することで、計算負荷のバランスを取り、計算量を削減し、推論速度を向上させています。

さらに、百川智能科技が提供する全チェーンにわたる領域強化ツールチェーンは使いやすく、データ取得、クレンジング、拡張、モデルトレーニング、評価、圧縮、展開など、モデル展開の全プロセスを網羅しており、企業は自社のニーズに合わせてモデルの暗号化展開とトレーニングを行うことができます。同社は様々なハードウェアの互換性問題を解決しており、主要なチップの多くに効率的に対応できます。

このソリューションの発表は、百川智能科技が大規模モデルの応用分野において重要な一歩を踏み出したことを示しており、企業に効率的で低コストなAIモデル展開の選択肢を提供します。

アドレス:https://platform.baichuan-ai.com/homePage