深度求索は、670億パラメーターの大規模言語モデル「DeepSeekLLM67B」を公開しました。このモデルは完全にオープンソースであり、申請不要で商用利用が可能です。
DeepSeekLLM67Bは、推論、数学、プログラミングにおいて良好な性能を示し、オープンな領域での推論テストでも高い能力を有しています。
深度求索は、70億パラメーターと670億パラメーターの2種類のモデルに加え、トレーニング途中の9個のチェックポイントも公開しています。
詳細は、DeepSeekのHugging Faceページをご覧ください。
