深度求索發佈了一個名爲 DeepSeekLLM67B 的 67B 大模型,該模型完全開源並無需申請即可免費商用。DeepSeekLLM67B 在推理、數學和編程能力方面表現良好,並在開放域推理的測試中展現出較好的性能。DeepSeek 還開源了 7B 和 67B 兩種規模的模型,並提供了 9 個訓練中途的模型 checkpoints 的下載。詳細信息可訪問 DeepSeek 的 Hugging Face 首頁。