北京智譜華章科技有限公司近期宣佈,將旗下GLM-4-Flash大型語言模型的API接口免費向公衆開放,以推動大型模型技術的普及和應用。
GLM-4-Flash模型在速度和性能上都展現出顯著的優勢,特別是在推理速度方面,通過採用自適應權重量化、並行處理技術、批處理策略和投機性採樣等優化措施,實現了高達72.14token/s的穩定速度,這一速度在同類模型中表現突出。
在性能優化方面,GLM-4-Flash模型在預訓練階段使用了10TB的高質量多語言數據,這使得模型不僅能夠處理多輪對話、網頁搜索、工具調用等任務,還支持長文本推理,最大上下文長度可達128K。此外,該模型還支持包括漢語、英語、日語、韓語、德語等在內的26種語言,顯示出其強大的多語言能力。
爲了滿足不同用戶對模型的特定需求,智譜AI還提供了模型微調功能,幫助用戶將GLM-4-Flash模型更好地適配到各種應用場景中。智譜AI的這一舉措,旨在讓更廣泛的用戶羣體能夠體驗並利用先進的大型模型技術,進一步拓展AI技術的應用邊界。
接口地址:https://open.bigmodel.cn/dev/api#glm-4