2025年1月15日,北京月之暗面科技有限公司宣佈全新多模態圖片理解模型moonshot-v1-vision-preview正式發佈,該模型完善了moonshot-v1模型系列的多模態能力,助力Kimi更好地理解世界。

Vision模型具備強大的圖像識別能力,能準確識別圖像中的複雜細節和細微差別,無論是食物還是動物,都能區分出相似但不相同的對象。例如,面對16張相似的人眼較難區分的藍莓鬆餅和吉娃娃圖片,Vision模型能精確地區分和識別。

Vision模型還擁有國內領先的高級圖像識別能力,在OCR文字識別和圖像理解場景中表現優異,比普通文件掃描和OCR識別軟件更加準確,能識別收據單、快遞單等潦草的手寫內容。

微信截圖_20250115135433.png

Vision視覺模型支持多輪對話、流式輸出、工具調用、JSON Mode、Partial Mode等特性,但暫不支持聯網搜索,不支持創建帶有圖片內容的Context Cache,但支持使用已創建成功的Cache調用Vision模型,不支持URL格式的圖片,目前僅支持使用base64編碼的圖片內容。

模型計費

模型計費單位價格
moonshot-v1-8k-vision-preview1M tokens¥12.00
moonshot-v1-32k-vision-preview1M tokens¥24.00
moonshot-v1-128k-vision-preview1M tokens¥60.00