2025年1月15日,北京月之暗面科技有限公司宣佈全新多模態圖片理解模型moonshot-v1-vision-preview正式發佈,該模型完善了moonshot-v1模型系列的多模態能力,助力Kimi更好地理解世界。
Vision模型具備強大的圖像識別能力,能準確識別圖像中的複雜細節和細微差別,無論是食物還是動物,都能區分出相似但不相同的對象。例如,面對16張相似的人眼較難區分的藍莓鬆餅和吉娃娃圖片,Vision模型能精確地區分和識別。
Vision模型還擁有國內領先的高級圖像識別能力,在OCR文字識別和圖像理解場景中表現優異,比普通文件掃描和OCR識別軟件更加準確,能識別收據單、快遞單等潦草的手寫內容。
Vision視覺模型支持多輪對話、流式輸出、工具調用、JSON Mode、Partial Mode等特性,但暫不支持聯網搜索,不支持創建帶有圖片內容的Context Cache,但支持使用已創建成功的Cache調用Vision模型,不支持URL格式的圖片,目前僅支持使用base64編碼的圖片內容。
模型計費
模型 | 計費單位 | 價格 |
moonshot-v1-8k-vision-preview | 1M tokens | ¥12.00 |
moonshot-v1-32k-vision-preview | 1M tokens | ¥24.00 |
moonshot-v1-128k-vision-preview | 1M tokens | ¥60.00 |