在過去的兩年裏,人工智能領域的關注點逐漸轉向了大模型的技術發展,而商湯科技作爲一家成立不到十年的公司,憑藉其在計算機視覺領域的技術積累,正迅速轉型,迎接這一浪潮。儘管在2023年之前,商湯主要聚焦於視覺模型,但隨着 DeepSeek R1的發佈,市場的重心開始向自然語言處理和大規模參數模型傾斜,商湯的策略也隨之調整。

商湯於4月10日推出的全新6000億參數多模態大模型 “日日新 Sense Nova V6”,展現了強大的綜合能力,與國際領先的 GPT-4.5和 Gemini2.0Pro 不相上下。商湯不僅成功彌補了文本模型的差距,更在多模態領域厚積薄發,標誌着其在國內大模型市場中越來越重要的地位。

元宇宙 科幻 賽博朋克 繪畫 (5)大模型

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

值得注意的是,商湯在構建其多模態模型的過程中,採用了獨特的思維鏈構建方法。通過將文本、圖像、語音和視頻數據融合,商湯的日日新 V6能在同一上下文中進行有效的推理,達到1+1>2的效果。這一創新不僅提升了模型的理解與生成能力,也使得多模態之間的協同作用更加顯著。

當前,儘管市場上出現了衆多多模態模型,能夠同時處理多種數據模態的產品依然屈指可數。商湯的日日新 V6憑藉其在多模態數據融合方面的成功,逐漸顯示出其在未來人工智能競爭中的強大潛力。