在多模態大語言模型(MLLM)迅速發展的浪潮中,字節跳動與清華大學近日聯合發佈了名爲 ChatTS 的新型時序多模態大模型。ChatTS 的推出不僅爲時序數據的處理與推理注入了新活力,也填補了當前市場在這一領域的空白。該模型的開發旨在提升 AI 在時序數據問答與推理中的應用能力,尤其在 AIOps 與金融等需要處理複雜時序數據的場景中顯得尤爲重要。
本次研究的主要作者是清華大學的三年級博士生謝哲,合作團隊還包括來自字節跳動的李則言和何曉,指導教師則是字節跳動的研究科學家張鐵贏和清華大學計算機系副教授裴丹。ChatTS 的核心優勢在於其原生支持多變量時序問答與推理功能,解決了以往模型在處理時序數據時的侷限性。

時序數據分析一直以來依賴於傳統的統計模型或 AI 模型,這些模型通常需要大量特定數據的訓練和複雜的預處理。這使得通用性和可解釋性成爲其主要短板。而 ChatTS 的出現正是爲了改變這一現狀,利用其強大的語言建模能力來實現對時序數據的自然語言理解。
爲了應對時序與語言之間的匹配困難,研究團隊採用了 “純合成驅動” 的方式,設計了一套端到端的數據生成與模型訓練框架。通過構建 “屬性驅動” 的時序生成體系,ChatTS 能生成多樣化且真實的時序數據,同時確保與自然語言描述的準確對應。

在具體的應用中,ChatTS 能夠分析多變量時序的形態,識別未見過的波動模式,並能自動進行命名。此外,模型還可以在沒有精確提示的情況下,準確提取時序數據中的異常波動,展現了其強大的靈活性和智能化特徵。

這一創新模型的發佈,將大大推動時序數據在各行業中的應用,未來可能在故障診斷、金融分析等領域發揮重要作用。ChatTS 的研究成果已被頂級數據庫會議 VLDB2025接受,展現了其學術價值和實際應用前景。

