新加坡國立大學發佈 NExT-GPT 多模態語言模型,支持文本、圖像、視頻和音頻處理,助力多媒體人工智能應用發展。模型採用三層架構,通過 MosIT 技術進行中間層訓練,開源貢獻爲研究者和開發者創造了集成多模態輸入的機會。NExT-GPT 的獨特之處在於能夠生成模態信令標記,爲內容生成、多媒體分析等領域帶來潛在應用前景。