在這個個性化至上的時代,AI如何更懂你?想象一下,當你在聊天軟件中輸入“我通過了,很開心!”時,一個懂得你心意的AI,不僅識別出你的興奮情緒,還記起你偏愛笑臉貓的表情,於是,它爲你量身打造了一系列獨特的笑臉貓表情包。

1.jpg

在人工智能的個性化生成領域,華爲與清華大學強強聯手,打造了一項名爲PMG(Personalized Multimodal Generation)的新技術。這項技術能夠根據用戶的歷史行爲和偏好,生成符合用戶個性化需求的多模態內容,如表情包、T恤設計圖、電影海報等。

PMG的工作原理是什麼?它通過分析用戶的觀影和對話歷史,結合大語言模型的推理能力,提取出用戶的偏好。這一過程包括顯式的關鍵詞生成和隱式的用戶偏好向量生成,兩者相結合,爲多模態內容的生成提供了豐富的信息基礎。

在實際應用中,PMG技術能夠實現如下功能:

關鍵詞生成:構造提示詞指導大模型提取用戶偏好爲關鍵詞。

隱向量生成:結合用戶偏好關鍵詞和目標項關鍵詞,使用P-Tuning V2微調的偏差校正大模型,學習多模態生成能力。

用戶偏好和目標項的平衡:通過計算個性化水平和準確度,量化衡量生成效果,並優化生成內容。

2.jpg

研究團隊通過電商服裝圖片生成、電影海報場景和表情生成三個應用場景驗證了PMG技術的有效性。實驗結果表明,PMG能夠生成反映用戶偏好的個性化內容,並且在圖像相似度指標LPIPS和SSIM上表現出色。

這項技術不僅在理論上具有創新性,而且在實際應用中展現出巨大的潛力和商業價值。隨着個性化需求的日益增長,PMG技術有望在未來迎來爆發式增長,爲用戶帶來更加豐富、個性化的體驗。

項目地址:https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG