AI生圖可“量身定製”！華爲清華聯手推個性化生成技術PMG

在這個個性化至上的時代，AI如何更懂你?想象一下，當你在聊天軟件中輸入“我通過了，很開心!”時，一個懂得你心意的AI，不僅識別出你的興奮情緒，還記起你偏愛笑臉貓的表情，於是，它爲你量身打造了一系列獨特的笑臉貓表情包。

在人工智能的個性化生成領域，華爲與清華大學強強聯手，打造了一項名爲PMG（Personalized Multimodal Generation）的新技術。這項技術能夠根據用戶的歷史行爲和偏好，生成符合用戶個性化需求的多模態內容，如表情包、T恤設計圖、電影海報等。

PMG的工作原理是什麼?它通過分析用戶的觀影和對話歷史，結合大語言模型的推理能力，提取出用戶的偏好。這一過程包括顯式的關鍵詞生成和隱式的用戶偏好向量生成，兩者相結合，爲多模態內容的生成提供了豐富的信息基礎。

在實際應用中，PMG技術能夠實現如下功能:

關鍵詞生成:構造提示詞指導大模型提取用戶偏好爲關鍵詞。

隱向量生成:結合用戶偏好關鍵詞和目標項關鍵詞，使用P-Tuning V2微調的偏差校正大模型，學習多模態生成能力。

用戶偏好和目標項的平衡:通過計算個性化水平和準確度，量化衡量生成效果，並優化生成內容。

研究團隊通過電商服裝圖片生成、電影海報場景和表情生成三個應用場景驗證了PMG技術的有效性。實驗結果表明，PMG能夠生成反映用戶偏好的個性化內容，並且在圖像相似度指標LPIPS和SSIM上表現出色。

這項技術不僅在理論上具有創新性，而且在實際應用中展現出巨大的潛力和商業價值。隨着個性化需求的日益增長，PMG技術有望在未來迎來爆發式增長，爲用戶帶來更加豐富、個性化的體驗。

項目地址：https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG

算力被“特工”耗盡？GitHub Copilot 緊急叫停個人賬戶註冊