國產大模型DeepSeek發佈了全新的Janus-Pro多模態大模型,正式進軍文生圖領域。這一舉動標誌着DeepSeek在多模態AI技術上的重大突破。

在GenEval和DPG-Bench基準測試中,Janus-Pro-7B不僅擊敗了OpenAI的DALL-E3,還超越了Stable Diffusion、Emu3-Gen等熱門模型。Janus-Pro採用MIT開源協議,這意味着它可以無限制地用於商業場景。DeepSeek表示,Janus-Pro是2024年11月13日發佈的JanusFlow大模型的高級版本。

DeepSeek深夜發佈全新多模態大模型 性能碾壓OpenAI

相比前代模型,Janus-Pro優化了訓練策略,擴展了訓練數據,並且模型規模更大。這些改進使得Janus-Pro在多模態理解和文本到圖像的指令跟蹤功能方面取得了重大進步,同時增強了文本到圖像生成的穩定性。

DeepSeek深夜發佈全新多模態大模型 性能碾壓OpenAI

儘管Janus-Pro目前只能處理384x384分辨率的圖像,但考慮到其緊湊的模型規模,能達到如此水準已經令人驚豔。

作爲多模態模型,Janus-Pro不僅能生成圖像,還能對圖片進行描述,識別地標景點,識別圖像中的文字,並對圖片中的知識進行介紹。

劃重點: 

🌟 DeepSeek發佈Janus-Pro多模態大模型,進軍文生圖領域。

 📈 在基準測試中,Janus-Pro-7B性能超越OpenAI的DALL-E3等熱門模型。 

✅ Janus-Pro採用MIT開源協議,可無限制用於商業場景。