Midjourney創始人兼CEO David Holz近日在Discord上的"辦公時間"中,親自分享了公司當前項目的最新進展,並回答了社區用戶的問題。這次交流透露出Midjourney正在進行多方面的技術創新,以應對日益激烈的AI圖像生成領域的競爭。

新版本推遲但功能更豐富

儘管Midjourney在短時間內取得了快速進步,但最近新模型的發佈頻率明顯放緩。公司最新的6.1版本是在7月份發佈的,此後用戶經歷了一段較長的等待期。原計劃在夏季前推出的第7版現在有了新的時間表:預計將在一到兩個月內準備就緒。

Holz表示,開發團隊並非急於推出新模型,而是將重點放在提高技術的可訪問性和工具的日常專業使用價值上。例如,許多用戶最初對必須使用Discord感到不適應,現在公司已經爲所有用戶提供了網頁界面,包括那些想免費試用AI圖像生成的用戶。

性能提升與新功能

Midjourney計劃在近期推出一些新功能來提升用戶體驗:

多圖生成:用戶將能夠一次性生成8張圖像,這是對目前4張限制的提升。

圖像編輯器:公司正在開發一個允許用戶編輯外部圖像(如照片)的工具,包括局部重繪(inpainting)和擴展繪製(outpainting)功能。

3D系統:一個更具雄心的項目是開發允許用戶虛擬沉浸在AI圖像中的3D系統。該系統將採用一種新的"類NeRF"格式,而非傳統的多邊形渲染、NeRF或高斯散射技術。

個性化:基於用戶反饋,Midjourney aims to learn更多關於用戶偏好的信息,從而提供更個性化的結果。這項功能最近已在專門生成動漫角色的Niji模型中啓用。

image.png

視頻生成:除了靜態圖像,Midjourney也計劃涉足視頻生成領域。

硬件開發:公司還在軟件之外投資硬件開發。

面對OpenAI等競爭對手的快速發展,Midjourney選擇了一條更加穩健的發展道路。通過推出更多實用功能和提升用戶體驗,而非僅僅追求模型迭代速度,Midjourney希望在AI圖像生成這個競爭激烈的領域中保持自己的獨特優勢。

產品入口:https://top.aibase.com/tool/midjourneywangyeban