近日 ,由 @ammaar 開發的創新項目 Openjourney 引發廣泛關注。這款工具不僅在界面上巧妙模仿了 MidJourney,更在技術核心上深度整合了 Google Gemini SDK,並集成了強大的 Imagen4和 Veo2/3模型,爲用戶提供了一站式的 AI 圖像和視頻生成解決方案。Openjourney 旨在讓用戶輕鬆利用 AI 生成高質量的圖像和視頻,同時享受與 MidJourney 相似的直觀交互體驗。

QQ20250724-140815.png

Openjourney 充分利用 Imagen4模型,能根據用戶輸入的文字描述生成四張1024x1024像素的高清圖片。它的界面設計借鑑了 MidJourney 經典的四宮格佈局,並加入了實時加載動畫,大大提升了用戶體驗。生成的圖片可以直接下載、放大查看,甚至能一鍵轉換爲視頻。

在視頻生成方面,Openjourney 同樣表現出色:通過 Veo3模型,用戶只需輸入文字描述,即可生成一段帶音頻的3-5秒720p 短視頻;藉助 Veo2模型,靜態圖片也能“動起來”,用戶選擇一張圖片並添加文字描述,即可將其轉化爲動畫視頻。視頻內容以2x2網格形式展示,鼠標懸停即可自動播放,交互性極強。

Openjourney 在用戶體驗方面也考量周全。其輸入框簡潔直觀,用戶輸入提示詞後點擊“生成”或按下回車即可開始。平臺支持全屏查看和下載作品,並通過箭頭鍵方便用戶翻閱生成歷史,如同翻看相冊一般。界面的流暢動畫效果得益於 Framer Motion,而加載時的“骨架屏”佔位則進一步提升了專業感。

Openjourney 的技術棧現代且 robust,非常適合開發者學習和二次開發。它採用 Next.js15(包含 App Router 和 Turbopack)作爲前端框架,確保了出色的性能和開發體驗;使用 TypeScript 提升了代碼可靠性;基於 Tailwind CSS v4快速構建美觀界面;利用 Framer Motion 實現流暢的交互效果;並整合了 ShadCN 和 Radix UI 保證界面的美觀性和無障礙標準。其核心 AI 能力正是通過 Google Gemini SDK 調用 Imagen4和 Veo2/3模型來實現圖像和視頻生成。

Openjourney 的發佈,無疑爲開源社區帶來了 MidJourney 的一個強大且充滿潛力的替代方案,展示了 Google AI 技術在創意應用領域的廣闊前景。

地址:https://github.com/ammaarreshi/openjourney