近日 ,由 @ammaar 开发的创新项目 Openjourney 引发广泛关注。这款工具不仅在界面上巧妙模仿了 MidJourney,更在技术核心上深度整合了 Google Gemini SDK,并集成了强大的 Imagen4和 Veo2/3模型,为用户提供了一站式的 AI 图像和视频生成解决方案。Openjourney 旨在让用户轻松利用 AI 生成高质量的图像和视频,同时享受与 MidJourney 相似的直观交互体验。

QQ20250724-140815.png

Openjourney 充分利用 Imagen4模型,能根据用户输入的文字描述生成四张1024x1024像素的高清图片。它的界面设计借鉴了 MidJourney 经典的四宫格布局,并加入了实时加载动画,大大提升了用户体验。生成的图片可以直接下载、放大查看,甚至能一键转换为视频。

在视频生成方面,Openjourney 同样表现出色:通过 Veo3模型,用户只需输入文字描述,即可生成一段带音频的3-5秒720p 短视频;借助 Veo2模型,静态图片也能“动起来”,用户选择一张图片并添加文字描述,即可将其转化为动画视频。视频内容以2x2网格形式展示,鼠标悬停即可自动播放,交互性极强。

Openjourney 在用户体验方面也考量周全。其输入框简洁直观,用户输入提示词后点击“生成”或按下回车即可开始。平台支持全屏查看和下载作品,并通过箭头键方便用户翻阅生成历史,如同翻看相册一般。界面的流畅动画效果得益于 Framer Motion,而加载时的“骨架屏”占位则进一步提升了专业感。

Openjourney 的技术栈现代且 robust,非常适合开发者学习和二次开发。它采用 Next.js15(包含 App Router 和 Turbopack)作为前端框架,确保了出色的性能和开发体验;使用 TypeScript 提升了代码可靠性;基于 Tailwind CSS v4快速构建美观界面;利用 Framer Motion 实现流畅的交互效果;并整合了 ShadCN 和 Radix UI 保证界面的美观性和无障碍标准。其核心 AI 能力正是通过 Google Gemini SDK 调用 Imagen4和 Veo2/3模型来实现图像和视频生成。

Openjourney 的发布,无疑为开源社区带来了 MidJourney 的一个强大且充满潜力的替代方案,展示了 Google AI 技术在创意应用领域的广阔前景。

地址:https://github.com/ammaarreshi/openjourney