1.2.2 Midjourney
与Stable Diffusion相反,Midjourney是一款付费且闭源的AI绘画软件,如图1-36所示。它于2022年3月面世,创始人是David Holz。Midjourney并没有以APP或者网站的形式提供服务,而是将服务器搭载在Discord的频道上,用户可以进入Discord的Midjourney服务器,选择一个频道,然后在聊天框里调用/imagine命令,指示聊天机器人生成图片,如图1-37所示。Midjourney所有的功能都是通过调用聊天机器人程序实现的。对于大多数人来说,这是一种新奇的体验。
图1-36 Midjourney官网作品
图1-37 在Discord聊天软件中的Midjourney频道
Midjourney的最新模型拥有更多关于生物、地点、物体等的知识,它更擅长正确处理小细节,并且可以处理包含多个角色或对象的复杂提示。第4版模型支持图像提示和多提示等高级功能,具有非常高的一致性,并且在图像提示方面表现出色。
Midjourney团队一直在努力改进其算法,每隔几个月就会发布新的模型版本。其算法第二版于2022年4月推出,第三版于7月25日发布。2022年11月5日,第四版的alpha迭代版发布,第五版的alpha迭代版于2023年3月15日发布。
1.Midjourney的优势
● 专注于模型迭代—Midjourney是闭源的并且已经盈利了,未来将会有足够的现金流来支撑它的研发,另外在竞争的初期,保持闭源,能够保持自己的竞争优势,从而将注意力更多地花在产品的提高上。
● 图片质量高—按目前看,Midjourney制作的图片质量都比较高,它的水平下限比Stable Diffusion高不少。另外工具软件也相对简洁、易用,相比庞杂的Stable Diffusion来看,轻便许多。
● 产品特性强—Midjourney团队不断致力于优化产品体验,他们的目标是将Midjourney打造成一个庞大的、精致的、易用的、高效的人类想象力的基础设施。
2.Midjourney的缺点
● 使用成本高—Midjourney是付费应用,每生成一张图,都会消耗对应的积分,为了获得满意的图片,用户往往都需要进行多次修改和调整,这带来了昂贵的使用成本。
● 画面控制能力不足—目前,Midjourney无法像Stable Diffusion那样,允许用户通过ControlNet插件对画面的构图、人物的动作甚至表情进行干预。用户可以通过设置参考图的方式来影响图片生成,但可控性并不强。
● 无法使用自定义的插件或模型—在Midjourney中用户无法训练并使用自己的模型,用户无法自由探索创作的边界,也没有足够多的第三方插件供用户选择使用。