最近我测试了一下若干基于大语言模型可以免费进行图像生成和编辑的软件,个人发现Grok的表现相当不俗,同时每日可免费生成的图像配额足以满足普通用户的使用需要。而国产的的千问模型(版本3.5)对于图像风格迁移或者修饰表现不错,不过每日可免费生成的图像配额数较低。另外,豆包虽然也允许用户上传图像用于新的图像生成,但是本质上和通过语言描述进行全新的图像生成没有差别,无法在原图像上进行编辑修改。下图中所有图像都使用了Grok,有三张为Grok的直接输出,另外有三张是在Grok处理后再利用千问做了风格迁移呈现的最终效果图。

       当然图像生成模型最主要的问题依然是众所周知的难以遵循物理规律的问题,比如这次测试中最后一张图像面对镜像的处理,我已经是经过多轮测试后选取的表现最佳的图像,无论Grok还是千问都无法生成完全符合反射定理的图像。