前言
这几天玩了会之前火出圈的AI绘图,也下载的那52G的模型文件。体验之后感觉许多功能确实非常惊艳,但是许多对于细节上的把握是明显不足的。与此同时对于显卡的要求也是十分的高,尤其是显存,要直接生成1080p图片,显存至少要达到8G才可以使用。
下面的图片均是来自我自己生成的(感觉我的显卡挖了一天矿ヾ(´・ ・`。)ノ”
当然生成好看的图片有许许多多,却鲜有人提到问题,我想在这里体现出一部分。这里也只是使用了NoveAI的模型,许多东西我们肯定也是没有的,所以这只是我遇到的问题,这些模型还是不够完美,AI绘图在许多方面仍然需要完善。
简介
可以实现的功能:
- 按描述生成图片
- 以图生图
- 将图片的一部分进行替换
- 超像素(提升图片分辨率)
- 图片缩放
- 从图片中提取信息/关键词
- 自己训练模型
输入图片tag-对不好的地方进行重新绘制-以此图进行绘制-调整尺寸-最后超像素提升分辨率,一条龙服务
其实生成自己想要的图片最重要的是耐心,需要我们不停调整关键词,更改所用的模型,调整采样迭代步数,采样方法等等各种参数,对图片不满的地方进行定向修改,多次的渲染。渲染人脸的时候记得选上面部修复。
我所使用的模型:
不知各位是否好奇他的渲染过程,他给我有一种感觉就是先生成低分辨率模糊的图片,再一点点的进行计算,提升分辨率直到达到要求。在渲染的途中停下会发现生成的地方时模糊的。
样片
Nice
先来看看比较好的样片,感觉毫不逊色与人工绘制的
问题
不知道大家有没有注意到,这些照片都有一些共性的特点,这就是以下要提到的了
手
AI画出来的手总是千奇百怪,有的又尖又长,有的就剩下两个细长的手指,有的只有3根手指,还有的有6根,更有的手指直接消失或是两个手直接连在一起。可以说就没有多少正常的ヾ(´・ ・`。)ノ”
耳朵
这个其实还好了,可以人为调整调好,虽然也不是很好调,但是如果调不好,就会出现精灵耳
肢体缺失
AI理解动作
最经典的莫过于吃面条了,有那手抓的,有直接吸进去的
图生图-内部绘制
刚开始使用这个功能感觉真的是绝了,太厉害了,可以把画面上的我不喜欢的东西替换掉。感觉有点像PS的污点修复工具,但是要比那个强大好多好多。猛一看挺好,但是只要一仔细看只能说是漏洞百出。无奈放弃,哎
透视关系
正常来说这些地方应该是竖直的,感觉是受到了一些边缘信息的影响
以我小学三年级学的透视关系来说,应该是近大远小,是一个斜线。这里面虽然斜了,但是怎么看都不顺眼,应该是角度太大了
图画扭曲变形
添加无关图案
这些图片缩小起来粗看还是不错的,但是感觉AI计算的时候总是会把一些不知所以的线条加上,也可能单纯的是感觉这两个东西连上比较合适,于是…
边缘计算不成熟
给我的感觉就像是用铅笔画完又蹭了半天,整体感觉非常脏,各种的拐角都是虚的
可以看出来,AI计算的时候又是分不清背景还是主体,他们的过度非常的模糊
尤其是可以看到这张图片左边有个地方明显非常白,这就是左边背景太亮导致的
成图
最后看看成图吧,真的弄了好久,还用了一点点的ps,最终的效果说实话不是很满意,感觉我调的参数啥的还是有问题,总之以现有的模型应该是可以调成更好的。
后记
记得曾经有段话,有一个人用了好像1个月做出来了自动驾驶,于是对马斯克说不出1个月他的系统就会完善,而马斯克则回应称:前面基础的自动驾驶是很好搞定的,难点是后面细节的20%,尤其是怎么保障他的稳定性。
AI作画也是一样,画面的主体其实已经大差不差了,主要是细节,正如手部一样,那些只占画面极少部分却非常重要困难的东西,因为那些真的很困难。
所以我之前还是很担心眼睛的,后来才发现眼睛的处理还是很不错的,尤其是正脸,侧脸也基本大差不差(用的时候有出现一两个不好的),感觉可能是对于眼睛有专门的训练,毕竟眼睛可是比手耳朵更加重要的存在,一张二次元图片可以没有手,可以没有耳朵,但一定不能没有眼睛。
我也时常在想,既然使用AI绘画需要这么大的算力支持,如今AI的发展是不是主要都是寄托于硬件的升级,算力的提升?毕竟像许多人工智能的根基,opencv那些视觉算法,早在20世纪就提出来了。
如今我们即将进入后摩根定理时代,AI又将会如何发展?会不会突然有惊人的技术诞生呢?让我们拭目以待