JasonWen commited on
Commit
f2e0279
·
1 Parent(s): b347666

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +13 -7
README.md CHANGED
@@ -17,6 +17,7 @@ SD开源,自己配置麻烦,门槛高,下限低上限高,想要什么模
17
  还有的就是Midjourney的变种niji·journey了,Midjourney(简称MJ)是22年5月发布,主打写实和艺术绘画,随后waifu diffusion的开发团队加入进来合作开发了niji·journey(下文简称niji)。niji主打二次元AI绘画,也可以画furry,且上手简单不用配置,普遍效果好。MJ在v4之前的版本都很难画furry,v4可以画写实的兽人,v5除了写实兽人以外还可以画一些美漫风格的二次元福瑞。niji和MJ唯二缺点是要花钱和不能画涩图。
18
  另外我们前面说的**Dall·E2**也是可以完美画福瑞的,生成质量不差,只是Dall·E2的功能相比SD和MJ显得太少了,而且同样是收费,Dall·E2在OpenAI官网的服务比MJ贵多了。但是因为背靠微软金主,我们现在也能用上免费的Dall·E2了。微软在23年二月推出了基于Dall·E2的**Bing Image Creator**,它和Dall·E2的算法是一样的,只要你登陆微软账号就能无限白嫖。
19
  总结一下,现阶段有niji/MJ、Bing Image Creator和SD上的各种模型能画furry。那他们都有什么特点呢?要怎么选择呢?
 
20
  ### 二、该选择哪一种工具
21
  #### 1.根据手里的设备选择工具
22
  先确定你手上有什么设备,所有的AI绘画都需要高性能消耗,一般都是使用**英伟达显卡**(99%)也有极少数可以使用CPU、A卡或者Mac的,但是操作复杂、速度慢、效率低不推荐使用。N卡最好20系以上、60以上的型号,最好6G显存或以上,低于这个标准一点也能用,再低比如960或者4G显存的卡就会使用得极其痛苦。cuda够用的情况下显存越大越好。
@@ -26,21 +27,26 @@ SD开源,自己配置麻烦,门槛高,下限低上限高,想要什么模
26
  先说两种大公司的服务,单独购买每个月都要**两百到三百人民币左右(汇率问题)**,可以到群里时不时嚎一嗓子有没有拼车的,几个人一起购买会便宜一些。**NovelAI的服务是不需要魔法上网就可以访问的,界面全英,看不懂用翻译器**。而**niji/MJ是在discord频道里对机器人发送指令,访问discord要魔法上网(这里电脑端推荐steam++,手机端自己看)**。都是只要能访问、花钱氪金之后就能用,不挑本地设备是电脑还是手机。除了上述花钱购买的服务,还可以用微软的**Bing Image Creator,只需要魔法上网加登陆微软账号就可以无限白嫖**。
27
  租赁云端服务器自己配置适用于没有本地合适的硬件但是仍追求自己全部掌握的自由度,常见的有**colab(已经不能免费白嫖了)、autodl(价格低廉好用)、阿里云(秋叶的推广可以白嫖三个月)等**提供显卡算力的云平台(这几个平台都有人配置好了,方便),还有百度腾讯华为的云服务器(不太推荐)。这种方法是**你在云端配置好框架和模型,然后你通过网页访问服务器,发送命令获得图片**。其他平台的教程百度或者B站搜索。
28
  #### 2.  根据需求选择工具
29
-
30
  除了设备和使用方法外,也可以根据你想画什么来选择。
31
  如果你**不打算画瑟图**,想要美术风格更加强烈的图片(一眼美或者一眼帅),且对furry的特征没有要求(不画oc和别人的设定),那首推用niji画,niji简单好用易上手,只要你用心学,**三天就能速成**,~~学不会来打我~~。这里贴一个教程,看完包会[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)。除此之外还有**可以白嫖的Bing Image Creator**,很多情况下不比niji/MJ效果差,而且还能白嫖,教程[Dall·E2和Bing的AI图像生成](https://docs.qq.com/doc/DUXV5clpHT1JaZGx4)。
32
  如果你**打算画瑟图**,或者想画的内容比较偏门,或者对furry的特征有要求(画oc和别人的设定),那就用SD,更进一步说是WebUI(naifu自由度还是太低了,comfyUI还不成熟)。SD有些模型专门绘制冷门XP(感谢制作者!),还可以深度定制修改模型,真正做到了百无禁忌,想画啥就画啥。尽管现阶段WebUI的使用已经有无数前人的经验总结,变得很简单了(比之前),但是上手还有一定成本,最主要的是大多数模型生成一眼好看的图的概率比较低,很多人上来不会写咒语就生成古神,泼几次凉水后就没兴趣了。总的来说**玩得好真是能够画所有的东西,但是想要学到高手水平不容易**。
33
  如果你**打算画瑟图**,但是也不想在本地或者云服务器折腾,就想输入咒语就出现瑟图,那只有**NovelAI官网的furry beta模型**可以选择了。**吟唱,出瑟图,氪完金一切都是那么简单**。NovelAI的模型出图质量稳定,但是画风不多(也可能是我们氪金的人太少,没多少人研究出它的全部实力)。
34
- ### 三、必要的基本知识和术语
35
 
 
36
  #### 1.  基本知识和术语
37
-
38
  AI绘画最基本的操作是文生图和图生图。顾名思义**文生图**是你输入一些描述的词语或文字,算法根据你的描述生成对应图像;**图生图**是你先提供一张参考图片,程序根据图片和你的描述文字结合来生成图片。注意,图生图的参考都不是让AI记住你的人物,然后画出人物的其他姿态和动作,更接近根据色块和构图生成(SD的图生图)或者生成给定图片的风格的图片(niji的图生图),背后原因跟diffusion算法的原理有关(记住结论就行,如果想知道深层原理看这一篇[什么是AI绘画与stable diffusion讲解](https://docs.qq.com/doc/DSWVVYnZXdmhiTlBk))。
39
-
40
  你给程序的文字描述,用最标准的术语叫**prompt**,有时叫tag、咒语、关键词之类的大家也能听懂,只要生成图片就一定需要prompt。正面关键词是我们希望AI画出来的东西,负面关键词(negative prompt)是我们不希望AI画出来的东西。
41
-
42
  **参数**,常见的参数有画面分辨率和影响画面质量的一系列参数,具体每个框架不一样,下面分别讲。
43
-
44
  另外,咒语还有**语法**,语法是咒语的书写规范和特殊符号使用方法。SD的WebUI和naifu的语法看这里[SD咒语和语法(WebUI或naifu)](https://docs.qq.com/doc/DSXBkTVZrUmpLdmpC),niji和MJ看这个[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)。
 
 
 
 
 
 
 
 
 
 
 
45
 
46
- 对于SD框架,还可以自己加载不同的**模型**,也叫丹药。一个模型可能有多个版本,有时间上不同epoch的迭代,也有一个epoch的修剪版(降低体积,牺牲一点点质量)。模型的制作也叫炼丹。常见能画furry的模型可���分为4类:具有泛化性的**通用模型**,如animefull和anything(二次元)、fkingScifi(写实),这些主力不是用来画福瑞的,但是具有对furry的泛化性,效果也还行;**通用福瑞模型**,如furry epoch4、yiffy-e18(简称ye18,是第18个epoch)、YiffAI V2(简称YAI,还在更新);**特殊XP专用模型**,如Zack3D_Kinky(简称Z3D,也可以当通用福瑞模型用)、AnalVoreHumanFurryPony等;**特定角色专用模型**,现在已经被LoRA取代了,如阿努比斯(埃及神话)、布莱泽(艾尔登法环)、雷格西(动物狂想曲)等等你能想到的角色里面有十个甚至九个都有专属模型。注:模型大类可以参考,但是举的例子基本都是老模型了
 
17
  还有的就是Midjourney的变种niji·journey了,Midjourney(简称MJ)是22年5月发布,主打写实和艺术绘画,随后waifu diffusion的开发团队加入进来合作开发了niji·journey(下文简称niji)。niji主打二次元AI绘画,也可以画furry,且上手简单不用配置,普遍效果好。MJ在v4之前的版本都很难画furry,v4可以画写实的兽人,v5除了写实兽人以外还可以画一些美漫风格的二次元福瑞。niji和MJ唯二缺点是要花钱和不能画涩图。
18
  另外我们前面说的**Dall·E2**也是可以完美画福瑞的,生成质量不差,只是Dall·E2的功能相比SD和MJ显得太少了,而且同样是收费,Dall·E2在OpenAI官网的服务比MJ贵多了。但是因为背靠微软金主,我们现在也能用上免费的Dall·E2了。微软在23年二月推出了基于Dall·E2的**Bing Image Creator**,它和Dall·E2的算法是一样的,只要你登陆微软账号就能无限白嫖。
19
  总结一下,现阶段有niji/MJ、Bing Image Creator和SD上的各种模型能画furry。那他们都有什么特点呢?要怎么选择呢?
20
+
21
  ### 二、该选择哪一种工具
22
  #### 1.根据手里的设备选择工具
23
  先确定你手上有什么设备,所有的AI绘画都需要高性能消耗,一般都是使用**英伟达显卡**(99%)也有极少数可以使用CPU、A卡或者Mac的,但是操作复杂、速度慢、效率低不推荐使用。N卡最好20系以上、60以上的型号,最好6G显存或以上,低于这个标准一点也能用,再低比如960或者4G显存的卡就会使用得极其痛苦。cuda够用的情况下显存越大越好。
 
27
  先说两种大公司的服务,单独购买每个月都要**两百到三百人民币左右(汇率问题)**,可以到群里时不时嚎一嗓子有没有拼车的,几个人一起购买会便宜一些。**NovelAI的服务是不需要魔法上网就可以访问的,界面全英,看不懂用翻译器**。而**niji/MJ是在discord频道里对机器人发送指令,访问discord要魔法上网(这里电脑端推荐steam++,手机端自己看)**。都是只要能访问、花钱氪金之后就能用,不挑本地设备是电脑还是手机。除了上述花钱购买的服务,还可以用微软的**Bing Image Creator,只需要魔法上网加登陆微软账号就可以无限白嫖**。
28
  租赁云端服务器自己配置适用于没有本地合适的硬件但是仍追求自己全部掌握的自由度,常见的有**colab(已经不能免费白嫖了)、autodl(价格低廉好用)、阿里云(秋叶的推广可以白嫖三个月)等**提供显卡算力的云平台(这几个平台都有人配置好了,方便),还有百度腾讯华为的云服务器(不太推荐)。这种方法是**你在云端配置好框架和模型,然后你通过网页访问服务器,发送命令获得图片**。其他平台的教程百度或者B站搜索。
29
  #### 2.  根据需求选择工具
 
30
  除了设备和使用方法外,也可以根据你想画什么来选择。
31
  如果你**不打算画瑟图**,想要美术风格更加强烈的图片(一眼美或者一眼帅),且对furry的特征没有要求(不画oc和别人的设定),那首推用niji画,niji简单好用易上手,只要你用心学,**三天就能速成**,~~学不会来打我~~。这里贴一个教程,看完包会[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)。除此之外还有**可以白嫖的Bing Image Creator**,很多情况下不比niji/MJ效果差,而且还能白嫖,教程[Dall·E2和Bing的AI图像生成](https://docs.qq.com/doc/DUXV5clpHT1JaZGx4)。
32
  如果你**打算画瑟图**,或者想画的内容比较偏门,或者对furry的特征有要求(画oc和别人的设定),那就用SD,更进一步说是WebUI(naifu自由度还是太低了,comfyUI还不成熟)。SD有些模型专门绘制冷门XP(感谢制作者!),还可以深度定制修改模型,真正做到了百无禁忌,想画啥就画啥。尽管现阶段WebUI的使用已经有无数前人的经验总结,变得很简单了(比之前),但是上手还有一定成本,最主要的是大多数模型生成一眼好看的图的概率比较低,很多人上来不会写咒语就生成古神,泼几次凉水后就没兴趣了。总的来说**玩得好真是能够画所有的东西,但是想要学到高手水平不容易**。
33
  如果你**打算画瑟图**,但是也不想在本地或者云服务器折腾,就想输入咒语就出现瑟图,那只有**NovelAI官网的furry beta模型**可以选择了。**吟唱,出瑟图,氪完金一切都是那么简单**。NovelAI的模型出图质量稳定,但是画风不多(也可能是我们氪金的人太少,没多少人研究出它的全部实力)。
 
34
 
35
+ ### 三、必要的基本知识和术语
36
  #### 1.  基本知识和术语
 
37
  AI绘画最基本的操作是文生图和图生图。顾名思义**文生图**是你输入一些描述的词语或文字,算法根据你的描述生成对应图像;**图生图**是你先提供一张参考图片,程序根据图片和你的描述文字结合来生成图片。注意,图生图的参考都不是让AI记住你的人物,然后画出人物的其他姿态和动作,更接近根据色块和构图生成(SD的图生图)或者生成给定图片的风格的图片(niji的图生图),背后原因跟diffusion算法的原理有关(记住结论就行,如果想知道深层原理看这一篇[什么是AI绘画与stable diffusion讲解](https://docs.qq.com/doc/DSWVVYnZXdmhiTlBk))。
 
38
  你给程序的文字描述,用最标准的术语叫**prompt**,有时叫tag、咒语、关键词之类的大家也能听懂,只要生成图片就一定需要prompt。正面关键词是我们希望AI画出来的东西,负面关键词(negative prompt)是我们不希望AI画出来的东西。
 
39
  **参数**,常见的参数有画面分辨率和影响画面质量的一系列参数,具体每个框架不一样,下面分别讲。
 
40
  另外,咒语还有**语法**,语法是咒语的书写规范和特殊符号使用方法。SD的WebUI和naifu的语法看这里[SD咒语和语法(WebUI或naifu)](https://docs.qq.com/doc/DSXBkTVZrUmpLdmpC),niji和MJ看这个[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)。
41
+ 对于SD框架,还可以自己加载不同的**模型**,也叫丹药。一个模型可能有多个版本,有时间上不同epoch的迭代,也有一个epoch的修剪版(降低体积,牺牲一点点质量)。模型的制作也叫炼丹。常见能画furry的模型可以分为4类:具有泛化性的**通用模型**,如animefull和anything(二次元)、fkingScifi(写实),这些主力不是用来画福瑞的,但是具有对furry的泛化性,效果也还行;**通用福瑞模型**,如furry epoch4、yiffy-e18(简称ye18,是第18个epoch)、YiffAI V2(简称YAI,还在更新);**特殊XP专用模型**,如Zack3D_Kinky(简称Z3D,也可以当通用福瑞模型用)、AnalVoreHumanFurryPony等;**特定角色专用模型**,现在已经被LoRA取代了,如阿努比斯(埃及神话)、布莱泽(艾尔登法环)、雷格西(动物狂想曲)等等你能想到的角色里面有十个甚至九个都有专属模型。注:模型大类可以参考,但是举的例子基本都是老模型了
42
+ #### 2.  SD相关
43
+ SD主流有两个框架(WebUI和naifu)和他们的不同版本,如果Windows本地使用,你需要**至少20G以上**的硬盘空间+好的显卡。
44
+ 当下要使用WebUI,我只推荐**秋叶的启动器(视频教程[https://www.bilibili.com/video/BV1ne4y1V7QU](https://www.bilibili.com/video/BV1ne4y1V7QU)下载链接https://pan.baidu.com/s/1XHOx7zgO0IQVL-01opwXjA?pwd=uvdy更新:最新版可以直接去他的QQ频道下载,频道号是3764f45toc)**,简直不太好用好吗!原本复杂的操作直接一个启动器全部搞定!自动更新,升级回退版本,选配WebUI运行环境参数等等等等功能全部都有,傻瓜式使用!有了秋叶的启动器,WebUI再也不是一个难以上手的工具!秋叶YYDS!
45
+ WebUI常用的文生图参数有**采样步数steps、采样方法、宽高分辨率、生成轮数和每轮生成张数、CFG(prompt的整体权重)、种子seed、噪声种子**和其他相关参数。
46
+ WebUI除了基本的文生图和图生图以外还有只修改图片的一部分的**部分重绘、高清放大**等功能。除了这些,开源的WebUI还有很多插件和脚本,脚本有比如xy图(用于定性定量对比咒语的每个词或参数)、prompt热力图(每个词汇在生成的图片中负责画哪一部分)等等进阶的功能。
47
+ 除此之外还有很多进阶的知识和玩法,比如WebUI的各种神奇拓展和插件的使用方法、如何定性定量研究咒语的效果等等,还有炼丹(使用各种方法定制自己的模型),看具体文章里的讲解。
48
+ (**23.4更新**)进入23年SD又更新了**两个大杀器**(感谢开源社区),一个是LoRA,一个是ControlNet控制网。**LoRA**可以简单的理解为一种炼制小丹药的方法,用LoRA炼出来的模型都比较小,配合大模型能够快速调整**画风**或者**特定角色**等。**ControlNet控制网**则是实现了对画面的更直接的控制,有边缘监测、深度图、姿态检测等核心功能,能够对线稿上色、处理物体深度、按照人物姿势生成图像等,**极大的解决了之前生成图像随机抽卡导致人物肢体错位、画不好手等问题**。
49
+
50
+
51
+
52