代码收藏家技术教程 2023-02-17

稳定扩散：关键词标签语法指南

Stable Diffusion 关键词tag语法教程

AI绘图在线体验

二次元绘图

在线体验地址:Stable Diffusion
模型包括：

NovelAI，NovelAI的模型训练使用了数千个网站的数十亿张图片，包括 Pixiv、Twitter、DeviantArt、Tumblr等网站的作品。

Waifu，waifu的模型可用于生成二次元的卡通形象，可以生成独有的二次元动漫小姐姐和主人公

Stable diffusion-v1.5，以英文为输入的通用图像生成模型

中文输入绘图

在线体验地址:Stable Diffusion

太乙模型，首个开源的中文Stable Diffusion模型，基于0.2亿筛选过的中文图文对训练。

提示词 Prompt

Prompt 是输入到文生图模型的文字，不同的 Prompt 对于生成的图像质量有较大的影响

支持的语言

Stable Diffusion, NovelAI等模型支持的输入语言为英语，SD支持用自然语言描述，不过还是推荐使用用逗号分隔的一个个的关键词来写，当然表情符号，emoji，甚至一些日语都是可以用的。

tag语法

分隔：不同的关键词tag之间，需要使用英文逗号,分隔，逗号前后有空格或者换行是不碍事的
ex：1girl,loli,long hair,low twintails（1个女孩，loli，长发，低双马尾）
混合：WebUi 使用 | 分隔多个关键词，实现混合多个要素，注意混合是同等比例混合，同时混。
ex: 1girl,red|blue hair, long hair（1个女孩，红色与蓝色头发混合，长发）
增强/减弱：有两种写法

第一种 (提示词:权重数值)：数值从0.1~100，默认状态是1,低于1就是减弱，大于1就是加强
ex: ,(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)

第二种 (((提示词)))，每套一层()括号增强1.1倍,每套一层[]减弱1.1倍。也就是套两层是1.1*1.1=1.21倍，套三层是1.331倍，套4层是1.4641倍。

ex: ((loli)),((one girl)),(cat ears),[flower hairpin]和第一种写法等价

所以还是建议使用第一种方式，因为清晰而准确

渐变：比较简单的理解时，先按某种关键词生成，然后再此基础上向某个方向变化。
[关键词1:关键词2:数字]，数字大于1理解为第X步前为关键词1，第X步后变成关键词2，数字小于1理解为总步数的百分之X前为关键词1，之后变成关键词2

ex：a girl with very long [white:yellow:16] hair 等价为

开始 a girl with very long white hair

16步之后a girl with very long yellow hair

ex：a girl with very long [white:yellow:0.5] hair 等价为

开始 a girl with very long white hair

50%步之后a girl with very long yellow hair

交替：轮流使用关键词

ex：[cow|horse] in a field比如这就是个牛马的混合物，如果你写的更长比如[cow|horse|cat|dog] in a field就是先朝着像牛努力，再朝着像马努力，再向着猫努力，再向着狗努力，再向着马努力

tag书写示例

建议按类似这样的格式书写提示词

画质词>>这个一般比较固定，无非是，杰作，最高画质，分辨率超级大之类的
风格词艺术风格词>>比如是照片还是插画还是动画
图片的主题>>比如这个画的主体是一个女孩，还是一只猫，是儿童还是萝莉还是少女，是猫娘还是犬娘还是福瑞，是白领还是学生
他们的外表>>注意整体和细节都是从上到下描述，比如发型（呆毛，耳后有头发，盖住眼睛的刘海，低双马尾，大波浪卷发），发色（顶发金色，末端挑染彩色），衣服（长裙，蕾丝边，低胸，半透明，内穿蓝色胸罩，蓝色内裤，半长袖，过膝袜，室内鞋），头部（猫耳,红色眼睛），颈部（项链），手臂（露肩），胸部（贫乳），腹部（可看到肚脐），屁股（骆驼耻），腿部（长腿），脚步（裸足）
他们的情绪>>表述表情
他们的姿势>>基础动作（站，坐，跑，走，蹲，趴，跪），头动作（歪头，仰头，低头），手动作（手在拢头发，放在胸前 ，举手），腰动作（弯腰，跨坐，鸭子坐，鞠躬），腿动作（交叉站，二郎腿，M形开腿，盘腿，跪坐），复合动作（战斗姿态，JOJO立，背对背站，脱衣服）
图片的背景>>室内，室外，树林，沙滩，星空下，太阳下，天气如何
杂项>>比如NSFW，眼睛描绘详细

将不同的分类的词，通过换行区分开，方便自己随时调整

(masterpiece:1.331), best quality,illustration,(1girl),(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),beautiful detailed eyes,purple|red eyes),expressionless,sitting,dark background, moonlight, ,flower_petals,city,full_moon,

于是我们得到这样一张图

tag书写要点

虽然大家都管这个叫释放魔法，但真不是越长的魔咒（提示词）生成的图片越厉害，请尽量将关键词控制在75个（100个）以内。
越关键的词，越往前放。
相似的同类，放在一起。
只写必要的关键词。

反向提示词 Negative prompt

用文字描述你不想在图像中出现的东西
AI大致做法就是
1. 对图片进行去噪处理，使其看起来更像你的提示词。
2. 对图片进行去噪处理，使其看起来更像你的反向提示词（无条件条件）。
3. 观察这两者之间的差异，并利用它来产生一组对噪声图片的改变
4. 尝试将最终结果移向前者而远离后者
5. 一个相对比较通用的负面提示词设置

lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing arms,long neck,Humpbacked,missing limb,too many fingers,mutated,poorly drawn,out of frame,bad hands,owres,unclear eyes,poorly drawn,cloned face,bad face