稳定扩散:关键词标签语法指南

Stable Diffusion 关键词tag语法教程

AI绘图在线体验

二次元绘图

在线体验地址:Stable Diffusion
模型包括:

  • NovelAI,NovelAI的模型训练使用了数千个网站的数十亿张图片,包括 Pixiv、Twitter、DeviantArt、Tumblr等网站的作品。

  • Waifu,waifu的模型可用于生成二次元的卡通形象,可以生成独有的二次元动漫小姐姐和主人公

  • Stable diffusion-v1.5,以英文为输入的通用图像生成模型

  • 中文输入绘图

    在线体验地址:Stable Diffusion

  • 太乙模型,首个开源的中文Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练。

  • 提示词 Prompt

    Prompt 是输入到文生图模型的文字,不同的 Prompt 对于生成的图像质量有较大的影响

    支持的语言

    Stable Diffusion, NovelAI等模型支持的输入语言为英语,SD支持用自然语言描述,不过还是推荐使用用逗号分隔的一个个的关键词来写,当然表情符号,emoji,甚至一些日语都是可以用的。

    tag语法

    1. 分隔:不同的关键词tag之间,需要使用英文逗号,分隔,逗号前后有空格或者换行是不碍事的
      ex:1girl,loli,long hair,low twintails(1个女孩,loli,长发,低双马尾)

    2. 混合:WebUi 使用 | 分隔多个关键词,实现混合多个要素,注意混合是同等比例混合,同时混。
      ex: 1girl,red|blue hair, long hair(1个女孩,红色与蓝色头发混合,长发)

    3. 增强/减弱:有两种写法

  • 第一种 (提示词:权重数值):数值从0.1~100,默认状态是1,低于1就是减弱,大于1就是加强
    ex: ,(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)

  • 第二种 (((提示词))),每套一层()括号增强1.1倍,每套一层[]减弱1.1倍。也就是套两层是1.1*1.1=1.21倍,套三层是1.331倍,套4层是1.4641倍。

    ex: ((loli)),((one girl)),(cat ears),[flower hairpin]和第一种写法等价

  • 所以还是建议使用第一种方式,因为清晰而准确

    1. 渐变:比较简单的理解时,先按某种关键词生成,然后再此基础上向某个方向变化。
      [关键词1:关键词2:数字],数字大于1理解为第X步前为关键词1,第X步后变成关键词2,数字小于1理解为总步数的百分之X前为关键词1,之后变成关键词2

  • ex:a girl with very long [white:yellow:16] hair 等价为

    开始 a girl with very long white hair

    16步之后a girl with very long yellow hair

  • ex:a girl with very long [white:yellow:0.5] hair 等价为

    开始 a girl with very long white hair

    50%步之后a girl with very long yellow hair

    1. 交替:轮流使用关键词

      ex:[cow|horse] in a field比如这就是个牛马的混合物,如果你写的更长比如[cow|horse|cat|dog] in a field就是先朝着像牛努力,再朝着像马努力,再向着猫努力,再向着狗努力,再向着马努力

    tag书写示例

    建议按类似这样的格式书写提示词

    画质词>>这个一般比较固定,无非是,杰作,最高画质,分辨率超级大之类的
    风格词艺术风格词>>比如是照片还是插画还是动画
    图片的主题>>比如这个画的主体是一个女孩,还是一只猫,是儿童还是萝莉还是少女,是猫娘还是犬娘还是福瑞,是白领还是学生
    他们的外表>>注意整体和细节都是从上到下描述,比如发型(呆毛,耳后有头发,盖住眼睛的刘海,低双马尾,大波浪卷发),发色(顶发金色,末端挑染彩色),衣服(长裙,蕾丝边,低胸,半透明,内穿蓝色胸罩,蓝色内裤,半长袖,过膝袜,室内鞋),头部(猫耳,红色眼睛),颈部(项链),手臂(露肩),胸部(贫乳),腹部(可看到肚脐),屁股(骆驼耻),腿部(长腿),脚步(裸足)
    他们的情绪>>表述表情
    他们的姿势>>基础动作(站,坐,跑,走,蹲,趴,跪),头动作(歪头,仰头,低头),手动作(手在拢头发,放在胸前 ,举手),腰动作(弯腰,跨坐,鸭子坐,鞠躬),腿动作(交叉站,二郎腿,M形开腿,盘腿,跪坐),复合动作(战斗姿态,JOJO立,背对背站,脱衣服)
    图片的背景>>室内,室外,树林,沙滩,星空下,太阳下,天气如何
    杂项>>比如NSFW,眼睛描绘详细
    

    将不同的分类的词,通过换行区分开,方便自己随时调整

    (masterpiece:1.331), best quality,illustration,(1girl),(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),beautiful detailed eyes,purple|red eyes),expressionless,sitting,dark background, moonlight, ,flower_petals,city,full_moon,
    

    于是我们得到这样一张图

     

    tag书写要点

    1. 虽然大家都管这个叫释放魔法,但真不是越长的魔咒(提示词)生成的图片越厉害,请尽量将关键词控制在75个(100个)以内。

    2. 越关键的词,越往前放。

    3. 相似的同类,放在一起。

    4. 只写必要的关键词。

    反向提示词 Negative prompt

    用文字描述你不想在图像中出现的东西
    AI大致做法就是
    1. 对图片进行去噪处理,使其看起来更像你的提示词。
    2. 对图片进行去噪处理,使其看起来更像你的反向提示词(无条件条件)。
    3. 观察这两者之间的差异,并利用它来产生一组对噪声图片的改变
    4. 尝试将最终结果移向前者而远离后者
    5. 一个相对比较通用的负面提示词设置

    lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing arms,long neck,Humpbacked,missing limb,too many fingers,mutated,poorly drawn,out of frame,bad hands,owres,unclear eyes,poorly drawn,cloned face,bad face

    引用

    https://www.tjsky.net/tutorial/488

     

    物联沃分享整理
    物联沃-IOTWORD物联网 » 稳定扩散:关键词标签语法指南

    发表评论