WHEE美图｜AI创作零基础教程-文生图篇

Wincyfu 2024-08-27 17:01:02 阅读 91

前言：

2023年各种AI工具大爆发，身为AIGC探索者和设计师，自然也接触了不少国内外AI工具，近期我又发现了一款超好用的国产AI绘图神器-美图WHEE，它的操作相对简单，入手门槛较低，对于新手小白来说，是不错的AI绘图体验工具；对于有明确需求的设计师或专业人士，WHEE的出图效果和可控性也都很不错，可以帮助设计师快速实现设计方案及应用落地，为设计赋能。

从本篇开始，我将手把手教大家从使用WHEE，到WHEE助力提升工作效率，以及更多WHEE实践应用案例的探索。我计划将此做成系列文章教程，帮助大家更好的了解和掌握AIGC工具，将AI切实应用到实际工作中。预计每月一篇，欢迎码住～！

一、界面介绍

认识一个软件，先从基础界面开始。进入首页，会清晰的看到几个功能入口，分别是「文生图」「图生图」「风格模型训练」「AI模特图」「AI阔图」「AI改图」和「创作词库」七大功能，这些功能可以交叉使用。比如生图后，需要修改图片细节，可以使用改图功能局部修改，再使用扩图功能放大图片，最后应用在实际方案中，后面会详细介绍。

功能区下方为生图的效果，可以一键Get同款生图效果，非常直观且方便。咱们先来看看WHEE的基础功能吧～！

二、基础功能-文生图

文生图顾名思义，用文字描述你的画面生成图片，支持中英文输入，支持括号加权重。文生图中有两种创作模式：快捷创作和高级创作。

快捷创作更适合新手小白，简单的词语组合就可以生成效果不错的图片，初步体会AI绘图的乐趣是不错的选择，但是相对来说可控性会差一些，更推荐大家使用高级创作。

我们着重来了解一下高级创作的内容。

虽然看起来有很多需要选择的内容，但是操作流程并不复杂，可概括为4个步骤：填写提示词-选择模型-参数设定-一键出图。通过操作流程我们就可以了解到最终的出图效果是由提示词、模型和参数共同作用产生的结果，三者缺一不可，提示词主要决定画面的内容，模型主要决定画面的风格，参数设置主要用于图像属性的预设，下面我们就详细讲解一下～

2.1 提示词

提示词模块分成了两个小部分，提示词和不希望呈现的内容，我们一一来介绍。

提示词是文生图的核心内容，可以使用词语组合对所要展示的创意进行描绘，通过输入想要的内容和效果，模型就可以理解我们想表达的含义，从而更精准的呈现画面内容。在WHEE中可以使用简单的词组组合，如：“中国山水画，群山耸立，云雾缭绕”等。输入词组，并以逗号隔开，就可以生成相应的画面内容。

a、通用公式：

如果想表达的内容太多，提示词想到什么写什么，有可能会导致画面缺失信息，可以尝试使用下我平时写提示词的常用公式：主体内容+环境细节(背景、构图等)+图像质量+艺术风格。写提示词时可以参照这个公式来构思，当然也许你也会搜到其他博主的公式，内容大同小异，能满足出图效果即可。

主体内容：主体内容可以是动物、人物或者物品，就是你画面的主体物。

环境细节：环境细节：包括画面的背景、画面的辅助元素，灯光效果、镜头构图等，主要描述画面的整体，表达出画面的氛围和角度，比如清晨阳光、蓝天白云、俯视、对称构图等。

图像质量：用来增强画面效果，提升画面细节，比如4k，超高清，丰富的细节等。

艺术风格：画面最后的呈现风格，可以加入你喜欢的艺术家名字或者艺术类型和流派，或者年代等，比如：梵高风格、像素艺术、油画、哥特式、国风水墨等。

b、语法技巧

掌握了通用公式基本就可以顺畅的告诉AI你想要的画面了，如果想要通过提示词更精准的控制画面，可以使用2个语法小技巧：1、通过添加括号来增减提示词的权重；2、通过添加双引号可以在生图中添加文字信息。

先来说说通过添加“()”来增减提示词权重，我们以下图为例，提示词为“黑色渐变红色头发，女孩，微笑，正面，上半身”，但是生成的图片发现，红色头发比重偏高，并没有很好的出现黑色渐变色。

于是修改提示词为：“(黑色:1.6)渐变红色头发，女孩，微笑，正面，上半身”，加重了黑色头发的权重，黑色头发关键词的比例逐渐变高，可以看到生成的图片出现了上黑下红的渐变色。但是需要注意的是数值达到2时画面可能出现崩坏现象，建议权重数值最大不超过2；反之将关键词的权重设定0.25，则是减少此关键词的权重比例。

通过添加双引号可以在生图中添加文字信息，可添加文字信息这个功能算是我见到众多AI绘图工具中为数不多可以直接生成中文文字的工具，虽然有的文字会有些显示问题，但是相比于其他生图工具的看不懂的符号化“文字”，这个功能已经领先太多了。有点惊讶到！

初期对于提示词描写把握不准确也没关系，WHEE在提示词中还有两个非常好用的辅助功能：智能联想和词库。

智能联想

智能联想可以优化丰富你的提示词，给予更多细节，让画面更丰富

词库

词库功能更像是帮助你细化提示词的词语库，从起手式到人物五官肤色服饰动作，从光照到镜头质感，从背景色调再到艺术风格，都清清楚楚的划分出来，即使你不知道怎么写提示词，只需要在选项中进行简单的选择，也可以生成惊艳的画面效果。

2.1- 提示词-不希望呈现的内容

不希望呈现的内容是指反向的提示词，就是你不希望在画面中看到的内容，比如一些破损的画面，低质量的模糊的图，多余的手指或者胳膊等，这些提示词在词库功能中也可以找到，直接点击使用就可以，不需要费脑思考，也是非常人性化了～！

2.2 模型与风格模型

目前WHEE只有一个MiracleVision4.0模型，我们直接默认选择这个模型就可以，此模型配合风格模型可以组合出不同的画风，适用性非常广。

而风格模型，我们点击就可以发现有很多可供选择。风格模式举个例子就好像是我们画画时候选择的画笔，决定了我们的画面风格。选择毛笔，我们的画面就是水墨风格的毛笔画，我们选择蜡笔，就会生成一副蜡笔画，这个例子不算太恰当，但能更好的帮助我们理解风格模型这个概念，因为除了有多样的绘画风格，还有剪纸、毛绒、陶瓷、木头等不同的质感风格。

风格模型支持叠加使用，最多可以叠加3种风格模型，可以通过调节不同风格模型的权重来调整风格模型的叠加比例，需要注意混合模型时，强度不要过大，不然出图效果会不好，建议设置在40-60左右。

下图是使用年兽、炫彩流光、光影特效增强画质三个风格模型叠加出来的效果图，个人感觉还是不错的，大家可以多去尝试不同风格模型叠加，说不定会有意想不到的效果。

2.3 参数设定

参数设定又有几个小部分组成，画面尺寸就不用多说了，可以选择固定比例的尺寸，也可以自定义尺寸。建议一开始跑图的时候选择较小的尺寸以减少耗时，抽卡到自己满意的图片时再将尺寸扩大。

创意相关性就是生成图片与提示词的吻合度，创意相关性越高，画面就与提示词描述越吻合，图像就更贴合提示词的描述内容，但较高的创意相关性会降低本身AI的创意性，建议值可以在5-10左右，不建议创意相关性拉到最大，会生成崩溃图，图片质量也会降低。

生成张数很好理解，就是一次性生成几张图，生成张数越多，耗时也就会越久，所以可以先选择1-2张看大效果，生成效果比较满意的图片后再批量跑图抽卡。

采样器和采样步骤主要是负责去噪的过程，这涉及到整个AI的生图逻辑，我们不做过多原理讲述，只简单的介绍下每个采样器的大概功能，大家按需选择。

Euler：简单直接的采样器，出图速度快，适合范围广，能产生最终稳定的图像，最推荐；

Euler A：自适应采样器，出图速度也比较快，最终出图具有一定的随机性；

Ddim：去燥扩散隐式采样器，适合宽画幅，采样步数高表现会更好，速度比较慢；

Dpm2M和Dpm2MKarras：可以控制每个采样步骤中的噪声水平，速度相对较快，Dpm 2M Karras更适合二次元风格；

DpmSde和DpmSdeKarras：增强颜色与光影，速度较慢，超过30步后基本没变化。比较适合逼真写实画风；

大家只需要知道不同采样器的耗时与效果不同，首次可选择默认的快速采样Euler，也可以根据不同的跑图需求尝试不同的采样器获取最佳效果。

采样步骤是每次生成图片所需的步骤，与采样器配合使用，步骤越多耗时越久，通常30左右的步骤出图的细节和质量就很不错了，建议使用默认的采样步骤就可以。

Seed值就是随机种子数，因为在绘图过程中有很强的不确定性，所以每次生图都会产生一个固定的Seed值，通过固定Seed值可以锁定图片结果，如果想要生成同一张图，直接复制种子数即可。默认打开“随机”。

查看图片Seed值，只需要点击界面右侧「重新编辑」按钮，就可以查看此图片的Seed值了。

生成批次是随机多个Seed生成多组图片，主要用于提升出图效率，可以同一提示词出多组不同风格图片。

面部修复特别用于生成人物图片时，开启可优化人像面部的五官细节，但会增加生成时间。默认打开，可以不用特意操作，保持默认打开就可以。

到此，WHEE生图的三大要素：提示词、模型、参数设定都已经介绍完了，掌握了这三大模块，已经可以使用文生图生成我们需要的图片了。

但我们发现在高级创作模式中，还有一个「画面控制」模块，画面控制就是提高生成图片的可控性。边缘检测、深度估算等会到下篇图生图中再做详细讲解。本篇以融合控制为例，先带大家大概了解下画面控制的作用。

三、案例实操

为了帮助大家更好的理解画面控制的作用，以实际案例，讲解一下「画面控制-融合控制」功能，同时带大家动手实践上文讲解的内容，帮助大家更好的深入了解WHEE工具的文生图功能。

3.1 LOGO/文字融合海报

大家一定见过很多大厂通过AI生图，将公司的LOGO或者简单的文字融合到宣传海报当中，但是使用常规的AI工具，会需要调整非常多的参数，生图效果也不能保证，需要多次调试，虽然WHEE可以在图片中生成文字，但是效果比较生硬，并不能通过提示词将文字完美的融合在图片中。我尝试使用WHEE的融合控制功能来生成此类海报，发现生成效果很不错，而且操作非常简单，快来试试～！

（1）准备文字

在在PS或AI等软件中做一张黑底白字的文字图片，白色部分为画面中需要生成的部分，黑色部分为不需要的部分，有灰度的地方为半透明，格式使用jpg或png皆可，小于10M，尺寸与出图尺寸保持一致。

我的画面尺寸使用WHEE中默认的3:4，768*1024，所以新建的文字图也使用768*1024尺寸。