使用Unity 接入 Stable-Diffusion-WebUI 文生图生成图像

Unity小白。 2024-07-06 14:33:01 阅读 70

参考:stable diffusion 远端跑图—— Api基础知识掌握 - 知乎 (zhihu.com)

1、准备工作(下载启动器)

这一部分就不多赘诉了,我使用的是B站秋叶大佬的整合包,要启用API

网上蛮多自己配置的,可能需要设密码之类的。经自己测试,使用整合包的话就不配置这个API账号密码了,不然会出现客户端出错,连接不上等问题(可能是我操作不当,我也还没研究透)

附带:可以下一个Postman来测试接口

2、接口测试

FastAPI - Swagger UI 这里面有很多接口,暂时只研究了一下文生图的接口,关于文生图的这些请求体参数还没摸透目前。

找到文生图的 Post 接口

打开,里头有个Try it out,点击之后会出现一个请求体,然后底下会有一个Execute的执行按钮,然后在底下就能直接复制这个接口的地址了。这个接口其实在上面图片就有了,就是你的本机ip加上/sdapi/v1/txt2img

测试接口。可以在这个网站上直接测试接口。我这用的是Postman,其实没什么区别。在Postman中创建一个Post请求,填入地址。

添加请求体,选择json数据,输入请求体内容(如上所说,调试参数还没搞明白),然后发送等待返回数据即可。

解析数据。如果没出错的话,会返回一些信息,其中images是一个base64的字符串数组(后面在Unity会用到), 就是图片信息(是的,贼长一串),然后parameters就是你的请求体了(调试的参数),关于info(我不知道哈哈哈),

查看图片。可以复制这一长串字符串(images里面的。上面提到了这是数组,你的请求体如果写了出图是几张,如果你出的是两张图,那你直接复制进去肯定是解析不出来的,自己找到其中一张的信息拿出来用)。然后打开 Base64 to Image Decoder / Converter (codebeautify.org) 这个网站,将你的字符串输入进去(去掉首位的双引号啊中括号之类的),你就可以得到你生成的图片咯。

ps:额...有点抽象。关于调试参数这些的,网上有挺多内容的,大家可以自行查阅一下。

3、Unity 接入

发下疯,亚雷**,我以前写post接口测试的时候,都是传的json字符串,直接将数据序列化传输即可。测这玩意的时候,测了半天跑不通,就是422,读取不了我的数据。网上看了很多几乎都是python,官方文档也是用的python案例,好像也就是传个地址,然后不也是直接传的json字符串。有够绝望,误打误撞将数据转成byte字节流数据上传,成了....

在场景里搞个RawImage用来等下接收生成的图片,然后准备个dll文件,放在Plugins下。这是一个序列化和反序列化的库文件。也可以直接在VS里装,但我不知道咋回事,装好了之后重新打开脚本,引用直接报错了,索性直接下一个dll丢到里头。

代码的话,思路无非就是创建结构体或者来,表示你要上传的数据,然后序列化成json字符串,在转byte字节流,发送请求,然后收到请求,然后解析数据啊这样。

需要注意的几点就是:

1、json 数据常会有空值,但是值类型是没有空值的,所以我定义接收数据的时候更常用一些引用类型来接收,避免出现错误。

2、构建请求体的结构体或类时,字段名要对应Api接口的请求参数名。如api接口 prompt提示词和steps迭代次数,那我定义的时候就对应上。这个具体还是得看他所接收得字段名是啥,还有他得数据类型是啥。(传错的话似乎协程似乎会陷入无法释放的状态,然后就是重启大法....)

<code>public class txt2imgMes

{

   public int steps;

   public string prompt;

   public int batch_size;

 

}

请求的方法的话,UnityWebRequest 和 WWW 类我都试了一下,都行得通。之前做Post测试的时候,有时接口只能用其中一种方法,很奇怪我也不知道啥问题。另外需要加上请求头,试了一下不加请求头也会出错。

<code>#region UnityWebRequest 请求

// 创建Post请求

UnityWebRequest requestPost = new UnityWebRequest(URL, UnityWebRequest.kHttpVerbPOST);

// 实例请求体

txt2img_Mes txt2imgMes = new txt2img_Mes();

txt2imgMes.prompt = "puppy dog";

txt2imgMes.steps = 15;

txt2imgMes.batch_size = 2;

string str = JsonConvert.SerializeObject(txt2imgMes);

// 将Json字符串转换为byte[]

byte[] postData = Encoding.UTF8.GetBytes(str);

// 添加请求头

requestPost.SetRequestHeader("Accept", "application/json");

requestPost.SetRequestHeader("Content-Type", "application/json");

// 实例上传处理器,并将 postData 设置为上传的数据

requestPost.uploadHandler = new UploadHandlerRaw(postData);

// 使用构造函数创建 Post 请求,需要实例下载器存储数据及上传处理器

// 通过静态方法 UnityWebRequest.Post() 创建Post请求,会自动实例分配下载处理器和上传处理器。

requestPost.downloadHandler = new DownloadHandlerBuffer();

yield return requestPost.SendWebRequest();

if (requestPost.isHttpError || requestPost.isNetworkError)

{

   Debug.Log(requestPost.error);

}

else

{

   Debug.Log("图片生成中");

   string text = requestPost.downloadHandler.text;

   action.Invoke(text);

}

#endregion

定义接收返回数据的对象。之前提到过,返回的图片信息是一个base64字符串数组,然后试了一下用List列表去接收,也是可以的(毕竟列表也是通过数组实现的)。刚刚Postman测试的时候可以看到,返回的数据不止图片的信息一个,但只需要用到 images 这一个信息,所以只定义了这个对象用于接收

public class txt2imgReturnMes

{

   // 返回的图片信息是一个string字符串

   // 使用 List ,Json数据有的值是空值,对于接收的数据类型个人更常用引用类型

   public List<string> images;

   // public string[] images;

}

解析数据获取图片,反序列化获取的数据,然后将字符串转为byte字节流数据,生成图片,然后就可以了。

StartCoroutine(PostRequest(Url, (string str) =>

{

    Debug.Log(str);

    txt2img_ReturnMes byteMes = JsonConvert.DeserializeObject<txt2img_ReturnMes>(str);

    Debug.Log("获取返回数据");

    Debug.Log(byteMes.images.Count);

 

    byte[] bytes = Convert.FromBase64String(byteMes.images[0]);

    Texture2D texture = new Texture2D(1, 1);

    texture.LoadImage(bytes);

    image.texture = texture;

    byte[] bytes2 = Convert.FromBase64String(byteMes.images[1]);

    Texture2D texture2 = new Texture2D(1, 1);

    texture2.LoadImage(bytes2);

    image2.texture = texture2;

}));

出图,看起来还行,没那么抽象了哈哈哈

研究一下这些调试的参数,后面再去研究一下图生图,看能不能通过用户拍照直接生成一张图出来。

有问题的地方还请各位指正,感谢。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。