AI一键将小说文字转成漫画视频(附安装包/大模型)
bagell 2024-07-03 16:31:01 阅读 75
AI一键小说转漫画视频
创绘简介
一键智能AI推理提示词,自动关联上下文,画面匹配度更高一键批量绘图,同时支持本地和云端模式(没有显卡也能畅享绘图)一键导出剪映草稿,自动生成关键帧,快速图文视频合成自带全网热门配音,30多种情感配音任君挑选基础功能永久免费支持最新的webui forege版本,生图速度快30%全网第一个支持消除音频停顿的推文软件,成片效果堪比专业的付费配音!免费音频也支持消除停顿,不限时不限量。
创绘所需资源下载
01、创绘:文末领取
02、sd-webui-aki:文末领取
03、剪映PC版:文末领取
SD模型存放路径
大模型:sd-webui-aki安装目录下\models\Stable-diffusion
lora模型:sd-webui-aki安装目录下\models\Lora
VAE模型:sd-webui-aki安装目录下\models\VAE
创绘配置
01、翻译配置
腾讯翻译用于推理提示词
注册一个腾讯翻译的开发者账号
注册完成后将密钥输入到我们的软件当中即可
02、剪映草稿设置
打开剪映 -> 全局设置 -> 草稿位置,然后点开 -> 复制地址 -> 打开创绘 -> 基础设置 -> 更改草稿位置,把刚才复制的地址粘贴进去
03、SD模型配置
SD大模型:
模型存放路径: sd-webui-aki\models\Stable-diffusion
模型网站推荐:文末领取
模型推荐:majicMIX realistic 麦橘写实 V7
迭代步数:推荐20~30
AI绘画的原理用人话说就是,先随机出一个噪声图片
然后一步步的调整图片,向你的 提示词 Prompt 靠拢
Sampling Steps就是告诉AI,这样的步骤应该进行多少次。
步骤越多,每一步移动也就越小越精确。同时也成比例增加生成图像所需要的时间。
大部分采样器超过50步后意义就不大了
提示词权重:
图像与你的提示的匹配程度。
增加这个值将导致图像更接近你的提示,但过高会让图像色彩过于饱和(你可以自己试试看)
太高后在一定程度上降低了图像质量。可以适当增加采样步骤来抵消画质的劣化。
一般在5~15之间为好,7,9,12是3个常见的设置值。
采样方法:
推荐-DPM++2M Karras
使用哪种采样器,人话就是让AI用什么算法,这里介绍几个常用的
Euler a :富有创造力,不同步数可以生产出不同的图片。 超过30~40步基本就没什么增益了。Euler:最最常见基础的算法,最简单的,也是最快的。DDIM:收敛快,一般20步就差不多了。LMS:Eular的延伸算法,相对更稳定一点,30步就比较稳定了PLMS:再改进一点LMSDPM2:DDIM的一种改进版,它的速度大约是 DDIM 的两倍
外观VAE模型:
VAE一般用于美化图片的色彩和细节微调,主要功能是滤镜和微调;滤镜就像是剪映、美图秀秀、PS等软件用到的滤镜一样,让图片的画面看上整体色彩饱和清晰度更高;微调就是对出图的部分细节进行细微调整。
常见文件格式:尾缀ckpt、pt、safetensors(一般名字中会带有vae的字样)
常见文件大小:100MB-800MB不等
模型存放路径: sd-webui-aki\models\VAE
Loar模型
它是一个微调模型,主要是用于满足对应特定的风格,或指定的人物特征属性进行定制。在数据相似度非常高的情形下,lora模型更加轻巧,训练效率也更高,可以节省大量的训练时间和训练资源。
常见文件格式: 尾缀safetensors、pt、ckpt
常见文件大小:100MB-300MB不等
模型存放路径1: sd-webui-aki\models\Lora
随机种子:
AI绘画的原理是,先随机出一个噪声图片
因为计算机世界里不存在真随机
保持种子不变,同一模型和后端,保持所有参数一致的情况下,
相同的种子可以多次生成(几乎)相同的图像。
如果你用某个种子在某tag下生成了很棒的图,
保持种子数不变,而稍微改一点点tag,增减一点细节,一般得到的图也会不错。
• 不同型号的显卡即使参数与模型完全一致,也可能会生成完全不同的图。 10XX和16XX系显卡基本每种型号都会是不同的结果,20XX系和30XX系基本都可以完美复现图片。
• 这里不是10XX系显卡不适合AI作画的意思,只是你可能看网友的参数图很棒,你想照搬一下结果却大不一样。
• 某些模型比如anything3.0因为模型过于混沌,图像复现性能一样很差。
• 设置中有个选项参数叫ENSD( eta 噪声种子增量)这个会改变种子,有些扩展也可以实现同seed下随机微调种子,可能会造成无法复现其他人的图。
放大算法:
在高分辨率下(1024X1024)会生成非常怪异的图像。而此插件这使得AI先在较低的分辨率下部分渲染你的图片,再通过算法提高图片到高分辨率,然后在高分辨率下再添加细节。
放大算法:如果不知道选什么,一般无脑选“ ESRGAN_4x ”
重绘幅度:放大后修改细节的程度,从0到1,数值越大,AI创意就越多,也就越偏离原图。
放大倍数(Upscale by) :在原有宽度和长度上放大几倍,注意这个拉高需要更高的显存的。
正面提示词:
正向提示词例子:
(masterpiece:1.4),best quality,highres,extremely detailed CG,perfect lighting,8k wallpaper,anime, comic,unreal engine,pretty,Animation style
反面提示词:
一个通用的示例:
lowres,bad anatomy,bad hands,text,error,missing fingers, extra digit,fewer digits,cropped,worst quality, low quality,normal quality,jpeg artifacts,signature, watermark,username,blurry,missing arms,long neck, Humpbacked,missing limb,too many fingers, mutated,poorly drawn,out of frame,bad hands, unclear eyes,poorly drawn,cloned face,bad face
使用说明
01启动SD
02打卡创绘,新建项目
03导入脚本,推理关键词
04智能绘图-绘图模式
初步生成图片,觉得不好的分镜可以单独重绘
05智能绘图-放大模式
将生成的图片放大成1080的
06合成草稿
注意事项:
01、漫画推文的放大算法推荐选择****R-ESRGAN 4x+ Anime6B
如果你打开软件发现自己没有这个算法可以选择,请按照如下步骤操作:
将下载的算法:4x-UltraSharp.pth
将算法放置到到sd webui 下面的 models\ESRGAN目录里
02、SD进入扩展后如果发现加载不出来
试着把源改为
raw.githubusercontent.com/AUTOMATIC11…
03、绘制出来的图片风格不统一?
请在绘图设置中,调整全局正向词,比如这里设置为动漫风格
Animation style
04、导入SRT后合成草稿配音不存在
导出草稿提示音频不存在,生成草稿失败的解决方法【针对导入SRT字幕和音频】
重新创建一个项目,然后把音频和srt拖动进去,然后打开这个项目所在的那个文件夹,有一个audio,把这个文件夹替换到你已经配好了图的那个项目相同名称下,再点击合成就可以了,文件路径
写在最后
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。