stablediffusion训练模型的步骤

SD中文网 • 2023年9月19日 am8:00 • 模型 • 阅读 1358

取得高品质图片

为了训练稳定扩散模型，我们需要准备至少10张高品质的图片。重要的是图片的质量而不是数量。由于我们要训练的是单一人物且风格固定的模型，所以图片不应该有复杂的背景或其他无关人物。

你可以通过右键点击下载网络图片，但如果需要下载大量图片，我建议使用Imgrd Grabber或Hydrus Network。

在这里，我准备了33张由Hara绘制的斯卡萨哈的图片。

下载图片后，我们需要将训练图片裁切成512×512像素的大小。你可以选择使用SD WebUI自动裁切，或者手动裁切。

裁切图片不需要使用显卡计算。

将要裁切的图片放置在同一个目录下，例如/home/user/桌面/input。

打开SD WebUI，进入Train → Preprocess images页面。

在第一个字段”Source directory”中填写原始图片的路径。

在第二个字段”Destination directory”中填写输出路径，例如/home/user/桌面/cropped。

将宽度和高度设置为512×512。

点击”Preprocess”按钮，图片将自动裁切。之后，你可以删除原始图片，只保留裁切后的图片。

手动裁切图片的原因是为了避免重要的部分被裁掉。

安装修图软件GIMP，点击”文件”→”添加512×512像素的项目”。

使用油漆桶工具将画布涂成白色。

将图片拖曳到画布上，成为新的图层。

点击”工具”→”变形工具”→”缩放”，缩放图片使其符合画布大小，然后按Enter键。

点击”文件”→”导出”，将图片导出为png格式。

为了加快后续图片的处理速度，点击右下角的删除图层按钮，然后再拖入新的图片，重复上述操作。

将裁切后的33张Hara绘制的斯卡萨哈的图片统一放置到名为”raw”的目录中。

接下来，我们需要为图片预先添加提示词，这样AI才知道要学习哪些内容。

启动SD WebUI，进入Train页面。

进入Preprocess页面，将裁切后的图片的路径填入”Source”字段，将处理后的图片输出路径填入”Destination”字段。

勾选”Create Flipped Copies”，以创建翻转图片来增加训练数据量。

如果要训练真实图片的模型，勾选”Use BLIP for caption”；如果要训练动漫人物的模型，勾选”Use DeepBooru for caption”。

点击”Preprocess”按钮，几分钟后处理完成。输出目录中将包含每张图片对应的提示词txt文件。

打开txt文件，删除你认为与训练无关的特征，例如”2girls”这类过于笼统的提示词。

至此，训练数据准备完成。

原创文章，作者：SD中文网，如若转载，请注明出处：https://www.stablediffusion-cn.com/sd/sd-model/1661.html