用StabilityMatrix一键安装Stable Diffusion

stabilitymatrix,stable,diffusion · 浏览次数 : 9

小编点评

Stable Diffusion是一款2022年发布的深度学习文字到图像生成模型,具有易于使用、部署在本地端以及丰富的模型选择等优点。它的主要模型包括Base Model、Checkpoint、Merge Option Model、Textual Inversion、LoRA、VAE等。在使用Stable Diffusion时,用户需要安装Python环境、Git等,但通过StabilityMatrix等跨平台工具,可以简化部署过程。 StabilityMatrix是一个基于Stable Diffusion的Web UI,它允许用户轻松地控制多个Web UI,如Stable Diffusion、Comfy UI、SD.Next (Vladmandic)等。用户可以通过填写命令行参数来启用各种功能,如提高生成速度、降低VRAM使用等。此外,StabilityMatrix还支持多种启动选项,以满足不同用户的需求。 总的来说,Stable Diffusion和StabilityMatrix为用户提供了一个高效、易用的文字到图像生成解决方案,可以帮助用户快速生成高质量的图像。

正文

Stable Diffusion是2022年发布的深度学习文字到图像生成模型,它既能免费使用,又能部署在本地端,又有非常多的模型可以直接套用,在使用体验上比Midjourney和DALL-E更加强大。

Stable Diffusion使用的模型有下列几大类,对照模型网站 https://civitai.com 以形成更直观的认识:

  1. Base Model: Stable Diffusion的基底模型(Base models),由StableAI公司开源而来的最基础模型
    • 常见的基底模型有SD 1.5、SD2.0、SDXL 1.0等
  2. Checkpoint: 当做图像生成的基础模型,通称为大模型
    1. 由Base Model为基础微调而形成的模型,可生成质量更高的图像
    2. 形成图像的基本风格,例如真实风格或卡通风格等,分别使用不同的两种Checkpoint
    3. 合并多个Checkpoint而成的形成Checkpoint Merge
  3. 选项模型:附加在Checkpoint上的微调模型,可视为修补+滤镜功能的模型,增强或改变图像的风格
    1. Textual Inversion(文本反转,embedding): 用新的关键词来产生新的特征
    2. LoRA(Low-Rank Adaptation,低秩调整): Checkpoint就像是AI画家的「基本画功」,而LoRA则是要求AI画家「照这个风格」产生图片
    3. VAE(Value Auto Encoder): 用来调整亮度或饱和度的微调模型

不过Stable Diffusion的部署步骤有点繁复,必须安装Python相关环境、Git执行环境等等,但现在通过采用AvanloniaUI编写的跨平台桌面应用StabilityMatrix只要执行一个StabilityMatrix.exe就可以了,它会自动下载需要的文件与模型,并提供了图形界面让我们可以方便的控制多达 10几个Web UI(支持Automatic 1111、Comfy UI、SD.Next (Vladmandic)、VoltaML、InvokeAI、Fooocus 和Fooocus MRE), 可以说StabilityMatrix大幅降低了Stable Diffusion的使用门槛。

本次介绍完整的StabilityMatrix安装步骤,Stablility 支持Linux、Mac和Windows,下面的安装是Windows 11下进行的。

1. 安装步骤

  1. 解压缩 StabilityMatrix-win-x64.zip 后执行StabilityMatrix.exe。 在检查到NVIDIA显卡后,勾选同意授权协议再按【Continue】

image

  1. 勾选【Portable Mode】以建立便携环境,运行环境会建立在执行文件相同位置的Data文件夹里

image

  1. 选择Web UI,先使用最常见的Stable Diffusion WebUI,点击【Install】

image

开始安装并下载需要的文件...,它将在安装过程中显示推荐的型号(检查点)。 它分为最流行的常规型号“SD1.5系列”和“SDXL系列”,具有高性能而不是较大的VRAM负载。 每个都有几GB的大容量,因此下载时间会增加,但是如果有您想要的模型,请在此处查看并下载。

  1. 安装完成后会显示《Package》页面
  • 点击三横线显示完整的侧边栏菜单
  • 点击绿色的【Package】就能启动安装好的SwarmUI
  • 【启动】按钮右侧的齿轮可设定启动参数

image

关于启动选项

更高级一点。 SDwebUI 可以通过填写写成“--◯◯”的“命令行参数”来启动,以启用各种可选功能。 例如,有一个功能可以生成具有少量 VRAM 的 grabo,并加快生成速度。

在 StabilityMatrix 中,您可以在按下“启动”按钮之前按旁边的齿轮“⚙”按钮来调用启动选项屏幕,并且可以通过选中它通过“启动”来激活它。image

请参阅官方网站了解每个启动选项的含义。 您还可以通过自己填写参数来添加菜单中没有的内容。这里只是您应该记住的默认菜单中的选项。

-xformers:有望提高图像生成速度并显著减少 VRAM 使用。 请注意,它只能与 NVIDIA Gravo 一起使用。 几乎每个人都使用它

-autolaunch:webUI加载完毕后在浏览器中自动启动的功能,但在v1.6.0及以上版本中,可以在webui上设置,所以没有用。

-lowvram:用于低 VRAM 抓取。 性能可能是灾难性的,因此能够生成图像。

–medvram — 以牺牲速度为代价减少VRAM的使用。 

-medvram_sdxl:仅当使用 SDXL 模型时才激活 medvram。


5.点击【Packages】→【Add Package】可再新增其他的WebUI套件

image

6. 第一次启动(启动)时会自动复制需要的档案,其中默认的模型主档 v1-5-pruned-emaonly.safetensors 有3.97GB,需要花点时间下载。下载完成并启动后,会自动开启浏览器浏览网址 http://127.0.0.1:7801

image

2. 初次测试

  • State Diffusion checkpoint(大模型)选用预设的v1-5-pruned-emaonly.safetensors ,学习模型(检查点)通常主要以扩展名“.safetensors”和“.ckpt”分发,如果您将它们扔到指定的文件夹中,它们将起作用。 除了 StabilityAI 的每个版本的 StableDiffusion 之外,网络上还分享了无数的衍生模型,有些带有插图,有些带有逼真的色调,有些介于两者之间,有些擅长柔和的表达,等等。
  • 在txt2img分页的【Prompt】(正面提示词)输入 a cute kitten
  • 【Negative Prompt】(负面提示词)输入 (worst quality:2),(low quality:2),(normal quality:2),lowres
    • 负面提示词指示避免产生的属性,括号里可额外设定权重
  • 点击【Generate】开始生成图片。 产生时StabilityMatrix.exe窗口会显示执行记录
2.1. 生成结果

image

3.总结

目前 ComfyUI 对于新模型与新应用支持更好,已经有超越 Stable Diffusion web UI的趋势,SwarmUI 同时支持ComfyUI和SDWebUI,Fooocus由于简洁、占用资源低的原因,也越来越受欢迎,如果你是多个软件的用户,那么不妨考虑使用Stability Matrix 进行集中化管理。


4. 相关链接

与用StabilityMatrix一键安装Stable Diffusion相似的内容:

用StabilityMatrix一键安装Stable Diffusion

Stable Diffusion是2022年发布的深度学习文字到图像生成模型,它既能免费使用,又能部署在本地端,又有非常多的模型可以直接套用,在使用体验上比Midjourney和DALL-E更加强大。Stable Diffusion使用的模型有下列几大类,对照模型网站 https://civitai

用【游乐场】说清楚“硬件、操作系统、跨平台、应用软件、开发语言、代码”的关系

经常有小伙伴对一些计算机技术和概念不太清楚,产生很多误区,甚至张冠李戴,在一起聊天时又很难给对方解释清楚,经过苦思冥想,终于想到一些比喻,能够很好地阐述了“硬件、操作系统、跨平台、应用软件、开发语言、代码”之间的关系。 硬件 陆地(Intel)与海洋(AMD):硬件就像是一个广阔的自然环境,其中In

写了一个json小工具,希望大家体验(Mac平台)

用rust写了一个json小工具“JSON PICKER”,欢迎大家试用: https://github.com/davelet/json-picker/releases/tag/V0.2 动机是平常开发的时候,经常遇到大段json,里面的很多字段是不需要的。 我所在的项目组在接口对接上出现了rep

用 KV 缓存量化解锁长文本生成

很高兴和大家分享 Hugging Face 的一项新功能: KV 缓存量化 ,它能够把你的语言模型的速度提升到一个新水平。 太长不看版: KV 缓存量化可在最小化对生成质量的影响的条件下,减少 LLM 在长文本生成场景下的内存使用量,从而在内存效率和生成速度之间提供可定制的权衡。 你是否曾尝试过用语

用 Sentence Transformers v3 训练和微调嵌入模型

Sentence Transformers 是一个 Python 库,用于使用和训练各种应用的嵌入模型,例如检索增强生成 (RAG)、语义搜索、语义文本相似度、释义挖掘 (paraphrase mining) 等等。其 3.0 版本的更新是该工程自创建以来最大的一次,引入了一种新的训练方法。在这篇博

用Python脚本迁移MongoDB数据到金仓-kingbase数据库

1、首先需要明确MongoDB与kingbase的对应关系,collection相当于table,filed相当于字段,根据这个对应关系创建表; 此次迁移的MongoDB里的数据字段是:_id(自动生成的objectid),image(转成二进制存储的文档) 所以在金仓里创建表 create tab

用.NET代码生成JSON Schema 验证器

问题 对于验证复杂JSON数据是否合法的需求,通常的解决方式是标准JSON Schema,.Net下有对应的JSON Schema实现库。应用程序通常需要将标准JSON schema传入实现库,来做后续的数据验证。这里有一种情况,就是如果使用者不太了解标准JSON Schema格式,但又希望能在自己

用python字典统计CSV数据

1.用python字典统计CSV数据的步骤和代码示例 为了使用Python字典来统计CSV数据,我们可以使用内置的csv模块来读取CSV文件,并使用字典来存储统计信息。以下是一个详细的步骤和完整的代码示例: 1.1步骤 (1)导入csv模块。 (2)打开CSV文件并读取数据。 (3)初始化一个空字典

【ESP32】制作 Wi-fi 音箱(HTTP + I2S 协议)

用 Wifi 来传输音频数据,会比蓝牙更好。使用蓝牙方式,不管你用什么协议,都会对数据重新编码,说人话就是有损音质,虽然不至于全损。而使用 Wifi 就可以将 PCM 数据直接传输,无需再编码和压缩。在 ESP32 开发板上可以通过 I2S(IIS)向功放芯片发出音频数据。 关于 i2s 的时序,老

用STM32F4的DMA实现高速、实时的同步并行通信——以读取高速ADC为例[原创www.cnblogs.com/helesheng]

本文给出了一种利用STM32F4系列MCU的DMA功能,实现10MSPS数量级的同步并行数据通信的方法。并用控制高速流水线型的模数转换器AD9200读取作为实例,展示了该通行方法。本文最后总结了该方法的优点和问题,以及克服这些问题的思路。