Stable diffusion web UI


基本資料
軟件名	Stable diffusion web UI
開發者	AUTOMATIC1111及該項目的其他貢獻者^[1]
作業系統	Linux、Windows8及以上、macOS 10.9及以上
語言	英文（通過擴展支持多語言）
軟件類型	AI繪畫
許可協議	AGPL-3.0

Stable diffusion web UI是基於Stable diffusion AI模型的AI繪畫軟件。

軟件特點

Stable diffusion web UI是一個多功能的AI繪畫軟件，支持以下幾個功能：

文生圖

允許用戶通過輸入一堆關鍵詞或者一句話來生成圖片。除此之外，還支持設置生成圖片的尺寸大小，使用的隨機數種子（若為-1就是隨機生成），採樣的方式及採樣步數（顯著影響生成時間，適當多一些會改善圖像質量，但是邊際效應明顯，次數過多收益不大）、生成批次（執行生成的次數）、每批數量（每次生成時生成幾張圖片，非常吃顯存，不怎麼常用）等參數。除此之外，若批量使用同一關鍵詞來生成若干張圖片，會自動將這些圖片拼接起來。在生成按鈕下方，有五個按鈕，分別是應用上一次生成的提示詞、清空提示詞、快速更換各種模型（主生成模型、lora、超網絡、嵌入式）、應用選中的模板、保存此時的生成設定為模板。除此之外，部分插件會增加一些額外功能。

在這裏生成的圖片，可以被移動到圖生圖或者附加功能（進行後處理）。

使用Stable diffusion web UI文生圖功能生成的美人魚動漫圖片

圖生圖

使用用戶輸入的一堆關鍵詞或者一句話以及一張圖片來生成一張圖片。和文生圖一樣，這裏也支持調整一些參數。還有局部重繪功能，允許用戶選定一個區域進行重繪，同時保留區域以外的圖片內容。除此之外，用戶還可以使用塗鴉畫筆給已有圖片做一些修改再拿去生成。

這裏生成的圖片可以重新作為圖生圖的輸入進行生成或者進行局部重繪，除此之外，用戶還可以將圖片送往附加功能。這裏也可以通過輸入的圖片自動生成關鍵詞，可以使用CLIP與DeepBooru兩種AI模型反推。CLIP較適用於寫實風格圖片，DeepBooru則適用於動漫圖片。

附加功能

這部分類似於waifu2x,用戶可以在這裏調整圖片的解像度，可以設置等比例放大或者放大到指定解像度（一般等比放大質量更好）。放大操作可以使用一些簡單算法（如臨近插值）或使用AI模型放大。AI模型放大擁有較高的質量，但需要較長的處理時間；而簡單算法則質量較差，但是處理時間短。除此之外，還支持使用一些AI模型修復圖片中人物的臉部。輸入所採用的圖片可以來自於圖生圖、文生圖，也可以來自於本地的文件夾。可以一次處理一張圖片，也可以批量處理。

圖像信息

這部分類似於一個普通的圖片查看器，但是支持查看圖片上攜帶的一些信息。比如說一張由本軟件生成的圖片將會在「parameters」參數中出現生成時所用的關鍵詞句、生成步數、採樣方法、提示詞引導係數、隨機數種子、圖片尺寸、所用模型的哈希值等信息。在「postprocessing」參數中將會包含進行的圖片後處理以及使用的參數（不包含解像度縮放）。

模型合併

這裏用戶可以將兩到三個個Stable diffusion系列的模型合併為一個，合併後的模型可能會生成一些不同於用於合併的模型的圖片。除此之外，還支持替換模型的VAE（可變自動編碼器，負責變換圖像，影響圖片畫風）部分。除此之外還可以改變模型的格式，可以將ckpt格式的模型與safetensors格式的模型互相轉換。（模型合併僅限高級用戶，合併後的模型可能效果不好）

訓練

這裏用戶可以使用自己的本地圖片來訓練嵌入式（Embedding）或者超網絡（Hypernetwork），訓練後的這些結構可以在生產圖片時使用，能改變已有模型的畫風、構圖，產生一些新的圖片一般用戶不要想了，你顯卡沒那麼多顯存的，這裏有着非常多的設置（除非你知道這些是做什麼的，不然不建議瞎改）。如果想要了解更多內容，可以參考Textual Inversion（英文）。

擴展

在這裏用戶可以啟用/禁用、更新自己已有的擴展插件，或者從網上獲取擴展插件（可以從擴展插件名單中選擇或者自己輸入網址下載）。擴展程序有的是給Gui使用的翻譯，有的則是給軟件增加了新的功能。這裏簡單介紹一些常用的擴展插件。

簡體中文語言包

這個擴展除了翻譯了web ui本身的界面以外，還翻譯了非常多的常用插件。這個插件已包含接下來介紹的所有插件的中文翻譯。詳細的安裝與使用說明可以在插件的github頁面看到。

Tag 自動補全

這個擴展可以在輸入關鍵詞時提供自動補全功能，尤其適用於輸入booru風格（DeepBooru關鍵詞反推就會生成這種關鍵詞）的tag時。可以用這個擴展節省大量查找與輸入關鍵詞的時間。

ControlNet 插件（英文）

這個擴展提供了一些額外的控制圖片生成的工具，允許使用手繪圖、線框圖、塗鴉或者使用預處理器處理圖片生成法線貼圖、人物姿態等額外信息控制圖片的生成。這些額外信息可以單獨或一起使用。在受到控制的情況下，生成的圖片將會與輸入的圖片擁有相似的構圖、人物姿態等特徵。需要注意的是，這個擴展需要額外下載模型（在ControlNet modules safetensors處下載），並將模型放到軟件根目錄下的models\ControlNet文件夾里才可以使用。除此之外，這個插件目前只兼容1.x版本的Stable diffusion模型。

MultiDiffusion 放大器

這個擴展提供了一些算法以生成大尺寸圖片。其中融合Vae算法幾乎無成本的降低顯存使用（可以只用4G顯存就生成1080P圖片），唯一的缺點是比直接生成時間要長一點小顯存能跑起來就不錯了。通過利用這個算法，還可以讓圖片的不同部位使用不同的提示詞，進而更精細地控制圖片的構圖。除此之外，還提供了一種高質量的圖片放大算法。

Lora

這個擴展是內置的。可以使用一些體積較小的模型（稱為lora模型）影響生成的圖片。具有可以改變畫風、繪製特定人物的特點。有一些畫師、ACGN作品開發商甚至提供部分自己作品內人物的Lora模型

使用說明

在開始使用前請確定你的電腦使用的GPU品牌和作業系統，並且必須安裝Python 3.10以及Git（對於Linux，你還需要wget。對於Mac os，你還需要cmake、protobuf、rust與wget），同時保證這些軟件在安裝時都已經選擇「Add to Path」（即正確設置了環境變量）。之後就可以從AUTOMATIC1111的Github倉庫獲取程序。如果你使用N卡，直接運行軟件根目錄的webui-user.bat(對於Windows用戶)或webui-user.sh（對於Linux、Mac os用戶）即可開始安裝，之後會自動下載模型、各種依賴庫體積非常大，注意你的硬盤空間，最後會給出一個網址，訪問這個網址即可開始使用。如果你使用A卡，那麼你必須使用Linux系統，運行webui-user.sh就可以自動配置（windows下目前也可以用，但是這不是受官方支持的並且安裝比較麻煩，可參見Install and Run on AMD GPUs（英文））。如果你是蘋果的Mac M系列的用戶，那麼你也只需要運行webui-user.sh就可以自動配置。目前對於intel的GPU和CPU的支持任然在開發中，如果你想要使用可以訪問Installation on Intel Silicon（英文）以了解安裝流程。如果你的作業系統和GPU組合不是以上的任何一種（如Mac os+A卡），那麼你暫時不能使用此軟件（隨着軟件的開發將會適配更多的平台）。

鑑於此軟件配置安裝非常的麻煩，且由於網絡環境、系統硬件的問題經常安裝失敗，建議絕大多數用戶使用別人製作的離線整合版，直接運行啟動文件就可以了。

用文本編輯器打開啟動文件（webui-user.bat(對於Windows用戶)或webui-user.sh（對於Linux、Mac os用戶））可以找到有一行包含「COMMANDLINE_ARGS=」。這是額外的啟動參數，可以訪問Command Line Arguments and Settings（英文）以了解詳細設置。

關於模型

Stable diffusion web UI官方僅支持標準的Stable diffusion模型，其他基於Stable diffusion模型訓練的模型沒有官方支持，故這些模型能否運行~~比較看臉~~，不過實際上兼容性似乎還可以。

如果你需要使用其他生成模型（checkpoint），可以訪問civitai(需要代理)或者huggingface。在下載時，可能會有不同格式的模型文件，出於安全的考量，建議下載safetensors格式的模型^[2]，除此之外，如果提供了額外的VAE文件，那麼也需要下載。之後只需要將下載好的模型文件複製到軟件根目錄的models\Stable-diffusion文件夾裏面。在生成圖片時就可以在菜單裏選擇使用的模型了。

如果你需要更多的畫風，需要使用嵌入式、超網絡或者lora，也可以從civitai上找到這些模型。下載好之後放在軟件根目錄的models文件夾下的對應文件夾內即可使用。

除此之外，一個叫做Civitai Helper的擴展插件允許直接從civitai下載並安裝各種模型。

註釋及外部連結

↑ 由於本軟件開源，任何參與改進項目代碼的人都可以被視為軟件的開發者
↑ ckpt與pt格式的模型存在包含病毒的風險

Stable diffusion web UI的Github倉庫（英文）

[1] 由於本軟件開源，任何參與改進項目代碼的人都可以被視為軟件的開發者

[2] t與pt格式的模型存在包含病毒的風險

[1]

[2]

Stable diffusion web UI

目次

軟件特點

文生圖

圖生圖

附加功能

圖像信息

模型合併

訓練

擴展

簡體中文語言包

Tag 自動補全

ControlNet 插件（英文）

MultiDiffusion 放大器

Lora

使用說明

關於模型

註釋及外部連結

導覽菜單

Stable diffusion web UI

軟件特點

文生圖

圖生圖

附加功能

圖像信息

模型合併

訓練

擴展

簡體中文語言包

Tag 自動補全

ControlNet 插件（英文）

MultiDiffusion 放大器

Lora

使用說明

關於模型

註釋及外部連結

導覽菜單

搜尋