Minimum Workflow

Materials

ComfyUI

Minimum Workflow

Updated: 2026-05

1. このページで学ぶこと

文章から画像を生成する最小ワークフローの構成
各ノードが何をしているか、一文で説明できる状態
拡散モデルの内部処理が「ノードの繋がり」として見えるようになる

ノード操作そのものに慣れることが目的。生成画像の質を追うのは次回以降。

2. ワークフローの全景

Comfy Cloud を開くと最初に表示される標準ワークフロー。これだけでテキストから1枚の画像を生成できる。

ノードは大きく分けて6種類、左から右にデータを流していく。

チェックポイントを読み込む（Load Checkpoint）
CLIPテキストエンコード × 2（ポジティブ用・ネガティブ用）
空の潜在画像（Empty Latent Image）
Kサンプラー（KSampler）
VAEデコード（VAE Decode）
画像を保存（Save Image）

線の色には意味がある。モデル（紫）、CLIP（黄色）、潜在画像（ピンク）、ピクセル画像（青）といった具合に、ノードの間で流れているデータの種類を表す。

3. 各ノードの役割

3.1 チェックポイントを読み込む

モデル本体をディスクから読み込むノード。1つの .safetensors ファイルの中に、実は3つの部品が入っている。

モデル: 拡散プロセスの本体（ノイズを削る側）
CLIP: テキストを数値ベクトルに変える「テキスト解釈器」
VAE: 潜在空間と画像（ピクセル）を行き来する「変換器」

出力ピンが3つあるのはこのため。

デフォルトでは Stable Diffusion 1.5（v1-5-pruned-emaonly-fp16.safetensors）が読み込まれる。Comfy Cloud には900以上のモデルがプリインストール済み。

3.2 CLIPテキストエンコード（プロンプト）

人間が書いた文字列を、AIが内部処理できる特徴ベクトルに変換するノード。同じノードを2回使い、ポジティブ用とネガティブ用に分ける。

ポジティブ側（例）

beautiful scenery nature glass bottle landscape, purple galaxy bottle

ネガティブ側（例）

text, watermark

ネガティブには「画像に出てほしくない要素」を書く。

3.3 空の潜在画像

潜在空間で「ノイズの土台」を準備するノード。幅×高さ×バッチサイズを指定する。

注目すべきは、ここで作業しているのがピクセル空間ではないということ。拡散モデルは生成の大半を、画像をぐっと圧縮した「潜在空間」と呼ばれる数値の配列の中で行う。最後の最後で VAE を通して人間が見られる画像に展開する。

3.4 Kサンプラー

ワークフローの心臓部。拡散プロセス（ノイズを段階的に削って画像を浮かび上がらせる処理）を実行する。

主要パラメータ

シード（seed）: ランダム性の種。同じシードなら結果は完全に再現される
生成後の制御: 実行のたびにシードをどうするか（randomize / fixed / increment）
ステップ（steps）: ノイズを何回に分けて削るか。多いほど精細だが時間とクレジットが増える
cfg: プロンプトへの忠実度。低いと自由、高いと忠実だが過度に高いと崩れる
サンプラー名: ノイズを削るアルゴリズム。euler, dpmpp_2m など、モデルに相性のよいものを選ぶ
スケジューラ: ステップごとのノイズ量の減らし方の戦略

これら全てが結果に影響する。次のページ「Parameters」で1つずつ動かして比べる。

3.5 VAEデコード

潜在空間の数値列を、人間が見られる**画像（ピクセル）**に変換するノード。VAE = Variational Auto Encoder（変分オートエンコーダ）。

学習時には「画像 → 潜在空間」に圧縮し、生成時には「潜在空間 → 画像」に展開する。チェックポイントから出てきた vae ピンを入力に繋ぐ。

3.6 画像を保存

ピクセル画像をファイルに書き出すノード。ファイル名_プレフィックス で出力ファイル名の頭が決まる。

Comfy Cloud では、生成された画像を右クリックして「画像を保存」を選ぶとローカルにダウンロードできる。

4. 実行する

画面右上の 実行する ボタンをクリック
K-Sampler 画面の中にプレビュー画像が現れ、ノイズが少しずつ削られて被写体が浮かび上がってくる
SD 1.5、512×512、20ステップなら約3〜5秒で完成

実行中は画面上部に進捗バーが表示され、現在処理しているノードが緑の枠で示される。

5. クレジット消費の目安

無料プラン（400クレジット/月）での実測値。

モデル	解像度	設定	1枚あたり	400クレジットで何枚
SD 1.5	512×512	20ステップ euler	約 0.3〜0.5 cr	約 1,000〜1,200
Z Image Turbo	1024×1024	テンプレ標準	約 2 cr	約 200

SD 1.5 ベースならシードを変えて何度連打しても予算が尽きない。Z Image Turbo は本番出力寄り。

クレジット残高は画面右上のアバターをクリックして確認できる。

6. 試してみる

ノードに慣れるための小ネタ。1つずつ試して、どこを変えると何が変わるか体感する。

シードを変える: K-Sampler のシード欄で別の値を入れる → プロンプトは同じでも別の画像になる
プロンプトを書き換える: ポジティブ側を変える（例：purple galaxy bottle → red sunset wine glass）
サイズを変える: 空の潜在画像の幅/高さを 768×768 に → 計算量が増え、クレジット消費も増える
ステップ数を変える: K-Sampler のステップを 5 / 20 / 40 で比べる → 5 はざらつき、40 は精細

7. このあと

Parameters — ステップ、CFG、サンプラー、シードの効果を並べて比較する
Node Philosophy — なぜノードベースなのか、Stable Diffusion Web UI との違い
ControlNet — 構図や姿勢を別の画像で指定する

Getting Started Parameters