コンテンツにスキップ
Edge Cases

Edge Cases

Updated: 2026-05

1. このページについて

「面白ネタ実験」3部作の3本目。エッジ系 — 意図的に「壊す」「破綻させる」実験集。前ページ(Algorithm Exposure)と似ているが、こちらは ControlNet・LoRA・ワークフロー構造を不適切に使うことで生まれる「美しい破綻」を狙う。

授業では「AI を制御不能にする方法を知ることで、逆に制御の仕組みが見える」という反転的な学びを得る。

2. ネタ A: ControlNet 同士の衝突

ControlNet で複数 ControlNet を重ねる方法を扱った。衝突する組み合わせを意図的に作る。

やり方

  • ControlNet 1: OpenPose で「立っているポーズ」
  • ControlNet 2: OpenPose で「座っているポーズ」
  • 両方を strength 1.0 で適用
  • 結果: AI が両方を満たそうとして、立ちながら座っているような キメラ姿勢が出る

矛盾する制約のときに AI がどう挫折するか、観察する実験。

3. ネタ B: ControlNet を strength 5 で爆破

ControlNet 適用ノードの strength は通常 0.7〜1.0。これを 3 や 5 に設定する。

  • 結果: 制御画像のエッジ・色がそのまま出力に焼き付く
  • ノイズと制御画像が 強引に混ざった結果
  • 美術的には面白いノイズ・グリッチ表現

4. ネタ C: 矛盾プロンプト

プロンプトに 矛盾した指示 を意図的に入れる。

例:

  • a smiling angry warrior, both happy and sad, eyes closed and wide open
  • a square circle, both red and blue at the same time
  • a cat that is also a dog, photorealistic

AI は両方を満たそうと頑張るので、ハイブリッド生物色彩の混乱が起きる。

5. ネタ D: ネガティブに本体プロンプトを書く

ポジティブ・ネガティブを入れ替える実験。

  • ポジティブ: (空欄)または image
  • ネガティブ: a cat

「猫を描かないで」と言われた AI は、何を描くか。抽象的な何か、または不気味な「猫の不在」が出る。

6. ネタ E: 同じプロンプトを 100 回唱える

a cat a cat a cat a cat a cat a cat a cat a cat a cat a cat a cat a cat ...

CLIP のトークン長制限(標準で 77 トークン、最大 225 トークン)に達するまで同じ単語を繰り返す。

  • 結果: 過彩度になる、または奇妙な強調が起きる
  • 「強調する」プロンプトテクニック (cat:1.5) の極端版

7. ネタ F: img2img を破綻ループさせる

Algorithm Exposure ネタJ と似ているが、こちらは denoise を毎回上げていく

  • 1回目: 元画像 → img2img (denoise 0.3)
  • 2回目: 出力 → img2img (denoise 0.5)
  • 3回目: 出力 → img2img (denoise 0.7)
  • 4回目: 出力 → img2img (denoise 0.9)
  • 5回目: 出力 → img2img (denoise 1.0、つまり完全に忘れる)

徐々に元画像を忘れていくプロセス」が並んだ画像群として可視化される。美術作品としても成立する。

8. ネタ G: VAE エンコード→デコードを 10 回繰り返す

画像を VAE で潜在空間に圧縮 → そのまま VAE デコードで画像に戻す。これを 10 回繰り返す。

  • 1回目: ほぼ同じ
  • 3回目: 細部が削れ始める
  • 5回目: 色が変わり始める
  • 10回目: 元画像とは別物の「VAE による平均化された世界観」

VAE が 完全な可逆変換ではない ことの可視化。「圧縮=劣化」を視覚で理解する。

9. ネタ H: LoRA を全部効かせる

複数 LoRA を「全部 strength 1.0」で重ねる(通常は 0.5〜0.8 で 2〜3 個まで)。

  • LoRA: ジブリ + サイバーパンク + 80年代映画 + ポケモンピクセルアート + 細部強化
  • 全部 1.0
  • 結果: スタイルが衝突して 混沌の極み

LoRA 同士のスタイル衝突をどう調停するか、AI の挙動が見える。

10. ネタ I: ControlNet と img2img と LoRA の三重がけ

すべての制御を最大に組み合わせる。

  • ControlNet: OpenPose strength 1.0
  • img2img: 別画像から denoise 0.6
  • LoRA: 強烈なスタイル LoRA strength 1.0
  • プロンプト: 何か別の主題

4つの矛盾する指示を同時に AI に与える。出力は予測不能だが、AI のシステムの限界が見える瞬間。

11. ネタ J: 解像度を 64×64 まで下げる

通常 512×512 が SD 1.5 の標準。これを 64×64 や 128×128 に下げる。

  • 結果: ピクセル数が少なすぎて、ほぼノイズか、極小サムネイルのような結果
  • 学習時の解像度から大きく離れることの破綻

逆に 4096×4096 まで上げると、メモリ不足エラーで実行できないか、繰り返しパターンになる(高解像度はベースモデルの学習範囲外)。

12. ネタ K: シードを 0 固定で全モデル比較

シード 0 は AI 界での「あるある」値。たまたま出やすい絵がある。

  • 全モデル(SD 1.5, SDXL, Flux dev, Z Image Turbo)でシード 0 で同じプロンプト
  • 比較すると、各モデルの「シード 0 での好み」が見える

13. このページの教育的意義

エッジ系は「綺麗な作品を作るための知識」を超えて、「AI システムの境界を理解する」ためのもの。

  • どこまで効くか
  • どこから壊れるか
  • 矛盾をどう処理するか
  • 学習データの限界はどこか

これらを体感していると、Runway などの商用ツールで「うまく動かないとき」「変な結果が出るとき」冷静に原因推測ができるようになる。

14. クレジット予算

エッジ系も SD 1.5 で十分。1 ネタあたり 2〜5 クレジット × 5 ネタ程度で授業に持ち込める。

学生 1 人で全部試させる必要はない。先生が事前に印象的な 1 本を見つけて、授業中に再現する。

15. このあと

  • To Runway — Comfy Cloud で身につけた感覚を Runway 演習へ繋げる