Edge Cases
Updated: 2026-05
1. このページについて
「面白ネタ実験」3部作の3本目。エッジ系 — 意図的に「壊す」「破綻させる」実験集。前ページ(Algorithm Exposure)と似ているが、こちらは ControlNet・LoRA・ワークフロー構造を不適切に使うことで生まれる「美しい破綻」を狙う。
授業では「AI を制御不能にする方法を知ることで、逆に制御の仕組みが見える」という反転的な学びを得る。
2. ネタ A: ControlNet 同士の衝突
ControlNet で複数 ControlNet を重ねる方法を扱った。衝突する組み合わせを意図的に作る。
やり方
- ControlNet 1: OpenPose で「立っているポーズ」
- ControlNet 2: OpenPose で「座っているポーズ」
- 両方を strength 1.0 で適用
- 結果: AI が両方を満たそうとして、立ちながら座っているような キメラ姿勢が出る
矛盾する制約のときに AI がどう挫折するか、観察する実験。
3. ネタ B: ControlNet を strength 5 で爆破
ControlNet 適用ノードの strength は通常 0.7〜1.0。これを 3 や 5 に設定する。
- 結果: 制御画像のエッジ・色がそのまま出力に焼き付く
- ノイズと制御画像が 強引に混ざった結果
- 美術的には面白いノイズ・グリッチ表現
4. ネタ C: 矛盾プロンプト
プロンプトに 矛盾した指示 を意図的に入れる。
例:
a smiling angry warrior, both happy and sad, eyes closed and wide opena square circle, both red and blue at the same timea cat that is also a dog, photorealistic
AI は両方を満たそうと頑張るので、ハイブリッド生物や色彩の混乱が起きる。
5. ネタ D: ネガティブに本体プロンプトを書く
ポジティブ・ネガティブを入れ替える実験。
- ポジティブ: (空欄)または
image - ネガティブ:
a cat
「猫を描かないで」と言われた AI は、何を描くか。抽象的な何か、または不気味な「猫の不在」が出る。
6. ネタ E: 同じプロンプトを 100 回唱える
a cat a cat a cat a cat a cat a cat a cat a cat a cat a cat a cat a cat ...CLIP のトークン長制限(標準で 77 トークン、最大 225 トークン)に達するまで同じ単語を繰り返す。
- 結果: 過彩度になる、または奇妙な強調が起きる
- 「強調する」プロンプトテクニック
(cat:1.5)の極端版
7. ネタ F: img2img を破綻ループさせる
Algorithm Exposure ネタJ と似ているが、こちらは denoise を毎回上げていく。
- 1回目: 元画像 → img2img (denoise 0.3)
- 2回目: 出力 → img2img (denoise 0.5)
- 3回目: 出力 → img2img (denoise 0.7)
- 4回目: 出力 → img2img (denoise 0.9)
- 5回目: 出力 → img2img (denoise 1.0、つまり完全に忘れる)
「徐々に元画像を忘れていくプロセス」が並んだ画像群として可視化される。美術作品としても成立する。
8. ネタ G: VAE エンコード→デコードを 10 回繰り返す
画像を VAE で潜在空間に圧縮 → そのまま VAE デコードで画像に戻す。これを 10 回繰り返す。
- 1回目: ほぼ同じ
- 3回目: 細部が削れ始める
- 5回目: 色が変わり始める
- 10回目: 元画像とは別物の「VAE による平均化された世界観」
VAE が 完全な可逆変換ではない ことの可視化。「圧縮=劣化」を視覚で理解する。
9. ネタ H: LoRA を全部効かせる
複数 LoRA を「全部 strength 1.0」で重ねる(通常は 0.5〜0.8 で 2〜3 個まで)。
- LoRA: ジブリ + サイバーパンク + 80年代映画 + ポケモンピクセルアート + 細部強化
- 全部 1.0
- 結果: スタイルが衝突して 混沌の極み
LoRA 同士のスタイル衝突をどう調停するか、AI の挙動が見える。
10. ネタ I: ControlNet と img2img と LoRA の三重がけ
すべての制御を最大に組み合わせる。
- ControlNet: OpenPose strength 1.0
- img2img: 別画像から denoise 0.6
- LoRA: 強烈なスタイル LoRA strength 1.0
- プロンプト: 何か別の主題
4つの矛盾する指示を同時に AI に与える。出力は予測不能だが、AI のシステムの限界が見える瞬間。
11. ネタ J: 解像度を 64×64 まで下げる
通常 512×512 が SD 1.5 の標準。これを 64×64 や 128×128 に下げる。
- 結果: ピクセル数が少なすぎて、ほぼノイズか、極小サムネイルのような結果
- 学習時の解像度から大きく離れることの破綻
逆に 4096×4096 まで上げると、メモリ不足エラーで実行できないか、繰り返しパターンになる(高解像度はベースモデルの学習範囲外)。
12. ネタ K: シードを 0 固定で全モデル比較
シード 0 は AI 界での「あるある」値。たまたま出やすい絵がある。
- 全モデル(SD 1.5, SDXL, Flux dev, Z Image Turbo)でシード 0 で同じプロンプト
- 比較すると、各モデルの「シード 0 での好み」が見える
13. このページの教育的意義
エッジ系は「綺麗な作品を作るための知識」を超えて、「AI システムの境界を理解する」ためのもの。
- どこまで効くか
- どこから壊れるか
- 矛盾をどう処理するか
- 学習データの限界はどこか
これらを体感していると、Runway などの商用ツールで「うまく動かないとき」「変な結果が出るとき」冷静に原因推測ができるようになる。
14. クレジット予算
エッジ系も SD 1.5 で十分。1 ネタあたり 2〜5 クレジット × 5 ネタ程度で授業に持ち込める。
学生 1 人で全部試させる必要はない。先生が事前に印象的な 1 本を見つけて、授業中に再現する。
15. このあと
- To Runway — Comfy Cloud で身につけた感覚を Runway 演習へ繋げる
