コンテンツにスキップ
A Short History of Generative AI

A Short History of Generative AI

Updated: 2026-05

1. このページについて

授業中に触る Comfy Cloud は、ここ数年の生成AI技術の積み重ねの上にある。本ページはその流れをざっと追う読み物。深入りはしない。各時代の代表的なモデルと、社会で起きた象徴的な事件を一文ずつ把握できれば十分。

授業ではここを15分程度で紹介し、必要に応じて事前・事後の課題として読んでもらう想定。

2. 2022年 — 大爆発の夏

画像生成AIが一気に一般に広がった年。

  • 2月: Midjourney v1 — Discord ベースのテキスト→画像サービス
  • 8月: Stable Diffusion 1.4 — オープンソース公開。手元の GPU で誰でも動かせる
  • 9月: Théâtre D’opéra Spatial 事件 — Jason Allen 氏が Midjourney で生成した画像が Colorado State Fair のデジタルアート部門で1位を獲得。「これはアートか」「作者は誰か」という議論が世界中で起きる

Allen 氏のケースは後に米国著作権局(USCO)の判定にも進み、AIが大きな割合で関わった作品の著作権登録を拒否される。2025年に USCO は方針を更新し、「人間の選択・編集・構成といった創作的介入があれば保護対象になりうる」と表明。完全自動生成と人間が深く関わる制作の線引きが今も議論の中心。

3. 2023年 — ノードベースUIとモデル品質の向上

  • 1月: ComfyUI 公開 — Stable Diffusion のためのノードベース・インターフェース。初心者には複雑だが、内部処理がそのまま画面に出ているため学習教材として優秀
  • 7月: SDXL 1.0 — 1024×1024の高解像度生成が可能に。手・顔の破綻が大幅に減る

Web UI(AUTOMATIC1111 など)はチェックボックスとスライダーで構成された「アプリケーション」、ComfyUI は「処理を組み立てるエディタ」。同じ Stable Diffusion を、用途の違う2つのUIで触る時代に入った。

4. 2024年 — 動画生成AI元年

  • 2月: Sora 発表(OpenAI) — テキストから1分間のリアルな動画。映像業界に衝撃
  • 2月: Stable Diffusion 3 — テキストとの整合がさらに向上
  • 下半期: Kling AI — 中国発の動画生成サービスが商用展開
  • Flux — Black Forest Labs(Stable Diffusion の元開発チームの一部)が新たな高品質画像モデルをリリース

ここから「画像生成AI」の延長として「動画生成AI」が現実的な制作ツールとして使えるレベルに到達し始める。

5. 2025年 — 動画生成の本格化と Aggregator の登場

  • 3月: Sora 2 — 品質と速度が大幅に向上、商用利用が広がる
  • Hailuo AI — リアルタイム性とアジア系表現に強み、無料枠が比較的広い
  • ComfyUI on Cloud — Comfy Cloud が公式提供開始。ローカル GPU を持たなくても触れる
  • AI Aggregator という形態の定着 — Pollo.ai のように複数モデルを1つの UI から使えるサービスが普及

複数のサービスが「単独モデル提供」と「Aggregator として複数モデルを束ねる」の2方向に分かれた。Comfy Cloud は前者の系譜だが、Partner Nodes(Sora、Kling、Veo、Nano Banana 等)の経由で他社モデルも呼び出せるハイブリッドになっている。

6. 2026年 現在地

冒頭のバナー画像は、Comfy Cloud で Z Image Turbo を使い、デフォルトのプロンプトのまま無料枠で生成したもの(1枚あたり約2クレジット、1024×1024)。

2022年の SD 1.4 で同じプロンプトを実行すると、人物の手や顔は崩れ、背景は塗りつぶしのような印象になることが多かった。それから4年弱で、写真に見紛うレベルまで来ている。

教材で使う Comfy Cloud は、この4年間の積み重ねの「現時点での到達点を、ノードを開けて見られる形」で提供している。授業ではこの「中身が見える」点を最大限活用する。

7. 参考リンク

下記は授業時間内では読まない。興味を持った学生向けの読み物。

8. このあと

  • AI Tools Overview — いま使える主要モデル・ツールの俯瞰図
  • External Resources — 学外で参考になる動画・記事・コミュニティ
  • Diffusion Mechanism — 拡散モデルが内部で何をしているかの直感版