本文へスキップ
← WORKS

画像・動画生成パイプライン — AIクリエイティブ量産基盤

マーケティング素材(バナー・SNS投稿・ショート動画)の制作ワークフローをAI生成パイプラインで刷新。SDXL + LoRA + ControlNetによるブランド準拠の画像生成と、AnimateDiffによる動画変換を自動化し、制作工数70%削減・月間200素材の量産体制を実現。

ROLE
AIエンジニア / テクニカルリード
TEAM
4名(AI 2名 + デザイナー 1名 + PM 1名)
PERIOD
7ヶ月
  • 制作工数: 1素材あたり4〜6時間 → 30〜90分(-70%)
  • 月間出力量: 50〜60素材 → 200+素材(4倍)
  • AI生成バナーのCTR: 従来比+32%(A/Bテスト検証済み)
  • ブランド適合率: 自動品質ゲート(ブランドカラー閾値 + CLIP類似度 + NGワード/NSFW)通過率94%
  • ストックフォト費用: 年間約300万円 → 0円(GPU運用費を含めてもトータルコスト大幅削減)
TECHNOLOGIES
SDXLLoRAControlNetIP-AdapterAnimateDiffStable Video DiffusionESRGANCLIPComfyUIFastAPIPythonFFmpegAWS
AI生成パイプライン全体図 — BRIEF → GENERATE → CONTROL → ANIMATE → POST-PROCESS → DELIVER の6ステージ構成※画像はイメージです
Generation Pipeline: 6ステージの自動画像・動画生成フロー
スタイル制御システム — LoRA Fine-tuning・ControlNet・IP-Adapter・Brand Rule Engineの4層構造※画像はイメージです
Style Control: LoRA / ControlNet / IP-Adapter / Brand Rule の4層品質制御
ワークフロー比較 — 従来の手作業制作フロー(4〜6h)とAI生成パイプライン(30〜90min)のBefore/After※画像はイメージです
Before/After: 制作ワークフローの劇的な効率化

マーケティング部門では月間50〜60素材の制作が限界で、キャンペーンの展開速度がボトルネックとなっていた。デザイナー2名がPhotoshop / Illustrator / After Effectsでフル稼働しても需要に追いつかず、ストックフォト購入費も年間約300万円に達していた。素材の品質・トーンにもばらつきがあり、ブランドガイドラインの遵守が属人的な状態だった。

SDXL(Stable Diffusion XL)をベースに、自社保有素材(権利クリア済み、人物・ロゴ等は学習対象外)でブランドのビジュアルトーンを学習させたLoRA(Low-Rank Adaptation)を3種類作成(Product / Lifestyle / Illustration)。ControlNet(OpenPose・Canny・Depth・Tile)とIP-Adapterを組み合わせて構図・スタイルを精密に制御する4層のスタイル制御システムを構築した。

動画生成にはAnimateDiffとStable Video Diffusion(一部媒体向けに限定運用)を採用し、静止画→5〜15秒のショート動画への自動変換を実現。後処理はESRGANによる超解像、FFmpegによるエンコード・テキストオーバーレイを自動化。

品質保証として、CLIP Scoreによる意味的整合性チェック、ブランドカラー適合度の自動検証、Safety Filterによる不適切コンテンツ排除を組み込んだBrand Rule Engineを実装。人間はブリーフ入力と最終レビュー・選択のみを担当するHuman-in-the-Loopワークフローとした。