works/automosaic

業務自動化🤖 AI主導公開中

AutoMosaic

YOLOv8 + SAM2による動画・画像の自動モザイク処理システム。数時間の手作業を自動化するデスクトップアプリ

PythonYOLOv8SAM2PyQt6OpenCVffmpegCUDAPyInstaller

// VIBE CODING RATIO

💪 自力実装 25%🤖 AI担当 75%

■ 設計・判断・レビュー■ AI実装

非破壊編集方式の採用・カスタムYOLOモデル学習ループの設計・複数人分担作業の仕組みなど、核心的なアーキテクチャ判断は自分で行った。動作確認・品質評価も自分が担当。実装はAIと壁打ち。

// BACKGROUND — なぜ作ったか

映像編集の現場では、Photoshopによるモザイク処理が標準で1作品あたり数時間〜数日の工数を要していた。YOLOv8による物体検出とSAM2による動画追跡を組み合わせれば、この工数を大幅に削減できると考えた。単なる自動化ではなく、Adobe Premiere Pro / DaVinci Resolveと同等の非破壊編集方式を採用することで、誤検知修正のやり直しコストをゼロにする設計を目指した。

// WHAT I DID — 何をやったか

YOLOv8（物体検出）+ SAM2（動画追跡）+ Catmull-Romスプライン補間を組み合わせたデスクトップアプリをPyQt6で構築した。非破壊編集：元動画は変更せず「どこにモザイクをかけるか」の指示データ（JSON）だけを編集。出力時に合成する設計。使用中に蓄積した正解データでYOLOモデルを継続改善できる学習ループも実装。PyInstallerでインストール不要の単体EXEとして配布可能。

// MY DECISIONS — 自分が設計・判断した部分

「非破壊編集方式」の採用が最重要の設計判断だった。これにより誤検知修正時のやり直しコストがゼロになる。SAM2追跡・Catmull-Rom補間・手動ボックスの3方式を使い分ける設計も自分で決めた（静止シーンは補間の方がSAM2より100倍速い）。複数人が同一JSONを共有サーバーに置いて並行作業できる仕組みも自分が設計した。

// TECH DETAIL — 技術的な工夫

- **YOLOv8（ultralytics）**：カスタム学習済みモデルで物体検出。バックグラウンド処理で検出中もUI操作可能 - **SAM2（Meta AI）**：映像の動きに追従した高精度追跡。バッチ処理（60フレーム/バッチ）でVRAM効率化 - **Catmull-Romスプライン補間**：開始・終了フレームを指定するだけで中間フレームを即時生成 - **非破壊編集**：.amproj.jsonに指示データのみ保存。出力時に元動画と合成 - **継続学習ループ**：右クリック→「学習データに追加」でアノテーション蓄積→モデル再学習

// SCREENSHOTS

1 / 3

// RELEASE NOTES

v3.12026-05

SAM2クリック追跡（Sキー）・複数人分担作業・モデルバージョン切り替え実装

v3.02026-01

PyQt6フルUI・タイムラインエディタ・モザイクプレビュー実装

v2.02025-06

SAM2追跡・Catmull-Rom補間・非破壊編集方式に全面移行

v1.02024-06

YOLOv8自動検出・Streamlit UI・基本モザイク処理

開発開始: 2024-06最終更新: 2026-05