>_ sk.dev
works/automosaic
業務自動化🤖 AI主導公開中

AutoMosaic

YOLOv8 + SAM2による動画・画像の自動モザイク処理システム。数時間の手作業を自動化するデスクトップアプリ

PythonYOLOv8SAM2PyQt6OpenCVffmpegCUDAPyInstaller

// VIBE CODING RATIO

💪 自力実装 25%🤖 AI担当 75%
設計・判断・レビュー AI実装

非破壊編集方式の採用・カスタムYOLOモデル学習ループの設計・複数人分担作業の仕組みなど、核心的なアーキテクチャ判断は自分で行った。動作確認・品質評価も自分が担当。実装はAIと壁打ち。

// BACKGROUND — なぜ作ったか

映像編集の現場では、Photoshopによるモザイク処理が標準で1作品あたり数時間〜数日の工数を要していた。YOLOv8による物体検出とSAM2による動画追跡を組み合わせれば、この工数を大幅に削減できると考えた。 単なる自動化ではなく、Adobe Premiere Pro / DaVinci Resolveと同等の非破壊編集方式を採用することで、誤検知修正のやり直しコストをゼロにする設計を目指した。

// WHAT I DID — 何をやったか

YOLOv8(物体検出)+ SAM2(動画追跡)+ Catmull-Romスプライン補間を組み合わせたデスクトップアプリをPyQt6で構築した。 非破壊編集:元動画は変更せず「どこにモザイクをかけるか」の指示データ(JSON)だけを編集。出力時に合成する設計。使用中に蓄積した正解データでYOLOモデルを継続改善できる学習ループも実装。PyInstallerでインストール不要の単体EXEとして配布可能。

// MY DECISIONS — 自分が設計・判断した部分

「非破壊編集方式」の採用が最重要の設計判断だった。これにより誤検知修正時のやり直しコストがゼロになる。SAM2追跡・Catmull-Rom補間・手動ボックスの3方式を使い分ける設計も自分で決めた(静止シーンは補間の方がSAM2より100倍速い)。複数人が同一JSONを共有サーバーに置いて並行作業できる仕組みも自分が設計した。

// TECH DETAIL — 技術的な工夫

- **YOLOv8(ultralytics)**:カスタム学習済みモデルで物体検出。バックグラウンド処理で検出中もUI操作可能 - **SAM2(Meta AI)**:映像の動きに追従した高精度追跡。バッチ処理(60フレーム/バッチ)でVRAM効率化 - **Catmull-Romスプライン補間**:開始・終了フレームを指定するだけで中間フレームを即時生成 - **非破壊編集**:.amproj.jsonに指示データのみ保存。出力時に元動画と合成 - **継続学習ループ**:右クリック→「学習データに追加」でアノテーション蓄積→モデル再学習

// SCREENSHOTS

AutoMosaic screenshot 1
1 / 3

// RELEASE NOTES

v3.12026-05

SAM2クリック追跡(Sキー)・複数人分担作業・モデルバージョン切り替え実装

v3.02026-01

PyQt6フルUI・タイムラインエディタ・モザイクプレビュー実装

v2.02025-06

SAM2追跡・Catmull-Rom補間・非破壊編集方式に全面移行

v1.02024-06

YOLOv8自動検出・Streamlit UI・基本モザイク処理

開発開始: 2024-06最終更新: 2026-05