業務自動化🤖 AI主導公開中
AutoMosaic
YOLOv8 + SAM2による動画・画像の自動モザイク処理システム。数時間の手作業を自動化するデスクトップアプリ
PythonYOLOv8SAM2PyQt6OpenCVffmpegCUDAPyInstaller
// VIBE CODING RATIO
💪 自力実装 25%🤖 AI担当 75%
■ 設計・判断・レビュー■ AI実装
非破壊編集方式の採用・カスタムYOLOモデル学習ループの設計・複数人分担作業の仕組みなど、核心的なアーキテクチャ判断は自分で行った。動作確認・品質評価も自分が担当。実装はAIと壁打ち。
// BACKGROUND — なぜ作ったか
映像編集の現場では、Photoshopによるモザイク処理が標準で1作品あたり数時間〜数日の工数を要していた。YOLOv8による物体検出とSAM2による動画追跡を組み合わせれば、この工数を大幅に削減できると考えた。
単なる自動化ではなく、Adobe Premiere Pro / DaVinci Resolveと同等の非破壊編集方式を採用することで、誤検知修正のやり直しコストをゼロにする設計を目指した。
// WHAT I DID — 何をやったか
YOLOv8(物体検出)+ SAM2(動画追跡)+ Catmull-Romスプライン補間を組み合わせたデスクトップアプリをPyQt6で構築した。
非破壊編集:元動画は変更せず「どこにモザイクをかけるか」の指示データ(JSON)だけを編集。出力時に合成する設計。使用中に蓄積した正解データでYOLOモデルを継続改善できる学習ループも実装。PyInstallerでインストール不要の単体EXEとして配布可能。
// MY DECISIONS — 自分が設計・判断した部分
「非破壊編集方式」の採用が最重要の設計判断だった。これにより誤検知修正時のやり直しコストがゼロになる。SAM2追跡・Catmull-Rom補間・手動ボックスの3方式を使い分ける設計も自分で決めた(静止シーンは補間の方がSAM2より100倍速い)。複数人が同一JSONを共有サーバーに置いて並行作業できる仕組みも自分が設計した。
// TECH DETAIL — 技術的な工夫
- **YOLOv8(ultralytics)**:カスタム学習済みモデルで物体検出。バックグラウンド処理で検出中もUI操作可能
- **SAM2(Meta AI)**:映像の動きに追従した高精度追跡。バッチ処理(60フレーム/バッチ)でVRAM効率化
- **Catmull-Romスプライン補間**:開始・終了フレームを指定するだけで中間フレームを即時生成
- **非破壊編集**:.amproj.jsonに指示データのみ保存。出力時に元動画と合成
- **継続学習ループ**:右クリック→「学習データに追加」でアノテーション蓄積→モデル再学習
// SCREENSHOTS
// RELEASE NOTES
v3.12026-05
SAM2クリック追跡(Sキー)・複数人分担作業・モデルバージョン切り替え実装
v3.02026-01
PyQt6フルUI・タイムラインエディタ・モザイクプレビュー実装
v2.02025-06
SAM2追跡・Catmull-Rom補間・非破壊編集方式に全面移行
v1.02024-06
YOLOv8自動検出・Streamlit UI・基本モザイク処理
開発開始: 2024-06最終更新: 2026-05
