test2/vr180_matting/checkpoint_manager.py

"""
Checkpoint manager for resumable video processing
Saves progress to avoid reprocessing after OOM or crashes
"""

import json
import hashlib
from pathlib import Path
from typing import Dict, Any, Optional, List
import os
import shutil
from datetime import datetime


class CheckpointManager:
    """Manages processing checkpoints for resumable execution"""

    def __init__(self, video_path: str, output_path: str, checkpoint_dir: Optional[Path] = None):
        """
        Initialize checkpoint manager

        Args:
            video_path: Input video path
            output_path: Output video path
            checkpoint_dir: Directory for checkpoint files (default: .vr180_checkpoints in CWD)
        """
        self.video_path = Path(video_path)
        self.output_path = Path(output_path)

        # Create unique checkpoint ID based on video file
        self.video_hash = self._compute_video_hash()

        # Setup checkpoint directory
        if checkpoint_dir is None:
            self.checkpoint_dir = Path.cwd() / ".vr180_checkpoints" / self.video_hash
        else:
            self.checkpoint_dir = Path(checkpoint_dir) / self.video_hash

        self.checkpoint_dir.mkdir(parents=True, exist_ok=True)

        # Checkpoint files
        self.status_file = self.checkpoint_dir / "processing_status.json"
        self.chunks_dir = self.checkpoint_dir / "chunks"
        self.chunks_dir.mkdir(exist_ok=True)

        # Load existing status or create new
        self.status = self._load_status()

    def _compute_video_hash(self) -> str:
        """Compute hash of video file for unique identification"""
        # Use file path, size, and modification time for quick hash
        stat = self.video_path.stat()
        hash_str = f"{self.video_path}_{stat.st_size}_{stat.st_mtime}"
        return hashlib.md5(hash_str.encode()).hexdigest()[:12]

    def _load_status(self) -> Dict[str, Any]:
        """Load processing status from checkpoint file"""
        if self.status_file.exists():
            with open(self.status_file, 'r') as f:
                status = json.load(f)
                print(f"📋 Loaded checkpoint: {status['completed_chunks']}/{status['total_chunks']} chunks completed")
                return status
        else:
            # Create new status
            return {
                'video_path': str(self.video_path),
                'output_path': str(self.output_path),
                'video_hash': self.video_hash,
                'start_time': datetime.now().isoformat(),
                'total_chunks': 0,
                'completed_chunks': 0,
                'chunk_info': {},
                'processing_complete': False,
                'merge_complete': False
            }

    def _save_status(self):
        """Save current status to checkpoint file"""
        self.status['last_update'] = datetime.now().isoformat()
        with open(self.status_file, 'w') as f:
            json.dump(self.status, f, indent=2)

    def set_total_chunks(self, total_chunks: int):
        """Set total number of chunks to process"""
        self.status['total_chunks'] = total_chunks
        self._save_status()

    def is_chunk_completed(self, chunk_idx: int) -> bool:
        """Check if a chunk has already been processed"""
        chunk_key = f"chunk_{chunk_idx}"
        return chunk_key in self.status['chunk_info'] and \
               self.status['chunk_info'][chunk_key].get('completed', False)

    def get_chunk_file(self, chunk_idx: int) -> Optional[Path]:
        """Get saved chunk file path if it exists"""
        chunk_file = self.chunks_dir / f"chunk_{chunk_idx:04d}.npz"
        if chunk_file.exists() and self.is_chunk_completed(chunk_idx):
            return chunk_file
        return None

    def save_chunk(self, chunk_idx: int, frames: List, source_chunk_path: Optional[Path] = None):
        """
        Save processed chunk and mark as completed

        Args:
            chunk_idx: Chunk index
            frames: Processed frames (can be None if using source_chunk_path)
            source_chunk_path: If provided, copy this file instead of saving frames
        """
        chunk_file = self.chunks_dir / f"chunk_{chunk_idx:04d}.npz"

        try:
            if source_chunk_path and source_chunk_path.exists():
                # Copy existing chunk file
                shutil.copy2(source_chunk_path, chunk_file)
                print(f"💾 Copied chunk {chunk_idx} to checkpoint: {chunk_file.name}")
            elif frames is not None:
                # Save new frames
                import numpy as np
                np.savez_compressed(str(chunk_file), frames=frames)
                print(f"💾 Saved chunk {chunk_idx} to checkpoint: {chunk_file.name}")
            else:
                raise ValueError("Either frames or source_chunk_path must be provided")

            # Update status
            chunk_key = f"chunk_{chunk_idx}"
            self.status['chunk_info'][chunk_key] = {
                'completed': True,
                'file': chunk_file.name,
                'timestamp': datetime.now().isoformat()
            }
            self.status['completed_chunks'] = len([c for c in self.status['chunk_info'].values() if c['completed']])
            self._save_status()

            print(f"✅ Chunk {chunk_idx} checkpoint saved ({self.status['completed_chunks']}/{self.status['total_chunks']})")

        except Exception as e:
            print(f"❌ Failed to save chunk {chunk_idx} checkpoint: {e}")

    def get_completed_chunk_files(self) -> List[Path]:
        """Get list of all completed chunk files in order"""
        chunk_files = []
        missing_chunks = []

        for i in range(self.status['total_chunks']):
            chunk_file = self.get_chunk_file(i)
            if chunk_file:
                chunk_files.append(chunk_file)
            else:
                # Check if chunk is marked as completed but file is missing
                if self.is_chunk_completed(i):
                    missing_chunks.append(i)
                    print(f"⚠️  Chunk {i} marked complete but file missing!")
                else:
                    break  # Stop at first unprocessed chunk

        if missing_chunks:
            print(f"❌ Missing checkpoint files for chunks: {missing_chunks}")
            print(f"   This may happen if files were deleted during streaming merge")
            print(f"   These chunks may need to be reprocessed")

        return chunk_files

    def mark_processing_complete(self):
        """Mark all chunk processing as complete"""
        self.status['processing_complete'] = True
        self._save_status()
        print(f"✅ All chunks processed and checkpointed")

    def mark_merge_complete(self):
        """Mark final merge as complete"""
        self.status['merge_complete'] = True
        self._save_status()
        print(f"✅ Video merge completed")

    def cleanup_checkpoints(self, keep_chunks: bool = False):
        """
        Clean up checkpoint files after successful completion

        Args:
            keep_chunks: If True, keep chunk files but remove status
        """
        if keep_chunks:
            # Just remove status file
            if self.status_file.exists():
                self.status_file.unlink()
                print(f"🗑️  Removed checkpoint status file")
        else:
            # Remove entire checkpoint directory
            if self.checkpoint_dir.exists():
                shutil.rmtree(self.checkpoint_dir)
                print(f"🗑️  Removed all checkpoint files: {self.checkpoint_dir}")

    def get_resume_info(self) -> Dict[str, Any]:
        """Get information about what can be resumed"""
        return {
            'can_resume': self.status['completed_chunks'] > 0,
            'completed_chunks': self.status['completed_chunks'],
            'total_chunks': self.status['total_chunks'],
            'processing_complete': self.status['processing_complete'],
            'merge_complete': self.status['merge_complete'],
            'checkpoint_dir': str(self.checkpoint_dir)
        }

    def print_status(self):
        """Print current checkpoint status"""
        print(f"\n📊 CHECKPOINT STATUS:")
        print(f"   Video: {self.video_path.name}")
        print(f"   Hash: {self.video_hash}")
        print(f"   Progress: {self.status['completed_chunks']}/{self.status['total_chunks']} chunks")
        print(f"   Processing complete: {self.status['processing_complete']}")
        print(f"   Merge complete: {self.status['merge_complete']}")
        print(f"   Checkpoint dir: {self.checkpoint_dir}")

        if self.status['completed_chunks'] > 0:
            print(f"\n   Completed chunks:")
            for i in range(self.status['completed_chunks']):
                chunk_info = self.status['chunk_info'].get(f'chunk_{i}', {})
                if chunk_info.get('completed'):
                    print(f"     ✓ Chunk {i}: {chunk_info.get('file', 'unknown')}")