File size: 6,141 Bytes

8554c13

#!/usr/bin/env python
"""
Prepare RetinaRadar Model for Hugging Face Deployment

This script helps you prepare all necessary files for uploading your
trained RetinaRadar model to Hugging Face.

Usage:
    python prepare_for_hf.py --run-dir output/runs/run_ABC123 --output-dir ~/retinaradar_hf
"""

import argparse
import shutil
import json
from pathlib import Path


def prepare_deployment(run_dir: Path, output_dir: Path, checkpoint_type: str = "best"):
    """
    Prepare model files for Hugging Face deployment
    
    Args:
        run_dir: Path to training run directory
        output_dir: Path to output directory for deployment files
        checkpoint_type: Which checkpoint to use ('best' or 'last')
    """
    
    run_dir = Path(run_dir)
    output_dir = Path(output_dir)
    
    # Validate run directory
    if not run_dir.exists():
        raise FileNotFoundError(f"Run directory not found: {run_dir}")
    
    # Create output directory
    output_dir.mkdir(parents=True, exist_ok=True)
    print(f"📁 Created output directory: {output_dir}")
    
    # 1. Copy model checkpoint
    print("\n🔍 Looking for model checkpoint...")
    checkpoints_dir = run_dir / "checkpoints"
    
    if checkpoint_type == "best":
        # Find best checkpoint (lowest val_loss in filename)
        checkpoints = list(checkpoints_dir.glob("*epoch*.ckpt"))
        if not checkpoints:
            print("⚠️  No best checkpoint found, using last.ckpt")
            checkpoint_type = "last"
        else:
            # Sort by val_loss in filename
            checkpoint_path = sorted(checkpoints)[0]
    
    if checkpoint_type == "last":
        checkpoint_path = checkpoints_dir / "last.ckpt"
    
    if not checkpoint_path.exists():
        raise FileNotFoundError(f"Checkpoint not found: {checkpoint_path}")
    
    print(f"✅ Found checkpoint: {checkpoint_path.name}")
    
    # Copy to output with standard name
    output_checkpoint = output_dir / "retinaradar_model.ckpt"
    shutil.copy2(checkpoint_path, output_checkpoint)
    print(f"📋 Copied to: {output_checkpoint}")
    
    # Get checkpoint size
    size_mb = output_checkpoint.stat().st_size / (1024 * 1024)
    print(f"   Size: {size_mb:.1f} MB")
    
    if size_mb > 5000:
        print(f"⚠️  WARNING: Checkpoint is >5GB. Consider using FP16 quantization.")
    
    # 2. Copy metadata
    print("\n🔍 Looking for metadata...")
    metadata_path = run_dir / "artifacts" / "label_metadata.json"
    
    if not metadata_path.exists():
        raise FileNotFoundError(f"Metadata not found: {metadata_path}")
    
    print(f"✅ Found metadata: {metadata_path}")
    
    output_metadata = output_dir / "label_metadata.json"
    shutil.copy2(metadata_path, output_metadata)
    print(f"📋 Copied to: {output_metadata}")
    
    # Load and display metadata info
    with open(metadata_path, 'r') as f:
        metadata = json.load(f)
    
    print(f"   Features: {', '.join(metadata.get('feature_names', []))}")
    print(f"   Total labels: {metadata.get('num_labels', 'unknown')}")
    
    # 3. Copy inference package
    print("\n🔍 Looking for inference package...")
    inference_package_path = run_dir / "artifacts" / "inference_package.json"
    
    if inference_package_path.exists():
        output_package = output_dir / "inference_package.json"
        shutil.copy2(inference_package_path, output_package)
        print(f"✅ Copied inference package")
        
        # Load and display config
        with open(inference_package_path, 'r') as f:
            package = json.load(f)
        
        config = package.get('config', {})
        print(f"   Model: {config.get('model_name', 'unknown')}")
        print(f"   Learning rate: {config.get('learning_rate', 'unknown')}")
    else:
        print("⚠️  Inference package not found (optional)")
    
    # 4. Create examples directory
    print("\n📸 Creating examples directory...")
    examples_dir = output_dir / "examples"
    examples_dir.mkdir(exist_ok=True)
    print(f"✅ Created: {examples_dir}")
    print("   👉 Add 2-3 example images to this directory")
    
    # 5. Summary
    print("\n" + "="*60)
    print("✅ DEPLOYMENT PREPARATION COMPLETE!")
    print("="*60)
    print(f"\nAll files prepared in: {output_dir}")
    print("\nFiles created:")
    print("  ✓ retinaradar_model.ckpt")
    print("  ✓ label_metadata.json")
    if inference_package_path.exists():
        print("  ✓ inference_package.json")
    print("  ✓ examples/ (empty - add your images)")
    
    print("\n📝 Next steps:")
    print("1. Add 2-3 example images to examples/ directory")
    print("2. Copy hf_inference.py to this directory")
    print("3. Copy HF_MODEL_README.md as README.md")
    print("4. Follow the deployment guide to upload to Hugging Face")
    
    print(f"\nDeployment directory ready: {output_dir}")
    print("="*60)


def main():
    parser = argparse.ArgumentParser(
        description='Prepare RetinaRadar model for Hugging Face deployment',
        formatter_class=argparse.RawDescriptionHelpFormatter,
        epilog="""
Example:
  python prepare_for_hf.py \\
      --run-dir output/runs/run_ABC123-2025-01-15_120000 \\
      --output-dir ~/retinaradar_hf \\
      --checkpoint best
        """
    )
    
    parser.add_argument(
        '--run-dir',
        type=str,
        required=True,
        help='Path to the training run directory'
    )
    parser.add_argument(
        '--output-dir',
        type=str,
        required=True,
        help='Path to output directory for deployment files'
    )
    parser.add_argument(
        '--checkpoint',
        type=str,
        default='best',
        choices=['best', 'last'],
        help='Which checkpoint to use (default: best)'
    )
    
    args = parser.parse_args()
    
    try:
        prepare_deployment(
            run_dir=args.run_dir,
            output_dir=args.output_dir,
            checkpoint_type=args.checkpoint
        )
    except Exception as e:
        print(f"\n❌ Error: {e}")
        return 1
    
    return 0


if __name__ == "__main__":
    exit(main())