Predict_Rating / HF_ARCHITECTURE_DIAGRAM.md
vtdung23's picture
Upload folder using huggingface_hub
c09e844 verified

πŸ—οΈ Hugging Face Spaces Deployment Architecture

πŸ“Š High-Level Architecture

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                    HUGGING FACE SPACES                      β”‚
β”‚                     (16GB RAM - Free)                       β”‚
β”‚                                                             β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”‚
β”‚  β”‚              Docker Container                      β”‚    β”‚
β”‚  β”‚              (User ID: 1000)                       β”‚    β”‚
β”‚  β”‚                                                     β”‚    β”‚
β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”‚    β”‚
β”‚  β”‚  β”‚         FastAPI Application              β”‚     β”‚    β”‚
β”‚  β”‚  β”‚         (Port 7860)                      β”‚     β”‚    β”‚
β”‚  β”‚  β”‚                                          β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”‚   Uvicorn    β”‚  β”‚  PhoBERT     β”‚   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”‚   Server     β”‚  β”‚  Model       β”‚   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”‚              β”‚  β”‚  (~500MB)    β”‚   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚                                          β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”‚  Jinja2      β”‚  β”‚  WordCloud   β”‚   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β”‚  Templates   β”‚  β”‚  Generator   β”‚   β”‚     β”‚    β”‚
β”‚  β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜   β”‚     β”‚    β”‚
β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β”‚    β”‚
β”‚  β”‚                                                     β”‚    β”‚
β”‚  β”‚  Environment Variables (from HF Secrets):          β”‚    β”‚
β”‚  β”‚  - DATABASE_URL                                    β”‚    β”‚
β”‚  β”‚  - SECRET_KEY                                      β”‚    β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                          β”‚
                          β”‚ HTTPS
                          β–Ό
              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
              β”‚        Users           β”‚
              β”‚  (Web Browsers)        β”‚
              β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                          β”‚
                          β”‚
                          β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚               External PostgreSQL Database                  β”‚
β”‚               (Render / Neon / Other)                       β”‚
β”‚                                                             β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”        β”‚
β”‚  β”‚  Users       β”‚         β”‚  PredictionHistory   β”‚        β”‚
β”‚  β”‚  Table       │────────▢│  Table               β”‚        β”‚
β”‚  β”‚              β”‚   FK    β”‚                      β”‚        β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜        β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ”„ Request Flow

1. User visits Space URL
   └─▢ https://huggingface.co/spaces/USERNAME/SPACE_NAME
       β”‚
       β–Ό
2. Hugging Face routes to Docker container (port 7860)
       β”‚
       β–Ό
3. Uvicorn receives HTTP request
       β”‚
       β”œβ”€β–Ά GET /docs β†’ Swagger UI
       β”œβ”€β–Ά GET /dashboard β†’ Jinja2 Template + TailwindCSS
       β”œβ”€β–Ά POST /api/auth/login β†’ JWT Token
       β”œβ”€β–Ά POST /api/predict/single β†’ PhoBERT Model
       └─▢ POST /api/predict/batch β†’ CSV Processing + WordCloud
           β”‚
           β–Ό
4. Database query (if needed)
   └─▢ PostgreSQL on Render/Neon (via DATABASE_URL)
       β”‚
       β–Ό
5. Response returned to user
   └─▢ JSON (API) or HTML (Pages)

🐳 Docker Build Process

1. Dockerfile Instructions
   β”‚
   β”œβ”€β–Ά FROM python:3.10-slim
   β”‚   └─ Base image (~150MB)
   β”‚
   β”œβ”€β–Ά RUN useradd -m -u 1000 user
   β”‚   └─ Create non-root user (HF requirement)
   β”‚
   β”œβ”€β–Ά COPY requirements.txt
   β”‚   └─ Copy dependencies first
   β”‚
   β”œβ”€β–Ά RUN pip install -r requirements.txt
   β”‚   └─ Install packages (~2GB with PyTorch)
   β”‚
   β”œβ”€β–Ά COPY --chown=user:user . .
   β”‚   └─ Copy application code
   β”‚
   β”œβ”€β–Ά RUN chmod -R 777 /app/app/static/uploads
   β”‚   └─ Set write permissions
   β”‚
   β”œβ”€β–Ά USER user
   β”‚   └─ Switch to non-root user
   β”‚
   └─▢ CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]
       └─ Start application

Total Build Time: 5-10 minutes
Final Image Size: ~2.5GB

πŸ” Security Layer

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                      Security Features                      β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                             β”‚
β”‚  1. Authentication Layer                                    β”‚
β”‚     β”œβ”€ JWT Tokens (24h expiration)                         β”‚
β”‚     β”œβ”€ Bcrypt password hashing                             β”‚
β”‚     └─ OAuth2 Bearer scheme                                β”‚
β”‚                                                             β”‚
β”‚  2. Network Security                                        β”‚
β”‚     β”œβ”€ HTTPS (provided by HF)                              β”‚
β”‚     β”œβ”€ CORS configuration                                   β”‚
β”‚     └─ PostgreSQL SSL (sslmode=require)                    β”‚
β”‚                                                             β”‚
β”‚  3. Secret Management                                       β”‚
β”‚     β”œβ”€ Environment variables (HF Secrets)                  β”‚
β”‚     β”œβ”€ No hardcoded credentials                            β”‚
β”‚     └─ .dockerignore excludes .env                         β”‚
β”‚                                                             β”‚
β”‚  4. Container Security                                      β”‚
β”‚     β”œβ”€ Non-root user (UID 1000)                            β”‚
β”‚     β”œβ”€ Read-only filesystem (except uploads)               β”‚
β”‚     └─ Minimal base image                                   β”‚
β”‚                                                             β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ’Ύ Storage Architecture

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                   Storage Locations                         β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                             β”‚
β”‚  Container Storage (Ephemeral - Resets on rebuild)         β”‚
β”‚  β”œβ”€ /app/app/static/uploads/wordclouds/                    β”‚
β”‚  β”‚  └─ Word cloud images (temporary)                       β”‚
β”‚  └─ /app/app/database/                                     β”‚
β”‚     └─ SQLite fallback (dev only)                          β”‚
β”‚                                                             β”‚
β”‚  External Storage (Persistent)                              β”‚
β”‚  └─ PostgreSQL Database (Render/Neon)                      β”‚
β”‚     β”œβ”€ users table                                          β”‚
β”‚     β”œβ”€ prediction_history table                            β”‚
β”‚     └─ All user data & predictions                         β”‚
β”‚                                                             β”‚
β”‚  Future Enhancements (Optional)                             β”‚
β”‚  └─ S3 / Cloudinary for file uploads                       β”‚
β”‚     └─ Persistent word clouds & CSVs                       β”‚
β”‚                                                             β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ”Œ Connection Flow

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                Database Connection Logic                   β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
              β”‚
              β–Ό
    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
    β”‚ app/database.py     β”‚
    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
              β”‚
              β–Ό
    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
    β”‚ Check os.getenv("DATABASE_URL")     β”‚
    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
              β”‚
       β”Œβ”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”
       β”‚             β”‚
       β–Ό             β–Ό
   βœ… Found      ❌ Not Found
       β”‚             β”‚
       β”‚             β–Ό
       β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
       β”‚      β”‚ Use SQLite       β”‚
       β”‚      β”‚ (Local Dev)      β”‚
       β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
       β”‚
       β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚ Fix postgres:// URL      β”‚
β”‚ (replace with            β”‚
β”‚  postgresql://)          β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
       β”‚
       β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚ Connect to PostgreSQL    β”‚
β”‚ (Production on HF)       β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ“ˆ Scalability Considerations

Current Setup (Free Tier):
β”œβ”€ 16GB RAM (sufficient for >500MB model)
β”œβ”€ Shared CPU (adequate for moderate traffic)
└─ Unlimited uptime (99.9% availability)

If Scaling Needed:
β”œβ”€ Upgrade to Pro Space ($9/month)
β”‚  └─ Better CPU, more RAM, priority support
β”œβ”€ Database scaling
β”‚  └─ Upgrade PostgreSQL plan on Render/Neon
β”œβ”€ Add caching layer
β”‚  └─ Redis for frequent queries
└─ Consider load balancing
   └─ Multiple Space instances (advanced)

πŸ”„ Deployment Workflow

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚              Local Development                           β”‚
β”‚  β”œβ”€ Edit code                                           β”‚
β”‚  β”œβ”€ Test with SQLite                                    β”‚
β”‚  └─ Commit to Git                                       β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                      β”‚
                      β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚              Push to Hugging Face                        β”‚
β”‚  git push origin main                                    β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                      β”‚
                      β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚              HF Spaces Auto-Build                        β”‚
β”‚  β”œβ”€ Pull latest code                                    β”‚
β”‚  β”œβ”€ Build Docker image (5-10 min)                       β”‚
β”‚  β”œβ”€ Run container on port 7860                          β”‚
β”‚  └─ Inject environment variables                        β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                      β”‚
                      β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚              Application Running                         β”‚
β”‚  β”œβ”€ Connect to PostgreSQL                               β”‚
β”‚  β”œβ”€ Load ML model into memory                           β”‚
β”‚  β”œβ”€ Start Uvicorn server                                β”‚
β”‚  └─ Ready to serve requests                             β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ“Š Resource Usage

Component            Memory      CPU      Disk
─────────────────────────────────────────────────
Base Image           ~150MB      -        ~150MB
Python Dependencies  ~2GB        -        ~2GB
PhoBERT Model        ~500MB      High     ~500MB
Application Code     ~50MB       Low      ~50MB
Runtime Data         ~100MB      Medium   ~100MB
─────────────────────────────────────────────────
TOTAL (approx)       ~2.8GB      -        ~2.8GB

Hugging Face Provides: 16GB RAM (plenty of headroom)

🎯 Key Architectural Decisions

Why Docker SDK?

βœ… Heavy ML model (>500MB) needs more than 512MB RAM βœ… Full control over environment βœ… 16GB RAM on free tier

Why External Database?

βœ… Container is ephemeral (resets on rebuild) βœ… PostgreSQL provides persistence βœ… Easy to scale independently

Why Port 7860?

βœ… Hugging Face Spaces requirement βœ… Auto-routed by HF infrastructure βœ… HTTPS provided automatically

Why Non-Root User?

βœ… Security best practice βœ… Hugging Face Spaces requirement βœ… UID 1000 is standard


This architecture provides:

  • βœ… High availability (99.9% uptime)
  • βœ… Sufficient resources (16GB RAM)
  • βœ… Secure deployment (JWT, SSL, non-root)
  • βœ… Persistent storage (external DB)
  • βœ… Cost-effective (free tier)