Spaces:

danicor
/

server

Sleeping

App Files Files Community

danicor commited on Sep 29, 2025

Commit

e139f66

verified ·

1 Parent(s): f29052d

Create app.py

Browse files

Files changed (1) hide show

app.py +1119 -0

app.py ADDED Viewed

	@@ -0,0 +1,1119 @@

+import os
+import time
+import uuid
+import asyncio
+import aiohttp
+import torch
+import json
+import logging
+import threading
+from datetime import datetime
+from typing import Dict, List, Optional, Any, Callable
+from dataclasses import dataclass, field
+from enum import Enum
+from fastapi import FastAPI, HTTPException, Request
+from pydantic import BaseModel
+# Configure logging
+logger = logging.getLogger(__name__)
+# Define data models
+class TranslationRequest(BaseModel):
+    text: str
+    source_lang: str
+    target_lang: str
+    auto_charge: bool = False
+# Enums
+class JobStatus(Enum):
+    PENDING = "pending"
+    ASSIGNED = "assigned"
+    PROCESSING = "processing"
+    COMPLETED = "completed"
+    FAILED = "failed"
+    CANCELLED = "cancelled"
+class ServerStatus(Enum):
+    AVAILABLE = "available"
+    BUSY = "busy"
+    OFFLINE = "offline"
+    ERROR = "error"
+# Data classes
+@dataclass
+class TranslationJob:
+    job_id: str
+    request_id: str
+    text: str
+    source_lang: str
+    target_lang: str
+    priority: int = 0
+    auto_charge: bool = False
+    notification_url: Optional[str] = None
+    created_at: float = field(default_factory=time.time)
+    assigned_at: Optional[float] = None
+    started_at: Optional[float] = None
+    completed_at: Optional[float] = None
+    assigned_server: Optional[str] = None
+    status: JobStatus = JobStatus.PENDING
+    result: Optional[Dict[str, Any]] = None
+    error: Optional[str] = None
+    retry_count: int = 0
+    max_retries: int = 3
+    metadata: Dict[str, Any] = field(default_factory=dict)
+@dataclass
+class ServerInfo:
+    id: str
+    url: str
+    status: ServerStatus = ServerStatus.OFFLINE
+    last_ping: float = 0
+    current_jobs: int = 0
+    max_concurrent_jobs: int = 1
+    response_time: float = 0
+    error_count: int = 0
+    total_requests: int = 0
+    last_error: Optional[str] = None
+    metadata: Dict[str, Any] = field(default_factory=dict)
+# Server Registry Class
+class ServerRegistry:
+    def __init__(self, health_check_interval: int = 30):
+        self.servers: Dict[str, ServerInfo] = {}
+        self.health_check_interval = health_check_interval
+        self.lock = threading.Lock()
+        self.health_monitor_task = None
+        self.running = False
+    def register_server(self, server_id: str, url: str, max_concurrent_jobs: int = 1):
+        """Register a new translation server"""
+        with self.lock:
+            self.servers[server_id] = ServerInfo(
+                id=server_id,
+                url=url,
+                max_concurrent_jobs=max_concurrent_jobs
+            )
+        logger.info(f"Registered server {server_id} at {url}")
+    def unregister_server(self, server_id: str):
+        """Remove a server from registry"""
+        with self.lock:
+            if server_id in self.servers:
+                del self.servers[server_id]
+                logger.info(f"Unregistered server {server_id}")
+    def get_available_server(self) -> Optional[ServerInfo]:
+        """Get the best available server for processing"""
+        with self.lock:
+            available_servers = [
+                server for server in self.servers.values()
+                if server.status == ServerStatus.AVAILABLE and
+                   server.current_jobs < server.max_concurrent_jobs
+            ]
+            if not available_servers:
+                return None
+            available_servers.sort(key=lambda s: (s.current_jobs, s.response_time))
+            return available_servers[0]
+    def mark_server_busy(self, server_id: str):
+        """Mark server as busy"""
+        with self.lock:
+            if server_id in self.servers:
+                self.servers[server_id].current_jobs += 1
+                if self.servers[server_id].current_jobs >= self.servers[server_id].max_concurrent_jobs:
+                    self.servers[server_id].status = ServerStatus.BUSY
+    def mark_server_available(self, server_id: str):
+        """Mark server as available"""
+        with self.lock:
+            if server_id in self.servers:
+                self.servers[server_id].current_jobs = max(0, self.servers[server_id].current_jobs - 1)
+                if self.servers[server_id].current_jobs < self.servers[server_id].max_concurrent_jobs:
+                    self.servers[server_id].status = ServerStatus.AVAILABLE
+    def get_server_stats(self) -> Dict[str, Any]:
+        """Get statistics about all servers"""
+        with self.lock:
+            stats = {
+                'total_servers': len(self.servers),
+                'available_servers': len([s for s in self.servers.values() if s.status == ServerStatus.AVAILABLE]),
+                'busy_servers': len([s for s in self.servers.values() if s.status == ServerStatus.BUSY]),
+                'offline_servers': len([s for s in self.servers.values() if s.status == ServerStatus.OFFLINE]),
+                'servers': {
+                    server_id: {
+                        'status': server.status.value,
+                        'current_jobs': server.current_jobs,
+                        'max_jobs': server.max_concurrent_jobs,
+                        'response_time': server.response_time,
+                        'total_requests': server.total_requests,
+                        'error_count': server.error_count,
+                        'last_ping': server.last_ping
+                    }
+                    for server_id, server in self.servers.items()
+                }
+            }
+        return stats
+    async def check_server_health(self, server: ServerInfo) -> bool:
+        """Check if a server is healthy"""
+        try:
+            start_time = time.time()
+            async with aiohttp.ClientSession(timeout=aiohttp.ClientTimeout(total=10)) as session:
+                async with session.get(f"{server.url}/api/health") as response:
+                    response_time = time.time() - start_time
+                    if response.status == 200:
+                        data = await response.json()
+                        with self.lock:
+                            server.last_ping = time.time()
+                            server.response_time = response_time
+                            server.error_count = 0
+                            server.last_error = None
+                            if data.get('status') == 'healthy':
+                                if server.current_jobs < server.max_concurrent_jobs:
+                                    server.status = ServerStatus.AVAILABLE
+                                else:
+                                    server.status = ServerStatus.BUSY
+                            else:
+                                server.status = ServerStatus.ERROR
+                        return True
+                    else:
+                        raise Exception(f"HTTP {response.status}")
+        except Exception as e:
+            with self.lock:
+                server.status = ServerStatus.OFFLINE
+                server.error_count += 1
+                server.last_error = str(e)
+                logger.error(f"Health check failed for server {server.id}: {e}")
+            return False
+    async def health_monitor(self):
+        """Continuously monitor server health"""
+        while self.running:
+            try:
+                servers_to_check = list(self.servers.values())
+                health_tasks = [
+                    self.check_server_health(server)
+                    for server in servers_to_check
+                ]
+                await asyncio.gather(*health_tasks, return_exceptions=True)
+            except Exception as e:
+                logger.error(f"Error in health monitor: {e}")
+            await asyncio.sleep(self.health_check_interval)
+    def start_health_monitoring(self):
+        """Start the health monitoring task"""
+        if not self.running:
+            self.running = True
+            loop = asyncio.get_event_loop()
+            self.health_monitor_task = loop.create_task(self.health_monitor())
+            logger.info("Started server health monitoring")
+    def stop_health_monitoring(self):
+        """Stop the health monitoring task"""
+        self.running = False
+        if self.health_monitor_task:
+            self.health_monitor_task.cancel()
+            logger.info("Stopped server health monitoring")
+# Translation Queue Class
+class TranslationQueue:
+    def __init__(self, max_queue_size: int = 1000):
+        self.pending_jobs: asyncio.Queue = asyncio.Queue(maxsize=max_queue_size)
+        self.active_jobs: Dict[str, TranslationJob] = {}
+        self.completed_jobs: Dict[str, TranslationJob] = {}
+        self.failed_jobs: Dict[str, TranslationJob] = {}
+        self.lock = asyncio.Lock()
+        self.processor_task: Optional[asyncio.Task] = None
+        self.running = False
+        self.total_jobs = 0
+        self.processed_jobs = 0
+        self.failed_job_count = 0
+    async def add_job(self,
+                     text: str,
+                     source_lang: str,
+                     target_lang: str,
+                     request_id: Optional[str] = None,
+                     priority: int = 0,
+                     auto_charge: bool = False,
+                     notification_url: Optional[str] = None) -> str:
+        """Add a new translation job to the queue"""
+        if not request_id:
+            request_id = str(uuid.uuid4())
+        job_id = f"job_{int(time.time())}_{str(uuid.uuid4())[:8]}"
+        job = TranslationJob(
+            job_id=job_id,
+            request_id=request_id,
+            text=text,
+            source_lang=source_lang,
+            target_lang=target_lang,
+            priority=priority,
+            auto_charge=auto_charge,
+            notification_url=notification_url
+        )
+        try:
+            await self.pending_jobs.put(job)
+            async with self.lock:
+                self.total_jobs += 1
+            logger.info(f"Added job {job_id} to queue (request_id: {request_id})")
+            return job_id
+        except asyncio.QueueFull:
+            logger.error(f"Queue is full, cannot add job {job_id}")
+            raise Exception("Translation queue is full, please try again later")
+    async def get_job_status(self, job_id: str) -> Optional[Dict[str, Any]]:
+        """Get the status of a specific job"""
+        async with self.lock:
+            if job_id in self.active_jobs:
+                job = self.active_jobs[job_id]
+                return {
+                    "job_id": job_id,
+                    "request_id": job.request_id,
+                    "status": job.status.value,
+                    "assigned_server": job.assigned_server,
+                    "created_at": job.created_at,
+                    "assigned_at": job.assigned_at,
+                    "started_at": job.started_at,
+                    "processing_time": time.time() - job.started_at if job.started_at else 0,
+                    "retry_count": job.retry_count
+                }
+            if job_id in self.completed_jobs:
+                job = self.completed_jobs[job_id]
+                return {
+                    "job_id": job_id,
+                    "request_id": job.request_id,
+                    "status": job.status.value,
+                    "assigned_server": job.assigned_server,
+                    "created_at": job.created_at,
+                    "completed_at": job.completed_at,
+                    "processing_time": job.completed_at - job.started_at if job.started_at and job.completed_at else 0,
+                    "result": job.result,
+                    "retry_count": job.retry_count
+                }
+            if job_id in self.failed_jobs:
+                job = self.failed_jobs[job_id]
+                return {
+                    "job_id": job_id,
+                    "request_id": job.request_id,
+                    "status": job.status.value,
+                    "error": job.error,
+                    "created_at": job.created_at,
+                    "failed_at": job.completed_at,
+                    "retry_count": job.retry_count
+                }
+            return None
+    async def get_job_by_request_id(self, request_id: str) -> Optional[Dict[str, Any]]:
+        """Get job status by request_id"""
+        async with self.lock:
+            all_jobs = {**self.active_jobs, **self.completed_jobs, **self.failed_jobs}
+            for job in all_jobs.values():
+                if job.request_id == request_id:
+                    return await self.get_job_status(job.job_id)
+            return None
+    async def cancel_job(self, job_id: str) -> bool:
+        """Cancel a pending or active job"""
+        async with self.lock:
+            if job_id in self.active_jobs:
+                job = self.active_jobs[job_id]
+                if job.status in [JobStatus.PENDING, JobStatus.ASSIGNED]:
+                    job.status = JobStatus.CANCELLED
+                    job.completed_at = time.time()
+                    self.failed_jobs[job_id] = job
+                    del self.active_jobs[job_id]
+                    if job.assigned_server:
+                        server_registry.mark_server_available(job.assigned_server)
+                    logger.info(f"Cancelled job {job_id}")
+                    return True
+            return False
+    async def get_queue_stats(self) -> Dict[str, Any]:
+        """Get queue statistics"""
+        async with self.lock:
+            pending_count = self.pending_jobs.qsize()
+            active_count = len(self.active_jobs)
+            completed_count = len(self.completed_jobs)
+            failed_count = len(self.failed_jobs)
+            return {
+                "pending_jobs": pending_count,
+                "active_jobs": active_count,
+                "completed_jobs": completed_count,
+                "failed_jobs": failed_count,
+                "total_jobs": self.total_jobs,
+                "processed_jobs": self.processed_jobs,
+                "success_rate": (self.processed_jobs / max(1, self.total_jobs)) * 100,
+                "queue_utilization": (pending_count / self.pending_jobs.maxsize) * 100
+            }
+    async def send_translation_request(self, server_url: str, job: TranslationJob) -> Dict[str, Any]:
+        """Send translation request to a specific server"""
+        try:
+            payload = {
+                "text": job.text,
+                "source_lang": job.source_lang,
+                "target_lang": job.target_lang,
+                "request_id": job.request_id,
+                "auto_charge": job.auto_charge,
+                "notification_url": job.notification_url
+            }
+            timeout = aiohttp.ClientTimeout(total=300)
+            async with aiohttp.ClientSession(timeout=timeout) as session:
+                async with session.post(
+                    f"{server_url}/api/translate/heavy",
+                    json=payload,
+                    headers={"Content-Type": "application/json"}
+                ) as response:
+                    if response.status == 200:
+                        result = await response.json()
+                        logger.info(f"Successfully submitted job {job.job_id} to server {server_url}")
+                        return result
+                    else:
+                        error_text = await response.text()
+                        raise Exception(f"Server returned {response.status}: {error_text}")
+        except Exception as e:
+            logger.error(f"Failed to send job {job.job_id} to server {server_url}: {e}")
+            raise e
+    async def process_queue(self):
+        """Main queue processor - assigns jobs to available servers"""
+        logger.info("Started queue processor")
+        while self.running:
+            try:
+                try:
+                    job = await asyncio.wait_for(self.pending_jobs.get(), timeout=1.0)
+                except asyncio.TimeoutError:
+                    continue
+                available_server = server_registry.get_available_server()
+                if not available_server:
+                    await self.pending_jobs.put(job)
+                    logger.warning(f"No available servers for job {job.job_id}, requeueing")
+                    await asyncio.sleep(2)
+                    continue
+                async with self.lock:
+                    job.assigned_server = available_server.id
+                    job.assigned_at = time.time()
+                    job.status = JobStatus.ASSIGNED
+                    self.active_jobs[job.job_id] = job
+                server_registry.mark_server_busy(available_server.id)
+                try:
+                    job.status = JobStatus.PROCESSING
+                    job.started_at = time.time()
+                    result = await self.send_translation_request(available_server.url, job)
+                    logger.info(f"Job {job.job_id} submitted to server {available_server.id}")
+                except Exception as e:
+                    async with self.lock:
+                        job.retry_count += 1
+                        job.error = str(e)
+                        if job.retry_count < job.max_retries:
+                            job.status = JobStatus.PENDING
+                            job.assigned_server = None
+                            job.assigned_at = None
+                            job.started_at = None
+                            await self.pending_jobs.put(job)
+                            del self.active_jobs[job.job_id]
+                            logger.warning(f"Job {job.job_id} failed, retrying ({job.retry_count}/{job.max_retries})")
+                        else:
+                            job.status = JobStatus.FAILED
+                            job.completed_at = time.time()
+                            self.failed_jobs[job.job_id] = job
+                            self.failed_job_count += 1
+                            del self.active_jobs[job.job_id]
+                            logger.error(f"Job {job.job_id} failed permanently after {job.retry_count} retries")
+                    server_registry.mark_server_available(available_server.id)
+            except Exception as e:
+                logger.error(f"Error in queue processor: {e}")
+                await asyncio.sleep(1)
+    def start_processing(self):
+        """Start the queue processor"""
+        if not self.running:
+            self.running = True
+            self.processor_task = asyncio.create_task(self.process_queue())
+            logger.info("Started queue processing")
+    def stop_processing(self):
+        """Stop the queue processor"""
+        self.running = False
+        if self.processor_task:
+            self.processor_task.cancel()
+            logger.info("Stopped queue processing")
+# Global instances
+server_registry = ServerRegistry()
+translation_queue = TranslationQueue()
+# Configuration
+LOAD_BALANCER_ENABLED = os.getenv("LOAD_BALANCER_ENABLED", "false").lower() == "true"
+SERVER_ID = os.getenv("SERVER_ID", f"server_{int(time.time())}")
+CURRENT_SERVER_URL = os.getenv("CURRENT_SERVER_URL", "http://localhost:7860")
+PEER_SERVERS = os.getenv("PEER_SERVERS", "").split(",") if os.getenv("PEER_SERVERS") else []
+MODEL_NAME = os.getenv("MODEL_NAME", "default_model")
+# Initialize FastAPI app
+app = FastAPI(title="Enhanced Translation Service with Load Balancer")
+# Global storage for translations (you may need to replace this with your actual implementation)
+translations = {}
+translator = None  # This should be your actual translator instance
+# Helper functions
+async def estimate_queue_wait_time() -> int:
+    """Estimate wait time in seconds based on queue size and server availability"""
+    try:
+        queue_stats = await translation_queue.get_queue_stats()
+        server_stats = server_registry.get_server_stats()
+        pending_jobs = queue_stats['pending_jobs']
+        available_servers = server_stats['available_servers']
+        if available_servers == 0:
+            return 300
+        estimated_seconds = (pending_jobs * 30) // max(1, available_servers)
+        return min(estimated_seconds, 1800)
+    except Exception:
+        return 120
+async def send_completion_notification(notification_url: str, request_id: str,
+                                     translated_text: str, result: dict,
+                                     character_count: int, translation_length: int,
+                                     source_lang: str, target_lang: str, auto_charge: bool):
+    """Send completion notification with enhanced data"""
+    try:
+        payload = {
+            "request_id": request_id,
+            "status": "completed",
+            "translated_text": translated_text,
+            "processing_time": result['processing_time'],
+            "character_count": character_count,
+            "translation_length": translation_length,
+            "source_lang": source_lang,
+            "target_lang": target_lang,
+            "from_cache": result.get('from_cache', False),
+            "chunks_count": result.get('chunks_count', 1),
+            "auto_charge": auto_charge,
+            "server_id": SERVER_ID,
+            "completed_at": datetime.now().isoformat()
+        }
+        timeout = aiohttp.ClientTimeout(total=45)
+        async with aiohttp.ClientSession(timeout=timeout) as session:
+            async with session.post(
+                notification_url,
+                json=payload,
+                headers={
+                    'Content-Type': 'application/json',
+                    'User-Agent': 'MLT-Server/2.0'
+                }
+            ) as response:
+                if response.status == 200:
+                    logger.info(f"Notification sent successfully for {request_id}")
+                    return True
+                else:
+                    logger.warning(f"Notification failed with status {response.status} for {request_id}")
+                    return False
+    except Exception as e:
+        logger.error(f"Failed to send notification for {request_id}: {e}")
+        return False
+async def run_enhanced_translation_job(request_id: str, text: str, source_lang: str,
+                                     target_lang: str, notification_url: Optional[str],
+                                     auto_charge: bool = False):
+    """Enhanced translation job runner with load balancer integration"""
+    try:
+        start_time = time.time()
+        # Simulate progress updates
+        for i in range(1, 10):
+            await asyncio.sleep(2)
+            if request_id in translations:
+                translations[request_id]["progress"] = i * 10
+                translations[request_id]["elapsed_time"] = time.time() - start_time
+        # Perform actual translation (replace with your actual translation logic)
+        result = translator.translate_text(text, source_lang, target_lang)
+        translated_text = result['translated_text']
+        processing_time = time.time() - start_time
+        # Update translation status
+        translations[request_id] = {
+            "status": "completed",
+            "progress": 100,
+            "elapsed_time": processing_time,
+            "message": "Translation completed successfully",
+            "result": translated_text,
+            "server_id": SERVER_ID,
+            "processing_time": result['processing_time'],
+            "from_cache": result.get('from_cache', False)
+        }
+        # Store in completed translations
+        translator.completed_translations[request_id] = {
+            'result': result,
+            'completed_at': time.time(),
+            'character_count': len(text),
+            'translation_length': len(translated_text),
+            'server_id': SERVER_ID
+        }
+        # Free up server capacity
+        if LOAD_BALANCER_ENABLED:
+            server_registry.mark_server_available(SERVER_ID)
+        # Send notification if URL provided
+        if notification_url:
+            await send_completion_notification(
+                notification_url, request_id, translated_text, result,
+                len(text), len(translated_text), source_lang, target_lang, auto_charge
+            )
+        logger.info(f"Translation job {request_id} completed successfully on server {SERVER_ID}")
+    except Exception as e:
+        logger.error(f"Error in translation job {request_id}: {e}")
+        # Update error status
+        if request_id in translations:
+            translations[request_id] = {
+                "status": "failed",
+                "message": f"Translation failed: {str(e)}",
+                "server_id": SERVER_ID,
+                "elapsed_time": time.time() - start_time if 'start_time' in locals() else 0
+            }
+        # Free up server capacity
+        if LOAD_BALANCER_ENABLED:
+            server_registry.mark_server_available(SERVER_ID)
+# Event handlers
+@app.on_event("startup")
+async def startup_event():
+    """Initialize load balancer on startup"""
+    if LOAD_BALANCER_ENABLED:
+        server_registry.register_server(SERVER_ID, CURRENT_SERVER_URL, max_concurrent_jobs=1)
+        for i, peer_url in enumerate(PEER_SERVERS):
+            if peer_url.strip():
+                peer_id = f"peer_server_{i}"
+                server_registry.register_server(peer_id, peer_url.strip(), max_concurrent_jobs=1)
+        server_registry.start_health_monitoring()
+        translation_queue.start_processing()
+        logger.info(f"Load balancer initialized with {len(PEER_SERVERS)} peer servers")
+@app.on_event("shutdown")
+async def shutdown_event():
+    """Cleanup load balancer on shutdown"""
+    if LOAD_BALANCER_ENABLED:
+        server_registry.stop_health_monitoring()
+        translation_queue.stop_processing()
+        logger.info("Load balancer shutdown complete")
+# API Endpoints
+@app.post("/api/translate/heavy")
+async def heavy_translate_enhanced(request: Request):
+    """Enhanced heavy translation with load balancer support"""
+    try:
+        data = await request.json()
+        # Extract parameters
+        request_id = data.get("request_id")
+        if not request_id:
+            request_id = str(uuid.uuid4())
+        text = data.get("text")
+        source_lang = data.get("source_lang")
+        target_lang = data.get("target_lang")
+        auto_charge = data.get("auto_charge", False)
+        notification_url = data.get("notification_url")
+        # Validate required fields
+        if not all([text, source_lang, target_lang]):
+            raise HTTPException(status_code=400, detail="Missing required fields: text, source_lang, target_lang")
+        # Check if load balancer is enabled and this server is busy
+        if LOAD_BALANCER_ENABLED:
+            local_server = server_registry.servers.get(SERVER_ID)
+            # If this server is at capacity, try to route to another server
+            if (local_server and
+                local_server.current_jobs >= local_server.max_concurrent_jobs):
+                # Try to find an available peer server
+                available_server = server_registry.get_available_server()
+                if available_server and available_server.id != SERVER_ID:
+                    # Route to available peer server
+                    try:
+                        async with aiohttp.ClientSession() as session:
+                            async with session.post(
+                                f"{available_server.url}/api/translate/heavy",
+                                json=data,
+                                timeout=aiohttp.ClientTimeout(total=10)
+                            ) as response:
+                                if response.status == 200:
+                                    result = await response.json()
+                                    logger.info(f"Routed request {request_id} to server {available_server.id}")
+                                    return result
+                                else:
+                                    logger.warning(f"Failed to route to {available_server.id}: {response.status}")
+                    except Exception as e:
+                        logger.error(f"Error routing to {available_server.id}: {e}")
+                # If routing failed, add to queue
+                job_id = await translation_queue.add_job(
+                    text=text,
+                    source_lang=source_lang,
+                    target_lang=target_lang,
+                    request_id=request_id,
+                    auto_charge=auto_charge,
+                    notification_url=notification_url
+                )
+                return {
+                    "success": True,
+                    "request_id": request_id,
+                    "job_id": job_id,
+                    "message": "Server busy, request queued for processing",
+                    "processing_mode": "queued"
+                }
+        # Process locally
+        translations[request_id] = {
+            "status": "processing",
+            "progress": 0,
+            "elapsed_time": 0,
+            "message": "Translation in progress...",
+            "server_id": SERVER_ID
+        }
+        # Mark server as busy if load balancer is enabled
+        if LOAD_BALANCER_ENABLED:
+            server_registry.mark_server_busy(SERVER_ID)
+        # Start translation task
+        asyncio.create_task(
+            run_enhanced_translation_job(
+                request_id, text, source_lang, target_lang,
+                notification_url, auto_charge
+            )
+        )
+        return {
+            "success": True,
+            "request_id": request_id,
+            "message": "Translation started on current server",
+            "processing_mode": "local",
+            "server_id": SERVER_ID
+        }
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"Error in heavy_translate_enhanced: {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+@app.post("/api/webhook/job-completion")
+async def job_completion_webhook(data: dict):
+    """Webhook endpoint for receiving job completion notifications from peer servers"""
+    try:
+        job_id = data.get('job_id')
+        request_id = data.get('request_id')
+        status = data.get('status')
+        result = data.get('result')
+        server_id = data.get('server_id')
+        if not all([job_id, request_id, status]):
+            raise HTTPException(status_code=400, detail="Missing required fields")
+        # Update job status in queue
+        async with translation_queue.lock:
+            if job_id in translation_queue.active_jobs:
+                job = translation_queue.active_jobs[job_id]
+                if status == 'completed':
+                    job.status = JobStatus.COMPLETED
+                    job.completed_at = time.time()
+                    job.result = result
+                    # Move to completed jobs
+                    translation_queue.completed_jobs[job_id] = job
+                    del translation_queue.active_jobs[job_id]
+                    translation_queue.processed_jobs += 1
+                    logger.info(f"Job {job_id} completed on server {server_id}")
+                elif status == 'failed':
+                    job.status = JobStatus.FAILED
+                    job.completed_at = time.time()
+                    job.error = data.get('error', 'Unknown error')
+                    # Move to failed jobs
+                    translation_queue.failed_jobs[job_id] = job
+                    del translation_queue.active_jobs[job_id]
+                    translation_queue.failed_job_count += 1
+                    logger.error(f"Job {job_id} failed on server {server_id}")
+                # Free up the server
+                if job.assigned_server:
+                    server_registry.mark_server_available(job.assigned_server)
+        return {
+            "success": True,
+            "message": f"Job {job_id} status updated to {status}"
+        }
+    except Exception as e:
+        logger.error(f"Error in job completion webhook: {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/api/enhanced-status")
+async def enhanced_server_status():
+    """Get enhanced server status including load balancer information"""
+    try:
+        base_stats = {
+            "server_id": SERVER_ID,
+            "server_url": CURRENT_SERVER_URL,
+            "load_balancer_enabled": LOAD_BALANCER_ENABLED,
+            "model": MODEL_NAME,
+            "device": str(translator.device) if translator else "unknown",
+            "gpu_available": torch.cuda.is_available(),
+        }
+        if LOAD_BALANCER_ENABLED:
+            server_stats = server_registry.get_server_stats()
+            queue_stats = await translation_queue.get_queue_stats()
+            base_stats.update({
+                "server_registry": server_stats,
+                "queue_stats": queue_stats,
+                "peer_servers": len(PEER_SERVERS)
+            })
+        else:
+            # Local server stats only
+            base_stats.update({
+                "active_sessions": len(translator.translation_sessions) if translator else 0,
+                "completed_translations": len(translator.completed_translations) if translator else 0,
+                "total_requests": translator.total_requests if translator else 0
+            })
+        return {
+            "success": True,
+            **base_stats,
+            "timestamp": datetime.now().isoformat()
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.post("/api/translate/distributed")
+async def distributed_translate(request: TranslationRequest):
+    """
+    Distributed translation endpoint - routes requests to available servers
+    """
+    try:
+        if not LOAD_BALANCER_ENABLED:
+            # Fallback to local processing
+            return await translate_text_api(request)
+        # Check if this server is available for local processing
+        local_server = server_registry.servers.get(SERVER_ID)
+        if (local_server and
+            local_server.status == ServerStatus.AVAILABLE and
+            local_server.current_jobs < local_server.max_concurrent_jobs):
+            # Process locally if available
+            server_registry.mark_server_busy(SERVER_ID)
+            try:
+                result = perform_translation_internal(
+                    request.text,
+                    request.source_lang,
+                    request.target_lang
+                )
+                return {
+                    "success": True,
+                    "processed_by": SERVER_ID,
+                    "processing_mode": "local",
+                    "translated_text": result['translated_text'],
+                    "processing_time": result['processing_time'],
+                    "chunks_count": result['chunks_count'],
+                    "from_cache": result.get('from_cache', False),
+                    "character_count": len(request.text),
+                    "translation_length": len(result['translated_text'])
+                }
+            finally:
+                server_registry.mark_server_available(SERVER_ID)
+        else:
+            # Add to distributed queue
+            job_id = await translation_queue.add_job(
+                text=request.text,
+                source_lang=request.source_lang,
+                target_lang=request.target_lang,
+                auto_charge=request.auto_charge
+            )
+            return {
+                "success": True,
+                "processing_mode": "queued",
+                "job_id": job_id,
+                "message": "Request queued for processing on available server",
+                "estimated_wait_time": await estimate_queue_wait_time()
+            }
+    except Exception as e:
+        logger.error(f"Error in distributed translation: {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+@app.post("/api/translate/queue")
+async def queue_translate(request: TranslationRequest):
+    """
+    Force translation through the queue system
+    """
+    try:
+        job_id = await translation_queue.add_job(
+            text=request.text,
+            source_lang=request.source_lang,
+            target_lang=request.target_lang,
+            auto_charge=request.auto_charge
+        )
+        return {
+            "success": True,
+            "job_id": job_id,
+            "message": "Translation request added to queue",
+            "estimated_wait_time": await estimate_queue_wait_time()
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/api/job/{job_id}/status")
+async def get_job_status(job_id: str):
+    """Get status of a queued translation job"""
+    try:
+        status = await translation_queue.get_job_status(job_id)
+        if not status:
+            raise HTTPException(status_code=404, detail="Job not found")
+        return {
+            "success": True,
+            **status
+        }
+    except HTTPException:
+        raise
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/api/request/{request_id}/status")
+async def get_request_status(request_id: str):
+    """Get status by request_id (WordPress compatibility)"""
+    try:
+        status = await translation_queue.get_job_by_request_id(request_id)
+        if not status:
+            raise HTTPException(status_code=404, detail="Request not found")
+        return {
+            "success": True,
+            **status
+        }
+    except HTTPException:
+        raise
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.post("/api/job/{job_id}/cancel")
+async def cancel_job(job_id: str):
+    """Cancel a queued translation job"""
+    try:
+        cancelled = await translation_queue.cancel_job(job_id)
+        if cancelled:
+            return {
+                "success": True,
+                "message": f"Job {job_id} cancelled successfully"
+            }
+        else:
+            raise HTTPException(status_code=404, detail="Job not found or cannot be cancelled")
+    except HTTPException:
+        raise
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/api/load-balancer/status")
+async def load_balancer_status():
+    """Get load balancer status"""
+    try:
+        server_stats = server_registry.get_server_stats()
+        queue_stats = await translation_queue.get_queue_stats()
+        return {
+            "success": True,
+            "load_balancer_enabled": LOAD_BALANCER_ENABLED,
+            "server_registry": server_stats,
+            "queue_stats": queue_stats,
+            "total_servers": len(server_registry.servers),
+            "available_servers": len([s for s in server_registry.servers.values() if s.status == ServerStatus.AVAILABLE])
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.post("/api/load-balancer/register")
+async def register_server(server_data: dict):
+    """Register a new server with the load balancer"""
+    try:
+        server_id = server_data.get("server_id")
+        url = server_data.get("url")
+        max_concurrent_jobs = server_data.get("max_concurrent_jobs", 1)
+        if not all([server_id, url]):
+            raise HTTPException(status_code=400, detail="Missing server_id or url")
+        server_registry.register_server(server_id, url, max_concurrent_jobs)
+        return {
+            "success": True,
+            "message": f"Server {server_id} registered successfully"
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+@app.post("/api/load-balancer/unregister")
+async def unregister_server(server_data: dict):
+    """Unregister a server from the load balancer"""
+    try:
+        server_id = server_data.get("server_id")
+        if not server_id:
+            raise HTTPException(status_code=400, detail="Missing server_id")
+        server_registry.unregister_server(server_id)
+        return {
+            "success": True,
+            "message": f"Server {server_id} unregistered successfully"
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+# Helper functions for internal translation processing
+def perform_translation_internal(text: str, source_lang: str, target_lang: str) -> Dict[str, Any]:
+    """Internal translation function - replace with your actual implementation"""
+    # This is a placeholder - replace with your actual translation logic
+    start_time = time.time()
+    # Simulate translation processing
+    time.sleep(0.1)
+    translated_text = f"[TRANSLATED] {text} [{source_lang}->{target_lang}]"
+    return {
+        "translated_text": translated_text,
+        "processing_time": time.time() - start_time,
+        "chunks_count": 1,
+        "from_cache": False
+    }
+async def translate_text_api(request: TranslationRequest):
+    """Fallback translation API - replace with your actual implementation"""
+    try:
+        result = perform_translation_internal(
+            request.text,
+            request.source_lang,
+            request.target_lang
+        )
+        return {
+            "success": True,
+            "translated_text": result['translated_text'],
+            "processing_time": result['processing_time'],
+            "chunks_count": result['chunks_count'],
+            "from_cache": result.get('from_cache', False)
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+if __name__ == "__main__":
+    import uvicorn
+    # Configure logging
+    logging.basicConfig(
+        level=logging.INFO,
+        format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
+    )
+    # Start the server
+    uvicorn.run(
+        app,
+        host="0.0.0.0",
+        port=7860,
+        log_level="info"
+    )