Spaces:

danicor
/

server

Sleeping

File size: 43,394 Bytes

e139f66

import os
import time
import uuid
import asyncio
import aiohttp
import torch
import json
import logging
import threading
from datetime import datetime
from typing import Dict, List, Optional, Any, Callable
from dataclasses import dataclass, field
from enum import Enum
from fastapi import FastAPI, HTTPException, Request
from pydantic import BaseModel

# Configure logging
logger = logging.getLogger(__name__)

# Define data models
class TranslationRequest(BaseModel):
    text: str
    source_lang: str
    target_lang: str
    auto_charge: bool = False

# Enums
class JobStatus(Enum):
    PENDING = "pending"
    ASSIGNED = "assigned"
    PROCESSING = "processing"
    COMPLETED = "completed"
    FAILED = "failed"
    CANCELLED = "cancelled"

class ServerStatus(Enum):
    AVAILABLE = "available"
    BUSY = "busy"
    OFFLINE = "offline"
    ERROR = "error"

# Data classes
@dataclass
class TranslationJob:
    job_id: str
    request_id: str
    text: str
    source_lang: str
    target_lang: str
    priority: int = 0
    auto_charge: bool = False
    notification_url: Optional[str] = None
    created_at: float = field(default_factory=time.time)
    assigned_at: Optional[float] = None
    started_at: Optional[float] = None
    completed_at: Optional[float] = None
    assigned_server: Optional[str] = None
    status: JobStatus = JobStatus.PENDING
    result: Optional[Dict[str, Any]] = None
    error: Optional[str] = None
    retry_count: int = 0
    max_retries: int = 3
    metadata: Dict[str, Any] = field(default_factory=dict)

@dataclass
class ServerInfo:
    id: str
    url: str
    status: ServerStatus = ServerStatus.OFFLINE
    last_ping: float = 0
    current_jobs: int = 0
    max_concurrent_jobs: int = 1
    response_time: float = 0
    error_count: int = 0
    total_requests: int = 0
    last_error: Optional[str] = None
    metadata: Dict[str, Any] = field(default_factory=dict)

# Server Registry Class
class ServerRegistry:
    def __init__(self, health_check_interval: int = 30):
        self.servers: Dict[str, ServerInfo] = {}
        self.health_check_interval = health_check_interval
        self.lock = threading.Lock()
        self.health_monitor_task = None
        self.running = False
        
    def register_server(self, server_id: str, url: str, max_concurrent_jobs: int = 1):
        """Register a new translation server"""
        with self.lock:
            self.servers[server_id] = ServerInfo(
                id=server_id,
                url=url,
                max_concurrent_jobs=max_concurrent_jobs
            )
        logger.info(f"Registered server {server_id} at {url}")
    
    def unregister_server(self, server_id: str):
        """Remove a server from registry"""
        with self.lock:
            if server_id in self.servers:
                del self.servers[server_id]
                logger.info(f"Unregistered server {server_id}")
    
    def get_available_server(self) -> Optional[ServerInfo]:
        """Get the best available server for processing"""
        with self.lock:
            available_servers = [
                server for server in self.servers.values()
                if server.status == ServerStatus.AVAILABLE and 
                   server.current_jobs < server.max_concurrent_jobs
            ]
            
            if not available_servers:
                return None
            
            available_servers.sort(key=lambda s: (s.current_jobs, s.response_time))
            return available_servers[0]
    
    def mark_server_busy(self, server_id: str):
        """Mark server as busy"""
        with self.lock:
            if server_id in self.servers:
                self.servers[server_id].current_jobs += 1
                if self.servers[server_id].current_jobs >= self.servers[server_id].max_concurrent_jobs:
                    self.servers[server_id].status = ServerStatus.BUSY
    
    def mark_server_available(self, server_id: str):
        """Mark server as available"""
        with self.lock:
            if server_id in self.servers:
                self.servers[server_id].current_jobs = max(0, self.servers[server_id].current_jobs - 1)
                if self.servers[server_id].current_jobs < self.servers[server_id].max_concurrent_jobs:
                    self.servers[server_id].status = ServerStatus.AVAILABLE
    
    def get_server_stats(self) -> Dict[str, Any]:
        """Get statistics about all servers"""
        with self.lock:
            stats = {
                'total_servers': len(self.servers),
                'available_servers': len([s for s in self.servers.values() if s.status == ServerStatus.AVAILABLE]),
                'busy_servers': len([s for s in self.servers.values() if s.status == ServerStatus.BUSY]),
                'offline_servers': len([s for s in self.servers.values() if s.status == ServerStatus.OFFLINE]),
                'servers': {
                    server_id: {
                        'status': server.status.value,
                        'current_jobs': server.current_jobs,
                        'max_jobs': server.max_concurrent_jobs,
                        'response_time': server.response_time,
                        'total_requests': server.total_requests,
                        'error_count': server.error_count,
                        'last_ping': server.last_ping
                    }
                    for server_id, server in self.servers.items()
                }
            }
        return stats
    
    async def check_server_health(self, server: ServerInfo) -> bool:
        """Check if a server is healthy"""
        try:
            start_time = time.time()
            async with aiohttp.ClientSession(timeout=aiohttp.ClientTimeout(total=10)) as session:
                async with session.get(f"{server.url}/api/health") as response:
                    response_time = time.time() - start_time
                    
                    if response.status == 200:
                        data = await response.json()
                        with self.lock:
                            server.last_ping = time.time()
                            server.response_time = response_time
                            server.error_count = 0
                            server.last_error = None
                            
                            if data.get('status') == 'healthy':
                                if server.current_jobs < server.max_concurrent_jobs:
                                    server.status = ServerStatus.AVAILABLE
                                else:
                                    server.status = ServerStatus.BUSY
                            else:
                                server.status = ServerStatus.ERROR
                        
                        return True
                    else:
                        raise Exception(f"HTTP {response.status}")
                        
        except Exception as e:
            with self.lock:
                server.status = ServerStatus.OFFLINE
                server.error_count += 1
                server.last_error = str(e)
                logger.error(f"Health check failed for server {server.id}: {e}")
            return False
    
    async def health_monitor(self):
        """Continuously monitor server health"""
        while self.running:
            try:
                servers_to_check = list(self.servers.values())
                
                health_tasks = [
                    self.check_server_health(server) 
                    for server in servers_to_check
                ]
                
                await asyncio.gather(*health_tasks, return_exceptions=True)
                
            except Exception as e:
                logger.error(f"Error in health monitor: {e}")
            
            await asyncio.sleep(self.health_check_interval)
    
    def start_health_monitoring(self):
        """Start the health monitoring task"""
        if not self.running:
            self.running = True
            loop = asyncio.get_event_loop()
            self.health_monitor_task = loop.create_task(self.health_monitor())
            logger.info("Started server health monitoring")
    
    def stop_health_monitoring(self):
        """Stop the health monitoring task"""
        self.running = False
        if self.health_monitor_task:
            self.health_monitor_task.cancel()
            logger.info("Stopped server health monitoring")

# Translation Queue Class
class TranslationQueue:
    def __init__(self, max_queue_size: int = 1000):
        self.pending_jobs: asyncio.Queue = asyncio.Queue(maxsize=max_queue_size)
        self.active_jobs: Dict[str, TranslationJob] = {}
        self.completed_jobs: Dict[str, TranslationJob] = {}
        self.failed_jobs: Dict[str, TranslationJob] = {}
        
        self.lock = asyncio.Lock()
        self.processor_task: Optional[asyncio.Task] = None
        self.running = False
        
        self.total_jobs = 0
        self.processed_jobs = 0
        self.failed_job_count = 0
        
    async def add_job(self, 
                     text: str, 
                     source_lang: str, 
                     target_lang: str,
                     request_id: Optional[str] = None,
                     priority: int = 0,
                     auto_charge: bool = False,
                     notification_url: Optional[str] = None) -> str:
        """Add a new translation job to the queue"""
        
        if not request_id:
            request_id = str(uuid.uuid4())
            
        job_id = f"job_{int(time.time())}_{str(uuid.uuid4())[:8]}"
        
        job = TranslationJob(
            job_id=job_id,
            request_id=request_id,
            text=text,
            source_lang=source_lang,
            target_lang=target_lang,
            priority=priority,
            auto_charge=auto_charge,
            notification_url=notification_url
        )
        
        try:
            await self.pending_jobs.put(job)
            
            async with self.lock:
                self.total_jobs += 1
                
            logger.info(f"Added job {job_id} to queue (request_id: {request_id})")
            return job_id
            
        except asyncio.QueueFull:
            logger.error(f"Queue is full, cannot add job {job_id}")
            raise Exception("Translation queue is full, please try again later")
    
    async def get_job_status(self, job_id: str) -> Optional[Dict[str, Any]]:
        """Get the status of a specific job"""
        async with self.lock:
            if job_id in self.active_jobs:
                job = self.active_jobs[job_id]
                return {
                    "job_id": job_id,
                    "request_id": job.request_id,
                    "status": job.status.value,
                    "assigned_server": job.assigned_server,
                    "created_at": job.created_at,
                    "assigned_at": job.assigned_at,
                    "started_at": job.started_at,
                    "processing_time": time.time() - job.started_at if job.started_at else 0,
                    "retry_count": job.retry_count
                }
            
            if job_id in self.completed_jobs:
                job = self.completed_jobs[job_id]
                return {
                    "job_id": job_id,
                    "request_id": job.request_id,
                    "status": job.status.value,
                    "assigned_server": job.assigned_server,
                    "created_at": job.created_at,
                    "completed_at": job.completed_at,
                    "processing_time": job.completed_at - job.started_at if job.started_at and job.completed_at else 0,
                    "result": job.result,
                    "retry_count": job.retry_count
                }
            
            if job_id in self.failed_jobs:
                job = self.failed_jobs[job_id]
                return {
                    "job_id": job_id,
                    "request_id": job.request_id,
                    "status": job.status.value,
                    "error": job.error,
                    "created_at": job.created_at,
                    "failed_at": job.completed_at,
                    "retry_count": job.retry_count
                }
            
            return None
    
    async def get_job_by_request_id(self, request_id: str) -> Optional[Dict[str, Any]]:
        """Get job status by request_id"""
        async with self.lock:
            all_jobs = {**self.active_jobs, **self.completed_jobs, **self.failed_jobs}
            
            for job in all_jobs.values():
                if job.request_id == request_id:
                    return await self.get_job_status(job.job_id)
            
            return None
    
    async def cancel_job(self, job_id: str) -> bool:
        """Cancel a pending or active job"""
        async with self.lock:
            if job_id in self.active_jobs:
                job = self.active_jobs[job_id]
                if job.status in [JobStatus.PENDING, JobStatus.ASSIGNED]:
                    job.status = JobStatus.CANCELLED
                    job.completed_at = time.time()
                    
                    self.failed_jobs[job_id] = job
                    del self.active_jobs[job_id]
                    
                    if job.assigned_server:
                        server_registry.mark_server_available(job.assigned_server)
                    
                    logger.info(f"Cancelled job {job_id}")
                    return True
            
            return False
    
    async def get_queue_stats(self) -> Dict[str, Any]:
        """Get queue statistics"""
        async with self.lock:
            pending_count = self.pending_jobs.qsize()
            active_count = len(self.active_jobs)
            completed_count = len(self.completed_jobs)
            failed_count = len(self.failed_jobs)
            
            return {
                "pending_jobs": pending_count,
                "active_jobs": active_count,
                "completed_jobs": completed_count,
                "failed_jobs": failed_count,
                "total_jobs": self.total_jobs,
                "processed_jobs": self.processed_jobs,
                "success_rate": (self.processed_jobs / max(1, self.total_jobs)) * 100,
                "queue_utilization": (pending_count / self.pending_jobs.maxsize) * 100
            }
    
    async def send_translation_request(self, server_url: str, job: TranslationJob) -> Dict[str, Any]:
        """Send translation request to a specific server"""
        try:
            payload = {
                "text": job.text,
                "source_lang": job.source_lang,
                "target_lang": job.target_lang,
                "request_id": job.request_id,
                "auto_charge": job.auto_charge,
                "notification_url": job.notification_url
            }
            
            timeout = aiohttp.ClientTimeout(total=300)
            
            async with aiohttp.ClientSession(timeout=timeout) as session:
                async with session.post(
                    f"{server_url}/api/translate/heavy",
                    json=payload,
                    headers={"Content-Type": "application/json"}
                ) as response:
                    
                    if response.status == 200:
                        result = await response.json()
                        logger.info(f"Successfully submitted job {job.job_id} to server {server_url}")
                        return result
                    else:
                        error_text = await response.text()
                        raise Exception(f"Server returned {response.status}: {error_text}")
                        
        except Exception as e:
            logger.error(f"Failed to send job {job.job_id} to server {server_url}: {e}")
            raise e
    
    async def process_queue(self):
        """Main queue processor - assigns jobs to available servers"""
        logger.info("Started queue processor")
        
        while self.running:
            try:
                try:
                    job = await asyncio.wait_for(self.pending_jobs.get(), timeout=1.0)
                except asyncio.TimeoutError:
                    continue
                
                available_server = server_registry.get_available_server()
                
                if not available_server:
                    await self.pending_jobs.put(job)
                    logger.warning(f"No available servers for job {job.job_id}, requeueing")
                    await asyncio.sleep(2)
                    continue
                
                async with self.lock:
                    job.assigned_server = available_server.id
                    job.assigned_at = time.time()
                    job.status = JobStatus.ASSIGNED
                    self.active_jobs[job.job_id] = job
                
                server_registry.mark_server_busy(available_server.id)
                
                try:
                    job.status = JobStatus.PROCESSING
                    job.started_at = time.time()
                    
                    result = await self.send_translation_request(available_server.url, job)
                    
                    logger.info(f"Job {job.job_id} submitted to server {available_server.id}")
                    
                except Exception as e:
                    async with self.lock:
                        job.retry_count += 1
                        job.error = str(e)
                        
                        if job.retry_count < job.max_retries:
                            job.status = JobStatus.PENDING
                            job.assigned_server = None
                            job.assigned_at = None
                            job.started_at = None
                            
                            await self.pending_jobs.put(job)
                            del self.active_jobs[job.job_id]
                            
                            logger.warning(f"Job {job.job_id} failed, retrying ({job.retry_count}/{job.max_retries})")
                        else:
                            job.status = JobStatus.FAILED
                            job.completed_at = time.time()
                            
                            self.failed_jobs[job.job_id] = job
                            self.failed_job_count += 1
                            del self.active_jobs[job.job_id]
                            
                            logger.error(f"Job {job.job_id} failed permanently after {job.retry_count} retries")
                    
                    server_registry.mark_server_available(available_server.id)
                
            except Exception as e:
                logger.error(f"Error in queue processor: {e}")
                await asyncio.sleep(1)
    
    def start_processing(self):
        """Start the queue processor"""
        if not self.running:
            self.running = True
            self.processor_task = asyncio.create_task(self.process_queue())
            logger.info("Started queue processing")
    
    def stop_processing(self):
        """Stop the queue processor"""
        self.running = False
        if self.processor_task:
            self.processor_task.cancel()
            logger.info("Stopped queue processing")

# Global instances
server_registry = ServerRegistry()
translation_queue = TranslationQueue()

# Configuration
LOAD_BALANCER_ENABLED = os.getenv("LOAD_BALANCER_ENABLED", "false").lower() == "true"
SERVER_ID = os.getenv("SERVER_ID", f"server_{int(time.time())}")
CURRENT_SERVER_URL = os.getenv("CURRENT_SERVER_URL", "http://localhost:7860")
PEER_SERVERS = os.getenv("PEER_SERVERS", "").split(",") if os.getenv("PEER_SERVERS") else []
MODEL_NAME = os.getenv("MODEL_NAME", "default_model")

# Initialize FastAPI app
app = FastAPI(title="Enhanced Translation Service with Load Balancer")

# Global storage for translations (you may need to replace this with your actual implementation)
translations = {}
translator = None  # This should be your actual translator instance

# Helper functions
async def estimate_queue_wait_time() -> int:
    """Estimate wait time in seconds based on queue size and server availability"""
    try:
        queue_stats = await translation_queue.get_queue_stats()
        server_stats = server_registry.get_server_stats()
        
        pending_jobs = queue_stats['pending_jobs']
        available_servers = server_stats['available_servers']
        
        if available_servers == 0:
            return 300
        
        estimated_seconds = (pending_jobs * 30) // max(1, available_servers)
        return min(estimated_seconds, 1800)
        
    except Exception:
        return 120

async def send_completion_notification(notification_url: str, request_id: str, 
                                     translated_text: str, result: dict, 
                                     character_count: int, translation_length: int,
                                     source_lang: str, target_lang: str, auto_charge: bool):
    """Send completion notification with enhanced data"""
    try:
        payload = {
            "request_id": request_id,
            "status": "completed",
            "translated_text": translated_text,
            "processing_time": result['processing_time'],
            "character_count": character_count,
            "translation_length": translation_length,
            "source_lang": source_lang,
            "target_lang": target_lang,
            "from_cache": result.get('from_cache', False),
            "chunks_count": result.get('chunks_count', 1),
            "auto_charge": auto_charge,
            "server_id": SERVER_ID,
            "completed_at": datetime.now().isoformat()
        }
        
        timeout = aiohttp.ClientTimeout(total=45)
        
        async with aiohttp.ClientSession(timeout=timeout) as session:
            async with session.post(
                notification_url,
                json=payload,
                headers={
                    'Content-Type': 'application/json',
                    'User-Agent': 'MLT-Server/2.0'
                }
            ) as response:
                
                if response.status == 200:
                    logger.info(f"Notification sent successfully for {request_id}")
                    return True
                else:
                    logger.warning(f"Notification failed with status {response.status} for {request_id}")
                    return False
                    
    except Exception as e:
        logger.error(f"Failed to send notification for {request_id}: {e}")
        return False

async def run_enhanced_translation_job(request_id: str, text: str, source_lang: str, 
                                     target_lang: str, notification_url: Optional[str], 
                                     auto_charge: bool = False):
    """Enhanced translation job runner with load balancer integration"""
    try:
        start_time = time.time()
        
        # Simulate progress updates
        for i in range(1, 10):
            await asyncio.sleep(2)
            if request_id in translations:
                translations[request_id]["progress"] = i * 10
                translations[request_id]["elapsed_time"] = time.time() - start_time
        
        # Perform actual translation (replace with your actual translation logic)
        result = translator.translate_text(text, source_lang, target_lang)
        
        translated_text = result['translated_text']
        processing_time = time.time() - start_time
        
        # Update translation status
        translations[request_id] = {
            "status": "completed",
            "progress": 100,
            "elapsed_time": processing_time,
            "message": "Translation completed successfully",
            "result": translated_text,
            "server_id": SERVER_ID,
            "processing_time": result['processing_time'],
            "from_cache": result.get('from_cache', False)
        }
        
        # Store in completed translations
        translator.completed_translations[request_id] = {
            'result': result,
            'completed_at': time.time(),
            'character_count': len(text),
            'translation_length': len(translated_text),
            'server_id': SERVER_ID
        }
        
        # Free up server capacity
        if LOAD_BALANCER_ENABLED:
            server_registry.mark_server_available(SERVER_ID)
        
        # Send notification if URL provided
        if notification_url:
            await send_completion_notification(
                notification_url, request_id, translated_text, result, 
                len(text), len(translated_text), source_lang, target_lang, auto_charge
            )
        
        logger.info(f"Translation job {request_id} completed successfully on server {SERVER_ID}")
        
    except Exception as e:
        logger.error(f"Error in translation job {request_id}: {e}")
        
        # Update error status
        if request_id in translations:
            translations[request_id] = {
                "status": "failed",
                "message": f"Translation failed: {str(e)}",
                "server_id": SERVER_ID,
                "elapsed_time": time.time() - start_time if 'start_time' in locals() else 0
            }
        
        # Free up server capacity
        if LOAD_BALANCER_ENABLED:
            server_registry.mark_server_available(SERVER_ID)

# Event handlers
@app.on_event("startup")
async def startup_event():
    """Initialize load balancer on startup"""
    if LOAD_BALANCER_ENABLED:
        server_registry.register_server(SERVER_ID, CURRENT_SERVER_URL, max_concurrent_jobs=1)
        
        for i, peer_url in enumerate(PEER_SERVERS):
            if peer_url.strip():
                peer_id = f"peer_server_{i}"
                server_registry.register_server(peer_id, peer_url.strip(), max_concurrent_jobs=1)
        
        server_registry.start_health_monitoring()
        translation_queue.start_processing()
        
        logger.info(f"Load balancer initialized with {len(PEER_SERVERS)} peer servers")

@app.on_event("shutdown")
async def shutdown_event():
    """Cleanup load balancer on shutdown"""
    if LOAD_BALANCER_ENABLED:
        server_registry.stop_health_monitoring()
        translation_queue.stop_processing()
        logger.info("Load balancer shutdown complete")

# API Endpoints
@app.post("/api/translate/heavy")
async def heavy_translate_enhanced(request: Request):
    """Enhanced heavy translation with load balancer support"""
    try:
        data = await request.json()
        
        # Extract parameters
        request_id = data.get("request_id")
        if not request_id:
            request_id = str(uuid.uuid4())
            
        text = data.get("text")
        source_lang = data.get("source_lang")
        target_lang = data.get("target_lang")
        auto_charge = data.get("auto_charge", False)
        notification_url = data.get("notification_url")
        
        # Validate required fields
        if not all([text, source_lang, target_lang]):
            raise HTTPException(status_code=400, detail="Missing required fields: text, source_lang, target_lang")
        
        # Check if load balancer is enabled and this server is busy
        if LOAD_BALANCER_ENABLED:
            local_server = server_registry.servers.get(SERVER_ID)
            
            # If this server is at capacity, try to route to another server
            if (local_server and 
                local_server.current_jobs >= local_server.max_concurrent_jobs):
                
                # Try to find an available peer server
                available_server = server_registry.get_available_server()
                
                if available_server and available_server.id != SERVER_ID:
                    # Route to available peer server
                    try:
                        async with aiohttp.ClientSession() as session:
                            async with session.post(
                                f"{available_server.url}/api/translate/heavy",
                                json=data,
                                timeout=aiohttp.ClientTimeout(total=10)
                            ) as response:
                                if response.status == 200:
                                    result = await response.json()
                                    logger.info(f"Routed request {request_id} to server {available_server.id}")
                                    return result
                                else:
                                    logger.warning(f"Failed to route to {available_server.id}: {response.status}")
                    except Exception as e:
                        logger.error(f"Error routing to {available_server.id}: {e}")
                
                # If routing failed, add to queue
                job_id = await translation_queue.add_job(
                    text=text,
                    source_lang=source_lang,
                    target_lang=target_lang,
                    request_id=request_id,
                    auto_charge=auto_charge,
                    notification_url=notification_url
                )
                
                return {
                    "success": True,
                    "request_id": request_id,
                    "job_id": job_id,
                    "message": "Server busy, request queued for processing",
                    "processing_mode": "queued"
                }
        
        # Process locally
        translations[request_id] = {
            "status": "processing",
            "progress": 0,
            "elapsed_time": 0,
            "message": "Translation in progress...",
            "server_id": SERVER_ID
        }
        
        # Mark server as busy if load balancer is enabled
        if LOAD_BALANCER_ENABLED:
            server_registry.mark_server_busy(SERVER_ID)
        
        # Start translation task
        asyncio.create_task(
            run_enhanced_translation_job(
                request_id, text, source_lang, target_lang, 
                notification_url, auto_charge
            )
        )
        
        return {
            "success": True, 
            "request_id": request_id, 
            "message": "Translation started on current server",
            "processing_mode": "local",
            "server_id": SERVER_ID
        }
        
    except HTTPException:
        raise
    except Exception as e:
        logger.error(f"Error in heavy_translate_enhanced: {e}")
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/api/webhook/job-completion")
async def job_completion_webhook(data: dict):
    """Webhook endpoint for receiving job completion notifications from peer servers"""
    try:
        job_id = data.get('job_id')
        request_id = data.get('request_id')
        status = data.get('status')
        result = data.get('result')
        server_id = data.get('server_id')
        
        if not all([job_id, request_id, status]):
            raise HTTPException(status_code=400, detail="Missing required fields")
        
        # Update job status in queue
        async with translation_queue.lock:
            if job_id in translation_queue.active_jobs:
                job = translation_queue.active_jobs[job_id]
                
                if status == 'completed':
                    job.status = JobStatus.COMPLETED
                    job.completed_at = time.time()
                    job.result = result
                    
                    # Move to completed jobs
                    translation_queue.completed_jobs[job_id] = job
                    del translation_queue.active_jobs[job_id]
                    translation_queue.processed_jobs += 1
                    
                    logger.info(f"Job {job_id} completed on server {server_id}")
                    
                elif status == 'failed':
                    job.status = JobStatus.FAILED
                    job.completed_at = time.time()
                    job.error = data.get('error', 'Unknown error')
                    
                    # Move to failed jobs
                    translation_queue.failed_jobs[job_id] = job
                    del translation_queue.active_jobs[job_id]
                    translation_queue.failed_job_count += 1
                    
                    logger.error(f"Job {job_id} failed on server {server_id}")
                
                # Free up the server
                if job.assigned_server:
                    server_registry.mark_server_available(job.assigned_server)
        
        return {
            "success": True,
            "message": f"Job {job_id} status updated to {status}"
        }
        
    except Exception as e:
        logger.error(f"Error in job completion webhook: {e}")
        raise HTTPException(status_code=500, detail=str(e))

@app.get("/api/enhanced-status")
async def enhanced_server_status():
    """Get enhanced server status including load balancer information"""
    try:
        base_stats = {
            "server_id": SERVER_ID,
            "server_url": CURRENT_SERVER_URL,
            "load_balancer_enabled": LOAD_BALANCER_ENABLED,
            "model": MODEL_NAME,
            "device": str(translator.device) if translator else "unknown",
            "gpu_available": torch.cuda.is_available(),
        }
        
        if LOAD_BALANCER_ENABLED:
            server_stats = server_registry.get_server_stats()
            queue_stats = await translation_queue.get_queue_stats()
            
            base_stats.update({
                "server_registry": server_stats,
                "queue_stats": queue_stats,
                "peer_servers": len(PEER_SERVERS)
            })
        else:
            # Local server stats only
            base_stats.update({
                "active_sessions": len(translator.translation_sessions) if translator else 0,
                "completed_translations": len(translator.completed_translations) if translator else 0,
                "total_requests": translator.total_requests if translator else 0
            })
        
        return {
            "success": True,
            **base_stats,
            "timestamp": datetime.now().isoformat()
        }
        
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/api/translate/distributed")
async def distributed_translate(request: TranslationRequest):
    """
    Distributed translation endpoint - routes requests to available servers
    """
    try:
        if not LOAD_BALANCER_ENABLED:
            # Fallback to local processing
            return await translate_text_api(request)
        
        # Check if this server is available for local processing
        local_server = server_registry.servers.get(SERVER_ID)
        
        if (local_server and 
            local_server.status == ServerStatus.AVAILABLE and 
            local_server.current_jobs < local_server.max_concurrent_jobs):
            
            # Process locally if available
            server_registry.mark_server_busy(SERVER_ID)
            try:
                result = perform_translation_internal(
                    request.text, 
                    request.source_lang, 
                    request.target_lang
                )
                
                return {
                    "success": True,
                    "processed_by": SERVER_ID,
                    "processing_mode": "local",
                    "translated_text": result['translated_text'],
                    "processing_time": result['processing_time'],
                    "chunks_count": result['chunks_count'],
                    "from_cache": result.get('from_cache', False),
                    "character_count": len(request.text),
                    "translation_length": len(result['translated_text'])
                }
            finally:
                server_registry.mark_server_available(SERVER_ID)
        
        else:
            # Add to distributed queue
            job_id = await translation_queue.add_job(
                text=request.text,
                source_lang=request.source_lang,
                target_lang=request.target_lang,
                auto_charge=request.auto_charge
            )
            
            return {
                "success": True,
                "processing_mode": "queued",
                "job_id": job_id,
                "message": "Request queued for processing on available server",
                "estimated_wait_time": await estimate_queue_wait_time()
            }
            
    except Exception as e:
        logger.error(f"Error in distributed translation: {e}")
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/api/translate/queue")
async def queue_translate(request: TranslationRequest):
    """
    Force translation through the queue system
    """
    try:
        job_id = await translation_queue.add_job(
            text=request.text,
            source_lang=request.source_lang,
            target_lang=request.target_lang,
            auto_charge=request.auto_charge
        )
        
        return {
            "success": True,
            "job_id": job_id,
            "message": "Translation request added to queue",
            "estimated_wait_time": await estimate_queue_wait_time()
        }
        
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.get("/api/job/{job_id}/status")
async def get_job_status(job_id: str):
    """Get status of a queued translation job"""
    try:
        status = await translation_queue.get_job_status(job_id)
        
        if not status:
            raise HTTPException(status_code=404, detail="Job not found")
        
        return {
            "success": True,
            **status
        }
        
    except HTTPException:
        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.get("/api/request/{request_id}/status")
async def get_request_status(request_id: str):
    """Get status by request_id (WordPress compatibility)"""
    try:
        status = await translation_queue.get_job_by_request_id(request_id)
        
        if not status:
            raise HTTPException(status_code=404, detail="Request not found")
        
        return {
            "success": True,
            **status
        }
        
    except HTTPException:
        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/api/job/{job_id}/cancel")
async def cancel_job(job_id: str):
    """Cancel a queued translation job"""
    try:
        cancelled = await translation_queue.cancel_job(job_id)
        
        if cancelled:
            return {
                "success": True,
                "message": f"Job {job_id} cancelled successfully"
            }
        else:
            raise HTTPException(status_code=404, detail="Job not found or cannot be cancelled")
            
    except HTTPException:
        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.get("/api/load-balancer/status")
async def load_balancer_status():
    """Get load balancer status"""
    try:
        server_stats = server_registry.get_server_stats()
        queue_stats = await translation_queue.get_queue_stats()
        
        return {
            "success": True,
            "load_balancer_enabled": LOAD_BALANCER_ENABLED,
            "server_registry": server_stats,
            "queue_stats": queue_stats,
            "total_servers": len(server_registry.servers),
            "available_servers": len([s for s in server_registry.servers.values() if s.status == ServerStatus.AVAILABLE])
        }
        
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/api/load-balancer/register")
async def register_server(server_data: dict):
    """Register a new server with the load balancer"""
    try:
        server_id = server_data.get("server_id")
        url = server_data.get("url")
        max_concurrent_jobs = server_data.get("max_concurrent_jobs", 1)
        
        if not all([server_id, url]):
            raise HTTPException(status_code=400, detail="Missing server_id or url")
        
        server_registry.register_server(server_id, url, max_concurrent_jobs)
        
        return {
            "success": True,
            "message": f"Server {server_id} registered successfully"
        }
        
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/api/load-balancer/unregister")
async def unregister_server(server_data: dict):
    """Unregister a server from the load balancer"""
    try:
        server_id = server_data.get("server_id")
        
        if not server_id:
            raise HTTPException(status_code=400, detail="Missing server_id")
        
        server_registry.unregister_server(server_id)
        
        return {
            "success": True,
            "message": f"Server {server_id} unregistered successfully"
        }
        
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

# Helper functions for internal translation processing
def perform_translation_internal(text: str, source_lang: str, target_lang: str) -> Dict[str, Any]:
    """Internal translation function - replace with your actual implementation"""
    # This is a placeholder - replace with your actual translation logic
    start_time = time.time()
    
    # Simulate translation processing
    time.sleep(0.1)
    
    translated_text = f"[TRANSLATED] {text} [{source_lang}->{target_lang}]"
    
    return {
        "translated_text": translated_text,
        "processing_time": time.time() - start_time,
        "chunks_count": 1,
        "from_cache": False
    }

async def translate_text_api(request: TranslationRequest):
    """Fallback translation API - replace with your actual implementation"""
    try:
        result = perform_translation_internal(
            request.text, 
            request.source_lang, 
            request.target_lang
        )
        
        return {
            "success": True,
            "translated_text": result['translated_text'],
            "processing_time": result['processing_time'],
            "chunks_count": result['chunks_count'],
            "from_cache": result.get('from_cache', False)
        }
        
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

if __name__ == "__main__":
    import uvicorn
    
    # Configure logging
    logging.basicConfig(
        level=logging.INFO,
        format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
    )
    
    # Start the server
    uvicorn.run(
        app,
        host="0.0.0.0",
        port=7860,
        log_level="info"
    )