Spaces:

jeanbaptdzd
/

open-finance-llm-8b

Paused

open-finance-llm-8b / app /main.py

Rename vllm.py to transformers_provider.py - clarify implementation and force rebuild

afd6869 about 1 month ago

1.33 kB

	from fastapi import FastAPI
	from app.middleware import api_key_guard
	from app.routers import openai_api
	import logging

	# Configure logging
	logging.basicConfig(level=logging.INFO)
	logger = logging.getLogger(__name__)

	app = FastAPI(title="LLM Pro Finance API (Transformers)")

	# Mount routers
	app.include_router(openai_api.router, prefix="/v1")

	# Optional API key middleware
	app.middleware("http")(api_key_guard)

	@app.on_event("startup")
	async def startup_event():
	"""Startup event - initialize model in background"""
	import threading
	logger.info("Starting LLM Pro Finance API...")
	logger.info("Initializing model in background thread...")

	def load_model():
	from app.providers.transformers_provider import initialize_model
	initialize_model()

	# Start model loading in background thread
	thread = threading.Thread(target=load_model, daemon=True)
	thread.start()
	logger.info("Model initialization started in background")

	@app.get("/")
	async def root():
	return {
	"status": "ok",
	"service": "Qwen Open Finance R 8B Inference",
	"version": "1.0.0",
	"model": "DragonLLM/qwen3-8b-fin-v1.0",
	"backend": "Transformers"
	}

	@app.get("/health")
	async def health():
	return {"status": "healthy", "service": "LLM Pro Finance API"}