Spaces:

Kraft102
/

widgettdc-api

Paused

Update backend source

34367da verified 2 months ago

2 kB

	import sys
	import json
	import torch
	import os
	from sentence_transformers import SentenceTransformer

	def log(msg):
	sys.stderr.write(f"[GPU-Bridge] {msg}\n")
	sys.stderr.flush()

	def main():
	try:
	# Check for GPU
	device = 'cuda' if torch.cuda.is_available() else 'cpu'
	log(f"Initializing on device: {device}")

	# Load model (optimized for T4 GPU)
	model_name = os.environ.get('EMBEDDING_MODEL', 'sentence-transformers/all-MiniLM-L6-v2')
	log(f"Loading model: {model_name}...")
	model = SentenceTransformer(model_name, device=device)
	log("✅ Model loaded successfully.")

	# Signal readiness
	print(json.dumps({"status": "ready", "device": device}))
	sys.stdout.flush()

	# Processing Loop
	for line in sys.stdin:
	try:
	if not line.strip():
	continue

	payload = json.loads(line)

	if 'text' in payload:
	# Single embedding
	embedding = model.encode(payload['text'], convert_to_numpy=True).tolist()
	print(json.dumps({"embedding": embedding}))

	elif 'texts' in payload:
	# Batch embedding
	embeddings = model.encode(payload['texts'], convert_to_numpy=True).tolist()
	print(json.dumps({"embeddings": embeddings}))

	elif 'ping' in payload:
	print(json.dumps({"pong": True}))

	sys.stdout.flush()

	except Exception as e:
	log(f"Error processing request: {str(e)}")
	print(json.dumps({"error": str(e)}))
	sys.stdout.flush()

	except Exception as e:
	log(f"Fatal startup error: {str(e)}")
	sys.exit(1)

	if __name__ == "__main__":
	main()