Spaces:

Calcifer0323
/

matching

Sleeping

Calcifer0323 commited on Dec 10, 2025

Commit

9d0c7d0

1 Parent(s): 1c5dbef

замена на облегченную модель

Files changed (6) hide show

README.md CHANGED Viewed

@@ -7,8 +7,8 @@
 ### API Документация (Swagger)
 FastAPI автоматически генерирует интерактивную документацию:
-- **Swagger UI**: `http://localhost:8082/docs` (локально) или `https://your-service.onrender.com/docs`
-- **ReDoc**: `http://localhost:8082/redoc`
 - **OpenAPI Schema**: `http://localhost:8082/openapi.json`
 В Swagger UI можно:

 ### API Документация (Swagger)
 FastAPI автоматически генерирует интерактивную документацию:
+- **Swagger UI**: `http://localhost:8082/docs` (локально) или `https://matching-uebb.onrender.com/docs`
+- **ReDoc**: `http://localhost:8082/redoc` (локально) или `https://matching-uebb.onrender.com/redoc`
 - **OpenAPI Schema**: `http://localhost:8082/openapi.json`
 В Swagger UI можно:

embedding-service/Dockerfile CHANGED Viewed

@@ -2,19 +2,22 @@ FROM python:3.11-slim
 WORKDIR /app
-# Install dependencies
-COPY requirements.txt .
-RUN pip install --no-cache-dir -r requirements.txt
 # Copy application
 COPY main.py .
-# Pre-download model during build (faster cold starts)
-RUN python -c "from sentence_transformers import SentenceTransformer; SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')"
 # Expose port
 EXPOSE 8082
-# Run with uvicorn
-CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8082"]

 WORKDIR /app
+# Устанавливаем переменные окружения для оптимизации
+ENV PYTHONUNBUFFERED=1
+ENV TRANSFORMERS_CACHE=/tmp/transformers_cache
+ENV SENTENCE_TRANSFORMERS_HOME=/tmp/sentence_transformers
+ENV PIP_NO_CACHE_DIR=1
+# Install dependencies (используем production requirements)
+COPY requirements-prod.txt .
+RUN pip install --no-cache-dir -r requirements-prod.txt
 # Copy application
 COPY main.py .
 # Expose port
 EXPOSE 8082
+# Run with uvicorn (ограничиваем workers для экономии памяти)
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8082", "--workers", "1"]

embedding-service/main.py CHANGED Viewed

@@ -19,7 +19,7 @@ from dotenv import load_dotenv
 load_dotenv()
 # Конфигурация
-MODEL_NAME = os.getenv("EMBEDDING_MODEL", "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
 EMBEDDING_DIMENSIONS = int(os.getenv("EMBEDDING_DIMENSIONS", "384"))
 # Глобальная модель (загружается при старте)
@@ -38,7 +38,14 @@ async def lifespan(app: FastAPI):
     """Загрузка модели при старте приложения."""
     global model
     print(f"Loading embedding model: {MODEL_NAME}")
-    model = SentenceTransformer(MODEL_NAME)
     print(f"Model loaded successfully. Embedding dimensions: {model.get_sentence_embedding_dimension()}")
     yield
     # Cleanup

 load_dotenv()
 # Конфигурация
+MODEL_NAME = os.getenv("EMBEDDING_MODEL", "sentence-transformers/paraphrase-multilingual-MiniLM-L6-v2")
 EMBEDDING_DIMENSIONS = int(os.getenv("EMBEDDING_DIMENSIONS", "384"))
 # Глобальная модель (загружается при старте)
     """Загрузка модели при старте приложения."""
     global model
     print(f"Loading embedding model: {MODEL_NAME}")
+    # Оптимизация для минимального потребления памяти
+    model = SentenceTransformer(MODEL_NAME, device='cpu')
+    # Используем half precision для экономии памяти (если доступно)
+    try:
+        model.half()
+        print("Model converted to half precision (float16)")
+    except Exception as e:
+        print(f"Could not convert to half precision: {e}")
     print(f"Model loaded successfully. Embedding dimensions: {model.get_sentence_embedding_dimension()}")
     yield
     # Cleanup

embedding-service/requirements-prod.txt ADDED Viewed

+# Production requirements - оптимизировано для минимального потребления памяти
+fastapi==0.104.1
+uvicorn[standard]==0.24.0
+sentence-transformers==2.2.2
+numpy==1.24.4
+pydantic==2.5.3
+python-dotenv==1.0.0
+# PyTorch CPU-only версия (значительно меньше памяти)
+--extra-index-url https://download.pytorch.org/whl/cpu
+torch==2.1.0+cpu
+torchvision==0.16.0+cpu

embedding-service/requirements.txt CHANGED Viewed

@@ -4,5 +4,6 @@ sentence-transformers>=2.2.2
 numpy>=1.24.0
 pydantic>=2.5.0
 python-dotenv>=1.0.0
-torch>=2.0.0

 numpy>=1.24.0
 pydantic>=2.5.0
 python-dotenv>=1.0.0
+torch>=2.0.0,<2.2.0
+--extra-index-url https://download.pytorch.org/whl/cpu

render.yaml CHANGED Viewed

@@ -5,14 +5,16 @@ services:
     region: frankfurt  # или oregon для США
     plan: free  # бесплатный план, можно изменить на starter
     rootDir: embedding-service
-    buildCommand: pip install --no-cache-dir -r requirements.txt && python -c "from sentence_transformers import SentenceTransformer; SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')"
-    startCommand: uvicorn main:app --host 0.0.0.0 --port $PORT
     healthCheckPath: /health
     envVars:
       - key: EMBEDDING_MODEL
-        value: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
       - key: EMBEDDING_DIMENSIONS
         value: 384
       - key: PYTHON_VERSION
         value: 3.11.0

     region: frankfurt  # или oregon для США
     plan: free  # бесплатный план, можно изменить на starter
     rootDir: embedding-service
+    buildCommand: pip install --no-cache-dir -r requirements-prod.txt
+    startCommand: uvicorn main:app --host 0.0.0.0 --port $PORT --workers 1
     healthCheckPath: /health
     envVars:
       - key: EMBEDDING_MODEL
+        value: sentence-transformers/paraphrase-multilingual-MiniLM-L6-v2
       - key: EMBEDDING_DIMENSIONS
         value: 384
       - key: PYTHON_VERSION
         value: 3.11.0
+      - key: TRANSFORMERS_CACHE
+        value: /tmp/transformers_cache