Spaces:

yangg40
/

arxiv-embed-api

No application file

App Files Files Community

yangg40 commited on Nov 20, 2025

Commit

a8af144

verified ·

1 Parent(s): 75ac4a8

Initial commit

Browse files

Files changed (4) hide show

Dockerfile +25 -0
README.md +61 -11
app.py +145 -0
requirements.txt +3 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,25 @@

+FROM python:3.10-slim
+# Set working directory
+WORKDIR /app
+# Install system dependencies
+RUN apt-get update && apt-get install -y \
+    build-essential \
+    && rm -rf /var/lib/apt/lists/*
+# Copy requirements and install Python dependencies
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# Download the model at build time to speed up startup
+RUN python -c "from sentence_transformers import SentenceTransformer; SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')"
+# Copy application code
+COPY app.py .
+# Expose port 7860 (required by HuggingFace Spaces)
+EXPOSE 7860
+# Run the application
+CMD ["python", "app.py"]

README.md CHANGED Viewed

@@ -1,11 +1,61 @@
----
-title: Arxiv Embed Api
-emoji: 📈
-colorFrom: indigo
-colorTo: blue
-sdk: docker
-pinned: false
-license: mit
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+# ArXiv Papers Bot - Embedding API
+This HuggingFace Space provides a lightweight embedding API for the ArXiv Papers Discord Bot.
+## Endpoints
+### `GET /`
+Health check endpoint
+### `POST /embed`
+Generate embedding for a single text query
+**Request:**
+```json
+{
+  "text": "transformer architecture for computer vision"
+}
+```
+**Response:**
+```json
+{
+  "embedding": [0.123, -0.456, ...],
+  "dimensions": 384
+}
+```
+### `POST /batch_embed`
+Generate embeddings for multiple texts (max 100)
+**Request:**
+```json
+{
+  "texts": ["Text 1", "Text 2", "Text 3"]
+}
+```
+**Response:**
+```json
+{
+  "embeddings": [[...], [...], [...]],
+  "count": 3,
+  "dimensions": 384
+}
+```
+## Model
+- **Model:** sentence-transformers/all-MiniLM-L6-v2
+- **Dimensions:** 384
+- **Size:** ~80MB
+- **Speed:** Optimized for CPU inference
+## Deployment to HuggingFace Spaces
+1. Create a new Space on HuggingFace
+2. Select "Docker" as the SDK
+3. Upload all files from this directory
+4. The Space will automatically build and deploy
+No secrets required for this service!

app.py ADDED Viewed

	@@ -0,0 +1,145 @@

+"""
+HuggingFace Space - Embedding API
+Lightweight stateless API for generating text embeddings
+"""
+import os
+from flask import Flask, request, jsonify
+from sentence_transformers import SentenceTransformer
+import logging
+# Configure logging
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+# Initialize Flask app
+app = Flask(__name__)
+# Load the embedding model (all-MiniLM-L6-v2, 384 dimensions)
+# This model is small (~80MB) and fast on CPU
+logger.info("Loading embedding model...")
+model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
+logger.info("Model loaded successfully!")
+@app.route('/')
+def health():
+    """Health check endpoint"""
+    return jsonify({
+        "status": "healthy",
+        "model": "all-MiniLM-L6-v2",
+        "dimensions": 384,
+        "endpoints": {
+            "/embed": "POST - Generate embeddings for text",
+            "/batch_embed": "POST - Generate embeddings for multiple texts"
+        }
+    })
+@app.route('/embed', methods=['POST'])
+def embed_text():
+    """
+    Generate embedding for a single text query
+    Request body:
+    {
+        "text": "Your text here"
+    }
+    Response:
+    {
+        "embedding": [0.123, -0.456, ...],
+        "dimensions": 384
+    }
+    """
+    try:
+        data = request.get_json()
+        if not data or 'text' not in data:
+            return jsonify({
+                "error": "Missing 'text' field in request body"
+            }), 400
+        text = data['text']
+        if not isinstance(text, str) or len(text.strip()) == 0:
+            return jsonify({
+                "error": "Text must be a non-empty string"
+            }), 400
+        # Generate embedding
+        embedding = model.encode(text, convert_to_numpy=True)
+        return jsonify({
+            "embedding": embedding.tolist(),
+            "dimensions": len(embedding)
+        })
+    except Exception as e:
+        logger.error(f"Error generating embedding: {str(e)}")
+        return jsonify({
+            "error": "Internal server error",
+            "message": str(e)
+        }), 500
+@app.route('/batch_embed', methods=['POST'])
+def batch_embed_texts():
+    """
+    Generate embeddings for multiple texts (batch processing)
+    Request body:
+    {
+        "texts": ["Text 1", "Text 2", ...]
+    }
+    Response:
+    {
+        "embeddings": [[0.123, ...], [0.456, ...], ...],
+        "count": 2,
+        "dimensions": 384
+    }
+    """
+    try:
+        data = request.get_json()
+        if not data or 'texts' not in data:
+            return jsonify({
+                "error": "Missing 'texts' field in request body"
+            }), 400
+        texts = data['texts']
+        if not isinstance(texts, list) or len(texts) == 0:
+            return jsonify({
+                "error": "Texts must be a non-empty list"
+            }), 400
+        # Limit batch size to prevent abuse
+        if len(texts) > 100:
+            return jsonify({
+                "error": "Batch size too large (max 100 texts)"
+            }), 400
+        # Generate embeddings
+        embeddings = model.encode(texts, convert_to_numpy=True)
+        return jsonify({
+            "embeddings": embeddings.tolist(),
+            "count": len(embeddings),
+            "dimensions": embeddings.shape[1] if len(embeddings) > 0 else 384
+        })
+    except Exception as e:
+        logger.error(f"Error generating batch embeddings: {str(e)}")
+        return jsonify({
+            "error": "Internal server error",
+            "message": str(e)
+        }), 500
+if __name__ == '__main__':
+    # HuggingFace Spaces requires the app to listen on port 7860
+    port = int(os.environ.get('PORT', 7860))
+    logger.info(f"Starting server on port {port}...")
+    app.run(host='0.0.0.0', port=port, debug=False)

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+sentence-transformers==2.3.1
+torch==2.1.2
+flask==3.0.0