Spaces:

366degrees
/

snp-universal-embedding

Running

App Files Files Community

PunchNFIT commited on Nov 1, 2025

Commit

5c20eb3

1 Parent(s): 57f4afd

Simplified: Flask direct run, no Gunicorn

Browse files

Files changed (2) hide show

Dockerfile +2 -1
api_inference.py +21 -28

Dockerfile CHANGED Viewed

@@ -27,4 +27,5 @@ RUN touch /.gitconfig && chmod 666 /.gitconfig
 USER appuser
 # 8) Start server (Gunicorn)
-CMD ["gunicorn", "--bind", "0.0.0.0:7860", "api_inference:app"]

 USER appuser
 # 8) Start server (Gunicorn)
+CMD ["python", "api_inference.py"]

api_inference.py CHANGED Viewed

@@ -3,19 +3,16 @@ import torch
 import torch.nn as nn
 from flask import Flask, request, jsonify
 from transformers import (
-    AutoTokenizer,
-    AutoModel,
     AutoConfig,
     PretrainedConfig,
     PreTrainedModel,
-    TOKENIZER_MAPPING,
-    RobertaTokenizer
 )
 # ============================================================
-# Early Custom Registration (Runs before Flask/Gunicorn)
 # ============================================================
 class CustomSNPConfig(PretrainedConfig):
     model_type = "custom_snp"
@@ -40,47 +37,42 @@ class CustomSNPModel(PreTrainedModel):
         return self.projection(x)
-# --- Force registration order ---
-TOKENIZER_MAPPING[CustomSNPConfig] = (RobertaTokenizer, RobertaTokenizer)
-AutoConfig.register("custom_snp", CustomSNPConfig)
-AutoModel.register(CustomSNPConfig, CustomSNPModel)
 # ============================================================
-# Environment Configuration
 # ============================================================
 os.environ["HF_HOME"] = "/tmp/huggingface"
 MODEL_DIR = "./"
 PORT = int(os.environ.get("PORT", 7860))
 app = Flask(__name__)
 # ============================================================
-# Load Model & Tokenizer
 # ============================================================
 try:
     print("Loading model from:", MODEL_DIR)
     config = AutoConfig.from_pretrained(MODEL_DIR, trust_remote_code=True)
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_DIR)
-    model = AutoModel.from_pretrained(MODEL_DIR, config=config, trust_remote_code=True)
     model.eval()
     print("✅ Custom SNP model loaded successfully.")
 except Exception as e:
     print("❌ Error loading custom model:", e)
     raise e
-# ============================================================
-# Initialize weights (optional)
-# ============================================================
-def initialize_weights_if_missing(model):
-    for name, param in model.named_parameters():
-        if param.requires_grad and (torch.isnan(param).any() or torch.all(param == 0)):
-            nn.init.xavier_uniform_(param)
-            print(f"🔧 Initialized missing weights: {name}")
-initialize_weights_if_missing(model)
 # ============================================================
-# Flask Routes
 # ============================================================
 @app.route("/", methods=["GET"])
 def home():
@@ -135,8 +127,9 @@ def test():
         "embedding_preview": vector[0][:6]
     })
 # ============================================================
-# Run Server (Gunicorn)
 # ============================================================
 if __name__ == "__main__":
     print(f"🚀 Starting SNP Universal Embedding API on port {PORT}")

 import torch.nn as nn
 from flask import Flask, request, jsonify
 from transformers import (
     AutoConfig,
+    AutoModel,
     PretrainedConfig,
     PreTrainedModel,
 )
+from transformers import RobertaTokenizerFast as RobertaTokenizer
 # ============================================================
+# Custom SNP Architecture (no Gunicorn complications)
 # ============================================================
 class CustomSNPConfig(PretrainedConfig):
     model_type = "custom_snp"
         return self.projection(x)
 # ============================================================
+# Environment
 # ============================================================
 os.environ["HF_HOME"] = "/tmp/huggingface"
 MODEL_DIR = "./"
 PORT = int(os.environ.get("PORT", 7860))
 app = Flask(__name__)
 # ============================================================
+# Load Model & Tokenizer (direct tokenizer, no AutoTokenizer)
 # ============================================================
 try:
     print("Loading model from:", MODEL_DIR)
     config = AutoConfig.from_pretrained(MODEL_DIR, trust_remote_code=True)
+    # Use concrete tokenizer to avoid mapping issues
+    try:
+        tokenizer = RobertaTokenizer.from_pretrained(MODEL_DIR)
+        print("✅ Loaded tokenizer from model directory.")
+    except Exception:
+        print("⚠️ Falling back to default roberta-base tokenizer.")
+        tokenizer = RobertaTokenizer.from_pretrained("roberta-base")
+    model = CustomSNPModel(config)
+    if os.path.exists(os.path.join(MODEL_DIR, "pytorch_model.bin")):
+        state = torch.load(os.path.join(MODEL_DIR, "pytorch_model.bin"), map_location="cpu")
+        model.load_state_dict(state, strict=False)
     model.eval()
     print("✅ Custom SNP model loaded successfully.")
 except Exception as e:
     print("❌ Error loading custom model:", e)
     raise e
 # ============================================================
+# Routes
 # ============================================================
 @app.route("/", methods=["GET"])
 def home():
         "embedding_preview": vector[0][:6]
     })
 # ============================================================
+# Run Flask directly (no Gunicorn)
 # ============================================================
 if __name__ == "__main__":
     print(f"🚀 Starting SNP Universal Embedding API on port {PORT}")