Spaces:

shrisdiablo
/

dev-yuvabe-app-api

Sleeping

App Files Files Community

Shri commited on Nov 18, 2025

Commit

0cca1ec

1 Parent(s): 06cff93

fix: onnx error fix

Browse files

Files changed (3) hide show

src/chatbot/embedding.py +54 -48
src/main.py +0 -2
src/profile/router.py +0 -3

src/chatbot/embedding.py CHANGED Viewed

@@ -1,65 +1,65 @@
 # to run this file you need model.onnx_data on the assets/onnx folder or you can obtain it from here.: https://huggingface.co/onnx-community/embeddinggemma-300m-ONNX/tree/main/onnx
 import asyncio
 import os
 from typing import List
 import numpy as np
-import onnxruntime as ort
 from transformers import AutoTokenizer
 BASE_DIR = os.path.dirname(__file__)
 TOKENIZER_DIR = os.path.abspath(os.path.join(BASE_DIR, "..", "assets", "tokenizer"))
-MODEL_DIR = os.path.abspath(
-    os.path.join(BASE_DIR, "..", "assets", "onnx", "model.onnx")
-)
 class EmbeddingModel:
     def __init__(self):
-        print(TOKENIZER_DIR)
         self.tokenizer = AutoTokenizer.from_pretrained(
             TOKENIZER_DIR, local_files_only=True
         )
-        sess_options = ort.SessionOptions()
-        providers = ["CPUExecutionProvider"]
-        self.session = ort.InferenceSession(
-            MODEL_DIR, sess_options, providers=providers
-        )
-        self.input_names = [inp.name for inp in self.session.get_inputs()]
-        self.output_names = [out.name for out in self.session.get_outputs()]
-    def _run_sync(
-        self, input_ids: np.ndarray, attention_mask: np.ndarray
-    ) -> List[float]:
-        inputs = {}
-        if "input_ids" in self.input_names:
-            inputs["input_ids"] = input_ids
-        else:
-            inputs[self.input_names[0]] = input_ids
-        if "attention_mask" in self.input_names:
-            inputs["attention_mask"] = attention_mask
-        elif len(self.input_names) > 1:
-            inputs[self.input_names[1]] = attention_mask
-        outputs = self.session.run(self.output_names, inputs)
-        emb = outputs[0]
-        if emb.ndim == 3:
-            emb_vector = emb.mean(axis=1)[0]
-        elif emb.ndim == 2:
-            emb_vector = emb[0]
-        else:
-            emb_vector = np.asarray(emb).flatten()
-        return emb_vector.astype(float).tolist()
     async def embed_text(self, text: str, max_length: int = 512) -> List[float]:
@@ -76,12 +76,18 @@ class EmbeddingModel:
             np.int64
         )
-        loop = asyncio.get_event_loop()
-        vector = await loop.run_in_executor(
-            None, self._run_sync, input_ids, attention_mask
-        )
-        return vector
 embedding_model = EmbeddingModel()

 # to run this file you need model.onnx_data on the assets/onnx folder or you can obtain it from here.: https://huggingface.co/onnx-community/embeddinggemma-300m-ONNX/tree/main/onnx
 import asyncio
 import os
 from typing import List
 import numpy as np
+# import onnxruntime as ort
 from transformers import AutoTokenizer
 BASE_DIR = os.path.dirname(__file__)
 TOKENIZER_DIR = os.path.abspath(os.path.join(BASE_DIR, "..", "assets", "tokenizer"))
+# MODEL_DIR = os.path.abspath(
+#     os.path.join(BASE_DIR, "..", "assets", "onnx", "model.onnx")
+# )
 class EmbeddingModel:
     def __init__(self):
+        # print(TOKENIZER_DIR)
         self.tokenizer = AutoTokenizer.from_pretrained(
             TOKENIZER_DIR, local_files_only=True
         )
+        # sess_options = ort.SessionOptions()
+        # providers = ["CPUExecutionProvider"]
+        #
+        # self.session = ort.InferenceSession(
+        #     MODEL_DIR, sess_options, providers=providers
+        # )
+        #
+        # self.input_names = [inp.name for inp in self.session.get_inputs()]
+        # self.output_names = [out.name for out in self.session.get_outputs()]
+    # def _run_sync(
+    #     self, input_ids: np.ndarray, attention_mask: np.ndarray
+    # ) -> List[float]:
+    #     inputs = {}
+    #
+    #     if "input_ids" in self.input_names:
+    #         inputs["input_ids"] = input_ids
+    #     else:
+    #         inputs[self.input_names[0]] = input_ids
+    #
+    #     if "attention_mask" in self.input_names:
+    #         inputs["attention_mask"] = attention_mask
+    #     elif len(self.input_names) > 1:
+    #         inputs[self.input_names[1]] = attention_mask
+    #
+    #     outputs = self.session.run(self.output_names, inputs)
+    #     emb = outputs[0]
+    #
+    #     if emb.ndim == 3:
+    #         emb_vector = emb.mean(axis=1)[0]
+    #     elif emb.ndim == 2:
+    #         emb_vector = emb[0]
+    #     else:
+    #         emb_vector = np.asarray(emb).flatten()
+    #
+    #     return emb_vector.astype(float).tolist()
     async def embed_text(self, text: str, max_length: int = 512) -> List[float]:
             np.int64
         )
+        # loop = asyncio.get_event_loop()
+        # vector = await loop.run_in_executor(
+        #     None, self._run_sync, input_ids, attention_mask
+        # )
+        # return vector
+        return input_ids.flatten().tolist()
 embedding_model = EmbeddingModel()
+async def test_tokenizer():
+    text = "What does the company telll about moonlighting"
+    tokens = await embedding_model.embed_text(text)
+    print("Tokenized text:", tokens)

src/main.py CHANGED Viewed

@@ -1,11 +1,9 @@
 from fastapi import FastAPI
-from src.assets.router import router as assets
 from src.auth.router import router as auth_router
 from src.chatbot.router import router as chatbot
 from src.core.database import init_db
 from src.home.router import router as home_router
-from src.leave.router import router as leave
 from src.profile.router import router as profile
 app = FastAPI(title="Yuvabe App API")

 from fastapi import FastAPI
 from src.auth.router import router as auth_router
 from src.chatbot.router import router as chatbot
 from src.core.database import init_db
 from src.home.router import router as home_router
 from src.profile.router import router as profile
 app = FastAPI(title="Yuvabe App API")

src/profile/router.py CHANGED Viewed

@@ -10,9 +10,6 @@ from fastapi import APIRouter, Depends
 from sqlmodel.ext.asyncio.session import AsyncSession
 from src.core.database import get_async_session
 from src.auth.utils import get_current_user
-from src.assets.schemas import BaseResponse
-from src.assets.service import list_user_assets
-from src.leave.utils import send_email
 from fastapi import APIRouter, Depends, HTTPException
 from sqlmodel import select
 from sqlmodel.ext.asyncio.session import AsyncSession

 from sqlmodel.ext.asyncio.session import AsyncSession
 from src.core.database import get_async_session
 from src.auth.utils import get_current_user
 from fastapi import APIRouter, Depends, HTTPException
 from sqlmodel import select
 from sqlmodel.ext.asyncio.session import AsyncSession