Spaces:

sam2ai
/

embed_api

Running

App Files Files Community

sam2ai commited on Dec 19, 2023

Commit

c91441b

1 Parent(s): 5382507

Synced repo using 'sync_with_huggingface' Github Action

Browse files

Files changed (1) hide show

app.py +64 -31

app.py CHANGED Viewed

@@ -6,14 +6,12 @@ import os
 from io import BytesIO
 import uvicorn
-from fastapi import FastAPI, BackgroundTasks, File, Body, UploadFile, Request
-from fastapi.responses import StreamingResponse
-from starlette.staticfiles import StaticFiles
-from starlette.templating import Jinja2Templates
-from sentence_transformers import SentenceTransformer
-# from utils.data_utils import remove_punctuation
-# from utils.utils import add_arguments, print_arguments
 def print_arguments(args):
@@ -32,28 +30,31 @@ def strtobool(val):
     else:
         raise ValueError("invalid truth value %r" % (val,))
 def str_none(val):
     if val == 'None':
         return None
     else:
         return val
 def add_arguments(argname, type, default, help, argparser, **kwargs):
     type = strtobool if type == bool else type
     type = str_none if type == str else type
-    argparser.add_argument("--" + argname,
-                           default=default,
-                           type=type,
-                           help=help + ' Default: %(default)s.',
-                           **kwargs)
 os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'
 parser = argparse.ArgumentParser(description=__doc__)
 add_arg = functools.partial(add_arguments, argparser=parser)
 add_arg("host",        type=str,  default="0.0.0.0", help="")
 add_arg("port",        type=int,  default=5000,        help="")
 add_arg("model_path",  type=str,  default="BAAI/bge-small-en-v1.5", help="")
@@ -63,24 +64,45 @@ add_arg("beam_size",   type=int,  default=10,     help="")
 add_arg("num_workers", type=int,  default=2,      help="")
 add_arg("vad_filter",  type=bool, default=True,  help="")
 add_arg("local_files_only", type=bool, default=True, help="")
 args = parser.parse_args()
 print_arguments(args)
-#
-# assert os.path.exists(args.model_path), f"{args.model_path}"
-#
 if args.use_gpu:
-    model = SentenceTransformer(args.model_path, device="cuda", compute_type="float16", cache_folder=".")
 else:
-    model = SentenceTransformer(args.model_path, device='cpu', cache_folder=".")
 app = FastAPI(title="embedding Inference")
-# app.mount('/static', StaticFiles(directory='static'), name='static')
-# templates = Jinja2Templates(directory="templates")
-# model_semaphore = None
-def similarity_score(textA, textB):
     em_test = model.encode(
         [textA, textB],
         normalize_embeddings=True
@@ -88,13 +110,26 @@ def similarity_score(textA, textB):
     return em_test[0] @ em_test[1].T
-@app.post("/embed")
-async def api_embed(
             text1: str = Body("text1", description="", embed=True),
             text2: str = Body("text2", description="", embed=True),
         ):
-    scores = similarity_score(text1, text2)
     print(scores)
     scores = scores.tolist()
@@ -102,11 +137,9 @@ async def api_embed(
     return ret
-# @app.get("/")
-# async def index(request: Request):
-#     return templates.TemplateResponse(
-#         "index.html", {"request": request, "id": id}
-#         )
 if __name__ == '__main__':

 from io import BytesIO
 import uvicorn
+from fastapi import FastAPI, Body, Request
+# from fastapi.responses import StreamingResponse
+# from starlette.staticfiles import StaticFiles
+# from starlette.templating import Jinja2Templates
+from sentence_transformers import SentenceTransformer, models
 def print_arguments(args):
     else:
         raise ValueError("invalid truth value %r" % (val,))
 def str_none(val):
     if val == 'None':
         return None
     else:
         return val
 def add_arguments(argname, type, default, help, argparser, **kwargs):
     type = strtobool if type == bool else type
     type = str_none if type == str else type
+    argparser.add_argument(
+        "--" + argname,
+        default=default,
+        type=type,
+        help=help + ' Default: %(default)s.',
+        **kwargs
+    )
 os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'
 parser = argparse.ArgumentParser(description=__doc__)
 add_arg = functools.partial(add_arguments, argparser=parser)
 add_arg("host",        type=str,  default="0.0.0.0", help="")
 add_arg("port",        type=int,  default=5000,        help="")
 add_arg("model_path",  type=str,  default="BAAI/bge-small-en-v1.5", help="")
 add_arg("num_workers", type=int,  default=2,      help="")
 add_arg("vad_filter",  type=bool, default=True,  help="")
 add_arg("local_files_only", type=bool, default=True, help="")
 args = parser.parse_args()
 print_arguments(args)
+if args.use_gpu:
+    bge_model = SentenceTransformer(args.model_path, device="cuda", compute_type="float16", cache_folder=".")
+else:
+    bge_model = SentenceTransformer(args.model_path, device='cpu', cache_folder=".")
 if args.use_gpu:
+    model_name = 'sam2ai/sbert-tsdae'
+    word_embedding_model = models.Transformer(model_name)
+    pooling_model = models.Pooling(word_embedding_model.get_word_embedding_dimension(), 'cls')
+    tsdae_model = SentenceTransformer(
+        modules=[word_embedding_model, pooling_model],
+        device="cuda",
+        compute_type="float16",
+        cache_folder="."
+    )
 else:
+    model_name = 'sam2ai/sbert-tsdae'
+    word_embedding_model = models.Transformer(model_name)
+    pooling_model = models.Pooling(word_embedding_model.get_word_embedding_dimension(), 'cls')
+    tsdae_model = SentenceTransformer(
+        modules=[word_embedding_model, pooling_model],
+        device='cpu',
+        cache_folder="."
+    )
 app = FastAPI(title="embedding Inference")
+def similarity_score(model, textA, textB):
     em_test = model.encode(
         [textA, textB],
         normalize_embeddings=True
     return em_test[0] @ em_test[1].T
+@app.post("/bge_embed")
+async def api_bge_embed(
+            text1: str = Body("text1", description="", embed=True),
+            text2: str = Body("text2", description="", embed=True),
+        ):
+    scores = similarity_score(bge_model, text1, text2)
+    print(scores)
+    scores = scores.tolist()
+    ret = {"similarity score": scores, "status_code": 200}
+    return ret
+@app.post("/tsdae_embed")
+async def api_tsdae_embed(
             text1: str = Body("text1", description="", embed=True),
             text2: str = Body("text2", description="", embed=True),
         ):
+    scores = similarity_score(tsdae_model, text1, text2)
     print(scores)
     scores = scores.tolist()
     return ret
+@app.get("/")
+async def index(request: Request):
+    return {"detail": "API is Active !!"}
 if __name__ == '__main__':