Spaces:

MLOps26
/

FGDemo

Sleeping

KarishGupta commited on Feb 4

Commit

2c837a7

1 Parent(s): 0b79131

Implemented Inference Client with "zai-org/GLM-4.5V" model

Files changed (2) hide show

gradio_app.py CHANGED Viewed

@@ -1,13 +1,13 @@
 import gradio as gr
 from local_model import query_local
-from remote_model import query_remote, pipe
 import time
 def query(image, question, model_name):
     if model_name == "Local":
         return query_local(image, question)
     elif model_name == "Remote":
-        return query_remote(image, question, pipe)
     return "No model selected"

 import gradio as gr
 from local_model import query_local
+from remote_model import query_remote, client
 import time
 def query(image, question, model_name):
     if model_name == "Local":
         return query_local(image, question)
     elif model_name == "Remote":
+        return query_remote(image, question, client)
     return "No model selected"

remote_model.py CHANGED Viewed

@@ -1,32 +1,37 @@
 from huggingface_hub import InferenceClient
-import huggingface_hub
-from consts import BASE_MODEL
 from PIL import Image
-from transformers import pipeline
 import time
-pipe = pipeline("image-text-to-text", model = BASE_MODEL)
-def query_remote(image: Image.Image, question: str, pipe):
     start_time = time.time()
     print("starting remote inference... %s" %(start_time))
     if not Image:
         raise ValueError("Missing image")
     messages = [
         {
             "role": "user",
             "content": [
-                {"type": "image", "image": image},
                 {"type": "text", "text": question}
             ]
         }
     ]
-    outputs = pipe(text=messages, return_full_text=False)
     print("remote time %s --- " % (time.time() - start_time))
-    return outputs[0]["generated_text"]

 from huggingface_hub import InferenceClient
 from PIL import Image
 import time
+import base64
+from io import BytesIO
+remote_model="zai-org/GLM-4.5V"
+client = InferenceClient(model=remote_model)
+def query_remote(image: Image.Image, question: str, client: InferenceClient):
     start_time = time.time()
     print("starting remote inference... %s" %(start_time))
     if not Image:
         raise ValueError("Missing image")
+    buffered = BytesIO()
+    image.save(buffered, format="JPEG")
+    img_str = base64.b64encode(buffered.getvalue()).decode("utf-8")
+    image_url = f"data:image/jpeg;base64,{img_str}"
     messages = [
         {
             "role": "user",
             "content": [
+                {"type": "image_url", "image_url": {"url": image_url}},
                 {"type": "text", "text": question}
             ]
         }
     ]
+    response = client.chat.completions.create(messages=messages, max_tokens=256)
     print("remote time %s --- " % (time.time() - start_time))
+    return response.choices[0].message.content