InternVL

Running

zyliu commited on Jul 22, 2024

Commit

9ec7317

1 Parent(s): a0ab750

update model_worker.py

Files changed (1) hide show

model_worker.py CHANGED Viewed

@@ -228,7 +228,7 @@ class ModelWorker:
         )
         self.heart_beat_thread.start()
-    @spaces.GPU
     def import_flash_attn(self):
         try:
             import flash_attn
@@ -325,10 +325,8 @@ class ModelWorker:
             "queue_length": self.get_queue_length(),
         }
-    @spaces.GPU
     @torch.inference_mode()
     def generate_stream(self, params):
         system_message = params["prompt"][0]["content"]
         send_messages = params["prompt"][1:]
         max_input_tiles = params["max_input_tiles"]
@@ -455,6 +453,7 @@ class ModelWorker:
         )
         self.model.system_message = old_system_message
     def generate_stream_gate(self, params):
         try:
             for x in self.generate_stream(params):

         )
         self.heart_beat_thread.start()
+    @spaces.GPU(duration=120)
     def import_flash_attn(self):
         try:
             import flash_attn
             "queue_length": self.get_queue_length(),
         }
     @torch.inference_mode()
     def generate_stream(self, params):
         system_message = params["prompt"][0]["content"]
         send_messages = params["prompt"][1:]
         max_input_tiles = params["max_input_tiles"]
         )
         self.model.system_message = old_system_message
+    @spaces.GPU(duration=120)
     def generate_stream_gate(self, params):
         try:
             for x in self.generate_stream(params):