Spaces:

gpt-omni
/

mini-omni

Running

App Files Files Community

gpt-omni commited on Sep 4, 2024

Commit

58c8b03

verified ·

1 Parent(s): 6683bb4

Update inference.py

Browse files

Files changed (1) hide show

inference.py +14 -14

inference.py CHANGED Viewed

@@ -147,8 +147,8 @@ def load_audio(path):
 def A1_A2_batch(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step,
                 snacmodel, out_dir=None):
-    with fabric.init_tensor():
-        model.set_kv_cache(batch_size=2)
     tokenlist = generate_TA_BATCH(
         model,
         audio_feature,
@@ -191,8 +191,8 @@ def A1_A2_batch(fabric, audio_feature, input_ids, leng, model, text_tokenizer, s
 def A1_T2(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step):
-    with fabric.init_tensor():
-        model.set_kv_cache(batch_size=1)
     tokenlist = generate_AT(
         model,
         audio_feature,
@@ -214,8 +214,8 @@ def A1_T2(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step):
 def A1_A2(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step,
           snacmodel, out_dir=None):
-    with fabric.init_tensor():
-        model.set_kv_cache(batch_size=1)
     tokenlist = generate_AA(
         model,
         audio_feature,
@@ -256,8 +256,8 @@ def A1_A2(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step,
 def A1_T1(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step):
-    with fabric.init_tensor():
-        model.set_kv_cache(batch_size=1)
     tokenlist = generate_ASR(
         model,
         audio_feature,
@@ -280,8 +280,8 @@ def A1_T1(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step):
 def T1_A2(fabric, input_ids, model, text_tokenizer, step,
           snacmodel, out_dir=None):
-    with fabric.init_tensor():
-        model.set_kv_cache(batch_size=1)
     tokenlist = generate_TA(
         model,
         None,
@@ -325,8 +325,8 @@ def T1_A2(fabric, input_ids, model, text_tokenizer, step,
 def T1_T2(fabric, input_ids, model, text_tokenizer, step):
-    with fabric.init_tensor():
-        model.set_kv_cache(batch_size=1)
     tokenlist = generate_TT(
         model,
         None,
@@ -386,6 +386,7 @@ class OmniInference:
             pass
     @torch.inference_mode()
     def run_AT_batch_stream(self,
                             audio_path,
                             stream_stride=4,
@@ -400,8 +401,7 @@ class OmniInference:
         assert os.path.exists(audio_path), f"audio file {audio_path} not found"
         model = self.model
-        with self.fabric.init_tensor():
-            model.set_kv_cache(batch_size=2)
         mel, leng = load_audio(audio_path)
         audio_feature, input_ids = get_input_ids_whisper_ATBatch(mel, leng, self.whispermodel, self.device)

 def A1_A2_batch(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step,
                 snacmodel, out_dir=None):
+    model.set_kv_cache(batch_size=2)
     tokenlist = generate_TA_BATCH(
         model,
         audio_feature,
 def A1_T2(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step):
+    model.set_kv_cache(batch_size=1)
     tokenlist = generate_AT(
         model,
         audio_feature,
 def A1_A2(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step,
           snacmodel, out_dir=None):
+    model.set_kv_cache(batch_size=1)
     tokenlist = generate_AA(
         model,
         audio_feature,
 def A1_T1(fabric, audio_feature, input_ids, leng, model, text_tokenizer, step):
+    model.set_kv_cache(batch_size=1)
     tokenlist = generate_ASR(
         model,
         audio_feature,
 def T1_A2(fabric, input_ids, model, text_tokenizer, step,
           snacmodel, out_dir=None):
+    model.set_kv_cache(batch_size=1)
     tokenlist = generate_TA(
         model,
         None,
 def T1_T2(fabric, input_ids, model, text_tokenizer, step):
+    model.set_kv_cache(batch_size=1)
     tokenlist = generate_TT(
         model,
         None,
             pass
     @torch.inference_mode()
+    @spaces.GPU
     def run_AT_batch_stream(self,
                             audio_path,
                             stream_stride=4,
         assert os.path.exists(audio_path), f"audio file {audio_path} not found"
         model = self.model
+        model.set_kv_cache(batch_size=2)
         mel, leng = load_audio(audio_path)
         audio_feature, input_ids = get_input_ids_whisper_ATBatch(mel, leng, self.whispermodel, self.device)