qualcomm
/

HuggingFace-WavLM-Base-Plus

@@ -35,15 +35,16 @@ More details on model performance across various devices, can be found
 | Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
-| HuggingFace-WavLM-Base-Plus | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 814.795 ms | 63 - 98 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 739.112 ms | 30 - 50 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 530.552 ms | 63 - 77 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 742.901 ms | 63 - 66 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 927.766 ms | 63 - 610 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | SA8775 (Proxy) | SA8775P Proxy | TFLITE | 919.003 ms | 63 - 100 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 887.749 ms | 60 - 63 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | SA8295P ADP | SA8295P | TFLITE | 1027.812 ms | 63 - 82 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
-| HuggingFace-WavLM-Base-Plus | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 1159.685 ms | 30 - 57 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
@@ -108,8 +109,8 @@ Profiling Results
 HuggingFace-WavLM-Base-Plus
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
-Estimated inference time (ms)   : 814.8
-Estimated peak memory usage (MB): [63, 98]
 Total # Ops                     : 871
 Compute Unit(s)                 : CPU (871 ops)
 ```
@@ -130,13 +131,29 @@ in memory using the `jit.trace` and then call the `submit_compile_job` API.
 import torch
 import qai_hub as hub
-from qai_hub_models.models.huggingface_wavlm_base_plus import
 # Load the model
 # Device
 device = hub.Device("Samsung Galaxy S23")
 ```

 | Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
+| HuggingFace-WavLM-Base-Plus | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 768.657 ms | 63 - 103 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 818.517 ms | 32 - 54 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 543.868 ms | 61 - 76 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 953.526 ms | 63 - 96 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | SA7255P ADP | SA7255P | TFLITE | 1567.307 ms | 63 - 83 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 924.443 ms | 44 - 46 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | SA8295P ADP | SA8295P | TFLITE | 985.456 ms | 63 - 81 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 726.672 ms | 63 - 66 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | SA8775P ADP | SA8775P | TFLITE | 1317.403 ms | 63 - 83 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
+| HuggingFace-WavLM-Base-Plus | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 1062.167 ms | 64 - 89 MB | FP32 | CPU | [HuggingFace-WavLM-Base-Plus.tflite](https://huggingface.co/qualcomm/HuggingFace-WavLM-Base-Plus/blob/main/HuggingFace-WavLM-Base-Plus.tflite) |
 HuggingFace-WavLM-Base-Plus
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
+Estimated inference time (ms)   : 768.7
+Estimated peak memory usage (MB): [63, 103]
 Total # Ops                     : 871
 Compute Unit(s)                 : CPU (871 ops)
 ```
 import torch
 import qai_hub as hub
+from qai_hub_models.models.huggingface_wavlm_base_plus import Model
 # Load the model
+torch_model = Model.from_pretrained()
 # Device
 device = hub.Device("Samsung Galaxy S23")
+# Trace model
+input_shape = torch_model.get_input_spec()
+sample_inputs = torch_model.sample_inputs()
+pt_model = torch.jit.trace(torch_model, [torch.tensor(data[0]) for _, data in sample_inputs.items()])
+# Compile model on a specific device
+compile_job = hub.submit_compile_job(
+    model=pt_model,
+    device=device,
+    input_specs=torch_model.get_input_spec(),
+)
+# Get target model to run on-device
+target_model = compile_job.get_target_model()
 ```