STMicroelectronics
/

miniresnet

Audio Classification

Model card Files Files and versions

xet

Community

FBAGSTM commited on Aug 1, 2025

Commit

b78758c

verified ·

1 Parent(s): ca7b1fc

Update Readme ST Model Zoo

Browse files

Files changed (1) hide show

README.md +6 -12

README.md CHANGED Viewed

@@ -1,7 +1,3 @@
----
-license: apache-2.0
-pipeline_tag: audio-classification
----
 # Quantized miniresnet
 ## **Use case** : `AED`
@@ -56,17 +52,17 @@ It outputs embedding vectors of size 2048 for the 2 stacks version, and 3548 for
 ## Metrics
-* Measures are done with default STM32Cube.AI configuration with enabled input / output allocated option.
-* `tl` stands for "transfer learning", meaning that the model backbone weights were initialized from a pre-trained model, then only the last layer was unfrozen during the training.
 ### Reference MCU memory footprint based on ESC-10 dataset
 | Model             | Format | Resolution | Series  | Activation RAM (KiB) | Runtime RAM (KiB)| Weights Flash (KiB) | Code Flash (KiB) | Total RAM (KiB) | Total Flash (KiB)| STM32Cube.AI version  |
 |-------------------|--------|------------|---------|----------------|-------------|---------------|------------|-------------|-------------|-----------------------|
-| [MiniResNet 1stack ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_1stacks_64x50_tl/miniresnet_1stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A    | 59.89 | 5.38               |   123.6       |   56.9            | 65.27 | 180.5 | 10.0.0                 |
-| [MiniResNet 2stacks ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_2stacks_64x50_tl/miniresnet_2stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A    | 59.89 |   8.37      |   431.1           |   63.69    | 68.26 | 494.9 | 10.0.0                |
 ### Reference inference time based on ESC-10 dataset
@@ -74,8 +70,8 @@ It outputs embedding vectors of size 2048 for the 2 stacks version, and 3548 for
 | Model             | Format | Resolution | Board            | Execution Engine | Frequency   | Inference time (ms) | STM32Cube.AI version  |
 |-------------------|--------|------------|------------------|------------------|-------------|-----------------|-----------------------|
-| [MiniResNet 1stacks ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_1stacks_64x50_tl/miniresnet_1stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A | 1 CPU | 160 MHz | 92.25 | 10.0.0                 |
-| [MiniResNet 2stacks ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_2stacks_64x50_tl/miniresnet_2stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A | 1 CPU | 160 MHz | 142.69 | 10.0.0               |
 ### Accuracy with ESC-10 dataset
@@ -95,5 +91,3 @@ The reason this metric is used instead of patch-level accuracy is because patch-
 Please refer to the stm32ai-modelzoo-services GitHub [here](https://github.com/STMicroelectronics/stm32ai-modelzoo-services)

 # Quantized miniresnet
 ## **Use case** : `AED`
 ## Metrics
+Measures are done with default STM32Cube.AI configuration with enabled input / output allocated option.
 ### Reference MCU memory footprint based on ESC-10 dataset
 | Model             | Format | Resolution | Series  | Activation RAM (KiB) | Runtime RAM (KiB)| Weights Flash (KiB) | Code Flash (KiB) | Total RAM (KiB) | Total Flash (KiB)| STM32Cube.AI version  |
 |-------------------|--------|------------|---------|----------------|-------------|---------------|------------|-------------|-------------|-----------------------|
+| [MiniResNet 1stack ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_1stacks_64x50_tl/miniresnet_1stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A    | 59.89 | 5.38               |   123.6       |   55.89            | 65.27 | 179.49 | 10.2.0                 |
+| [MiniResNet 2stacks ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_2stacks_64x50_tl/miniresnet_2stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A    | 59.89 |   8.37      |   431.1           |   	62.68    | 68.26 | 493.78 | 10.2.0                |
 ### Reference inference time based on ESC-10 dataset
 | Model             | Format | Resolution | Board            | Execution Engine | Frequency   | Inference time (ms) | STM32Cube.AI version  |
 |-------------------|--------|------------|------------------|------------------|-------------|-----------------|-----------------------|
+| [MiniResNet 1stacks ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_1stacks_64x50_tl/miniresnet_1stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A | 1 CPU | 160 MHz | 91.47 | 10.2.0                 |
+| [MiniResNet 2stacks ](https://github.com/STMicroelectronics/stm32ai-modelzoo/tree/main/audio_event_detection/miniresnet/ST_pretrainedmodel_public_dataset/esc10/miniresnet_2stacks_64x50_tl/miniresnet_2stacks_64x50_tl_int8.tflite) | int8 | 64x50x1 | B-U585I-IOT02A | 1 CPU | 160 MHz | 141.86 | 10.2.0               |
 ### Accuracy with ESC-10 dataset
 Please refer to the stm32ai-modelzoo-services GitHub [here](https://github.com/STMicroelectronics/stm32ai-modelzoo-services)