qualcomm
/

Allam-7B

@@ -11,10 +11,10 @@ pipeline_tag: text-generation
 ![](https://qaihub-public-assets.s3.us-west-2.amazonaws.com/qai-hub-models/models/allam_7b/web-assets/model_demo.png)
-# Allam-7B: Optimized for Mobile Deployment
-## Large Language Model supporting arabic and english
-Allam 7B is SDAIA's first generation edge model, optimized for performance on Snapdragon X Elite.
  More details on model performance across various devices, can be found [here](https://aihub.qualcomm.com/models/allam_7b).
@@ -35,7 +35,7 @@ Allam 7B is SDAIA's first generation edge model, optimized for performance on Sn
 | Model | Precision | Device | Chipset | Target Runtime | Response Rate (tokens per second) | Time To First Token (range, seconds)
 |---|---|---|---|---|---|
-| ALLaM-7B-Quantized | w4a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN_CONTEXT_BINARY | 9.5 | 0.23854499999999998 - 1.399168 | -- | -- |
 ## Deploy Allam 7B on Snapdragon X Elite NPU

 ![](https://qaihub-public-assets.s3.us-west-2.amazonaws.com/qai-hub-models/models/allam_7b/web-assets/model_demo.png)
+# ALLaM-7B: Optimized for Mobile Deployment
+## Large Language Model supporting Arabic and English
+ALLaM 7B is SDAIA's first generation edge model, optimized for performance on Snapdragon X Elite.
  More details on model performance across various devices, can be found [here](https://aihub.qualcomm.com/models/allam_7b).
 | Model | Precision | Device | Chipset | Target Runtime | Response Rate (tokens per second) | Time To First Token (range, seconds)
 |---|---|---|---|---|---|
+| ALLaM-7B | w4a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN_CONTEXT_BINARY | 9.5 | 0.23854499999999998 - 1.399168 | -- | -- |
 ## Deploy Allam 7B on Snapdragon X Elite NPU