Tinytron
/

MLC-Tinytron

Model card Files Files and versions

MeowFET commited on Nov 25, 2024

Commit

9e8052d

·

verified ·

1 Parent(s): c858a47

Update build_mlc_android.sh

Files changed (1) hide show

build_mlc_android.sh +3 -3

build_mlc_android.sh CHANGED Viewed

@@ -20,7 +20,7 @@ MODEL_NAME="Qwen2-7B-Instruct-Tinytron-MLC"
 mlc_llm convert_weight --device cpu ${MODEL_PATH} --quantization ${QUANTIZATION} -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 生成配置
-mlc_llm gen_config ${MODEL_PATH}  --conv-template chatml --quantization ${QUANTIZATION} --context-window-size 512 --prefill-chunk-size=16 --max-batch-size=1 -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 切换模型
 MODEL_PATH="Phi-2-Tinytron-preview"
@@ -29,7 +29,7 @@ MODEL_NAME="Phi-2-Tinytron-preview-MLC"
 mlc_llm convert_weight --device cpu ${MODEL_PATH} --quantization ${QUANTIZATION} -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 生成配置
-mlc_llm gen_config ${MODEL_PATH}  --conv-template phi-2 --quantization ${QUANTIZATION} --context-window-size 512 --prefill-chunk-size=16 --max-batch-size=1 -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 MODEL_PATH="Cauchy-3B-preview"
 MODEL_NAME="Cauchy-3B-preview-MLC"
@@ -37,5 +37,5 @@ MODEL_NAME="Cauchy-3B-preview-MLC"
 mlc_llm convert_weight --model-type cauchy  --device cpu ${MODEL_PATH} --quantization ${QUANTIZATION} -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 生成配置
-mlc_llm gen_config ${MODEL_PATH} --model-type cauchy --conv-template chatml --quantization ${QUANTIZATION} --context-window-size 512 --prefill-chunk-size=16 --max-batch-size=1 -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/

 mlc_llm convert_weight --device cpu ${MODEL_PATH} --quantization ${QUANTIZATION} -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 生成配置
+mlc_llm gen_config ${MODEL_PATH}  --conv-template qwen2 --quantization ${QUANTIZATION} --context-window-size 512 --prefill-chunk-size=16 --max-batch-size=1 -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 切换模型
 MODEL_PATH="Phi-2-Tinytron-preview"
 mlc_llm convert_weight --device cpu ${MODEL_PATH} --quantization ${QUANTIZATION} -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 生成配置
+mlc_llm gen_config ${MODEL_PATH}  --conv-template qwen2 --quantization ${QUANTIZATION} --context-window-size 512 --prefill-chunk-size=16 --max-batch-size=1 -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 MODEL_PATH="Cauchy-3B-preview"
 MODEL_NAME="Cauchy-3B-preview-MLC"
 mlc_llm convert_weight --model-type cauchy  --device cpu ${MODEL_PATH} --quantization ${QUANTIZATION} -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/
 # 生成配置
+mlc_llm gen_config ${MODEL_PATH} --model-type cauchy --conv-template qwen2 --quantization ${QUANTIZATION} --context-window-size 512 --prefill-chunk-size=16 --max-batch-size=1 -o ${MODEL_OUTPUT_PATH}/${MODEL_NAME}/