Fastapitest

Sleeping

hsuwill000 commited on Aug 29, 2025

Commit

79ba2c9

verified ·

1 Parent(s): 908f8e7

Update start.sh

Files changed (1) hide show

start.sh CHANGED Viewed

@@ -4,34 +4,35 @@
 export WORK="/home/user/app"
 cd "$WORK" || exit 1
-# 建立 Python 虛擬環境
 python3 -m venv venv
-# 啟動虛擬環境
 source venv/bin/activate
 echo "Unzip and download model..."
 unzip llama_cpp_avx512.zip > /dev/null 2>&1
 #wget -O model.gguf https://huggingface.co/Intel/gpt-oss-20b-gguf-q4ks-AutoRound/resolve/main/gpt-oss-20b-32x2.4B-Q4_K_S.gguf > /dev/null 2>&1
 wget -O model.gguf https://huggingface.co/unsloth/gpt-oss-20b-GGUF/resolve/main/gpt-oss-20b-Q4_K_M.gguf > /dev/null 2>&1
 echo "Start llama.cpp server..."
-./llama-server -m model.gguf \
-                --port 8000 \
-                --host 0.0.0.0 \
-                --threads 2 \
-                --ctx-size 4096 \
-                --mlock \
-                --jinja \
-                --temp 0.2 \
-                --top-p 0.85 &
-# 安裝 Python 套件到虛擬環境
-pip install --upgrade pip
-pip install gradio openai
 echo "Start app.py..."
 python app.py
-#python3 -m http.server 7860 --bind 0.0.0.0

 export WORK="/home/user/app"
 cd "$WORK" || exit 1
+# 建立 Python 虛擬環境 (可選)
 python3 -m venv venv
 source venv/bin/activate
+# 安裝 Python 套件
+pip install --upgrade pip
+pip install gradio openai
 echo "Unzip and download model..."
 unzip llama_cpp_avx512.zip > /dev/null 2>&1
 #wget -O model.gguf https://huggingface.co/Intel/gpt-oss-20b-gguf-q4ks-AutoRound/resolve/main/gpt-oss-20b-32x2.4B-Q4_K_S.gguf > /dev/null 2>&1
 wget -O model.gguf https://huggingface.co/unsloth/gpt-oss-20b-GGUF/resolve/main/gpt-oss-20b-Q4_K_M.gguf > /dev/null 2>&1
 echo "Start llama.cpp server..."
+nohup ./llama-server \
+    -m model.gguf \
+    --port 8000 \
+    --host 0.0.0.0 \
+    --threads 2 \
+    --ctx-size 4096 \
+    --mlock \
+    --jinja \
+    --temp 0.2 \
+    --top-p 0.85 \
+    -v \
+    > llama.log 2>&1 &
+# 持續監控 log，但不阻塞 python app.py
+tail -n 50 -f llama.log &
 echo "Start app.py..."
 python app.py