Spaces:

K7Ploypailin
/

llm1

Running

App Files Files Community

K7Ploypailin commited on 7 days ago

Commit

e404781

1 Parent(s): 95eb984

Add application file

Browse files

Files changed (1) hide show

app.py +40 -32

app.py CHANGED Viewed

@@ -5,24 +5,25 @@ import onnxruntime as rt
 import os
 import spaces
 import torch
 from transformers import AutoImageProcessor
-from scipy.special import softmax
-import requests # <-- **NEW:** สำหรับการเรียก Hugging Face API
-# 1. การกำหนดค่าและโหลดโมเดล ONNX และ LLM
 # ----------------------------------------------------
 ONNX_MODEL_PATH = "model.onnx"
 CLASS_LABELS_FILE = "class_labels.txt"
-MODEL_ID = 'facebook/convnext-tiny-224' # ID โมเดลที่ใช้ในการฝึก
-# **LLM CONFIGURATION (NEW)**
-MODEL_NAME = "scb10x/typhoon2.5-qwen3-4b" # <--- ID โมเดล Typhoon 2.5
-# ดึง Hugging Face Token จาก Environment Variable (ต้องตั้งค่าใน Space Secrets)
 HF_TOKEN = os.getenv("HF_TOKEN")
 API_URL = f"https://api-inference.huggingface.co/models/{MODEL_NAME}"
-# โหลดชื่อคลาส (ตัวละครวันพีซ)
 try:
     with open(CLASS_LABELS_FILE, 'r', encoding='utf-8') as f:
         CHARACTER_LABELS = [line.strip() for line in f.readlines()]
@@ -30,45 +31,49 @@ except FileNotFoundError:
     CHARACTER_LABELS = ['Luffy', 'Zoro', 'Nami', 'Sanji', 'Chopper', 'Franky', 'Brook', 'Usopp', 'Jinbei', 'Robin', 'Ace', 'Law', 'Shanks', 'Kurohige', 'Mihawk', 'Rayleigh']
     print(f"⚠️ WARNING: {CLASS_LABELS_FILE} not found. Using default labels.")
-# โหลด ONNX Runtime Session
 try:
     sess = rt.InferenceSession(ONNX_MODEL_PATH)
     onnx_input_name = sess.get_inputs()[0].name
     onnx_output_name = sess.get_outputs()[0].name
     processor = AutoImageProcessor.from_pretrained(MODEL_ID)
     print("ONNX model and Image Processor loaded successfully.")
 except Exception as e:
-    print(f"Error loading ONNX model or Image Processor: {e}. ตรวจสอบไฟล์ model.onnx และชื่อไฟล์.")
     sess = None
-# 2. ฟังก์ชันเรียกใช้ Typhoon 2.5 API (แทนฟังก์ชันจำลองเดิม)
 # ----------------------------------------------------
 def query_typhoon_api(payload):
-    """ส่ง Prompt ไปยัง Hugging Face Inference API ของ Typhoon 2.5"""
     if not HF_TOKEN:
         return "Error: HF_TOKEN is not set in Hugging Face Space secrets."
     headers = {"Authorization": f"Bearer {HF_TOKEN}"}
     response = requests.post(API_URL, headers=headers, json=payload)
-    # ตรวจสอบ Response
     if response.status_code != 200:
         return f"Error {response.status_code}: API call failed. {response.text}"
-    # ดึงผลลัพธ์
     try:
-        # ผลลัพธ์จาก API จะอยู่ในรูปแบบ [ {'generated_text': '...'} ]
         result = response.json()[0]['generated_text']
-        # โมเดลอาจจะตอบกลับด้วย Prompt เดิม เราจึงลบส่วน Prompt ออก
         return result.split(payload['inputs'])[-1].strip()
     except Exception as e:
         return f"Error processing API response: {e}"
-# ฐานข้อมูลข้อมูลเสริมตัวละคร (ยังคงเก็บไว้เป็นความรู้พื้นฐาน)
 CHARACTER_INFO = {
-    # ... (ข้อมูลตัวละครยังคงเหมือนเดิม) ...
     "Ace": "โพโทกัส ดี เอส พี่ชายบุญธรรม���องลูฟี่ ผู้ใช้พลังผลปีศาจเมระ เมระ",
     "Luffy": "มังกี้ ดี ลูฟี่ กัปตันกลุ่มโจรสลัดหมวกฟาง ผู้ใฝ่ฝันจะเป็นราชาโจรสลัด",
     "Zoro": "โรโรโนอา โซโล นักดาบสามเล่มแห่งกลุ่มหมวกฟาง ผู้มีเป้าหมายเป็นนักดาบอันดับหนึ่งของโลก",
@@ -90,11 +95,11 @@ CHARACTER_INFO = {
 def generate_thai_response(character_name, confidence):
     """
-    ฟังก์ชัน LLM ที่ใช้ API จริง
     """
     info = CHARACTER_INFO.get(character_name, "ตัวละครวันพีซ")
-    # 1. สร้าง Prompt ที่ชัดเจนสำหรับ Typhoon 2.5
     prompt = (
         f"จากผลการวิเคราะห์ภาพ (ความมั่นใจ {confidence*100:.2f}%), ตัวละครที่ทำนายคือ '{character_name}'. "
         f"ตัวละครนี้คือ {info}. "
@@ -102,7 +107,7 @@ def generate_thai_response(character_name, confidence):
         f"และรวมข้อมูลทั้งหมดนี้เข้าด้วยกันในประโยคเดียวโดยใช้ Markdown bold สำหรับชื่อตัวละครและความมั่นใจ (XX.XX%)."
     )
-    # 2. เตรียม Payload สำหรับ API
     payload = {
         "inputs": prompt,
         "parameters": {
@@ -111,47 +116,50 @@ def generate_thai_response(character_name, confidence):
         }
     }
-    # 3. เรียก API และรับคำตอบ
     llm_response = query_typhoon_api(payload)
-    # 4. หาก API call สำเร็จ ให้คืนคำตอบ หากล้มเหลวให้คืน Error
     if llm_response.startswith("Error"):
-        return f"⚠️ LLM Error: {llm_response}"
-    # Typhoon 2.5 มักจะตอบกลับเป็นประโยคที่ถูกต้องตาม Prompt
     return llm_response
-# 3. ฟังก์ชันทำนายชื่อตัวละครด้วย ONNX (รองรับ ZeroGPU)
 @spaces.GPU
 def predict_one_piece_character(pil_image):
     if pil_image is None or sess is None:
         return "⚠️ โมเดลไม่พร้อมใช้งาน กรุณาตรวจสอบไฟล์ ONNX และการตั้งค่า"
     try:
-        # 3.1 เตรียม Input ด้วย Image Processor
         inputs = processor(images=pil_image, return_tensors="np")
         onnx_input = inputs['pixel_values'].astype(np.float32)
-        # 3.2 ทำนายผลด้วย ONNX Runtime
         onnx_predictions = sess.run([onnx_output_name], {onnx_input_name: onnx_input})
         logits = onnx_predictions[0].squeeze()
-        # 3.3 ประมวลผลผลลัพธ์ (Softmax และ Argmax)
         probabilities = softmax(logits)
         predicted_index = np.argmax(probabilities)
         predicted_character = CHARACTER_LABELS[predicted_index]
         confidence = probabilities[predicted_index].item()
-        # 3.4 การรวมผล: ใช้ LLM Logic สร้างข้อความตอบกลับ
         final_response = generate_thai_response(predicted_character, confidence)
         return final_response
     except Exception as e:
-        print(f"ERROR during prediction: {e}")
         return f"เกิดข้อผิดพลาดในการทำนาย: {e}"
-# 4. การสร้าง Gradio Interface
 interface = gr.Interface(
     fn=predict_one_piece_character,
     inputs=gr.Image(type="pil", label="อัปโหลดรูปภาพตัวละครวันพีซ"),

 import os
 import spaces
 import torch
+# Use AutoImageProcessor for robust image preprocessing (ConvNeXt/ViT)
 from transformers import AutoImageProcessor
+from scipy.special import softmax # Used for computing probabilities from model output
+import requests # Used for making HTTP API calls (Typhoon 2.5)
+# 1. ONNX MODEL AND LLM CONFIGURATION
 # ----------------------------------------------------
 ONNX_MODEL_PATH = "model.onnx"
 CLASS_LABELS_FILE = "class_labels.txt"
+MODEL_ID = 'facebook/convnext-tiny-224' # The base model ID used for training
+# **LLM CONFIGURATION (Actual API Call Setup)**
+MODEL_NAME = "scb10x/typhoon2.5-qwen3-4b" # Typhoon 2.5 Model ID
+# Fetch Hugging Face Token from Space Secrets
 HF_TOKEN = os.getenv("HF_TOKEN")
 API_URL = f"https://api-inference.huggingface.co/models/{MODEL_NAME}"
+# Load character classes from the file created during training
 try:
     with open(CLASS_LABELS_FILE, 'r', encoding='utf-8') as f:
         CHARACTER_LABELS = [line.strip() for line in f.readlines()]
     CHARACTER_LABELS = ['Luffy', 'Zoro', 'Nami', 'Sanji', 'Chopper', 'Franky', 'Brook', 'Usopp', 'Jinbei', 'Robin', 'Ace', 'Law', 'Shanks', 'Kurohige', 'Mihawk', 'Rayleigh']
     print(f"⚠️ WARNING: {CLASS_LABELS_FILE} not found. Using default labels.")
+# Load ONNX Runtime Session
 try:
+    print(f"Attempting to load ONNX model from: {ONNX_MODEL_PATH}") # <-- NEW DEBUG LINE
     sess = rt.InferenceSession(ONNX_MODEL_PATH)
     onnx_input_name = sess.get_inputs()[0].name
     onnx_output_name = sess.get_outputs()[0].name
+    # Load Image Processor (essential for correct image preparation)
     processor = AutoImageProcessor.from_pretrained(MODEL_ID)
     print("ONNX model and Image Processor loaded successfully.")
 except Exception as e:
+    # <--- NEW DEBUG BLOCK: พิมพ์ Error จริงออกมา
+    print(f"FATAL ERROR LOADING ONNX MODEL: {e}")
+    print("Please ensure model.onnx is tracked by Git LFS and is uploaded correctly.")
     sess = None
+# 2. LLM API FUNCTION (Replaces Placeholder)
 # ----------------------------------------------------
 def query_typhoon_api(payload):
+    """Sends prompt to the Hugging Face Inference API of Typhoon 2.5."""
     if not HF_TOKEN:
         return "Error: HF_TOKEN is not set in Hugging Face Space secrets."
     headers = {"Authorization": f"Bearer {HF_TOKEN}"}
     response = requests.post(API_URL, headers=headers, json=payload)
+    # Check for non-successful status codes (e.g., 401 Unauthorized, 503 Service Unavailable)
     if response.status_code != 200:
         return f"Error {response.status_code}: API call failed. {response.text}"
     try:
+        # Extract the generated text from the response structure
         result = response.json()[0]['generated_text']
+        # Remove the input prompt part from the output text
         return result.split(payload['inputs'])[-1].strip()
     except Exception as e:
         return f"Error processing API response: {e}"
+# 3. TYPHOON 2.5 LOGIC (Knowledge Base + Prompt Generation)
+# ---------------------------------------------------------
+# This dictionary serves as the LLM's knowledge base for the character's full name/role
 CHARACTER_INFO = {
     "Ace": "โพโทกัส ดี เอส พี่ชายบุญธรรม���องลูฟี่ ผู้ใช้พลังผลปีศาจเมระ เมระ",
     "Luffy": "มังกี้ ดี ลูฟี่ กัปตันกลุ่มโจรสลัดหมวกฟาง ผู้ใฝ่ฝันจะเป็นราชาโจรสลัด",
     "Zoro": "โรโรโนอา โซโล นักดาบสามเล่มแห่งกลุ่มหมวกฟาง ผู้มีเป้าหมายเป็นนักดาบอันดับหนึ่งของโลก",
 def generate_thai_response(character_name, confidence):
     """
+    Constructs a sophisticated prompt and queries the Typhoon 2.5 API.
     """
     info = CHARACTER_INFO.get(character_name, "ตัวละครวันพีซ")
+    # 1. Build a clear, instructional prompt for the LLM
     prompt = (
         f"จากผลการวิเคราะห์ภาพ (ความมั่นใจ {confidence*100:.2f}%), ตัวละครที่ทำนายคือ '{character_name}'. "
         f"ตัวละครนี้คือ {info}. "
         f"และรวมข้อมูลทั้งหมดนี้เข้าด้วยกันในประโยคเดียวโดยใช้ Markdown bold สำหรับชื่อตัวละครและความมั่นใจ (XX.XX%)."
     )
+    # 2. Prepare Payload
     payload = {
         "inputs": prompt,
         "parameters": {
         }
     }
+    # 3. Call the API and handle potential errors
     llm_response = query_typhoon_api(payload)
     if llm_response.startswith("Error"):
+        # Fallback to a static, simple response if API fails
+        thai_name = info.split(' ')[0]
+        return (f"⚠️ LLM API ไม่ตอบสนอง: ตัวละครคือ **{thai_name}** ({info}) "
+                f"[ความมั่นใจ: **{confidence*100:.2f}%**]")
     return llm_response
+# 4. ONNX INFERENCE FUNCTION
+# ----------------------------------------------------
 @spaces.GPU
 def predict_one_piece_character(pil_image):
     if pil_image is None or sess is None:
         return "⚠️ โมเดลไม่พร้อมใช้งาน กรุณาตรวจสอบไฟล์ ONNX และการตั้งค่า"
     try:
+        # 4.1 Preprocessing (ConvNeXt standard input)
         inputs = processor(images=pil_image, return_tensors="np")
         onnx_input = inputs['pixel_values'].astype(np.float32)
+        # 4.2 Run Inference
         onnx_predictions = sess.run([onnx_output_name], {onnx_input_name: onnx_input})
         logits = onnx_predictions[0].squeeze()
+        # 4.3 Post-processing (Softmax and Argmax)
         probabilities = softmax(logits)
         predicted_index = np.argmax(probabilities)
         predicted_character = CHARACTER_LABELS[predicted_index]
         confidence = probabilities[predicted_index].item()
+        # 4.4 LLM Integration
         final_response = generate_thai_response(predicted_character, confidence)
         return final_response
     except Exception as e:
+        print(f"RUNTIME ERROR: {e}")
         return f"เกิดข้อผิดพลาดในการทำนาย: {e}"
+# 5. GRADIO INTERFACE
+# ----------------------------------------------------
 interface = gr.Interface(
     fn=predict_one_piece_character,
     inputs=gr.Image(type="pil", label="อัปโหลดรูปภาพตัวละครวันพีซ"),