Spaces:

m97j
/

PersonaChatEngine_hf-serve

Sleeping

App Files Files Community

m97j commited on Aug 31, 2025

Commit

79d952a

1 Parent(s): 8d29c2e

Update model_loading logig

Browse files

Files changed (2) hide show

config.py +1 -1
model_loader.py +22 -10

config.py CHANGED Viewed

@@ -7,7 +7,7 @@ load_dotenv()
 # 모델 경로 (환경변수 없으면 기본값 사용)
 BASE_MODEL = os.getenv("BASE_MODEL", "Qwen/Qwen2.5-3B-Instruct")
-ADAPTER_MODEL = os.getenv("ADAPTER_MODEL", "m97j/npc_LoRA-fps")
 # 장치 설정
 DEVICE = os.getenv("DEVICE", "cuda" if torch.cuda.is_available() else "cpu")

 # 모델 경로 (환경변수 없으면 기본값 사용)
 BASE_MODEL = os.getenv("BASE_MODEL", "Qwen/Qwen2.5-3B-Instruct")
+ADAPTERS = os.getenv("ADAPTER_MODEL", "m97j/npc_LoRA-fps")
 # 장치 설정
 DEVICE = os.getenv("DEVICE", "cuda" if torch.cuda.is_available() else "cpu")

model_loader.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os, json, torch
 import torch.nn as nn
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
-from config import BASE_MODEL, ADAPTER_MODEL, DEVICE, HF_TOKEN
 def get_current_branch():
     if os.path.exists("current_branch.txt"):
@@ -12,13 +12,14 @@ def get_current_branch():
 class ModelWrapper:
     def __init__(self):
         flags_path = os.path.join(os.path.dirname(__file__), "flags.json")
         self.flags_order = json.load(open(flags_path, encoding="utf-8"))["ALL_FLAGS"]
         self.num_flags = len(self.flags_order)
-        # 토큰 전달
         self.tokenizer = AutoTokenizer.from_pretrained(
-            ADAPTER_MODEL,
             use_fast=True,
             token=HF_TOKEN
         )
@@ -26,6 +27,7 @@ class ModelWrapper:
             self.tokenizer.pad_token = self.tokenizer.eos_token
         self.tokenizer.padding_side = "right"
         branch = get_current_branch()
         base = AutoModelForCausalLM.from_pretrained(
             BASE_MODEL,
@@ -33,25 +35,35 @@ class ModelWrapper:
             trust_remote_code=True,
             token=HF_TOKEN
         )
         self.model = PeftModel.from_pretrained(
             base,
-            ADAPTER_MODEL,
             revision=branch,
             device_map="auto",
             token=HF_TOKEN
         )
         hidden_size = self.model.config.hidden_size
         self.model.delta_head = nn.Linear(hidden_size, 2).to(DEVICE)
         self.model.flag_head = nn.Linear(hidden_size, self.num_flags).to(DEVICE)
         self.model.flag_threshold_head = nn.Linear(hidden_size, self.num_flags).to(DEVICE)
-        if os.path.exists("delta_head.pt"):
-            self.model.delta_head.load_state_dict(torch.load("delta_head.pt", map_location=DEVICE))
-        if os.path.exists("flag_head.pt"):
-            self.model.flag_head.load_state_dict(torch.load("flag_head.pt", map_location=DEVICE))
-        if os.path.exists("flag_threshold_head.pt"):
-            self.model.flag_threshold_head.load_state_dict(torch.load("flag_threshold_head.pt", map_location=DEVICE))
         self.model.eval()

 import torch.nn as nn
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
+from config import BASE_MODEL, ADAPTERS, DEVICE, HF_TOKEN
 def get_current_branch():
     if os.path.exists("current_branch.txt"):
 class ModelWrapper:
     def __init__(self):
+        # Flags 정보 로드
         flags_path = os.path.join(os.path.dirname(__file__), "flags.json")
         self.flags_order = json.load(open(flags_path, encoding="utf-8"))["ALL_FLAGS"]
         self.num_flags = len(self.flags_order)
+        # 토크나이저는 베이스 모델에서 로드
         self.tokenizer = AutoTokenizer.from_pretrained(
+            BASE_MODEL,
             use_fast=True,
             token=HF_TOKEN
         )
             self.tokenizer.pad_token = self.tokenizer.eos_token
         self.tokenizer.padding_side = "right"
+        # 베이스 모델 로드
         branch = get_current_branch()
         base = AutoModelForCausalLM.from_pretrained(
             BASE_MODEL,
             trust_remote_code=True,
             token=HF_TOKEN
         )
+        # LoRA 어댑터 적용
         self.model = PeftModel.from_pretrained(
             base,
+            ADAPTERS,
             revision=branch,
             device_map="auto",
             token=HF_TOKEN
         )
+        # 커스텀 헤드 추가
         hidden_size = self.model.config.hidden_size
         self.model.delta_head = nn.Linear(hidden_size, 2).to(DEVICE)
         self.model.flag_head = nn.Linear(hidden_size, self.num_flags).to(DEVICE)
         self.model.flag_threshold_head = nn.Linear(hidden_size, self.num_flags).to(DEVICE)
+        # .pt 파일이 없으면 그냥 넘어감
+        for head_name, file_name in [
+            ("delta_head", "delta_head.pt"),
+            ("flag_head", "flag_head.pt"),
+            ("flag_threshold_head", "flag_threshold_head.pt")
+        ]:
+            try:
+                if os.path.exists(file_name):
+                    getattr(self.model, head_name).load_state_dict(
+                        torch.load(file_name, map_location=DEVICE)
+                    )
+            except Exception as e:
+                print(f"[WARN] Failed to load {file_name}: {e}")
         self.model.eval()