Spaces:

AndaiMD
/

brainbench

Sleeping

App Files Files Community

AndaiMD commited on Jun 13, 2025

Commit

71681f4

1 Parent(s): fc5b9bc

brain gpt

Browse files

Files changed (1) hide show

app/model_loader.py +45 -44

app/model_loader.py CHANGED Viewed

@@ -3,42 +3,11 @@ import os
 from transformers import AutoModelForCausalLM, AutoTokenizer
 from peft import PeftModel
-# def load_model():
-#     hf_token = os.getenv("HF_TOKEN")
-#     if not hf_token:
-#         raise RuntimeError("HF_TOKEN not set.")
-#     # Use a user-writable cache directory (important for Docker non-root)
-#     HF_CACHE = os.path.expanduser("~/.cache/huggingface")
-#     os.makedirs(HF_CACHE, exist_ok=True)
-#     os.environ["TRANSFORMERS_CACHE"] = HF_CACHE
-#     os.environ["HF_HOME"] = HF_CACHE
-#     base_model = AutoModelForCausalLM.from_pretrained(
-#         "meta-llama/Llama-2-7b-chat-hf",
-#         use_auth_token=hf_token,
-#         cache_dir="/tmp/hf_cache",
-#         torch_dtype="auto",
-#         device_map="auto"
-#     )
-#     model = PeftModel.from_pretrained(
-#         base_model,
-#         "BrainGPT/BrainGPT-7B-v0.1",
-#         use_auth_token=hf_token,
-#         cache_dir="/tmp/hf_cache"
-#     )
-#     tokenizer = AutoTokenizer.from_pretrained(
-#         "meta-llama/Llama-2-7b-chat-hf",
-#         use_auth_token=hf_token,
-#         cache_dir="/tmp/hf_cache"
-#     )
-#     return model, tokenizer
-import os
-from transformers import AutoModelForCausalLM, AutoTokenizer
 def load_model():
     # Use a user-writable cache directory (important for Docker non-root)
     HF_CACHE = os.path.expanduser("~/.cache/huggingface")
     os.makedirs(HF_CACHE, exist_ok=True)
@@ -46,16 +15,48 @@ def load_model():
     os.environ["TRANSFORMERS_CACHE"] = HF_CACHE
     os.environ["HF_HOME"] = HF_CACHE
-    model_name = "gpt2"
     tokenizer = AutoTokenizer.from_pretrained(
-        model_name,
-        cache_dir=HF_CACHE
     )
-    model = AutoModelForCausalLM.from_pretrained(
-        model_name,
-        cache_dir=HF_CACHE
-    )
-    return model, tokenizer

 from transformers import AutoModelForCausalLM, AutoTokenizer
 from peft import PeftModel
 def load_model():
+    hf_token = os.getenv("HF_TOKEN")
+    if not hf_token:
+        raise RuntimeError("HF_TOKEN not set.")
     # Use a user-writable cache directory (important for Docker non-root)
     HF_CACHE = os.path.expanduser("~/.cache/huggingface")
     os.makedirs(HF_CACHE, exist_ok=True)
     os.environ["TRANSFORMERS_CACHE"] = HF_CACHE
     os.environ["HF_HOME"] = HF_CACHE
+    base_model = AutoModelForCausalLM.from_pretrained(
+        "meta-llama/Llama-2-7b-chat-hf",
+        use_auth_token=hf_token,
+        cache_dir="/tmp/hf_cache",
+        torch_dtype="auto",
+        device_map="auto"
+    )
+    model = PeftModel.from_pretrained(
+        base_model,
+        "BrainGPT/BrainGPT-7B-v0.1",
+        use_auth_token=hf_token,
+        cache_dir="/tmp/hf_cache"
+    )
     tokenizer = AutoTokenizer.from_pretrained(
+        "meta-llama/Llama-2-7b-chat-hf",
+        use_auth_token=hf_token,
+        cache_dir="/tmp/hf_cache"
     )
+    return model, tokenizer
+## GPT 2 Model
+# import os
+# from transformers import AutoModelForCausalLM, AutoTokenizer
+# def load_model():
+#     # Use a user-writable cache directory (important for Docker non-root)
+#     HF_CACHE = os.path.expanduser("~/.cache/huggingface")
+#     os.makedirs(HF_CACHE, exist_ok=True)
+#     os.environ["TRANSFORMERS_CACHE"] = HF_CACHE
+#     os.environ["HF_HOME"] = HF_CACHE
+#     model_name = "gpt2"
+#     tokenizer = AutoTokenizer.from_pretrained(
+#         model_name,
+#         cache_dir=HF_CACHE
+#     )
+#     model = AutoModelForCausalLM.from_pretrained(
+#         model_name,
+#         cache_dir=HF_CACHE
+#     )
+#     return model, tokenizer