RegBotBeta3.1

Runtime error

Zwea Htet commited on Aug 6, 2023

Commit

069e494

1 Parent(s): 8013479

update llama custom

Files changed (1) hide show

models/llamaCustom.py CHANGED Viewed

@@ -38,10 +38,10 @@ CHUNK_OVERLAP_RATION = 0.2
 @st.cache_resource
-def load_model(mode_name: str):
     # llm_model_name = "bigscience/bloom-560m"
-    tokenizer = AutoTokenizer.from_pretrained(mode_name)
-    model = AutoModelForCausalLM.from_pretrained(mode_name, config="T5Config")
     pipe = pipeline(
         task="text-generation",
@@ -62,11 +62,11 @@ class CustomLLM(LLM):
     llm_model_name: str
     pipeline: Any
-    def __init__(self, model_name: str):
-        # super().__init__()
-        self.llm_model_name = model_name
-        self.pipeline = load_model(mode_name=model_name)
     def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
         prompt_length = len(prompt)

 @st.cache_resource
+def load_model(model_name: str):
     # llm_model_name = "bigscience/bloom-560m"
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForCausalLM.from_pretrained(model_name, config="T5Config")
     pipe = pipeline(
         task="text-generation",
     llm_model_name: str
     pipeline: Any
+    def __init__(self, llm_model_name: str):
+        super().__init__()
+        self.llm_model_name = llm_model_name
+        self.pipeline = load_model(mode_name=llm_model_name)
     def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
         prompt_length = len(prompt)