Spaces:

Nemil
/

ImageCaptionGenerator

Runtime error

App Files Files Community

Nemil commited on Apr 18, 2024

Commit

6270cb3

verified ·

1 Parent(s): 6a961b1

Upload 2 files

Browse files

Files changed (2) hide show

app.py +40 -46
requirements.txt +6 -6

app.py CHANGED Viewed

@@ -138,58 +138,52 @@ class Social_Media_Captioner:
     def _load_model(self):
-        try:
-            self.bnb_config = BitsAndBytesConfig(
-                load_in_4bit = True,
-                bnb_4bit_use_double_quant = True,
-                bnb_4bit_quant_type= "nf4",
-                bnb_4bit_compute_dtype=torch.bfloat16,
-                )
             self.model = AutoModelForCausalLM.from_pretrained(
-                self.MODEL_NAME,
-                device_map = "auto",
-                trust_remote_code = True,
-                quantization_config = self.bnb_config
                 )
             # Defining the tokenizers
-            self.tokenizer = AutoTokenizer.from_pretrained(self.MODEL_NAME)
             self.tokenizer.pad_token = self.tokenizer.eos_token
-            if self.use_finetuned:
-                # LORA Config Model
-                self.lora_config = LoraConfig(
-                    r=16,
-                    lora_alpha=32,
-                    target_modules=["query_key_value"],
-                    lora_dropout=0.05,
-                    bias="none",
-                    task_type="CAUSAL_LM"
-                )
-                self.model = get_peft_model(self.model, self.lora_config)
-                # Fitting the adapters
-                self.peft_config = PeftConfig.from_pretrained(self.peft_model_name)
-                self.model = AutoModelForCausalLM.from_pretrained(
-                    self.peft_config.base_model_name_or_path,
-                    return_dict = True,
-                    quantization_config = self.bnb_config,
-                    device_map= "auto",
-                    trust_remote_code = True
-                    )
-                self.model = PeftModel.from_pretrained(self.model, self.peft_model_name)
-                # Defining the tokenizers
-                self.tokenizer = AutoTokenizer.from_pretrained(self.peft_config.base_model_name_or_path)
-                self.tokenizer.pad_token = self.tokenizer.eos_token
-            self.model_loaded = True
-            print("Model Loaded successfully")
-        except Exception as e:
-            print(e)
-            self.model_loaded = False
     def inference(self, input_text: str, use_cached=True, cache_generation=True) -> str | None:
         if not self.model_loaded:

     def _load_model(self):
+        self.bnb_config = BitsAndBytesConfig(
+            load_in_4bit = True,
+            bnb_4bit_use_double_quant = True,
+            bnb_4bit_quant_type= "nf4",
+            bnb_4bit_compute_dtype=torch.bfloat16,
+            )
+        self.model = AutoModelForCausalLM.from_pretrained(
+            self.MODEL_NAME,
+            device_map = "auto",
+            trust_remote_code = True,
+            quantization_config = self.bnb_config
+            )
+        # Defining the tokenizers
+        self.tokenizer = AutoTokenizer.from_pretrained(self.MODEL_NAME)
+        self.tokenizer.pad_token = self.tokenizer.eos_token
+        if self.use_finetuned:
+            # LORA Config Model
+            self.lora_config = LoraConfig(
+                r=16,
+                lora_alpha=32,
+                target_modules=["query_key_value"],
+                lora_dropout=0.05,
+                bias="none",
+                task_type="CAUSAL_LM"
+            )
+            self.model = get_peft_model(self.model, self.lora_config)
+            # Fitting the adapters
+            self.peft_config = PeftConfig.from_pretrained(self.peft_model_name)
             self.model = AutoModelForCausalLM.from_pretrained(
+                self.peft_config.base_model_name_or_path,
+                return_dict = True,
+                quantization_config = self.bnb_config,
+                device_map= "auto",
+                trust_remote_code = True
                 )
+            self.model = PeftModel.from_pretrained(self.model, self.peft_model_name)
             # Defining the tokenizers
+            self.tokenizer = AutoTokenizer.from_pretrained(self.peft_config.base_model_name_or_path)
             self.tokenizer.pad_token = self.tokenizer.eos_token
+        self.model_loaded = True
+        print("Model Loaded successfully")
     def inference(self, input_text: str, use_cached=True, cache_generation=True) -> str | None:
         if not self.model_loaded:

requirements.txt CHANGED Viewed

@@ -1,11 +1,11 @@
 evaluate
 jiwer
-huggingface_hub==0.20.0
-gradio
-bitsandbytes
-transformers @ git+https://github.com/huggingface/transformers.git
-peft @ git+https://github.com/huggingface/peft.git
-accelerate @ git+https://github.com/huggingface/accelerate.git
 einops
 safetensors
 torch

 evaluate
 jiwer
+huggingface_hub==0.16.4
+gradio==3.36.0
+bitsandbytes==0.41.0
+transformers==4.31.0
+peft==0.4.0
+accelerate==0.21.0
 einops
 safetensors
 torch