naver
/

splade-code-8B

Feature Extraction

sentence-transformers

text-generation

text-embeddings-inference

Model card Files Files and versions

maxoul commited on Feb 24

Commit

ad75b95

·

verified ·

1 Parent(s): 6c95abb

Update splade.py

Files changed (1) hide show

splade.py +5 -5

splade.py CHANGED Viewed

@@ -22,10 +22,10 @@ class SpladeConfig(PretrainedConfig):
     def __init__(
         self,
-        model_name_or_path: str = "meta-llama/Llama-3.1-8B",
         attn_implementation: str = "flash_attention_2",
         bidirectional: bool = True,  # only for decoder models
-        padding_side: str = "right",
         **kwargs,
     ):
         super().__init__(**kwargs)
@@ -72,15 +72,15 @@ class Splade(PreTrainedModel):
     def from_pretrained(cls, model_name_or_path, *args, **kwargs):
         config = SpladeConfig.from_pretrained(model_name_or_path)
         model = cls(config)
-        # local_dir = snapshot_download(model_name_or_path)
-        # adapter_path = os.path.join(local_dir, "lora")
-        # model.model.load_adapter(adapter_path)
         model.model = PeftModel.from_pretrained(
             model.model,
             model_name_or_path,
             subfolder="lora",
             token=kwargs.get("token", None),
         )
         # model.model = PeftModel.from_pretrained(model.model, adapter_path)
         model.reverse_voc = {v: k for k, v in model.tokenizer.vocab.items()}
         return model

     def __init__(
         self,
+        model_name_or_path: str = "Qwen/Qwen3-8B",
         attn_implementation: str = "flash_attention_2",
         bidirectional: bool = True,  # only for decoder models
+        padding_side: str = "left",
         **kwargs,
     ):
         super().__init__(**kwargs)
     def from_pretrained(cls, model_name_or_path, *args, **kwargs):
         config = SpladeConfig.from_pretrained(model_name_or_path)
         model = cls(config)
         model.model = PeftModel.from_pretrained(
             model.model,
             model_name_or_path,
             subfolder="lora",
             token=kwargs.get("token", None),
         )
+        # local_dir = snapshot_download(model_name_or_path)
+        # adapter_path = os.path.join(local_dir, "lora")
+        # model.model.load_adapter(adapter_path)
         # model.model = PeftModel.from_pretrained(model.model, adapter_path)
         model.reverse_voc = {v: k for k, v in model.tokenizer.vocab.items()}
         return model