sdadas
/

polish-reranker-roberta-v2

sentence-transformers

text-classification

information-retrieval

text-embeddings-inference

Model card Files Files and versions

sdadas commited on Sep 20, 2024

Commit

53da7de

·

verified ·

1 Parent(s): b9bed78

Update README.md

Files changed (1) hide show

README.md +7 -3

README.md CHANGED Viewed

@@ -36,12 +36,16 @@ answers = [
 model_name = "sdadas/polish-reranker-roberta-v2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(
-    model_name, trust_remote_code=True, torch_dtype=torch.bfloat16, attn_implementation="flash_attention_2"
 )
 texts = [f"{query}</s></s>{answer}" for answer in answers]
-tokens = tokenizer(texts, padding="longest", max_length=512, truncation=True, return_tensors="pt")
 output = model(**tokens)
-results = output.logits.detach().numpy()
 results = np.squeeze(results)
 print(results.tolist())
 ```

 model_name = "sdadas/polish-reranker-roberta-v2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(
+    model_name,
+    trust_remote_code=True,
+    torch_dtype=torch.bfloat16,
+    attn_implementation="flash_attention_2",
+    device_map="cuda"
 )
 texts = [f"{query}</s></s>{answer}" for answer in answers]
+tokens = tokenizer(texts, padding="longest", max_length=512, truncation=True, return_tensors="pt").to("cuda")
 output = model(**tokens)
+results = output.logits.detach().cpu().float().numpy()
 results = np.squeeze(results)
 print(results.tolist())
 ```