nicholasKluge
/

RewardModel

Text Classification

preference model

text-embeddings-inference

Model card Files Files and versions

nicholasKluge commited on Jun 11, 2023

Commit

8d0ac59

·

1 Parent(s): 1c00037

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -79,7 +79,7 @@ tokens = tokenizer(question, response1,
 tokens.to(device)
 # Score the response
-score = model(**tokens, alpha=10).item()
 print(f"Question: {question} \n")
 print(f"Response 1: {response1} Score: {score:.3f}")
@@ -91,7 +91,7 @@ tokens = tokenizer(question, response2,
 tokens.to(device)
-score = model(**tokens, alpha=10).item()
 print(f"Response 2: {response2} Score: {score:.3f}")
 ```

 tokens.to(device)
 # Score the response
+score = rewardModel(**tokens, alpha=10).item()
 print(f"Question: {question} \n")
 print(f"Response 1: {response1} Score: {score:.3f}")
 tokens.to(device)
+score = rewardModel(**tokens, alpha=10).item()
 print(f"Response 2: {response2} Score: {score:.3f}")
 ```