Amir337/llm-course-hw2-reward-model

Files changed (3) hide show

README.md CHANGED Viewed

@@ -37,8 +37,8 @@ This model was trained with Reward.
 - TRL: 0.25.1
 - Transformers: 4.57.1
-- Pytorch: 2.8.0+cu126
-- Datasets: 4.0.0
 - Tokenizers: 0.22.1
 ## Citations

 - TRL: 0.25.1
 - Transformers: 4.57.1
+- Pytorch: 2.6.0+cu124
+- Datasets: 4.4.1
 - Tokenizers: 0.22.1
 ## Citations

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9a7dc93c33cfa251f04a3c4bca4afd51fd106ff3c4ffa887e3327526f9a6811b
 size 538092792

 version https://git-lfs.github.com/spec/v1
+oid sha256:82cd6448ce9dbbbadd4d103371661e2ec50bbe67a7b1c8b769a8f87116d8b12e
 size 538092792

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65be1512ce79df43577a3a9589a5a81730208466434882c55383dfeff3430cac
-size 6033

 version https://git-lfs.github.com/spec/v1
+oid sha256:bfc059f525bb527ee7bb6631603dfa0e20728494798f38d6eb1dbba71ad91b9f
+size 5624