iproskurina
/

test

Text Generation

Generated from Trainer

Eval Results (legacy)

text-generation-inference

Model card Files Files and versions

iproskurina commited on Nov 19, 2025

Commit

90f58ec

·

verified ·

1 Parent(s): 37d8e0d

End of training

Files changed (3) hide show

config.json +2 -3
generation_config.json +1 -1
model.safetensors +1 -1

config.json CHANGED Viewed

@@ -20,17 +20,16 @@
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
-  "rope_parameters": {
     "factor": 32.0,
     "high_freq_factor": 4.0,
     "low_freq_factor": 1.0,
     "original_max_position_embeddings": 8192,
-    "rope_theta": 500000.0,
     "rope_type": "llama3"
   },
   "rope_theta": 500000.0,
   "tie_word_embeddings": true,
-  "transformers_version": "5.0.0.dev0",
   "use_cache": true,
   "vocab_size": 128256
 }

   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
+  "rope_scaling": {
     "factor": 32.0,
     "high_freq_factor": 4.0,
     "low_freq_factor": 1.0,
     "original_max_position_embeddings": 8192,
     "rope_type": "llama3"
   },
   "rope_theta": 500000.0,
   "tie_word_embeddings": true,
+  "transformers_version": "4.57.1",
   "use_cache": true,
   "vocab_size": 128256
 }

generation_config.json CHANGED Viewed

@@ -5,5 +5,5 @@
   "eos_token_id": 128001,
   "temperature": 0.6,
   "top_p": 0.9,
-  "transformers_version": "5.0.0.dev0"
 }

   "eos_token_id": 128001,
   "temperature": 0.6,
   "top_p": 0.9,
+  "transformers_version": "4.57.1"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df5d95f3dc5264321550b65f9fa9a7f791c4a71b0165f6729508b37986af1f76
 size 4943274328

 version https://git-lfs.github.com/spec/v1
+oid sha256:0418036d8baaf75567b7d4f31a4172e1acca7f30f223c273871359577a5f9cab
 size 4943274328