berwart
/

Inteligent_ai

Text Generation

Model card Files Files and versions

Mxytyu commited on Jun 9, 2024

Commit

82a267c

·

verified ·

1 Parent(s): 2ec93d0

Update model.safetensors

Files changed (1) hide show

model.safetensors +15 -3

model.safetensors CHANGED Viewed

@@ -29,6 +29,10 @@ class HelloWorldModel(PreTrainedModel, GenerationMixin):
     def _update_model_kwargs_for_generation(self, outputs, model_kwargs, is_encoder_decoder=False):
         return model_kwargs
 tokenizer_config = {
     "do_lower_case": False,
     "model_max_length": 512,
@@ -38,7 +42,7 @@ tokenizer_config = {
     "unk_token": "<unk>",
     "bos_token": "<s>",
     "eos_token": "</s>",
-    "vocab_size": 1,  # Simplified vocabulary size
 }
 # Save tokenizer configuration
@@ -46,5 +50,13 @@ with open("tokenizer.json", "w") as f:
     import json
     json.dump(tokenizer_config, f)
-tokenizer = PreTrainedTokenizerFast(tokenizer_file="tokenizer.json")
-tokenizer.add_tokens(["Hello, world!"])

     def _update_model_kwargs_for_generation(self, outputs, model_kwargs, is_encoder_decoder=False):
         return model_kwargs
+# Define tokenizer
+tokenizer = PreTrainedTokenizerFast(tokenizer_file="tokenizer.json")
+tokenizer.add_tokens(["Hello, world!"])
 tokenizer_config = {
     "do_lower_case": False,
     "model_max_length": 512,
     "unk_token": "<unk>",
     "bos_token": "<s>",
     "eos_token": "</s>",
+    "vocab_size": 2,  # Simplified vocabulary size
 }
 # Save tokenizer configuration
     import json
     json.dump(tokenizer_config, f)
+# Initialize model
+config = HelloWorldConfig(vocab_size=2)  # Adjusted vocab size
+model = HelloWorldModel(config)
+# Create dummy state_dict for saving
+state_dict = model.state_dict()
+# Save model using safetensors format
+from safetensors.torch import save_file
+save_file(state_dict, "hello_world_model.safetensors")