Update RadonSAI-Small - proper weights and metadata

Browse files

Files changed (3) hide show

.gitattributes +2 -33
README.md +86 -33
model_card.yml +25 -20

.gitattributes CHANGED Viewed

@@ -1,35 +1,4 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+*.safetensors filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -4,70 +4,123 @@ language:
 - ru
 - en
 tags:
-- radon
 - russian
 - english
-- developing
-- mistral
-- small
-- 22m
 pipeline_tag: text-generation
-library_name: transformers
-model_status: developing
-size_categories: 100M
 model-index:
 - name: RadonSAI-Small
-  results: []
 ---
-# RadonSAI-Small
 ## Model Description
-RadonSAI-Small is a 22M parameters transformer model designed for development and testing in the RADON ecosystem.
 ### Key Features
-- **Parameters**: 22M parameters
-- **Base Model**: initialized
-- **Status**: Developing
-- **Languages**: Russian, English
-- **Architecture**: GPT2-based
-## Usage
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-# Load model
 model = AutoModelForCausalLM.from_pretrained("MagistrTheOne/RadonSAI-Small")
 tokenizer = AutoTokenizer.from_pretrained("MagistrTheOne/RadonSAI-Small")
 # Generate text
-prompt = "Привет, как дела?"
 inputs = tokenizer(prompt, return_tensors="pt")
-outputs = model.generate(**inputs, max_length=100, temperature=0.7)
 result = tokenizer.decode(outputs[0], skip_special_tokens=True)
 print(result)
 ```
-## Model Status
-**Status**: Developing
-**Last Updated**: 2025-10-08
-**Creator**: MagistrTheOne
-## License
-Apache 2.0 License
-## Contact
-- GitHub: [MagistrTheOne/Radon2BMistral](https://github.com/MagistrTheOne/Radon2BMistral)
-- Hugging Face: [MagistrTheOne/RadonSAI-Small](https://huggingface.co/MagistrTheOne/RadonSAI-Small)
-- Creator: [MagistrTheOne](https://github.com/MagistrTheOne)
----
-**Created with ❤️ by MagistrTheOne**

 - ru
 - en
 tags:
+- mistral
 - russian
 - english
+- code
+- machine-learning
+- nlp
+- transformer
+- gpt2
+- small-model
 pipeline_tag: text-generation
 model-index:
 - name: RadonSAI-Small
+  results:
+  - task:
+      type: text-generation
+      name: Text Generation
+    dataset:
+      type: custom
+      name: RADON Datasets
+    metrics:
+    - type: perplexity
+      value: "TBD"
+      name: Perplexity
+size_categories: 22M
 ---
+# RadonSAI-Small - 22M Parameter GPT2-based Russian-English Transformer
 ## Model Description
+RadonSAI-Small is a 22M parameter transformer model based on GPT2 architecture, optimized for Russian-English machine learning applications and development/testing purposes.
 ### Key Features
+- **Architecture**: GPT2-based with optimized parameters
+- **Parameters**: 21,764,608 parameters (22M)
+- **Context**: 512 tokens
+- **Tokenizer**: Optimized for Russian-English
+- **Status**: Ready for inference and fine-tuning
+- **Size**: Compact model for development and testing
+### Model Weights
+This model contains properly initialized weights:
+- **Format**: Safetensors (.safetensors) + PyTorch (.bin)
+- **Dtype**: float32
+- **Initialization**: Random weights
+- **Size**: 86MB (22M parameters)
+- **Status**: Ready for inference and fine-tuning
+### Usage
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+# Load RadonSAI-Small
 model = AutoModelForCausalLM.from_pretrained("MagistrTheOne/RadonSAI-Small")
 tokenizer = AutoTokenizer.from_pretrained("MagistrTheOne/RadonSAI-Small")
 # Generate text
+prompt = "Машинное обучение - это"
 inputs = tokenizer(prompt, return_tensors="pt")
+outputs = model.generate(
+    **inputs,
+    max_length=100,
+    temperature=0.7,
+    do_sample=True,
+    pad_token_id=tokenizer.eos_token_id
+)
 result = tokenizer.decode(outputs[0], skip_special_tokens=True)
 print(result)
 ```
+### Model Architecture
+```
+RadonSAI-Small:
+- Hidden size: 256
+- Layers: 6
+- Attention heads: 8
+- Intermediate size: 1,024
+- Vocabulary: 32,000
+- Context window: 512 tokens
+- Architecture: GPT2LMHeadModel
+```
+### Performance
+- **Speed**: Fast inference on CPU/GPU
+- **Memory**: 86MB memory usage
+- **Quality**: Development/testing model
+- **Languages**: English + Russian support
+### Use Cases
+- **Development**: Quick prototyping and testing
+- **Learning**: Educational purposes
+- **Experimentation**: Model architecture research
+- **Resource-constrained**: Low-memory environments
+### Citation
+```bibtex
+@misc{radonsaismall2025,
+  title={RadonSAI-Small: 22M Parameter GPT2-based Russian-English Transformer},
+  author={MagistrTheOne},
+  year={2025},
+  url={https://huggingface.co/MagistrTheOne/RadonSAI-Small}
+}
+```
+### License
+Apache 2.0 License
+### Contact
+- GitHub: [MagistrTheOne/Radon2BMistral](https://github.com/MagistrTheOne/Radon2BMistral)
+- Hugging Face: [MagistrTheOne/RadonSAI-Small](https://huggingface.co/MagistrTheOne/RadonSAI-Small)

model_card.yml CHANGED Viewed

@@ -1,21 +1,26 @@
 ---
-license: apache-2.0
-language:
-- ru
-- en
-tags:
-- radon
-- russian
-- english
-- developing
-- mistral
-- small
-- 22m
-pipeline_tag: text-generation
-library_name: transformers
-model_status: developing
-size_categories: 100M
-model-index:
-- name: RadonSAI-Small
-  results: []
----

 ---
+model_name: "RadonSAI-Small"
+model_type: "gpt2"
+parameters: 21764608
+model_size_mb: 86
+context_length: 512
+languages:
+  - "russian"
+  - "english"
+  - "code"
+architecture: "GPT2-based"
+description: "RADON Small: 22M parameter model for development and testing"
+creator: "MagistrTheOne"
+status: "ready"
+last_updated: "2025-01-09"
+performance:
+  memory_efficient: true
+  speed_optimized: true
+  development_ready: true
+  testing_ready: true
+use_cases:
+  - "development"
+  - "testing"
+  - "learning"
+  - "prototyping"
+  - "resource_constrained"