haykgrigorian
/

v2mini-eval2

Text Generation

text-generation-inference

Model card Files Files and versions

haykgrigorian commited on 22 days ago

Commit

93b6729

·

verified ·

1 Parent(s): b3e44dc

Update README.md

Files changed (1) hide show

README.md +6 -5

README.md CHANGED Viewed

@@ -1,13 +1,14 @@
 license: mit
 language:
 - en
 pipeline_tag: text-generation
-datasets:
-- haykgrigorian/TimeCapsuleLLM-London-1800-1875-v2-15GB
-library_name: transformers
 ---
-# haykgrigorian/v2mini-eval1: Llama-Architecture 318M Model
 ## Model Overview
@@ -16,7 +17,7 @@ library_name: transformers
 | Detail | Value |
 | :--- | :--- |
 | **Model Architecture** | LlamaForCausalLM (Decoder-Only Transformer) |
-| **Parameter Count** | **~215 Million (318M)** |
 | **Training Type** | Trained **from Scratch** (10,000 steps) |
 | **Tokenizer** | Custom BPE, Vocab Size 32,003 |
 | **Sequence Length** | 4096 tokens (4x increase from eval1) |

+---
 license: mit
+datasets:
+- haykgrigorian/TimeCapsuleLLM-London-1800-1875-v2-15GB
 language:
 - en
 pipeline_tag: text-generation
 ---
+# haykgrigorian/v2mini-eval1: Llama-Architecture 215M Model
 ## Model Overview
 | Detail | Value |
 | :--- | :--- |
 | **Model Architecture** | LlamaForCausalLM (Decoder-Only Transformer) |
+| **Parameter Count** | **~215 Million (214.8M)** |
 | **Training Type** | Trained **from Scratch** (10,000 steps) |
 | **Tokenizer** | Custom BPE, Vocab Size 32,003 |
 | **Sequence Length** | 4096 tokens (4x increase from eval1) |