dmitry315
/

ELlama1-0.7b

Text Generation

Model card Files Files and versions

dmitry315 commited on Nov 4

Commit

7a040ed

·

verified ·

1 Parent(s): 0f64af7

Update README.md

Files changed (1) hide show

README.md +60 -3

README.md CHANGED Viewed

@@ -1,3 +1,60 @@
----
-license: mit
----

+---
+license: mit
+datasets:
+- dmitry315/fineweb2-modern-greece-sample
+language:
+- el
+pipeline_tag: text-generation
+---
+# ELlama1
+Серия LLM обученных на греческом языке
+# ELlama1-0.7b
+Модель в основе которой лежит Qwen (да-да не удивляейтесь).
+ELlama1-0.7b - pretrain модель, обученная на семпле из fineweb2: [fineweb2-modern-greece-sample](https://huggingface.co/datasets/dmitry315/fineweb2-modern-greece-sample).
+# Quick Start
+## Hugging face
+```
+import torch
+from transformers import AutoModelForCausalLM, PreTrainedTokenizerFast
+model_path = "dmitry315/ELlama1-0.7b"
+model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, trust_remote_code=True)
+tokenizer = PreTrainedTokenizerFast.from_pretrained(model_path, trust_remote_code=True)
+text = "Γεια σας , δεν ξερω τιποτα για τον Ηροδοτο , μπορειτε να μου πειτε γι ' αυτον ;"
+with torch.no_grad():
+    inputs = tokenizer(
+        text,
+        return_tensors="pt",
+        padding=True,
+        truncation=True,
+        max_length=128
+    ).to(device)
+    outputs = model.generate(
+        inputs.input_ids,
+        max_length=128,
+        temperature=args.temperature,
+        top_p=args.top_p,
+        do_sample=True,
+        pad_token_id=tokenizer.eos_token_id,
+        num_return_sequences=1
+    )
+    generated_text = tokenizer.decode(
+        outputs[0],
+        skip_special_tokens=True
+    )
+print(generated_text)
+```
+# Github
+Код обучения: [ELlama](https://github.com/Dmitry315/ELlama)