Spaces:

vector2000
/

test_finetunning

Paused

vector2000 commited on Aug 27, 2024

Commit

3fa0881

verified ·

1 Parent(s): 5f1f151

Update finetunning.py

Files changed (1) hide show

finetunning.py CHANGED Viewed

@@ -21,19 +21,18 @@ os.makedirs('./fine_tuned_model', exist_ok=True)
 os.chmod('./fine_tuned_model', 0o777)
 # Завантаження моделі та токенізатора
-model_name = "facebook/opt-350m"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 # Завантаження датасета (приклад з використанням датасета wiki_text)
 # dataset = load_dataset("wikitext", "wikitext-2-raw-v1", split="train")
 # Завантаження данних з локального тестового файлу
-with open("ilya_klimov_data.txt", "r", encoding="utf-8") as file:
-    text_data = file.read().strip()
-# Створення датасету
-dataset = Dataset.from_dict({"text": [text_data]})
 # Функція для токенізації данних
 def tokenize_function(examples):

 os.chmod('./fine_tuned_model', 0o777)
 # Завантаження моделі та токенізатора
+model_name = "meta-llama/Meta-Llama-3.1-8B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 # Завантаження датасета (приклад з використанням датасета wiki_text)
 # dataset = load_dataset("wikitext", "wikitext-2-raw-v1", split="train")
+dataset = load_dataset("Aniemore/resd")
 # Завантаження данних з локального тестового файлу
+# with open("ilya_klimov_data.txt", "r", encoding="utf-8") as file:
+#     text_data = file.read().strip()
+# dataset = Dataset.from_dict({"text": [text_data]})
 # Функція для токенізації данних
 def tokenize_function(examples):