Spaces:

hackergeek
/

Tuning

Sleeping

App Files Files Community

hackergeek commited on Mar 17

Commit

e784c2f

verified ·

1 Parent(s): 99cd08e

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -15

app.py CHANGED Viewed

@@ -4,15 +4,13 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments,
 from peft import get_peft_model, LoraConfig, TaskType
 from datasets import load_dataset
-# ✅ بررسی سخت‌افزار (CPU/GPU)
 device = "cuda" if torch.cuda.is_available() else "cpu"
-# ✅ تابع اجرای ترینینگ (قفل شده تا پایان)
 def train_model(dataset_url, model_url, epochs):
     try:
-        # 🚀 بارگیری مدل و توکنایزر
-        tokenizer = AutoTokenizer.from_pretrained(model_url)
-        model = AutoModelForCausalLM.from_pretrained(model_url).to(device)
         # ✅ تنظیم LoRA برای کاهش مصرف حافظه
         lora_config = LoraConfig(
@@ -41,15 +39,15 @@ def train_model(dataset_url, model_url, epochs):
             output_dir="./deepseek_lora_cpu",
             evaluation_strategy="epoch",
             learning_rate=5e-4,
-            per_device_train_batch_size=1,  # کاهش مصرف RAM
             per_device_eval_batch_size=1,
             num_train_epochs=int(epochs),
             save_strategy="epoch",
             save_total_limit=2,
             logging_dir="./logs",
             logging_steps=10,
-            fp16=False,  # عدم استفاده از FP16 روی CPU
-            gradient_checkpointing=True,  # ذخیره حافظه
             optim="adamw_torch",
             report_to="none"
         )
@@ -62,7 +60,7 @@ def train_model(dataset_url, model_url, epochs):
         # 🚀 شروع ترینینگ (قفل شده تا پایان)
         trainer.train()
-        trainer.save_model("./deepseek_lora_finetuned")  # ذخیره نهایی مدل
         tokenizer.save_pretrained("./deepseek_lora_finetuned")
         return "✅ ترینینگ کامل شد! مدل ذخیره شد."
@@ -70,7 +68,7 @@ def train_model(dataset_url, model_url, epochs):
     except Exception as e:
         return f"❌ خطا: {str(e)}"
-# ✅ Gradio UI با دکمه‌ی غیرفعال‌شونده
 with gr.Blocks() as app:
     gr.Markdown("# 🚀 AutoTrain DeepSeek R1 (CPU) - (بدون توقف تا پایان)")
@@ -81,13 +79,11 @@ with gr.Blocks() as app:
     train_button = gr.Button("شروع ترینینگ", interactive=True)
     output_text = gr.Textbox(label="وضعیت ترینینگ")
-    # 🚀 بعد از کلیک دکمه را غیرفعال کنیم تا کار متوقف نشود
     def disable_button(*args):
-        train_button.interactive = False  # غیرفعال کردن دکمه
         return train_model(*args)
     train_button.click(disable_button, inputs=[dataset_url, model_url, epochs], outputs=output_text)
-# ✅ اجرای Gradio در حالت قفل شده
-app.queue()  # این خط تضمین می‌کند که پردازش متوقف نشود
-app.launch(server_name="0.0.0.0", server_port=7860, share=True)  # ❌ `blocking=True` حذف شد

 from peft import get_peft_model, LoraConfig, TaskType
 from datasets import load_dataset
 device = "cuda" if torch.cuda.is_available() else "cpu"
 def train_model(dataset_url, model_url, epochs):
     try:
+        # 🚀 بارگیری مدل و توکنایزر با `trust_remote_code=True`
+        tokenizer = AutoTokenizer.from_pretrained(model_url, trust_remote_code=True)
+        model = AutoModelForCausalLM.from_pretrained(model_url, trust_remote_code=True).to(device)
         # ✅ تنظیم LoRA برای کاهش مصرف حافظه
         lora_config = LoraConfig(
             output_dir="./deepseek_lora_cpu",
             evaluation_strategy="epoch",
             learning_rate=5e-4,
+            per_device_train_batch_size=1,
             per_device_eval_batch_size=1,
             num_train_epochs=int(epochs),
             save_strategy="epoch",
             save_total_limit=2,
             logging_dir="./logs",
             logging_steps=10,
+            fp16=False,
+            gradient_checkpointing=True,
             optim="adamw_torch",
             report_to="none"
         )
         # 🚀 شروع ترینینگ (قفل شده تا پایان)
         trainer.train()
+        trainer.save_model("./deepseek_lora_finetuned")
         tokenizer.save_pretrained("./deepseek_lora_finetuned")
         return "✅ ترینینگ کامل شد! مدل ذخیره شد."
     except Exception as e:
         return f"❌ خطا: {str(e)}"
+# ✅ رابط کاربری Gradio
 with gr.Blocks() as app:
     gr.Markdown("# 🚀 AutoTrain DeepSeek R1 (CPU) - (بدون توقف تا پایان)")
     train_button = gr.Button("شروع ترینینگ", interactive=True)
     output_text = gr.Textbox(label="وضعیت ترینینگ")
     def disable_button(*args):
+        train_button.interactive = False
         return train_model(*args)
     train_button.click(disable_button, inputs=[dataset_url, model_url, epochs], outputs=output_text)
+app.queue()
+app.launch(server_name="0.0.0.0", server_port=7860, share=True)