Spaces:

rishabhsetiya
/

CAIAssignmentGradio

Sleeping

App Files Files Community

rishabhsetiya commited on Aug 24, 2025

Commit

eff248a

verified ·

1 Parent(s): f58dfef

Create fine_tuning.py

Browse files

Files changed (1) hide show

fine_tuning.py +194 -0

fine_tuning.py ADDED Viewed

	@@ -0,0 +1,194 @@

+import os
+import json
+import math
+import torch
+import pandas as pd
+import torch.nn as nn
+import torch.nn.functional as F
+from datasets import Dataset
+import transformers
+from transformers import AutoModelForCausalLM, DataCollatorForLanguageModeling, Trainer, TrainingArguments
+from peft import LoraConfig, get_peft_model
+# -----------------------------
+# ENVIRONMENT / CACHE
+# -----------------------------
+os.environ["TRANSFORMERS_CACHE"] = "/tmp/huggingface_cache"
+os.environ["HF_HOME"] = "/tmp/huggingface_cache"
+os.environ["HF_DATASETS_CACHE"] = "/tmp/huggingface_cache"
+os.environ["HF_METRICS_CACHE"] = "/tmp/huggingface_cache"
+os.environ["WANDB_MODE"] = "disabled"
+# -----------------------------
+# SETTINGS
+# -----------------------------
+device = "cuda" if torch.cuda.is_available() else "cpu"
+tokenizer = transformers.AutoTokenizer.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0")
+# -----------------------------
+# LoRA / MoE Modules
+# -----------------------------
+class LoraLinear(nn.Module):
+    def __init__(self, in_features, out_features, r=8, lora_alpha=16, lora_dropout=0.05, bias=False):
+        super().__init__()
+        self.in_features = in_features
+        self.out_features = out_features
+        self.r = r
+        self.scaling = lora_alpha / r if r > 0 else 1.0
+        self.weight = nn.Parameter(torch.empty(out_features, in_features), requires_grad=False)
+        self.bias = nn.Parameter(torch.zeros(out_features), requires_grad=False) if bias else None
+        if r > 0:
+            self.lora_A = nn.Parameter(torch.zeros((r, in_features)))
+            self.lora_B = nn.Parameter(torch.zeros((out_features, r)))
+            nn.init.kaiming_uniform_(self.lora_A, a=math.sqrt(5))
+            nn.init.zeros_(self.lora_B)
+            self.lora_dropout = nn.Dropout(p=lora_dropout)
+        else:
+            self.lora_A, self.lora_B, self.lora_dropout = None, None, None
+    def forward(self, x):
+        result = F.linear(x, self.weight, self.bias)
+        if self.r > 0:
+            lora_out = self.lora_dropout(x) @ self.lora_A.T @ self.lora_B.T
+            result = result + self.scaling * lora_out
+        return result
+class MoELoRALinear(nn.Module):
+    def __init__(self, base_linear, r, num_experts=2, k=1, lora_alpha=16, lora_dropout=0.05):
+        super().__init__()
+        self.base_linear = base_linear
+        self.num_experts = num_experts
+        self.k = k
+        self.experts = nn.ModuleList([
+            LoraLinear(base_linear.in_features, base_linear.out_features, r=r, lora_alpha=lora_alpha, lora_dropout=lora_dropout)
+            for _ in range(num_experts)
+        ])
+        self.gate = nn.Linear(base_linear.in_features, num_experts)
+    def forward(self, x):
+        base_out = self.base_linear(x)
+        gate_scores = torch.softmax(self.gate(x), dim=-1)
+        expert_out = 0
+        for i, expert in enumerate(self.experts):
+            expert_out += gate_scores[..., i:i+1] * expert(x)
+        return base_out + expert_out
+def replace_proj_with_moe_lora(model, r=8, num_experts=2, k=1, lora_alpha=16, lora_dropout=0.05):
+    for layer in model.model.layers:
+        for proj_name in ["up_proj", "down_proj"]:
+            old = getattr(layer.mlp, proj_name)
+            moe = MoELoRALinear(
+                base_linear=old,
+                r=r,
+                num_experts=num_experts,
+                k=k,
+                lora_alpha=lora_alpha,
+                lora_dropout=lora_dropout,
+            ).to(next(old.parameters()).device)
+            setattr(layer.mlp, proj_name, moe)
+    return model
+# -----------------------------
+# DATA PREPROCESSING
+# -----------------------------
+def preprocess(example):
+    tokens = tokenizer(example['text'], truncation=True, padding=False)
+    text = example['text']
+    assistant_index = text.find("<|assistant|>")
+    prefix_ids = tokenizer(text[:assistant_index], add_special_tokens=False)['input_ids']
+    prefix_len = len(prefix_ids)
+    labels = tokens['input_ids'].copy()
+    labels[:prefix_len] = [-100] * prefix_len
+    tokens['labels'] = labels
+    return tokens
+# -----------------------------
+# LOAD & TRAIN MODEL
+# -----------------------------
+def load_and_train(model_id="TinyLlama/TinyLlama-1.1B-Chat-v1.0"):
+    current_dir = os.path.dirname(os.path.abspath(__file__))
+    json_file_path = os.path.join(current_dir, 'makemytrip_qa_full.json')
+    with open(json_file_path, 'r', encoding='utf-8') as f:
+        data = json.load(f)
+    df = pd.DataFrame(data)
+    print(f"Loaded dataset containing {len(df)} questions")
+    system_prompt = "You are a helpful assistant that provides financial data from MakeMyTrip reports."
+    training_data = [
+        {"text": f"<|system|>\n{system_prompt}</s>\n<|user|>\n{row['question']}</s>\n<|assistant|>\n{row['answer']}</s>"}
+        for _, row in df.iterrows()
+    ]
+    dataset = Dataset.from_list(training_data)
+    tokenized_dataset = dataset.map(preprocess, remove_columns=["text"])
+    base_model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True).to(device)
+    model = replace_proj_with_moe_lora(base_model)
+    peft_config = LoraConfig(r=8, lora_alpha=16, lora_dropout=0.05, target_modules=["o_proj"], bias="none", task_type="CAUSAL_LM")
+    model = get_peft_model(model, peft_config)
+    model.config.use_cache = False
+    model.gradient_checkpointing_disable()
+    data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
+    training_args = TrainingArguments(
+        learning_rate=5e-5,
+        output_dir="./results",
+        num_train_epochs=2,
+        per_device_train_batch_size=1,
+        gradient_accumulation_steps=4,
+        logging_steps=1,
+        save_steps=10,
+        save_total_limit=2,
+        fp16=True,
+        bf16=False,
+    )
+    trainer = Trainer(
+        model=model,
+        args=training_args,
+        train_dataset=tokenized_dataset,
+        data_collator=data_collator
+    )
+    print("Training started")
+    trainer.train()
+    model.eval()
+    return model, tokenizer, device
+# -----------------------------
+# GENERATE ANSWER
+# -----------------------------
+def generate_answer(model, tokenizer, device, prompt, max_tokens=200):
+    if prompt.strip() == "":
+        return "Please enter a prompt!"
+    system_prompt = "You are a helpful assistant that provides financial data from MakeMyTrip reports."
+    messages = [{"role": "system", "content": system_prompt}, {"role": "user", "content": prompt}]
+    input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+    inputs = tokenizer(input_text, return_tensors="pt").to(device)
+    with torch.no_grad():
+        outputs = model.generate(
+            **inputs,
+            max_new_tokens=max_tokens,
+            do_sample=True,
+            top_p=0.9,
+            temperature=0.7,
+        )
+    decoded_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    answer_start_token = '<|assistant|>'
+    answer_start_index = decoded_output.rfind(answer_start_token)
+    if answer_start_index != -1:
+        generated_answer = decoded_output[answer_start_index + len(answer_start_token):].strip()
+        if generated_answer.endswith('</s>'):
+            generated_answer = generated_answer[:-len('</s>')].strip()
+    else:
+        generated_answer = "Could not extract answer from model output."
+    return generated_answer