Spaces:

userdotcs
/

Dizgec-Text-Corrector

Paused

App Files Files Community

userdotcs commited on Dec 17, 2025

Commit

b4d2667

verified ·

1 Parent(s): 0d77d33

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -15

app.py CHANGED Viewed

@@ -1,36 +1,52 @@
-import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import torch
 import spaces
 MODEL_ID = "userdotcs/gpt-oss-20b-turkish-correction-finetuned"
-BASE_MODEL = "unsloth/gpt-oss-20b"   # veya base repo adı neyse
-tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
-    torch_dtype=torch.float16,
-    trust_remote_code=True
 )
 @spaces.GPU
 def generate(prompt):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    out = model.generate(
-        **inputs,
-        max_new_tokens=256,
-        pad_token_id=tokenizer.eos_token_id
-    )
-    text = tokenizer.decode(out[0], skip_special_tokens=True)
-    return text
 demo = gr.Interface(
     fn=generate,
-    inputs=gr.Textbox(lines=4, placeholder="Bir metin gir…"),
     outputs="text",
-    title="Turkish Correction GPT-OSS-20B"
 )
 demo.launch()

 import torch
+import gradio as gr
 import spaces
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 MODEL_ID = "userdotcs/gpt-oss-20b-turkish-correction-finetuned"
+# 1. Kuantizasyon ayarlarını config'den manuel çekiyoruz (Bellek yetmesi için şart)
+bnb_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_use_double_quant=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_compute_dtype=torch.float16
+)
+# 2. Tokenizer'ı yükle
+tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True)
+# 3. Modeli yükle (Özel mimari olduğu için trust_remote_code kritik)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
+    quantization_config=bnb_config,
     device_map="auto",
+    trust_remote_code=True, # Custom 'GptOssForCausalLM' mimarisi için zorunlu
+    torch_dtype=torch.float16
 )
 @spaces.GPU
 def generate(prompt):
+    # Prompt formatını modelin eğitimine uygun hale getirmek gerekebilir
+    # Örn: "Düzeltme: {prompt}" gibi
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    with torch.no_grad():
+        out = model.generate(
+            **inputs,
+            max_new_tokens=1024,
+            pad_token_id=tokenizer.eos_token_id
+        )
+    # Sadece yeni üretilen metni al (input'u kes)
+    output_text = tokenizer.decode(out[0][inputs.input_ids.shape[-1]:], skip_special_tokens=True)
+    return output_text
 demo = gr.Interface(
     fn=generate,
+    inputs=gr.Textbox(lines=4, placeholder="Düzeltilecek metni girin..."),
     outputs="text",
+    title="Turkish Correction with GPT-OSS-20B"
 )
 demo.launch()