Spaces:

edithram23
/

model

Sleeping

edithram23 commited on Jun 23, 2024

Commit

2e30d38

verified ·

1 Parent(s): 90c1233

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -4,15 +4,15 @@ os.environ["HF_HOME"] = "/.cache"
 import re
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-model_dir = 'edithram23/Redaction'
 tokenizer = AutoTokenizer.from_pretrained(model_dir)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_dir)
 def mask_generation(text):
     import re
     inputs = ["Mask Generation: " + text]
-    inputs = tokenizer(inputs, max_length=128, truncation=True, return_tensors="pt")
-    output = model.generate(**inputs, num_beams=8, do_sample=True, max_length=len(i))
     decoded_output = tokenizer.batch_decode(output, skip_special_tokens=True)[0]
     predicted_title = decoded_output.strip()
     pattern = r'\[.*?\]'

 import re
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+model_dir = 'edithram23/Redaction_Personal_info_v1'
 tokenizer = AutoTokenizer.from_pretrained(model_dir)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_dir)
 def mask_generation(text):
     import re
     inputs = ["Mask Generation: " + text]
+    inputs = tokenizer(inputs, max_length=512, truncation=True, return_tensors="pt")
+    output = model.generate(**inputs, num_beams=8, do_sample=True, max_length=512)
     decoded_output = tokenizer.batch_decode(output, skip_special_tokens=True)[0]
     predicted_title = decoded_output.strip()
     pattern = r'\[.*?\]'