Spaces:

SantanuBanerjee
/

TaxDirection

Sleeping

SantanuBanerjee commited on Aug 4, 2024

Commit

50515cb

verified ·

1 Parent(s): cb90440

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -153,7 +153,18 @@ nltk.download('averaged_perceptron_tagger')
 #     return outputs.last_hidden_state.mean(dim=1).squeeze().numpy()
-def text_processing_for_domain(text):
     # Text Cleaning
     text = re.sub(r'[^\w\s]', '', text)

 #     return outputs.last_hidden_state.mean(dim=1).squeeze().numpy()
+from transformers import pipeline
+# Load a summarization model
+summarizer = pipeline("summarization")
+def text_processing_for_domain(unsummarized_text):
+    # Summarization
+    text = summarizer(unsummarized_text, max_length=70, min_length=30, do_sample=False)[0]['summary_text']
     # Text Cleaning
     text = re.sub(r'[^\w\s]', '', text)