Spaces:

Shoaib-33
/

News-Summarizer

Sleeping

App Files Files Community

News-Summarizer / preprocessor.py

Shoaib-33's picture

Upload 20 files

fbb3f82 verified about 2 years ago

history blame contribute delete

443 Bytes


	import spacy

	nlp = spacy.load('en_core_web_sm')
	def preprocesser(text_array):
	preprocessed_texts = []
	for text in text_array:
	doc = nlp(text)
	words_lst = []
	for token in doc:
	if not token.is_stop and not token.is_punct:
	words_lst.append(token.lemma_)
	preprocessed_text = " ".join(words_lst)
	preprocessed_texts.append(preprocessed_text)
	return preprocessed_texts