Spaces:

atanu0491
/

postagger_beta

Running

App Files Files Community

atanu0491 commited on Jul 2, 2023

Commit

b428cbd

1 Parent(s): 5b7293b

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -15

app.py CHANGED Viewed

@@ -3,13 +3,13 @@ from annotated_text import annotated_text
 import warnings
 import pandas as pd
-from io import StringIO
 warnings.filterwarnings('ignore')
 import re, flair, random, time
 from bnlp import BasicTokenizer
 from flair.data import Corpus, Sentence
 from flair.datasets import ColumnCorpus
-#from flair.embeddings import TransformerWordEmbeddings
 from flair.models import SequenceTagger
 from flair.trainers import ModelTrainer
@@ -55,35 +55,40 @@ if choice == 'ফাইল আপলোড':
     if uploaded_files is not None:
         search_word_def = uploaded_files.name.split('.')[0].split(' ')[-1]
         dataframe = pd.read_excel(uploaded_files)
         # model = load_model('best-model-002.pt')
-        # st.write(dataframe)
         for index, row in dataframe.iterrows():
-            # st.write(index)
-            # st.write(row['Unnamed: 2'])
             if pd.notnull(row['Unnamed: 2']):
                 data = BasicTokenizer().tokenize(row['Unnamed: 2'])
                 sentence = Sentence(data)
                 model.predict(sentence)
-                # st.write(sentence)
                 search_w = []
                 my_list = []
                 for token in sentence:
-                    # st.write(token)
-                    # st.write(search_word_def)
                     if token.text == search_word_def:
-                        w = []
-                        # st.write('In loop')
-                        # st.write(token.text)
-                        w.append(token.text)
-                        w.append(token.tag)
-                        st.write(tuple(w))
-                        search_w.append("/".join(tuple(w)))
                     word = []
                     word.append(token.text)
                     word.append(token.tag)
                     my_list.append("/".join(tuple(word)))
                 st.write(" ".join(my_list))
                 st.write(" ".join(search_w))

 import warnings
 import pandas as pd
 warnings.filterwarnings('ignore')
 import re, flair, random, time
 from bnlp import BasicTokenizer
 from flair.data import Corpus, Sentence
 from flair.datasets import ColumnCorpus
 from flair.models import SequenceTagger
 from flair.trainers import ModelTrainer
     if uploaded_files is not None:
         search_word_def = uploaded_files.name.split('.')[0].split(' ')[-1]
         dataframe = pd.read_excel(uploaded_files)
+        search_word = = st.text_input('Any other word you want to search for', '')
         # model = load_model('best-model-002.pt')
         for index, row in dataframe.iterrows():
             if pd.notnull(row['Unnamed: 2']):
                 data = BasicTokenizer().tokenize(row['Unnamed: 2'])
                 sentence = Sentence(data)
                 model.predict(sentence)
+                search_w_d = []
                 search_w = []
                 my_list = []
                 for token in sentence:
+                    if search_word is not None:
+                        if token.text == search_word:
+                            w = []
+                            w.append(token.text)
+                            w.append(token.tag)
+                            search_w.append("/".join(tuple(w)))
                     if token.text == search_word_def:
+                        w_d = []
+                        w_d.append(token.text)
+                        w_d.append(token.tag)
+                        search_w_d.append("/".join(tuple(w_d)))
                     word = []
                     word.append(token.text)
                     word.append(token.tag)
                     my_list.append("/".join(tuple(word)))
                 st.write(" ".join(my_list))
+                st.write(" ".join(search_w_d))
                 st.write(" ".join(search_w))