Spaces:

whuang06
/

wordrank

Sleeping

App Files Files Community

whuang06 commited on Jan 21, 2024

Commit

bfbd92e

verified ·

1 Parent(s): d25e34a

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -3

app.py CHANGED Viewed

@@ -2,13 +2,15 @@ import requests
 import spacy
 import json
 import time
 import streamlit as st
 import pandas as pd
 import matplotlib.pyplot as plt
 headers = {'Accept': 'application/json'}
 languages = {"French": "30", "German": "31", "Spanish": "32"}
 try:
     nlp = spacy.load("en_core_web_sm")
 except:
@@ -20,13 +22,17 @@ except:
 # 32 - spanish
 def get_relevance(text, language, scaling=5):
-    link = f"https://books.google.com/ngrams/json?content={'+'.join(text.split(' '))}&year_start=2000&year_end=2019&corpus={languages[language]}&smoothing=0"
     r = requests.get(link, headers=headers)
     try:
         ngrams = r.json()[0]['timeseries']
         avg = sum(ngrams) / len(ngrams)
     except:
         avg = 0.0
     return avg * pow(10, scaling)
 def remove_punc(text):
@@ -88,13 +94,18 @@ common_words = {
 }
 excluded = st.text_input("Common words to exclude:", common_words[lang])
 excluded = excluded.replace(" ", "").lower().split(",")
 upper_bound = st.number_input('Upper bound N-gram score', 0.0, 1000.0, value=10.0)
 lower_bound = st.number_input('Lower bound N-gram score', 0.0, 1000.0, value=1e-19)
 langMP = {"French": "fr", "German": "de", "Spanish": "es"}
 if st.button("Calculate"):
     my_bar = st.progress(0, text="Calculating N-grams 0%")
@@ -102,7 +113,8 @@ if st.button("Calculate"):
     df = pd.DataFrame(output, columns=["Word", "N-Gram"])
-    fig, ax = plt.subplots()
     ax.spines['top'].set_visible(False)
     ax.spines['right'].set_visible(False)
     ax.spines['bottom'].set_visible(False)
@@ -112,6 +124,7 @@ if st.button("Calculate"):
     ax.set_ylabel("Words")
     st.subheader("Word Relevance")
     st.pyplot(fig)
     definitions = []

 import spacy
 import json
 import time
+import datetime
 import streamlit as st
 import pandas as pd
 import matplotlib.pyplot as plt
 headers = {'Accept': 'application/json'}
 languages = {"French": "30", "German": "31", "Spanish": "32"}
+if "memo" not in st.session_state:
+    st.session_state["memo"] = {}
 try:
     nlp = spacy.load("en_core_web_sm")
 except:
 # 32 - spanish
 def get_relevance(text, language, scaling=5):
+    if f"{text}_{language}_{scaling}" in st.session_state["memo"]:
+        return st.session_state["memo"][f"{text}_{language}_{scaling}"]
+    link = f"https://books.google.com/ngrams/json?content={'+'.join(text.split(' '))}&year_start=1990&year_end=2019&corpus={languages[language]}&smoothing=0"
     r = requests.get(link, headers=headers)
     try:
         ngrams = r.json()[0]['timeseries']
         avg = sum(ngrams) / len(ngrams)
     except:
         avg = 0.0
+    st.session_state["memo"][f"{text}_{language}_{scaling}"] = avg * pow(10, scaling)
     return avg * pow(10, scaling)
 def remove_punc(text):
 }
 excluded = st.text_input("Common words to exclude:", common_words[lang])
 excluded = excluded.replace(" ", "").lower().split(",")
 upper_bound = st.number_input('Upper bound N-gram score', 0.0, 1000.0, value=10.0)
 lower_bound = st.number_input('Lower bound N-gram score', 0.0, 1000.0, value=1e-19)
 langMP = {"French": "fr", "German": "de", "Spanish": "es"}
 if st.button("Calculate"):
     my_bar = st.progress(0, text="Calculating N-grams 0%")
     df = pd.DataFrame(output, columns=["Word", "N-Gram"])
+    fig, ax = plt.subplots(figsize=(5, int((len(set(df["Word"].tolist()))) ** 0.6)))
     ax.spines['top'].set_visible(False)
     ax.spines['right'].set_visible(False)
     ax.spines['bottom'].set_visible(False)
     ax.set_ylabel("Words")
     st.subheader("Word Relevance")
     st.pyplot(fig)
     definitions = []