Spaces:

TwinklData
/

Community_Collections_App

Sleeping

App Files Files Community

lynn-twinkl commited on May 16, 2025

Commit

7d6f84e

1 Parent(s): fca167e

Implemented heartfelt prediction model

Browse files

Files changed (1) hide show

app.py +17 -1

app.py CHANGED Viewed

@@ -5,7 +5,9 @@
 import streamlit as st
 import pandas as pd
 import altair as alt
 from io import BytesIO
 from streamlit_extras.metric_cards import style_metric_cards
 # ---- FUNCTIONS ----
@@ -15,6 +17,7 @@ from src.necessity_index import compute_necessity, index_scaler, qcut_labels
 from src.column_detection import detect_freeform_col
 from src.shortlist import shortlist_applications
 from src.twinkl_originals import find_book_candidates
 from typing import Tuple
 ##################################
@@ -26,6 +29,11 @@ from typing import Tuple
 # changes. The function only re‑runs if the **file contents** change.
 # -----------------------------------------------------------------------------
 @st.cache_data(show_spinner=True)
 def load_and_process(raw_csv: bytes) -> Tuple[pd.DataFrame, str]:
     """
@@ -51,10 +59,16 @@ def load_and_process(raw_csv: bytes) -> Tuple[pd.DataFrame, str]:
     # Find Twinkl Originals Candidates
     scored['book_candidates'] = find_book_candidates(scored, freeform_col)
     # Usage Extraction
     docs = df_orig[freeform_col].to_list()
-    scored['Usage'] = extract_usage(docs)
     return scored, freeform_col
@@ -88,6 +102,8 @@ if uploaded_file is not None:
     df, freeform_col = load_and_process(raw)
     ## ---- INTERACTIVE FILTERING & REVIEW INTERFACE ----
     with st.sidebar:

 import streamlit as st
 import pandas as pd
 import altair as alt
+import joblib
 from io import BytesIO
+import os
 from streamlit_extras.metric_cards import style_metric_cards
 # ---- FUNCTIONS ----
 from src.column_detection import detect_freeform_col
 from src.shortlist import shortlist_applications
 from src.twinkl_originals import find_book_candidates
+from src.preprocess_text import normalise_text
 from typing import Tuple
 ##################################
 # changes. The function only re‑runs if the **file contents** change.
 # -----------------------------------------------------------------------------
+@st.cache_resource
+def load_heartfelt_predictor():
+    model_path = os.path.join("src", "models", "heartfelt_pipeline.joblib")
+    return joblib.load(model_path)
 @st.cache_data(show_spinner=True)
 def load_and_process(raw_csv: bytes) -> Tuple[pd.DataFrame, str]:
     """
     # Find Twinkl Originals Candidates
     scored['book_candidates'] = find_book_candidates(scored, freeform_col)
+    # Label Heartfelt Applications
+    scored['clean_text'] = scored[freeform_col].map(normalise_text)
+    model = load_heartfelt_predictor()
+    scored['is_heartfelt'] = model.predict(scored['clean_text'].astype(str))
     # Usage Extraction
     docs = df_orig[freeform_col].to_list()
+    #scored['Usage'] = extract_usage(docs)
     return scored, freeform_col
     df, freeform_col = load_and_process(raw)
+    st.dataframe(df)
     ## ---- INTERACTIVE FILTERING & REVIEW INTERFACE ----
     with st.sidebar: