Spaces:

larrysim
/

demo

Sleeping

larrysim commited on Aug 24, 2025

Commit

92d79f6

verified ·

1 Parent(s): aa160cc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,28 +1,44 @@
 import streamlit as st
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
 # Load model & tokenizer
 @st.cache_resource
-def load_model():
-    tokenizer = AutoTokenizer.from_pretrained(".")
-    model = AutoModelForCausalLM.from_pretrained(".")
-    return tokenizer, model
-tokenizer, model = load_model()
-st.title("📝 Next Word Prediction App")
-st.write("Type a sentence and let the model suggest the next word!")
-# User input
-text = st.text_input("Enter your sentence:", "")
-if st.button("Predict Next Word") and text:
-    inputs = tokenizer(text, return_tensors="pt")
-    with torch.no_grad():
-        outputs = model.generate(**inputs, max_new_tokens=1)
-    prediction = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Extract only the new part
-    predicted_next = prediction[len(text):].strip()
-    st.success(f"**Predicted next word:** {predicted_next}")

 import streamlit as st
+import tensorflow as tf
+import pickle
+import numpy as np
+# ----------------------
 # Load model & tokenizer
+# ----------------------
 @st.cache_resource
+def load_assets():
+    model = tf.keras.models.load_model("nextword_model.h5")  # your saved model
+    with open("tokenizer.pkl", "rb") as f:                   # your saved tokenizer
+        tokenizer = pickle.load(f)
+    return model, tokenizer
+model, tokenizer = load_assets()
+# ----------------------
+# Streamlit UI
+# ----------------------
+st.title("📝 LSTM Next Word Prediction")
+st.write("Type a sentence and let the LSTM suggest the next word!")
+# Input text
+text = st.text_input("Enter your sentence:")
+def predict_next_word(model, tokenizer, text, max_len=20):
+    """Predict next word from input text using trained LSTM model."""
+    seq = tokenizer.texts_to_sequences([text])[0]
+    seq = tf.keras.preprocessing.sequence.pad_sequences([seq], maxlen=max_len-1, padding='pre')
+    preds = model.predict(seq, verbose=0)[0]
+    next_index = np.argmax(preds)
+    for word, index in tokenizer.word_index.items():
+        if index == next_index:
+            return word
+    return None
+if st.button("Predict Next Word") and text:
+    predicted_word = predict_next_word(model, tokenizer, text)
+    if predicted_word:
+        st.success(f"**Predicted next word:** {predicted_word}")
+    else:
+        st.warning("Could not predict a word. Try another input.")