Spaces:

deepthi6
/

clausewise_full_project

Runtime error

App Files Files Community

deepthi6 commited on Nov 5, 2025

Commit

55ae994

verified ·

1 Parent(s): 6edbcf8

Update app.py

Browse files

Files changed (1) hide show

app.py +84 -79

app.py CHANGED Viewed

@@ -19,19 +19,12 @@ from io import BytesIO
 import spacy
 # -----------------------------
-# STREAMLIT CONFIG
 # -----------------------------
 st.set_page_config(page_title="⚖️ ClauseWise", page_icon="⚖️", layout="wide")
-st.title("⚖️ ClauseWise: Multilingual Legal AI Assistant")
-st.markdown("""
-Simplify, translate, and analyze legal documents in **10+ languages**.
-ClauseWise helps you understand clauses, fairness, and contract structure — plus chat with an AI legal assistant.
----
-""")
 # -----------------------------
-# LANGUAGE SUPPORT
 # -----------------------------
 LANG_MAP = {
     "English": "en", "French": "fr", "Spanish": "es", "German": "de",
@@ -41,7 +34,7 @@ LANG_MAP = {
 LANG_NAMES = list(LANG_MAP.keys())
 # -----------------------------
-# LOAD ALL MODELS
 # -----------------------------
 @st.cache_resource
 def load_models():
@@ -53,7 +46,7 @@ def load_models():
     gen_tokenizer = AutoTokenizer.from_pretrained(gen_model_id)
     gen_model = AutoModelForCausalLM.from_pretrained(gen_model_id)
-    # ✅ Safe SpaCy load
     try:
         nlp = spacy.load("en_core_web_sm")
     except OSError:
@@ -63,7 +56,6 @@ def load_models():
     classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")
     summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
     return tokenizer_simplify, simplify_model, gen_tokenizer, gen_model, nlp, classifier, summarizer
 tokenizer_simplify, simplify_model, gen_tokenizer, gen_model, nlp, classifier, summarizer = load_models()
@@ -85,9 +77,9 @@ def extract_text(file):
         if name.endswith(".pdf"):
             reader = PdfReader(tmp_path)
             for page in reader.pages:
-                page_text = page.extract_text()
-                if page_text:
-                    text += page_text + "\n"
         elif name.endswith(".docx"):
             doc = Document(tmp_path)
             text = "\n".join([p.text for p in doc.paragraphs])
@@ -134,7 +126,7 @@ def clause_simplification(text, mode):
 def fairness_score_visual(text, lang):
     pos = len(re.findall(r"(mutual|both parties|shared)", text, re.I))
     neg = len(re.findall(r"(sole|unilateral|exclusive right)", text, re.I))
-    score = max(0, min(100, 70 + pos - 2*neg))
     st.subheader("⚖️ Fairness Balance Meter")
     fairness_df = pd.DataFrame({
@@ -153,73 +145,86 @@ def chat_response(prompt, lang):
     return translate_text(response, lang)
 # -----------------------------
-# APP INTERFACE
 # -----------------------------
-tab1, tab2, tab3, tab4 = st.tabs(["📄 Analyzer", "🌐 Translate & Audio", "💬 Chatbot", "ℹ️ About"])
-# TAB 1: ANALYZER
-with tab1:
-    st.subheader("📁 Upload or Paste Document")
-    lang = st.selectbox("Select Language:", LANG_NAMES, index=0)
-    file = st.file_uploader("Upload a Legal Document (PDF/DOCX/TXT)", type=["pdf", "docx", "txt"])
-    text_input = st.text_area("Or Paste Text Here:", height=200)
-    if file or text_input:
-        text = extract_text(file) if file else text_input
-        mode = st.radio("Simplify Mode", ["Explain like I'm 5", "Simplified", "Professional"])
-        if st.button("🧾 Simplify Clauses"):
-            with st.spinner("Simplifying..."):
-                simplified = clause_simplification(text, mode)
-                translated = translate_text(simplified, lang)
-                st.success(translated)
-                audio_data = text_to_speech(translated, lang)
-                if audio_data:
-                    st.audio(audio_data, format="audio/mp3")
-        if st.button("⚖️ Fairness Analysis"):
-            fairness_score_visual(text, lang)
-# TAB 2: TRANSLATION + AUDIO
-with tab2:
-    st.subheader("🌐 Translate & Listen")
-    text_input = st.text_area("Enter text:", height=200)
-    lang = st.selectbox("Translate to:", LANG_NAMES, index=4)
-    if st.button("Translate"):
-        translated = translate_text(text_input, lang)
-        st.success(translated)
-    if st.button("🎧 Generate Audio"):
-        audio_data = text_to_speech(text_input, lang)
-        if audio_data:
-            st.audio(audio_data, format="audio/mp3")
-# TAB 3: CHATBOT
-with tab3:
-    st.subheader("💬 Chat with ClauseWise (Multilingual)")
-    lang = st.selectbox("Chat Language:", LANG_NAMES, index=4)
-    query = st.text_area("Ask about clauses, fairness, or legal meaning:", height=150)
-    if st.button("Ask"):
-        with st.spinner("Thinking..."):
-            response = chat_response(f"You are a legal assistant. Answer helpfully: {query}", lang)
-            st.success(response)
-            audio_data = text_to_speech(response, lang)
             if audio_data:
                 st.audio(audio_data, format="audio/mp3")
-# TAB 4: ABOUT
-with tab4:
-    st.markdown("""
-    ### ⚖️ About ClauseWise
-    ClauseWise is a multilingual AI-powered legal assistant that helps users:
-    - Simplify complex clauses
-    - Translate and listen in 10+ languages
-    - Assess fairness visually
-    - Chat interactively
-    **Languages Supported:**
-    English, French, Spanish, German, Hindi, Tamil, Telugu, Kannada, Marathi, Gujarati, Bengali
-    **Disclaimer:** Educational purposes only, not legal advice.
-    """)

 import spacy
 # -----------------------------
+# STREAMLIT PAGE CONFIG
 # -----------------------------
 st.set_page_config(page_title="⚖️ ClauseWise", page_icon="⚖️", layout="wide")
 # -----------------------------
+# LANGUAGE MAP
 # -----------------------------
 LANG_MAP = {
     "English": "en", "French": "fr", "Spanish": "es", "German": "de",
 LANG_NAMES = list(LANG_MAP.keys())
 # -----------------------------
+# MODEL LOADING (with caching)
 # -----------------------------
 @st.cache_resource
 def load_models():
     gen_tokenizer = AutoTokenizer.from_pretrained(gen_model_id)
     gen_model = AutoModelForCausalLM.from_pretrained(gen_model_id)
+    # ✅ Auto-download SpaCy if missing
     try:
         nlp = spacy.load("en_core_web_sm")
     except OSError:
     classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")
     summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
     return tokenizer_simplify, simplify_model, gen_tokenizer, gen_model, nlp, classifier, summarizer
 tokenizer_simplify, simplify_model, gen_tokenizer, gen_model, nlp, classifier, summarizer = load_models()
         if name.endswith(".pdf"):
             reader = PdfReader(tmp_path)
             for page in reader.pages:
+                t = page.extract_text()
+                if t:
+                    text += t + "\n"
         elif name.endswith(".docx"):
             doc = Document(tmp_path)
             text = "\n".join([p.text for p in doc.paragraphs])
 def fairness_score_visual(text, lang):
     pos = len(re.findall(r"(mutual|both parties|shared)", text, re.I))
     neg = len(re.findall(r"(sole|unilateral|exclusive right)", text, re.I))
+    score = max(0, min(100, 70 + pos - 2 * neg))
     st.subheader("⚖️ Fairness Balance Meter")
     fairness_df = pd.DataFrame({
     return translate_text(response, lang)
 # -----------------------------
+# MAIN STREAMLIT APP FUNCTION
 # -----------------------------
+def main():
+    st.title("⚖️ ClauseWise: Multilingual Legal AI Assistant")
+    st.markdown("""
+    **Simplify**, **translate**, and **analyze** legal documents with AI — in your language.
+    ---
+    """)
+    tab1, tab2, tab3, tab4 = st.tabs(["📄 Analyzer", "🌐 Translate & Audio", "💬 Chatbot", "ℹ️ About"])
+    # TAB 1: ANALYZER
+    with tab1:
+        st.subheader("📁 Upload or Paste Legal Document")
+        lang = st.selectbox("Select Language:", LANG_NAMES, index=0)
+        file = st.file_uploader("Upload a Legal Document (PDF/DOCX/TXT)", type=["pdf", "docx", "txt"])
+        text_input = st.text_area("Or Paste Text Here:", height=200)
+        if file or text_input:
+            text = extract_text(file) if file else text_input
+            mode = st.radio("Simplify Mode", ["Explain like I'm 5", "Simplified", "Professional"])
+            if st.button("🧾 Simplify Clauses"):
+                with st.spinner("Simplifying..."):
+                    simplified = clause_simplification(text, mode)
+                    translated = translate_text(simplified, lang)
+                    st.success(translated)
+                    audio_data = text_to_speech(translated, lang)
+                    if audio_data:
+                        st.audio(audio_data, format="audio/mp3")
+            if st.button("⚖️ Fairness Analysis"):
+                fairness_score_visual(text, lang)
+    # TAB 2: TRANSLATION + AUDIO
+    with tab2:
+        st.subheader("🌐 Translate & Listen")
+        text_input = st.text_area("Enter text:", height=200)
+        lang = st.selectbox("Translate to:", LANG_NAMES, index=4)
+        if st.button("Translate"):
+            translated = translate_text(text_input, lang)
+            st.success(translated)
+        if st.button("🎧 Generate Audio"):
+            audio_data = text_to_speech(text_input, lang)
             if audio_data:
                 st.audio(audio_data, format="audio/mp3")
+    # TAB 3: CHATBOT
+    with tab3:
+        st.subheader("💬 Chat with ClauseWise (Multilingual)")
+        lang = st.selectbox("Chat Language:", LANG_NAMES, index=4)
+        query = st.text_area("Ask about clauses, fairness, or legal meaning:", height=150)
+        if st.button("Ask"):
+            with st.spinner("Thinking..."):
+                response = chat_response(f"You are a legal assistant. Answer helpfully: {query}", lang)
+                st.success(response)
+                audio_data = text_to_speech(response, lang)
+                if audio_data:
+                    st.audio(audio_data, format="audio/mp3")
+    # TAB 4: ABOUT
+    with tab4:
+        st.markdown("""
+        ### ⚖️ About ClauseWise
+        ClauseWise is a multilingual AI-powered legal assistant that helps users:
+        - Simplify complex clauses
+        - Translate and listen in 10+ languages
+        - Assess fairness visually
+        - Chat interactively
+        **Languages Supported:**
+        English, French, Spanish, German, Hindi, Tamil, Telugu, Kannada, Marathi, Gujarati, Bengali
+        **Disclaimer:** Educational purposes only, not legal advice.
+        """)
+# -----------------------------
+# RUN STREAMLIT APP SAFELY
+# -----------------------------
+if __name__ == "__main__":
+    main()