Spaces:

NOBODY204
/

ArchivChat

Sleeping

App Files Files Community

NOBODY204 commited on Mar 2

Commit

8bf9737

verified ·

1 Parent(s): 5af68f9

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -16

app.py CHANGED Viewed

@@ -2,12 +2,9 @@
 import gradio as gr
 import PyPDF2
 import re
-from sumy.parsers.plaintext import PlaintextParser
-from sumy.nlp.tokenizers import Tokenizer
-from sumy.summarizers.lex_rank import LexRankSummarizer
 # -----------------------------
-# Calcul emplacement (11 boîtes / étage)
 # -----------------------------
 def calculer_emplacement(n):
     try:
@@ -28,24 +25,36 @@ Position : {case} / 11
         return "❌ Erreur"
 # -----------------------------
-# Résumé fidèle hors-ligne
 # -----------------------------
 def summarize_offline(text, n_sentences=5):
-    parser = PlaintextParser.from_string(text, Tokenizer("arabic"))
-    summarizer = LexRankSummarizer()
-    summary = summarizer(parser.document, sentences_count=n_sentences)
-    return " ".join([str(sentence) for sentence in summary])
 # -----------------------------
-# Analyse PDF (SANS OCR)
 # -----------------------------
 def analyser_pdf(file, longueur):
     if file is None:
         return "❌ Aucun fichier", ""
     try:
         reader = PyPDF2.PdfReader(file.name)
         text = ""
-        for page in reader.pages[:5]:
             content = page.extract_text()
             if content:
                 text += content + " "
@@ -53,21 +62,23 @@ def analyser_pdf(file, longueur):
         clean_text = re.sub(r"\s+", " ", text).strip()
         if len(clean_text) < 50:
-            return "❌ PDF scanné (OCR désactivé pour stabilité)", ""
-        n_sentences = 10 if longueur == "Détaillé" else 5
         summary = summarize_offline(clean_text, n_sentences)
-        return "✅ Résumé réussi", summary
     except Exception as e:
         return f"❌ Erreur : {str(e)}", ""
 # -----------------------------
-# Interface Gradio
 # -----------------------------
 with gr.Blocks() as demo:
-    gr.Markdown("# 📁 ArchivChat Stable")
     with gr.Tab("📍 Localisation"):
         input_num = gr.Number(label="Numéro de boîte", precision=0)

 import gradio as gr
 import PyPDF2
 import re
 # -----------------------------
+# 📍 Calcul emplacement (11 boîtes / étage)
 # -----------------------------
 def calculer_emplacement(n):
     try:
         return "❌ Erreur"
 # -----------------------------
+# 📄 Résumé simple stable (arabe + français)
 # -----------------------------
 def summarize_offline(text, n_sentences=5):
+    # Découpage phrases arabe + français
+    sentences = re.split(r'[.!؟\n]', text)
+    # Nettoyage
+    sentences = [s.strip() for s in sentences if len(s.strip()) > 30]
+    if len(sentences) == 0:
+        return "⚠️ Texte insuffisant pour résumé"
+    summary = sentences[:n_sentences]
+    return ". ".join(summary) + "."
 # -----------------------------
+# 📄 Analyse PDF (SANS OCR)
 # -----------------------------
 def analyser_pdf(file, longueur):
     if file is None:
         return "❌ Aucun fichier", ""
     try:
         reader = PyPDF2.PdfReader(file.name)
         text = ""
+        for page in reader.pages[:5]:  # max 5 pages pour stabilité
             content = page.extract_text()
             if content:
                 text += content + " "
         clean_text = re.sub(r"\s+", " ", text).strip()
         if len(clean_text) < 50:
+            return "❌ PDF vide ou scanné (OCR désactivé)", ""
+        n_sentences = 8 if longueur == "Détaillé" else 4
         summary = summarize_offline(clean_text, n_sentences)
+        return "✅ Résumé généré avec succès", summary
     except Exception as e:
         return f"❌ Erreur : {str(e)}", ""
 # -----------------------------
+# 🖥 Interface Gradio
 # -----------------------------
 with gr.Blocks() as demo:
+    gr.Markdown("# 📁 ArchivChat Stable Version")
     with gr.Tab("📍 Localisation"):
         input_num = gr.Number(label="Numéro de boîte", precision=0)