Spaces:

Adjoumani
/

UnifySummarizer

Sleeping

App Files Files Community

Adjoumani commited on Jan 8, 2025

Commit

86321f2

verified ·

1 Parent(s): 022b635

Update app.py

Browse files

Files changed (1) hide show

app.py +60 -9

app.py CHANGED Viewed

@@ -53,11 +53,14 @@ from dotenv import load_dotenv
 load_dotenv()
 class Config:
     """Centralisation de la configuration"""
-    GROQ_API_KEY = "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"
-    SENDER_EMAIL = "adjoumanideyanvo1@gmail.com"
-    SENDER_PASSWORD = "fkev txsk ldjg nyqs"
     FASTTEXT_MODEL_PATH = "lid.176.bin"
 import urllib.request
 urllib.request.urlretrieve('https://dl.fbaipublicfiles.com/fasttext/supervised-models/lid.176.bin', 'lid.176.bin')
@@ -101,8 +104,8 @@ class PDFGenerator:
 class EmailSender:
     def __init__(self, sender_email: str, sender_password: str):
-        self.sender_email = Config.SENDER_EMAIL
-        self.sender_password = Config.SENDER_PASSWORD
     def send_email(self, recipient_email: str, subject: str, body: str, pdf_path: str) -> bool:
         try:
@@ -130,11 +133,11 @@ class EmailSender:
 class AudioProcessor:
     def __init__(self, model_name: str, prompt: str = None, chunk_length_ms: int = 300000):
         self.chunk_length_ms = chunk_length_ms
-        self.groq_client = Groq(api_key=Config.GROQ_API_KEY)
         self.llm = ChatGroq(
             model=model_name,
             temperature=0,
-            api_key=Config.GROQ_API_KEY
         )
         self.custom_prompt = prompt
         self.language_detector = fasttext.load_model(Config.FASTTEXT_MODEL_PATH)
@@ -158,7 +161,7 @@ class AudioProcessor:
         """Traduit le texte en français si nécessaire"""
         try:
             messages = [
-                SystemMessage(content="Vous êtes un traducteur professionnel. Traduisez le texte suivant en français en conservant le format et la structure:"),
                 HumanMessage(content=text)
             ]
             result = self._make_api_call(messages)
@@ -211,7 +214,7 @@ class AudioProcessor:
             return ""
-# Dans la classe AudioProcessor, ajoutez cette méthode :
     def split_text(self, text: str, max_tokens: int = 4000) -> List[str]:
       text_splitter = RecursiveCharacterTextSplitter(
           chunk_size=max_tokens * 4,  # Estimation approximative tokens -> caractères
@@ -819,6 +822,54 @@ def is_valid_email(email: str) -> bool:
 def enhance_main():
     """Fonction principale avec gestion des états et des erreurs améliorée"""
     st.set_page_config(page_title="Multimodal Content Summarizer", page_icon="📝")
     if "audio_processor" not in st.session_state:
         model_name, custom_prompt = model_selection_sidebar()

 load_dotenv()
+SENDER_EMAIL = os.environ.get('SENDER_EMAIL')
+SENDER_PASSWORD = os.environ.get('SENDER_PASSWORD')
 class Config:
     """Centralisation de la configuration"""
+    #GROQ_API_KEY = ""
+    #SENDER_EMAIL = ""
+    #SENDER_PASSWORD = ""
     FASTTEXT_MODEL_PATH = "lid.176.bin"
 import urllib.request
 urllib.request.urlretrieve('https://dl.fbaipublicfiles.com/fasttext/supervised-models/lid.176.bin', 'lid.176.bin')
 class EmailSender:
     def __init__(self, sender_email: str, sender_password: str):
+        self.sender_email = SENDER_EMAIL # or Config.SENDER_EMAIL
+        self.sender_password = SENDER_PASSWORD # or Config.SENDER_PASSWORD
     def send_email(self, recipient_email: str, subject: str, body: str, pdf_path: str) -> bool:
         try:
 class AudioProcessor:
     def __init__(self, model_name: str, prompt: str = None, chunk_length_ms: int = 300000):
         self.chunk_length_ms = chunk_length_ms
+        self.groq_client = Groq() #api_key=Config.GROQ_API_KEY
         self.llm = ChatGroq(
             model=model_name,
             temperature=0,
+            #api_key=Config.GROQ_API_KEY
         )
         self.custom_prompt = prompt
         self.language_detector = fasttext.load_model(Config.FASTTEXT_MODEL_PATH)
         """Traduit le texte en français si nécessaire"""
         try:
             messages = [
+                SystemMessage(content="Vous êtes un traducteur professionnel agréé en Français. Traduisez le texte suivant en français en conservant le format et la structure:"),
                 HumanMessage(content=text)
             ]
             result = self._make_api_call(messages)
             return ""
+    # Dans la classe AudioProcessor, ajoutez cette méthode :
     def split_text(self, text: str, max_tokens: int = 4000) -> List[str]:
       text_splitter = RecursiveCharacterTextSplitter(
           chunk_size=max_tokens * 4,  # Estimation approximative tokens -> caractères
 def enhance_main():
     """Fonction principale avec gestion des états et des erreurs améliorée"""
     st.set_page_config(page_title="Multimodal Content Summarizer", page_icon="📝")
+    # Titre de l'application
+    st.title("🧠 **MultiModal Genius - Résumé Intelligent de Contenus Multimédias**")
+    st.subheader("Transformez vidéos, audios, textes, pages webs et plus en résumés clairs et percutants grâce à la puissance de l'IA")
+    with st.expander("Notice d'utilisation 📜"):
+        st.markdown("""
+        ## **Bienvenue dans l'application MultiModal Genius !** 🎉
+        Cette application exploite la puissance de l'IA pour résumer des contenus multimédias variés, tels que des **documents**, **vidéos YouTube**, **audios**, **pages web**, et bien plus encore ! 🧠✨
+        ### **Comment utiliser l'application ?**
+        1. **Documents** 📄 :
+           - **Formats supportés** : `.pdf`, `.docx`, `.pptx`
+           - Chargez un document via le bouton **"Télécharger un fichier"**.
+           - ⚠️ **Remarque** : Les documents contenant plus de **10 pages** peuvent entraîner des résultats imprécis en raison des limitations des modèles d'IA.
+        2. **Vidéos YouTube** 📹 :
+           - Collez simplement l'URL de la vidéo.
+           - La vidéo est automatiquement découpée en segments pour une analyse et un résumé précis.
+           - **Durée du traitement** : Plus la vidéo est longue, plus le traitement peut prendre du temps.
+        3. **Audios** 🎵 :
+           - Téléchargez un fichier audio au format `.mp3`.
+           - L'audio sera transcrit par blocs (chunks) avant d'être résumé.
+           - ⚠️ **Remarque** : Les fichiers audio de grande taille peuvent rallonger le processus.
+        4. **Pages Web** 🌐 :
+           - Fournissez l'URL de la page.
+           - Le contenu textuel sera extrait, découpé en blocs, puis résumé.
+        ### **Pourquoi le résumé peut être long ?**
+        - **Traitement volumineux** : Les contenus trop longs ou complexes nécessitent un découpage en plusieurs blocs (chunks). Ces blocs sont analysés et traduits avant d'être rassemblés pour un résumé final.
+        - **Limites des modèles IA** : Certains contenus trop volumineux peuvent provoquer des hallucinations du modèle (résultats incohérents ou incorrects).
+        ### **Fonctionnalités à venir 🚀**
+        - **Description d'images** 🖼️ : Transformez vos images en descriptions riches et détaillées.
+        - **Extraction de données** 📊 : Convertissez vos contenus en **format JSON** structuré.
+        - **Amélioration des résumés longs** : Réduction des hallucinations grâce à des optimisations.
+        - Et bien plus encore ! 🎯
+        ### **Astuce pour une meilleure expérience**
+        - **Préférez des contenus courts ou moyennement volumineux** pour des résultats optimaux.
+        - En cas de traitement long, un indicateur de progression vous tiendra informé. ⏳
+        ### **Nous sommes là pour vous aider !**
+        Si vous rencontrez un problème ou avez une suggestion pour améliorer l'application, n'hésitez pas à nous contacter. 🙌
+        """)
     if "audio_processor" not in st.session_state:
         model_name, custom_prompt = model_selection_sidebar()