Spaces:

educa
/

Dictelly

Runtime error

App Files Files Community

Lenylvt commited on Mar 10, 2024

Commit

ec5aa3a

verified ·

1 Parent(s): c755bb6

Update app.py

Browse files

Files changed (1) hide show

app.py +59 -19

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ from pydub import AudioSegment
 # Initialize Hugging Face InferenceClient
 client_hf = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
 async def text_to_speech_edge(text, language_code):
     voice = {"fr": "fr-FR-RemyMultilingualNeural"}[language_code]
     communicate = edge_tts.Communicate(text, voice)
@@ -18,6 +19,7 @@ async def text_to_speech_edge(text, language_code):
     await communicate.save(tmp_path)
     return tmp_path
 def run_in_threadpool(func, *args, **kwargs):
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
@@ -33,6 +35,7 @@ def concatenate_audio(paths):
     combined.export(combined_path, format="mp3")
     return combined_path
 def dictee_to_audio_segmented(dictee):
     sentences = segmenter_texte(dictee)
     audio_urls = []
@@ -60,6 +63,23 @@ def generer_dictee(classe, longueur):
     dictee = dictee.replace("</s>", "").strip()
     return dictee
 def replace_punctuation(text):
     replacements = {
         ".": " point.",
@@ -77,30 +97,50 @@ def segmenter_texte(texte):
     sentences = re.split(r'(?<=[.!?]) +', texte)
     return sentences
 st.set_page_config(layout="wide")
 st.title('Générateur de Dictée')
 with st.expander("Paramètres de la dictée", expanded=True):
-    mode = st.radio("Mode:", ["S'entrainer", "Entrainer"])
     classe = st.selectbox("Classe", ["CP", "CE1", "CE2", "CM1", "CM2", "6ème", "5ème", "4ème", "3ème", "Seconde", "Premiere", "Terminale"], index=2)
     longueur = st.slider("Longueur de la dictée (nombre de mots)", 50, 500, 200)
-if st.button('Générer la Dictée'):
     with st.spinner("Génération de la dictée en cours..."):
         dictee = generer_dictee(classe, longueur)
-        if mode == "S'entrainer":
-            audio_urls = dictee_to_audio_segmented(dictee)
-            concatenated_audio_path = concatenate_audio(audio_urls)
-            col1, col2 = st.columns(2)
-            with col1:
-                st.audio(concatenated_audio_path, format='audio/mp3')
-            with col2:
-                # Utiliser st.session_state pour conserver la saisie de l'utilisateur
-                user_input = st.text_area("Écrivez la dictée ici:", value=st.session_state.get('user_input', ''), height=300, key='user_input')
-                if st.button('Correction'):
-                    st.write("Dictée originale:")
-                    st.text(dictee)
-                    # Ajouter ici la logique de comparaison/correction détaillée si nécessaire
-        elif mode == "Entrainer":
-            st.text_area("Voici votre dictée :", dictee, height=300)

 # Initialize Hugging Face InferenceClient
 client_hf = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
+# Define the async function for text-to-speech conversion using Edge TTS
 async def text_to_speech_edge(text, language_code):
     voice = {"fr": "fr-FR-RemyMultilingualNeural"}[language_code]
     communicate = edge_tts.Communicate(text, voice)
     await communicate.save(tmp_path)
     return tmp_path
+# Helper function to run async functions from within Streamlit (synchronous context)
 def run_in_threadpool(func, *args, **kwargs):
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
     combined.export(combined_path, format="mp3")
     return combined_path
+# Modified function to work with async Edge TTS
 def dictee_to_audio_segmented(dictee):
     sentences = segmenter_texte(dictee)
     audio_urls = []
     dictee = dictee.replace("</s>", "").strip()
     return dictee
+def correction_dictee(dictee, dictee_utilisateur):
+    prompt = f"Voici une dictée crée: {dictee} | Voici la dictée faite par l'utilisateur : {dictee_utilisateur} - Corrige la dictée en donnant les explications, utilise les syntax du markdown pour une meilleur comprehesion de la correction."
+    generate_kwargs = {
+        "temperature": 0.7,
+        "max_new_tokens": 2000,  # Ajustez selon la longueur attendue de la correction
+        "top_p": 0.95,
+        "repetition_penalty": 1.2,
+        "do_sample": True,
+    }
+    formatted_prompt = f"<s>[INST] {prompt} [/INST]"
+    stream = client_hf.text_generation(formatted_prompt, **generate_kwargs, stream=True, details=True, return_full_text=False)
+    texte_ameliore = ""
+    for response in stream:
+        texte_ameliore += response.token.text
+    texte_ameliore = texte_ameliore.replace("</s>", "").strip()
+    return correction
 def replace_punctuation(text):
     replacements = {
         ".": " point.",
     sentences = re.split(r'(?<=[.!?]) +', texte)
     return sentences
+# Stocker la dictée dans une variable de session pour qu'elle persiste
+if 'dictée' not in st.session_state:
+    st.session_state.dictée = None
+# Streamlit App Interface
 st.set_page_config(layout="wide")
 st.title('Générateur de Dictée')
 with st.expander("Paramètres de la dictée", expanded=True):
+    mode = st.radio("Mode:", ["S'entrainer: Vous aurez uniquement les audios suivi d'une correction par IA (Pour 1 seul personne)", "Entrainer:  Vous aurez uniquement le texte de la dictée pour entrainer quelqu'un d'autre (Pour 2 ou + personnes)"])
     classe = st.selectbox("Classe", ["CP", "CE1", "CE2", "CM1", "CM2", "6ème", "5ème", "4ème", "3ème", "Seconde", "Premiere", "Terminale"], index=2)
     longueur = st.slider("Longueur de la dictée (nombre de mots)", 50, 500, 200)
+    bouton_generer = st.button('Générer la Dictée')
+if bouton_generer:
     with st.spinner("Génération de la dictée en cours..."):
         dictee = generer_dictee(classe, longueur)
+        st.session_state.dictée = dictee
+if st.session_state.dictée:
+    # Afficher la dictée ou les audios en fonction du mode
+    if mode == "S'entrainer: Vous aurez uniquement les audios suivi d'une correction par IA (Pour 1 seul personne)":
+        audio_urls = dictee_to_audio_segmented(st.session_state.dictée)
+        concatenated_audio_path = concatenate_audio(audio_urls)
+        col1, col2 = st.columns(2)
+        with col1:
+            st.audio(concatenated_audio_path, format='audio/wav', start_time=0)
+            with st.expander("Phrases de la Dictée"):
+                for idx, url in enumerate(audio_urls, start=1):
+                    st.markdown(f"**Phrase {idx}:**")
+                    st.audio(url, format='audio/wav')
+        with col2:
+            dictee_utilisateur = st.text_input("Écrivez la dictée ici:")
+            if st.button('Correction'):
+                with st.spinner("Génération de la correction en cours..."):
+                    correction = correction_dictee(st.session_state.dictée, dictee_utilisateur)
+                    st.text_area("Voici la correction :", correction, height=500)
+    elif mode == "Entrainer:  Vous aurez uniquement le texte de la dictée pour entrainer quelqu'un d'autre (Pour 2 ou + personnes)":
+        st.text_area("Voici votre dictée :", st.session_state.dictée, height=300)
+    # Ajouter un bouton "Retour" pour réinitialiser la session
+    if st.button('Retour'):
+        st.session_state.dictée = None