Spaces:

educa
/

Dictelly

Runtime error

App Files Files Community

Lenylvt commited on Mar 10, 2024

Commit

e280a73

verified ·

1 Parent(s): af27aee

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -39

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import streamlit as st
 from huggingface_hub import InferenceClient
-import time
 import re
 import edge_tts
 import asyncio
@@ -11,7 +10,6 @@ from pydub import AudioSegment
 # Initialize Hugging Face InferenceClient
 client_hf = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
-# Define the async function for text-to-speech conversion using Edge TTS
 async def text_to_speech_edge(text, language_code):
     voice = {"fr": "fr-FR-RemyMultilingualNeural"}[language_code]
     communicate = edge_tts.Communicate(text, voice)
@@ -20,7 +18,6 @@ async def text_to_speech_edge(text, language_code):
     await communicate.save(tmp_path)
     return tmp_path
-# Helper function to run async functions from within Streamlit (synchronous context)
 def run_in_threadpool(func, *args, **kwargs):
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
@@ -36,7 +33,6 @@ def concatenate_audio(paths):
     combined.export(combined_path, format="mp3")
     return combined_path
-# Modified function to work with async Edge TTS
 def dictee_to_audio_segmented(dictee):
     sentences = segmenter_texte(dictee)
     audio_urls = []
@@ -48,7 +44,7 @@ def dictee_to_audio_segmented(dictee):
     return audio_urls
 def generer_dictee(classe, longueur):
-    prompt = f"Créer une dictée pour la classe {classe} d'une longueur d'environ {longueur} mots. Il est important de créer le texte uniquement de la dictée et de ne pas ajouter de consignes ou d'indications supplémentaires."
     generate_kwargs = {
         "temperature": 0.7,
         "max_new_tokens": 1000,
@@ -64,24 +60,6 @@ def generer_dictee(classe, longueur):
     dictee = dictee.replace("</s>", "").strip()
     return dictee
-def correction_dictee(dictee, dictee_utilisateur):
-    prompt = f"Voici une dictée crée: {dictee} | Voici la dictée faite par l'utilisateur : {dictee_utilisateur} - Corrige la dictée en donnant les explications, utilise les syntax du markdown pour une meilleur comprehesion de la correction."
-    generate_kwargs = {
-        "temperature": 0.7,
-        "max_new_tokens": 2000,  # Ajustez selon la longueur attendue de la correction
-        "top_p": 0.95,
-        "repetition_penalty": 1.2,
-        "do_sample": True,
-    }
-    formatted_prompt = f"<s>[INST] {prompt} [/INST]"
-    stream = client_hf.text_generation(formatted_prompt, **generate_kwargs, stream=True, details=True, return_full_text=False)
-    texte_ameliore = ""
-    for response in stream:
-        texte_ameliore += response.token.text
-    texte_ameliore = texte_ameliore.replace("</s>", "").strip()
-    return correction
 def replace_punctuation(text):
     replacements = {
         ".": " point.",
@@ -99,37 +77,30 @@ def segmenter_texte(texte):
     sentences = re.split(r'(?<=[.!?]) +', texte)
     return sentences
-# Streamlit App Interface
 st.set_page_config(layout="wide")
 st.title('Générateur de Dictée')
 with st.expander("Paramètres de la dictée", expanded=True):
-    mode = st.radio("Mode:", ["S'entrainer: Vous aurez uniquement les audios suivi d'une correction par IA (Pour 1 seul personne)", "Entrainer:  Vous aurez uniquement le texte de la dictée pour entrainer quelqu'un d'autre (Pour 2 ou + personnes)"])
     classe = st.selectbox("Classe", ["CP", "CE1", "CE2", "CM1", "CM2", "6ème", "5ème", "4ème", "3ème", "Seconde", "Premiere", "Terminale"], index=2)
     longueur = st.slider("Longueur de la dictée (nombre de mots)", 50, 500, 200)
 if st.button('Générer la Dictée'):
     with st.spinner("Génération de la dictée en cours..."):
         dictee = generer_dictee(classe, longueur)
-        if mode == "S'entrainer: Vous aurez uniquement les audios suivi d'une correction par IA (Pour 1 seul personne)":
             audio_urls = dictee_to_audio_segmented(dictee)
             concatenated_audio_path = concatenate_audio(audio_urls)
             col1, col2 = st.columns(2)
             with col1:
-                st.audio(concatenated_audio_path, format='audio/wav', start_time=0)
-                with st.expander("Phrases de la Dictée"):
-                    for idx, url in enumerate(audio_urls, start=1):
-                        st.markdown(f"**Phrase {idx}:**")
-                        st.audio(url, format='audio/wav')
             with col2:
-                dictee_utilisateur = st.text_input("Écrivez la dictée ici:")
                 if st.button('Correction'):
-                    with st.spinner("Génération de la dictée en cours..."):
-                        correction = correction_dictee(dictee, dictee_utilisateur)
-                        st.text_area("Voici la correction :", correction, height=500)
-        elif mode == "Entrainer:  Vous aurez uniquement le texte de la dictée pour entrainer quelqu'un d'autre (Pour 2 ou + personnes)":
             st.text_area("Voici votre dictée :", dictee, height=300)

 import streamlit as st
 from huggingface_hub import InferenceClient
 import re
 import edge_tts
 import asyncio
 # Initialize Hugging Face InferenceClient
 client_hf = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
 async def text_to_speech_edge(text, language_code):
     voice = {"fr": "fr-FR-RemyMultilingualNeural"}[language_code]
     communicate = edge_tts.Communicate(text, voice)
     await communicate.save(tmp_path)
     return tmp_path
 def run_in_threadpool(func, *args, **kwargs):
     loop = asyncio.new_event_loop()
     asyncio.set_event_loop(loop)
     combined.export(combined_path, format="mp3")
     return combined_path
 def dictee_to_audio_segmented(dictee):
     sentences = segmenter_texte(dictee)
     audio_urls = []
     return audio_urls
 def generer_dictee(classe, longueur):
+    prompt = f"Créer une dictée pour la classe {classe} d'une longueur d'environ {longueur} mots."
     generate_kwargs = {
         "temperature": 0.7,
         "max_new_tokens": 1000,
     dictee = dictee.replace("</s>", "").strip()
     return dictee
 def replace_punctuation(text):
     replacements = {
         ".": " point.",
     sentences = re.split(r'(?<=[.!?]) +', texte)
     return sentences
 st.set_page_config(layout="wide")
 st.title('Générateur de Dictée')
 with st.expander("Paramètres de la dictée", expanded=True):
+    mode = st.radio("Mode:", ["S'entrainer", "Entrainer"])
     classe = st.selectbox("Classe", ["CP", "CE1", "CE2", "CM1", "CM2", "6ème", "5ème", "4ème", "3ème", "Seconde", "Premiere", "Terminale"], index=2)
     longueur = st.slider("Longueur de la dictée (nombre de mots)", 50, 500, 200)
 if st.button('Générer la Dictée'):
     with st.spinner("Génération de la dictée en cours..."):
         dictee = generer_dictee(classe, longueur)
+        if mode == "S'entrainer":
             audio_urls = dictee_to_audio_segmented(dictee)
             concatenated_audio_path = concatenate_audio(audio_urls)
             col1, col2 = st.columns(2)
             with col1:
+                st.audio(concatenated_audio_path, format='audio/mp3')
             with col2:
+                # Utiliser st.session_state pour conserver la saisie de l'utilisateur
+                user_input = st.text_area("Écrivez la dictée ici:", value=st.session_state.get('user_input', ''), height=300, key='user_input')
                 if st.button('Correction'):
+                    st.write("Dictée originale:")
+                    st.text(dictee)
+                    # Ajouter ici la logique de comparaison/correction détaillée si nécessaire
+        elif mode == "Entrainer":
             st.text_area("Voici votre dictée :", dictee, height=300)