CODIGOSDIOS

Sleeping

App Files Files Community

Josedcape commited on Jun 29, 2024

Commit

5d9778c

verified ·

1 Parent(s): 45d3a78

Update app.py

Browse files

Files changed (1) hide show

app.py +67 -2

app.py CHANGED Viewed

@@ -1,13 +1,16 @@
-import time
 import pandas as pd
 import streamlit as st
 from dotenv import load_dotenv
 import openai
 import os
 # Configuración de la clave API
 load_dotenv()
 openai.api_key = os.getenv("OPENAI_API_KEY")
 # Clases para la gestión de pedidos
 class PedidoAgent:
@@ -75,6 +78,41 @@ def obtener_respuesta(pregunta, modelo="gpt-4", temperatura=0.5):
     respuesta = response['choices'][0]['message']['content']
     return respuesta
 # Configuración de Streamlit
 st.set_page_config(page_title="Asistente Teológico", page_icon="📖")
@@ -114,7 +152,7 @@ st.markdown(
 )
 # Encabezado
-st.image("biblie.jpg")
 st.title("📖 Asistente Teológico - BOTIDINAMIX AI")
 st.markdown("Bienvenido al Asistente Teológico, donde puedes preguntar sobre interpretaciones y reflexiones bíblicas.")
@@ -139,6 +177,10 @@ if st.button("Enviar"):
             st.session_state.mensajes.append({"role": "assistant", "content": respuesta, "timestamp": time.time()})
             with st.chat_message("assistant"):
                 st.markdown(respuesta)
     else:
         st.warning("Por favor, ingresa una pregunta antes de enviar.")
@@ -153,3 +195,26 @@ calculo_pedido_agent = CalculoPedidoAgent()
 pedido_agent.realizar_pedido(st.session_state)
 calculo_pedido_agent.calcular_total(st.session_state)

 import pandas as pd
 import streamlit as st
 from dotenv import load_dotenv
 import openai
 import os
+import time
+from google.cloud import texttospeech, speech
+from streamlit_webrtc import webrtc_streamer, WebRtcMode, AudioProcessorBase
 # Configuración de la clave API
 load_dotenv()
 openai.api_key = os.getenv("OPENAI_API_KEY")
+os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "path/to/your/google-cloud-credentials.json"
 # Clases para la gestión de pedidos
 class PedidoAgent:
     respuesta = response['choices'][0]['message']['content']
     return respuesta
+# Función para convertir texto a voz usando Google Cloud Text-to-Speech
+def text_to_speech(text):
+    client = texttospeech.TextToSpeechClient()
+    synthesis_input = texttospeech.SynthesisInput(text=text)
+    voice = texttospeech.VoiceSelectionParams(language_code="es-ES", ssml_gender=texttospeech.SsmlVoiceGender.NEUTRAL)
+    audio_config = texttospeech.AudioConfig(audio_encoding=texttospeech.AudioEncoding.MP3)
+    response = client.synthesize_speech(input=synthesis_input, voice=voice, audio_config=audio_config)
+    audio_path = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3").name
+    with open(audio_path, "wb") as out:
+        out.write(response.audio_content)
+    return audio_path
+# Clase para procesar audio
+class AudioProcessor(AudioProcessorBase):
+    def __init__(self):
+        self.audio_bytes = b''
+    def recv(self, frame):
+        self.audio_bytes += frame.to_ndarray().tobytes()
+        return frame
+# Función para transcribir audio a texto usando Google Cloud Speech-to-Text
+def transcribir_audio(audio_bytes):
+    client = speech.SpeechClient()
+    audio = speech.RecognitionAudio(content=audio_bytes)
+    config = speech.RecognitionConfig(
+        encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
+        sample_rate_hertz=16000,
+        language_code="es-ES",
+    )
+    response = client.recognize(config=config, audio=audio)
+    for result in response.results:
+        return result.alternatives[0].transcript
+    return ""
 # Configuración de Streamlit
 st.set_page_config(page_title="Asistente Teológico", page_icon="📖")
 )
 # Encabezado
+st.image("biblia.jpg")
 st.title("📖 Asistente Teológico - BOTIDINAMIX AI")
 st.markdown("Bienvenido al Asistente Teológico, donde puedes preguntar sobre interpretaciones y reflexiones bíblicas.")
             st.session_state.mensajes.append({"role": "assistant", "content": respuesta, "timestamp": time.time()})
             with st.chat_message("assistant"):
                 st.markdown(respuesta)
+            # Convertir texto a voz
+            audio_path = text_to_speech(respuesta)
+            st.audio(audio_path, format="audio/mp3", start_time=0)
     else:
         st.warning("Por favor, ingresa una pregunta antes de enviar.")
 pedido_agent.realizar_pedido(st.session_state)
 calculo_pedido_agent.calcular_total(st.session_state)
+# Captura de audio y transcripción
+st.subheader("🎤 Captura de voz y transcripción")
+if st.button("Grabar 🎙️"):
+    webrtc_ctx = webrtc_streamer(
+        key="example",
+        mode=WebRtcMode.SENDONLY,
+        audio_receiver_size=256,
+        rtc_configuration={"iceServers": [{"urls": ["stun:stun.l.google.com:19302"]}]},
+        media_stream_constraints={"audio": True},
+        audio_processor_factory=AudioProcessor,
+    )
+    if webrtc_ctx.audio_receiver:
+        audio_frames = webrtc_ctx.audio_receiver.get_frames(timeout=1)
+        for audio_frame in audio_frames:
+            audio_bytes = audio_frame.to_ndarray().tobytes()
+            transcripcion = transcribir_audio(audio_bytes)
+            if transcripcion:
+                st.session_state.mensajes.append({"role": "user", "content": transcripcion, "timestamp": time.time()})
+                with st.chat_message("user"):
+                    st.markdown(transcripcion)
+                break  # Solo capturamos una vez por grabación