Spaces:
Build error
los requerimientos de la app
Browse filestorch: Una biblioteca de aprendizaje automático que proporciona capacidades de cálculo en GPU y herramientas para construir y entrenar modelos de deep learning.
torchvision: Complementa a torch y se utiliza principalmente para tareas de visión por computadora, como la manipulación de imágenes y el uso de modelos preentrenados.
torchaudio: Proporciona herramientas para manejar audio en PyTorch, facilitando la carga, la transformación y el procesamiento de archivos de audio.
moviepy: Permite la edición y manipulación de videos. Se usa para extraer el audio de archivos de video.
SpeechRecognition: Proporciona una interfaz para varios motores de reconocimiento de voz, permitiendo convertir audio en texto.
pyaudio: Utilizado para grabar y reproducir audio en Python. Es esencial para manejar audio en tiempo real.
noisereduce: Ayuda a reducir el ruido de fondo en grabaciones de audio, mejorando la claridad del audio para un mejor reconocimiento de voz.
gradio: Facilita la creación de interfaces de usuario interactivas para aplicaciones de machine learning, permitiendo a los usuarios cargar archivos y obtener resultados fácilmente.
pydub: Una biblioteca para manipular audio con facilidad, utilizada aquí para dividir el audio en segmentos más pequeños.
- requirements.txt +9 -0
|
@@ -0,0 +1,9 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
torch
|
| 2 |
+
torchvision
|
| 3 |
+
torchaudio
|
| 4 |
+
moviepy
|
| 5 |
+
SpeechRecognition
|
| 6 |
+
pyaudio
|
| 7 |
+
noisereduce
|
| 8 |
+
gradio
|
| 9 |
+
pydub
|