Buckets:
| # Unidad 2. Una introducci贸n amigable a las aplicaciones de audio | |
| Bienvenido a la segunda unidad del curso de audio de Hugging Face隆, Anteriormente, exploramos los conceptos fundamentales | |
| de los datos de audio y aprendimo como trabajar con conjuntos de datos de audio usando las librerias 馃 Datasets y 馃 Transformers. | |
| Discutimos diferentes conceptos como frecuencia de muestreo, amplitud, profundidad de bits, forma de onda y espectrogramas, y vimos | |
| como preprocesar datos para un modelo pre-entrenado. | |
| En este punto quiza estes ansioso por aprender acerca de las tareas de audio que 馃 Transformers puede realizar, y ahora que tienes | |
| los conocimientos fundamentales para comprenderlo todo, echemos un vistazo a unos impresionantes ejemplos de aplicaciones de audio. | |
| * **Clasificaci贸n de Audio**: Categorizar facilmente un clip de audio. Puedes identificar si una grabaci贸n es de un ladrido de un perro | |
| o un maullido de gato, o a que g茅nero corresponde una caci贸n. | |
| * **Reconocimiento autom谩tico de voz**: Transformar un clip de audio en texto a traves de una transcripci贸n autom谩tica. Puedes obtener | |
| la representaci贸n en texto de una grabaci贸n en donde alguien habla. Muy 煤til para tomar notas! | |
| * **Diarizaci贸n de hablantes** Alguna vez te has preguntado 驴Qui茅n habla en una grabaci贸n? con 馃 Transformers, puedes identificar | |
| que persona esta hablando en un determinado tiempo del clip de audio. Imaginate ser capaz de de diferencias entre "Alice" y "Bob" | |
| en una grabaci贸n en donde ambos estan teniendo una conversaci贸n. | |
| * **Texto a voz**: Crear una narraci贸n a partir de un texto que puede ser usada para crear un audio book, ayuda con la accesibilidad, | |
| o le da la voz a un NPC en un juego. con 馃 Transformers puedes hacer facilmente esto | |
| En esta unidad, tu aprenderas como usar modelos pre entrenados para algunas de estas tareas usando la funci贸n `pipeline()` de 馃 Transformers. | |
| Especificamente, veremos como usar modelos pre-entrenados para las tareas de clasificaci贸n de audio y reconocimiento autom谩tico de la voz. | |
| Comencemos! | |
Xet Storage Details
- Size:
- 2.08 kB
- Xet hash:
- 69e2335c0eda7f05499e2dd6965b5cb6a65bbea51c0ab04440f5cf47fc96a34b
路
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.