Buckets:
Раздел 7. Собираем все воедино 🪢
Молодцы, что добрались до 7-го раздела 7 🥳 Вы находитесь всего в нескольких шагах от завершения курса и приобретения нескольких последних навыков, необходимых для работы в области Аудио ML. Что касается понимания, то вы уже знаете все, что нужно знать! Вместе мы всесторонне рассмотрели основные темы, составляющие аудио домен, и сопутствующую им теорию (аудио данные, классификацию аудиоданных, распознавание речи и преобразование текста в речь). Целью данного раздела является создание основы для сочетания всего этого вместе: теперь, когда вы знаете, как работает каждая из этих задач в отдельности, мы рассмотрим, как вы можете объединить их вместе для создания некоторых реальных приложений.
Чему вы научитесь и что создадите
В этом разделе мы рассмотрим следующие три темы:
- Перевод речи в речь: перевод речи с одного языка в речь на другом языке
- Создание голосового ассистента: создание собственного голосового помощника, работающего аналогично Alexa или Siri
- Транскрибирование встреч: транскрибация встречи и маркировка транскрипции с указанием того, кто когда выступал
Xet Storage Details
- Size:
- 2.11 kB
- Xet hash:
- 62f27d67b839334719d3daed858bdc2a19b3c6d3396df9d3a4100cf7bed2cd52
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.