Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / audio-course /pr_201 /ko /chapter2 /introduction.html

rtrm

3 months ago

download

raw

6.54 kB

	<meta charset="utf-8" /><meta name="hf:doc:metadata" content="{"title":"2단원. 오디오의 응용에 대한 소개","local":"unit-2-a-gentle-introduction-to-audio-applications","sections":[],"depth":1}">
	<link href="/docs/audio-course/pr_201/ko/_app/immutable/assets/0.e3b0c442.css" rel="modulepreload">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/entry/start.21c5e22e.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/scheduler.b8dd6794.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/singletons.b4e4211c.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/index.4e4eb7ec.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/paths.422100c2.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/entry/app.96747e47.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/index.0a3e3d78.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/nodes/0.e357daf5.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/each.e59479a4.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/nodes/15.8732ce48.js">
	<link rel="modulepreload" href="/docs/audio-course/pr_201/ko/_app/immutable/chunks/EditOnGithub.065de0ac.js"><!-- HEAD_svelte-u9bgzb_START --><meta name="hf:doc:metadata" content="{"title":"2단원. 오디오의 응용에 대한 소개","local":"unit-2-a-gentle-introduction-to-audio-applications","sections":[],"depth":1}"><!-- HEAD_svelte-u9bgzb_END --> <p></p> <h1 class="relative group"><a id="unit-2-a-gentle-introduction-to-audio-applications" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#unit-2-a-gentle-introduction-to-audio-applications"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>2단원. 오디오의 응용에 대한 소개</span></h1> <p data-svelte-h="svelte-x2zhsq">허깅페이스 오디오 코스의 두번째 단원에 오신것을 환영합니다! 지금까지는 오디오 데이터의 기본 개념을 살펴보고 🤗 Datasets과 🤗 Transformers 라이브러리를 활용해 오디오 데이터셋을 처리하는 방법을 배웠습니다. 또한 샘플링 속도, 진폭, 비트뎁스, 파형, 스펙트로그램, 사전학습된 모델을 위해 데이터를 전처리하는 방법에 관하여도 살펴봤습니다.</p> <p data-svelte-h="svelte-1dl5yt9">이 시점에서 여러분은 🤗 Transformers로 처리할 수 있는 오디오 작업들에 관해 배우고 싶으실 것이며 이에 필요한 기초 지식은 모두 갖추셨을 것입니다. 몇 가지 놀라운 오디오 작업 예제들을 살펴봅시다:</p> <ul data-svelte-h="svelte-4010i8"><li><strong>오디오 분류(Audio classification)</strong>: 오디오 클립을 쉽게 다른 카테고리들로 분류합니다. 녹음된 소리가 개가 짖는 소리인지 고양이가 우는 소리인지를 구분한다거나, 노래가 어떤 음악 장르에 속하는지 등을 판별합니다.</li> <li><strong>자동 음성 인식(Automatic speech recognition)</strong>: 오디오 클립에서 자동으로 자막을 만듭니다. “오늘 하루 어때요?”와 같이 누군가가 말하는 녹음 내용을 텍스트로 변환할 수 있습니다. 메모를 할 때 상당히 유용합니다!</li> <li><strong>화자 구분(Speaker diarization)</strong>: 녹음에서 누가 말하고 있는지 궁금했던 적이 있나요? 🤗 Transformers를 사용하면 오디오 클립의 어느 시점에 누가 말하는지를 구분할 수 있습니다. “Alice”와 “Bob” 두 사람의 대화 녹음에서 그들을 구분할 수 있다고 상상해 보세요.</li> <li><strong>텍스트 음성 변환(Text to speech)</strong>: 텍스트의 나레이션을 만들어 오디오북을 만들거나 접근성(accessibility)을 향상시킬 수도 있고 게임의 NPC에게 목소리를 부여할 수도 있습니다. 🤗 Transformers를 사용하면 쉬운 일입니다!</li></ul> <p data-svelte-h="svelte-1conf8p">이번 단원에서는 🤗 Transformers의 <code>pipeline()</code> 함수를 사용하여 이런 작업들에 사전학습된 모델을 쓰는 법을 알아보겠습니다.
	특히, 사전학습된 모델이 오디오 분류와 자동 음성 인식에 어떻게 쓰이는지를 살펴보겠습니다.
	시작해봅시다!</p> <a class="!text-gray-400 !no-underline text-sm flex items-center not-prose mt-4" href="https://github.com/huggingface/audio-transformers-course/blob/main/chapters/ko/chapter2/introduction.mdx" target="_blank"><span data-svelte-h="svelte-1kd6by1"><</span> <span data-svelte-h="svelte-x0xyl0">></span> <span data-svelte-h="svelte-1dajgef"><span class="underline ml-1.5">Update</span> on GitHub</span></a> <p></p>

	<script>
	{
	__sveltekit_1l4l789 = {
	assets: "/docs/audio-course/pr_201/ko",
	base: "/docs/audio-course/pr_201/ko",
	env: {}
	};

	const element = document.currentScript.parentElement;

	const data = [null,null];

	Promise.all([
	import("/docs/audio-course/pr_201/ko/_app/immutable/entry/start.21c5e22e.js"),
	import("/docs/audio-course/pr_201/ko/_app/immutable/entry/app.96747e47.js")
	]).then(([kit, app]) => {
	kit.start(app, element, {
	node_ids: [0, 15],
	data,
	form: null,
	error: null
	});
	});
	}
	</script>

Xet Storage Details

Size:: 6.54 kB
Xet hash:: b358936eb20672f5c10743c9ca2d6b3fa7f65f2a91fe8f66c33afff745edeb14

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.