Gemma [[gemma]]
๊ฐ์ [[overview]]
Gemma ๋ชจ๋ธ์ Google์ Gemma ํ์ด ์์ฑํ Gemma: Open Models Based on Gemini Technology and Research์์ ์ ์๋์์ต๋๋ค.
Gemma ๋ชจ๋ธ์ 6์กฐ ํ ํฐ์ผ๋ก ํ์ต๋์์ผ๋ฉฐ, 2b์ 7b์ ๋ ๊ฐ์ง ๋ฒ์ ์ผ๋ก ์ถ์๋์์ต๋๋ค.
๋ ผ๋ฌธ์ ์ด๋ก์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
์ด ์ฐ๊ตฌ๋ ์ธ์ด ์ดํด, ์ถ๋ก ๋ฐ ์์ ์ฑ์ ๋ํ ํ์ ๋ฒค์น๋งํฌ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ ์๋ก์ด ์คํ ์ธ์ด ๋ชจ๋ธ ๊ณ์ด์ธ Gemma๋ฅผ ์๊ฐํฉ๋๋ค. ์ฐ๋ฆฌ๋ ๋ ๊ฐ์ง ํฌ๊ธฐ(20์ต ๋ฐ 70์ต ๋งค๊ฐ๋ณ์)์ ๋ชจ๋ธ์ ์ถ์ํ๋ฉฐ, ์ฌ์ ํ์ต๋ ์ฒดํฌํฌ์ธํธ์ ๋ฏธ์ธ ์กฐ์ ๋ ์ฒดํฌํฌ์ธํธ๋ฅผ ๋ชจ๋ ์ ๊ณตํฉ๋๋ค. Gemma๋ 18๊ฐ์ ํ ์คํธ ๊ธฐ๋ฐ ์์ ์ค 11๊ฐ์์ ์ ์ฌํ ํฌ๊ธฐ์ ์คํ ๋ชจ๋ธ์ ๋ฅ๊ฐํ๋ฉฐ, ์ฐ๋ฆฌ๋ ๋ชจ๋ธ ๊ฐ๋ฐ์ ๋ํ ์์ธํ ์ค๋ช ๊ณผ ํจ๊ป ์์ ์ฑ๊ณผ ์ฑ ์ ์ธก๋ฉด์ ๋ํ ์ข ํฉ์ ์ธ ํ๊ฐ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ฐ๋ฆฌ๋ LLM์ ์ฑ ์๊ฐ ์๋ ๊ณต๊ฐ๊ฐ ์ต์ฒจ๋จ ๋ชจ๋ธ์ ์์ ์ฑ์ ํฅ์์ํค๊ณ ๋ค์ ์ธ๋์ LLM ํ์ ์ ๊ฐ๋ฅํ๊ฒ ํ๋ ๋ฐ ์ค์ํ๋ค๊ณ ๋ฏฟ์ต๋๋ค.
ํ:
- ์๋ณธ ์ฒดํฌํฌ์ธํธ๋ ๋ณํ ์คํฌ๋ฆฝํธ
src/transformers/models/gemma/convert_gemma_weights_to_hf.py๋ฅผ ์ฌ์ฉํ์ฌ ๋ณํํ ์ ์์ต๋๋ค.
์ด ๋ชจ๋ธ์ Arthur Zucker, Younes Belkada, Sanchit Gandhi, Pedro Cuenca๊ฐ ๊ธฐ์ฌํ์ต๋๋ค.
GemmaConfig [[transformers.GemmaConfig]]
[[autodoc]] GemmaConfig
GemmaTokenizer [[transformers.GemmaTokenizer]]
[[autodoc]] GemmaTokenizer
GemmaTokenizerFast [[transformers.GemmaTokenizerFast]]
[[autodoc]] GemmaTokenizerFast
GemmaModel [[transformers.GemmaModel]]
[[autodoc]] GemmaModel - forward
GemmaForCausalLM [[transformers.GemmaForCausalLM]]
[[autodoc]] GemmaForCausalLM - forward
GemmaForSequenceClassification [[transformers.GemmaForSequenceClassification]]
[[autodoc]] GemmaForSequenceClassification - forward
GemmaForTokenClassification [[transformers.GemmaForTokenClassification]]
[[autodoc]] GemmaForTokenClassification - forward
FlaxGemmaModel [[transformers.FlaxGemmaModel]]
[[autodoc]] FlaxGemmaModel - call
FlaxGemmaForCausalLM [[transformers.FlaxGemmaForCausalLM]]
[[autodoc]] FlaxGemmaForCausalLM - call