File size: 25,141 Bytes
002bd9b |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 |
<!--Copyright 2022 The HuggingFace Team. All rights reserved.
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with
the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on
an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the
โ ๏ธ Note that this file is in Markdown but contain specific syntax for our doc-builder (similar to MDX) that may not be
rendered properly in your Markdown viewer.
-->
# ์ด๋ป๊ฒ ๐ค Transformers ๋ชจ๋ธ์ TensorFlow๋ก ๋ณํํ๋์? [[how-to-convert-a-transformers-model-to-tensorflow]]
๐ค Transformers์์์ฒ๋ผ ์ฌ์ฉํ ์ ์๋ ์ฌ๋ฌ ๊ฐ์ง ํ๋ ์์ํฌ๊ฐ ์๋ค๋ ๊ฒ์ ์ ํ๋ฆฌ์ผ์ด์
์ ์ค๊ณํ ๋ ๊ทธ๋ค์ ๊ฐ์ ์ ์ ์ฐํ๊ฒ ์ด์ฉํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ง๋ง, ๋ชจ๋ธ ๋ณ๋ก ํธํ์ฑ์ ์ถ๊ฐํด์ผ ํ๋ค๋ ๋จ์ ๋ํ ์กด์ฌํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ข์ ์์์ ๊ธฐ์กด ๋ชจ๋ธ์ TensorFlow ํธํ์ฑ์ ์ถ๊ฐํ๋ ๊ฒ์ด [์ฒ์๋ถํฐ ์๋ก์ด ๋ชจ๋ธ์ ์ถ๊ฐํ๋ ๊ฒ](add_new_model)๋ณด๋ค๋ ๊ฐ๋จํ๋ค๋ ๊ฒ์
๋๋ค!
๋ง์ฝ ๋๊ท๋ชจ TensorFlow ๋ชจ๋ธ์ ๋ ๊น์ด ์ดํดํ๋ ค๊ฑฐ๋, ์คํ ์์ค์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ๋ ค๊ฑฐ๋, ์ ํํ ๋ชจ๋ธ์ Tensorflow๋ฅผ ํ์ฉํ๋ คํ๋ค๋ฉด, ์ด ์๋ด์๋ ์ฌ๋ฌ๋ถ๊ป ๋์์ด ๋ ๊ฒ์
๋๋ค.
์ด ๊ฐ์ด๋๋ Hugging Face ํ์ ์ต์ํ์ ๊ฐ๋
์๋์์ ๐ค Transformers์์ ์ฌ์ฉ๋๋ TensorFlow ๋ชจ๋ธ ๊ฐ์ค์น์/๋๋ ์ํคํ
์ฒ๋ฅผ ๊ธฐ์ฌํ ์ ์๋ ์ปค๋ฎค๋ํฐ ๊ตฌ์ฑ์์ธ ์ฌ๋ฌ๋ถ์ ๋์์ผ๋ก ํฉ๋๋ค.
์๋ก์ด ๋ชจ๋ธ์ ์์ฑํ๋ ๊ฒ์ ์ฌ์ด ์ผ์ด ์๋์ง๋ง, ์ด ๊ฐ์ด๋๋ฅผ ํตํด ์กฐ๊ธ ๋ ํ๋ค๊ณ ํจ์ฌ ์ฌ์ด ์์
์ผ๋ก ๋ง๋ค ์ ์์ต๋๋ค.
๋ชจ๋์ ๊ฒฝํ์ ๋ชจ์ผ๋ ๊ฒ์ ์ด ์์
์ ์ ์ฐจ์ ์ผ๋ก ๋ ์ฝ๊ฒ ๋ง๋๋ ๋ฐ ๊ต์ฅํ ์ค์ํ๊ธฐ ๋๋ฌธ์, ์ด ๊ฐ์ด๋๋ฅผ ๊ฐ์ ์ํฌ๋งํ ์ ์์ด ๋ ์ค๋ฅด๋ฉด ๊ณต์ ํ์๋๊ฑธ ์ ๊ทน์ ์ผ๋ก ๊ถ์ฅํฉ๋๋ค!
๋ ๊น์ด ์์๋ณด๊ธฐ ์ ์, ๐ค Transformers๋ฅผ ์ฒ์ ์ ํ๋ ๊ฒฝ์ฐ ๋ค์ ์๋ฃ๋ฅผ ํ์ธํ๋ ๊ฒ์ด ์ข์ต๋๋ค:
- [๐ค Transformers์ ์ผ๋ฐ ๊ฐ์](add_new_model#general-overview-of-transformers)
- [Hugging Face์ TensorFlow ์ฒ ํ](https://huggingface.co/blog/tensorflow-philosophy)
์ด ๊ฐ์ด๋์ ๋๋จธ์ง ๋ถ๋ถ์์๋ ์๋ก์ด TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ๋ฅผ ์ถ๊ฐํ๋ ๋ฐ ํ์ํ ๋จ๊ณ, Pytorch๋ฅผ TensorFlow ๋ชจ๋ธ ๊ฐ์ค์น๋ก ๋ณํํ๋ ์ ์ฐจ ๋ฐ ML ํ๋ ์์ํฌ ๊ฐ์ ๋ถ์ผ์น๋ฅผ ํจ์จ์ ์ผ๋ก ๋๋ฒ๊น
ํ๋ ๋ฐฉ๋ฒ์ ์๊ฒ ๋ ๊ฒ์
๋๋ค. ์์ํด๋ด
์๋ค!
<Tip>
์ฌ์ฉํ๋ ค๋ ๋ชจ๋ธ์ด ์ด๋ฏธ ํด๋นํ๋ TensorFlow ์ํคํ
์ฒ๊ฐ ์๋์ง ํ์คํ์ง ์๋์?
์ ํํ ๋ชจ๋ธ([์](https://huggingface.co/google-bert/bert-base-uncased/blob/main/config.json#L14))์ `config.json`์ `model_type` ํ๋๋ฅผ ํ์ธํด๋ณด์ธ์. ๐ค Transformers์ ํด๋น ๋ชจ๋ธ ํด๋์๋ "modeling_tf"๋ก ์์ํ๋ ํ์ผ์ด ์๋ ๊ฒฝ์ฐ, ํด๋น ๋ชจ๋ธ์๋ ํด๋น TensorFlow ์ํคํ
์ฒ([์](https://github.com/huggingface/transformers/tree/main/src/transformers/models/bert))๊ฐ ์๋ค๋ ์๋ฏธ์
๋๋ค.
</Tip>
## TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ ์ฝ๋ ์ถ๊ฐํ๋ ๋จ๊ณ๋ณ ๊ฐ์ด๋ [[step-by-step-guide-to add-tensorFlow-model-architecture-code]]
๋๊ท๋ชจ ์ํคํ
์ฒ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ์ ์ค๊ณํ๋ ๋ฐฉ๋ฒ์๋ ์ฌ๋ฌ๊ฐ์ง๊ฐ ์์ผ๋ฉฐ, ํด๋น ์ค๊ณ๋ฅผ ๊ตฌํํ๋ ๋ฐฉ๋ฒ๋ ์ฌ๋ฌ ๊ฐ์ง์
๋๋ค.
๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ [๐ค Transformers ์ผ๋ฐ ๊ฐ์](add_new_model#general-overview-of-transformers)์์ ์ธ๊ธํ ๋๋ก ์ผ๊ด๋ ์ค๊ณ ์ ํ์ ๋ฐ๋ผ์ผ์ง๋ง ๐ค Transformers๋ฅผ ์ฌ์ฉํ๊ธฐ ํธํ ๊ฒ์ด๋ผ๋ ํ๊ณ ํ ์๊ฒฌ์ ๊ฐ์ง๊ณ ์์ต๋๋ค.
์ฐ๋ฆฌ์ ๊ฒฝํ์ ํตํด TensorFlow ๋ชจ๋ธ์ ์ถ๊ฐํ๋ ๋ฐ ๊ด๋ จ๋ ์ค์ํ ๋ช ๊ฐ์ง ์ฌํญ์ ์๋ ค ๋๋ฆด ์ ์์ต๋๋ค:
- ์ด๋ฏธ ์๋๊ฑธ ๋ค์ ๊ฐ๋ฐํ๋ ค ํ์ง ๋ง์ธ์! ์ต์ํ 2๊ฐ์ ์ด๋ฏธ ๊ตฌํ๋ ๋ชจ๋ธ์ ๋๊ฐ ์ฐธ์กฐํด์ผ ํฉ๋๋ค. ๊ตฌํํ๋ ค๋ ๋ชจ๋ธ๊ณผ ๊ธฐ๋ฅ์ ๋์ผํ Pytorch ๋ชจ๋ธ ํ๋์ ๊ฐ์ ๋ฌธ์ ์ ํ์ ํ๊ณ ์๋ ๋ค๋ฅธ TensorFlow ๋ชจ๋ธ ํ๋๋ฅผ ์ดํด๋ณด์ธ์.
- ์ฐ์ํ ๋ชจ๋ธ ๊ตฌํ์ ์๊ฐ์ด ์ง๋๋ ๋จ์์์ต๋๋ค. ์ด๊ฒ์ ์ฝ๋๊ฐ ์๋ฆ๋ต๋ค๋ ์ด์ ๊ฐ ์๋๋ผ ์ฝ๋๊ฐ ๋ช
ํํ๊ณ ๋๋ฒ๊น
๋ฐ ๊ฐ์ ์ด ์ฝ๊ธฐ ๋๋ฌธ์
๋๋ค. TensorFlow ๊ตฌํ์์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๊ณผ ํจํด์ ๋๊ฐ์ด ํ๊ณ Pytorch ๊ตฌํ๊ณผ์ ๋ถ์ผ์น๋ฅผ ์ต์ํํ์ฌ ๋ฉ์ธํ
์ด๋์ ์
๋ฌด๋ฅผ ์ฝ๊ฒ ํ๋ค๋ฉด, ๊ธฐ์ฌํ ์ฝ๋๊ฐ ์ค๋๋๋ก ์ ์ง๋ ์ ์์ต๋๋ค.
- ํ์ํ๋ค๋ฉด ๋์์ ์์ฒญํ์ธ์! ๐ค Transformers ํ์ ์ฌ๋ฌ๋ถ์ ๋๊ธฐ ์ํด ์์ผ๋ฉฐ, ์ฌ๋ฌ๋ถ์ด ์ง๋ฉดํ ๋์ผํ ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ์ฑ
์ ์ด๋ฏธ ์ฐพ์ ๊ฒฝ์ฐ๋ ์์ ์ ์์ต๋๋ค.
TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ๋ฅผ ์ถ๊ฐํ๋ ๋ฐ ํ์ํ ๋จ๊ณ๋ฅผ ๊ฐ๋ต์ ์ผ๋ก ์จ๋ณด๋ฉด:
1. ๋ณํํ๋ ค๋ ๋ชจ๋ธ ์ ํ
2. transformers ๊ฐ๋ฐ ํ๊ฒฝ ์ค๋น
3. (์ ํ ์ฌํญ) ์ด๋ก ์ ์ธก๋ฉด ๋ฐ ๊ธฐ์กด ๊ตฌํ ์ดํด
4. ๋ชจ๋ธ ์ํคํ
์ฒ ๊ตฌํ
5. ๋ชจ๋ธ ํ
์คํธ ๊ตฌํ
6. PR (pull request) ์ ์ถ
7. (์ ํ ์ฌํญ) ๋ฐ๋ชจ ๋น๋ ๋ฐ ๊ณต์
### 1.-3. ๋ชจ๋ธ ๊ธฐ์ฌ ์ค๋น [[1.-3.-prepare-your-model-contribution]]
**1. ๋ณํํ๋ ค๋ ๋ชจ๋ธ ์ ํ**
์ฐ์ ๊ธฐ๋ณธ ์ฌํญ๋ถํฐ ์์ํด ๋ณด๊ฒ ์ต๋๋ค. ๋จผ์ ๋ณํํ๋ ค๋ ์ํคํ
์ฒ๋ฅผ ์์์ผ ํฉ๋๋ค.
ํน์ ์ํคํ
์ฒ์ ๋ํ ๊ด์ฌ ์๋ ๊ฒฝ์ฐ, ๐ค Transformers ํ์๊ฒ ์ ์์ ์์ฒญํ๋ ๊ฒ์ ์ฌ๋ฌ๋ถ์ ์ํฅ๋ ฅ์ ๊ทน๋ํํ๋ ์ข์ ๋ฐฉ๋ฒ์
๋๋ค.
์ฐ๋ฆฌ๋ TensorFlow์์ ๋น ์ ธ ์๋ ๊ฐ์ฅ ์ ๋ช
ํ ์ํคํ
์ฒ๋ก ์ด๋์ด ๋๋ฆฌ๊ฒ ์ต๋๋ค.
TensorFlow์์ ์ฌ์ฉํ ๋ชจ๋ธ์ด ์ด๋ฏธ ๐ค Transformers์ TensorFlow ์ํคํ
์ฒ ๊ตฌํ์ด ์์ง๋ง ๊ฐ์ค์น๊ฐ ์๋ ๊ฒฝ์ฐ,
์ด ํ์ด์ง์ [๊ฐ์ค์น ์ถ๊ฐ ์น์
](#adding-tensorflow-weights-to-hub)์ผ๋ก ๋ฐ๋ก ์ด๋ํ์
๋ ๋ฉ๋๋ค.
๊ฐ๋จํ ๋งํด์, ์ด ์๋ด์์ ๋๋จธ์ง ๋ถ๋ถ์ TensorFlow ๋ฒ์ ์ *BrandNewBert*([๊ฐ์ด๋](add_new_model)์ ๋์ผํ ์์ )๋ฅผ ๊ธฐ์ฌํ๋ ค๊ณ ๊ฒฐ์ ํ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.
<Tip>
TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ์ ์์
์ ์์ํ๊ธฐ ์ ์ ํด๋น ์์
์ด ์งํ ์ค์ธ์ง ํ์ธํ์ธ์.
`BrandNewBert`๋ฅผ ๊ฒ์ํ์ฌ
[pull request GitHub ํ์ด์ง](https://github.com/huggingface/transformers/pulls?q=is%3Apr)์์ TensorFlow ๊ด๋ จ pull request๊ฐ ์๋์ง ํ์ธํ ์ ์์ต๋๋ค.
</Tip>
**2. transformers ๊ฐ๋ฐ ํ๊ฒฝ ์ค๋น**
๋ชจ๋ธ ์ํคํ
์ฒ๋ฅผ ์ ํํ ํ, ๊ด๋ จ ์์
์ ์ํํ ์๋๋ฅผ ๋ฏธ๋ฆฌ ์๋ฆฌ๊ธฐ ์ํด Draft PR์ ์ฌ์ธ์. ์๋ ์ง์นจ๋๋ก ํ์๋ฉด ํ๊ฒฝ์ ์ค์ ํ๊ณ Draft PR์ ์ด ์ ์์ต๋๋ค.
1. 'Fork' ๋ฒํผ์ ํด๋ฆญํ์ฌ [๋ฆฌํฌ์งํฐ๋ฆฌ](https://github.com/huggingface/transformers)๋ฅผ ํฌํฌํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด GitHub ์ฌ์ฉ์ ๊ณ์ ์ ์ฝ๋์ ์ฌ๋ณธ์ด ์์ฑ๋ฉ๋๋ค.
2. `transformers` ํฌํฌ๋ฅผ ๋ก์ปฌ ๋์คํฌ์ ํด๋ก ํ๊ณ ์๋ณธ ๋ฆฌํฌ์งํฐ๋ฆฌ๋ฅผ ์๊ฒฉ ๋ฆฌํฌ์งํฐ๋ฆฌ๋ก ์ถ๊ฐํ์ธ์.
```bash
git clone https://github.com/[your Github handle]/transformers.git
cd transformers
git remote add upstream https://github.com/huggingface/transformers.git
```
3. ๊ฐ๋ฐ ํ๊ฒฝ์ ์ค์ ํ์ธ์. ์๋ฅผ ๋ค์ด, ๋ค์ ๋ช
๋ น์ ์คํํ์ฌ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ค์ ํ ์ ์์ต๋๋ค.
```bash
python -m venv .env
source .env/bin/activate
pip install -e ".[dev]"
```
์ด์ ์ฒด์ ์ ๋ฐ๋ผ์ Transformers์ ์ ํ์ ์ข
์์ฑ์ด ์ฆ๊ฐํ๋ฉด์ ์ ๋ช
๋ น์ด ์คํจํ ์๋ ์์ต๋๋ค. ๊ทธ๋ฐ ๊ฒฝ์ฐ TensorFlow๋ฅผ ์ค์นํ ํ ๋ค์์ ์คํํ์ธ์.
```bash
pip install -e ".[quality]"
```
**์ฐธ๊ณ :** CUDA๋ฅผ ์ค์นํ ํ์๋ ์์ต๋๋ค. ์๋ก์ด ๋ชจ๋ธ์ด CPU์์ ์๋ํ๋๋ก ๋ง๋๋ ๊ฒ๋ง์ผ๋ก ์ถฉ๋ถํฉ๋๋ค.
4. ๋ฉ์ธ ๋ธ๋์น์์ ๋ง๋๋ ค๋ ๊ธฐ๋ฅ์ด ์ ํํ๋๋ ์ด๋ฆ์ผ๋ก ๋ธ๋์น๋ฅผ ๋ง๋ญ๋๋ค.
```bash
git checkout -b add_tf_brand_new_bert
```
5. ๋ฉ์ธ ๋ธ๋์น์ ํ์ฌ ์ํ๋ฅผ ํ์น(fetch)ํ๊ณ ๋ฆฌ๋ฒ ์ด์คํ์ธ์.
```bash
git fetch upstream
git rebase upstream/main
```
6. `transformers/src/models/brandnewbert/`์ `modeling_tf_brandnewbert.py`๋ผ๋ ๋น `.py` ํ์ผ์ ์ถ๊ฐํ์ธ์. ์ด ํ์ผ์ด TensorFlow ๋ชจ๋ธ ํ์ผ์ด ๋ ๊ฒ์
๋๋ค.
7. ๋ณ๊ฒฝ ์ฌํญ์ ๊ณ์ ์ ํธ์ํ์ธ์.
```bash
git add .
git commit -m "initial commit"
git push -u origin add_tf_brand_new_bert
```
8. ๋ง์กฑ์ค๋ฌ์ด ๊ฒฝ์ฐ GitHub์์ ํฌํฌ๋ ์น ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค. "Pull request"๋ฅผ ํด๋ฆญํฉ๋๋ค. Hugging Face ํ์ GitHub ID๋ฅผ ๋ฆฌ๋ทฐ์ด๋ก ์ถ๊ฐํด์, ์์ผ๋ก์ ๋ณ๊ฒฝ ์ฌํญ์ ๋ํด Hugging Face ํ์ด ์๋ฆผ์ ๋ฐ์ ์ ์๋๋ก ํฉ๋๋ค.
9. GitHub Pull Requests ํ์ด์ง์ ์ค๋ฅธ์ชฝ์ ์๋ "Convert to draft"๋ฅผ ํด๋ฆญํ์ฌ PR์ ์ด์์ผ๋ก ๋ณ๊ฒฝํ์ธ์.
์ด์ ๐ค Transformers์์ *BrandNewBert*๋ฅผ TensorFlow๋ก ๋ณํํ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ค์ ํ์ต๋๋ค.
**3. (์ ํ ์ฌํญ) ์ด๋ก ์ ์ธก๋ฉด ๋ฐ ๊ธฐ์กด ๊ตฌํ ์ดํด**
*BrandNewBert*์ฒ๋ผ ์์ธํ ๊ธ์ด ์๋ค๋ฉด ์๊ฐ์ ๋ด์ด ๋
ผ๋ฌธ์ ์ฝ๋๊ฑธ ์ถ์ฒ๋๋ฆฝ๋๋ค. ์ดํดํ๊ธฐ ์ด๋ ค์ด ๋ถ๋ถ์ด ๋ง์ ์ ์์ต๋๋ค. ๊ทธ๋ ๋ค๊ณ ํด์ ๊ฑฑ์ ํ์ง ๋ง์ธ์! ๋ชฉํ๋ ๋
ผ๋ฌธ์ ์ฌ๋์๋ ์ด๋ก ์ ์ดํด๊ฐ ์๋๋ผ TensorFlow๋ฅผ ์ฌ์ฉํ์ฌ ๐ค Transformers์ ๋ชจ๋ธ์ ํจ๊ณผ์ ์ผ๋ก ๋ค์ ๊ตฌํํ๋ ๋ฐ ํ์ํ ํ์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ๊ฒ์
๋๋ค. ๋ง์ ์๊ฐ์ ์ด๋ก ์ ์ดํด์ ํฌ์ํ ํ์๋ ์์ง๋ง ์ค์ฉ์ ์ธ ์ธก๋ฉด์์ ํ์ฌ ์กด์ฌํ๋ ๋ชจ๋ธ ๋ฌธ์ ํ์ด์ง(e.g. [model docs for BERT](model_doc/bert))์ ์ง์คํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
๋ชจ๋ธ์ ๊ธฐ๋ณธ ์ฌํญ์ ์ดํดํ ํ, ๊ธฐ์กด ๊ตฌํ์ ์ดํดํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ์ด๋ ์์
์ค์ธ ๋ชจ๋ธ์ ๋ํ ์ค์ ๊ตฌํ์ด ์ฌ๋ฌ๋ถ์ ๊ธฐ๋์ ์ผ์นํจ์ ํ์ธํ๊ณ , TensorFlow ์ธก๋ฉด์์์ ๊ธฐ์ ์ ๋ฌธ์ ๋ฅผ ์์ํ ์ ์์ต๋๋ค.
๋ง๋ํ ์์ ์ ๋ณด๋ฅผ ์ฒ์์ผ๋ก ํ์ตํ ๋ ์๋๋นํ๋ ๊ฒ์ ์์ฐ์ค๋ฌ์ด ์ผ์
๋๋ค. ์ด ๋จ๊ณ์์ ๋ชจ๋ธ์ ๋ชจ๋ ์ธก๋ฉด์ ์ดํดํด์ผ ํ๋ ํ์๋ ์ ํ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ Hugging Face์ [ํฌ๋ผ](https://discuss.huggingface.co/)์ ํตํด ์ง๋ฌธ์ด ์๋ ๊ฒฝ์ฐ ๋๋ต์ ๊ตฌํ ๊ฒ์ ๊ถ์ฅํฉ๋๋ค.
### 4. ๋ชจ๋ธ ๊ตฌํ [[4-model-implementation]]
์ด์ ๋๋์ด ์ฝ๋ฉ์ ์์ํ ์๊ฐ์
๋๋ค. ์ฐ๋ฆฌ์ ์ ์๋ ์์์ ์ PyTorch ํ์ผ ์์ฒด์
๋๋ค: `modeling_brand_new_bert.py`์ ๋ด์ฉ์
`src/transformers/models/brand_new_bert/` ๋ด๋ถ์
`modeling_tf_brand_new_bert.py`์ ๋ณต์ฌํฉ๋๋ค. ์ด ์น์
์ ๋ชฉํ๋ ํ์ผ์ ์์ ํ๊ณ ๐ค Transformers์ import ๊ตฌ์กฐ๋ฅผ ์
๋ฐ์ดํธํ์ฌ `TFBrandNewBert` ๋ฐ `TFBrandNewBert.from_pretrained(model_repo, from_pt=True)`๊ฐ ์ฑ๊ณต์ ์ผ๋ก ์๋ํ๋ TensorFlow *BrandNewBert* ๋ชจ๋ธ์ ๊ฐ์ ธ์ฌ ์ ์๋๋ก ํ๋ ๊ฒ์
๋๋ค.
์ ๊ฐ์ค๋ฝ๊ฒ๋, PyTorch ๋ชจ๋ธ์ TensorFlow๋ก ๋ณํํ๋ ๊ท์น์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ํ๋ก์ธ์ค๋ฅผ ๊ฐ๋ฅํํ ์ํํ๊ฒ ๋ง๋ค๊ธฐ ์ํด ๋ค์ ํ์ ๋ฐ๋ฅผ ์ ์์ต๋๋ค.
- ๋ชจ๋ ํด๋์ค ์ด๋ฆ ์์ `TF`๋ฅผ ๋ถ์
๋๋ค(์: `BrandNewBert`๋ `TFBrandNewBert`๊ฐ ๋ฉ๋๋ค).
- ๋๋ถ๋ถ์ PyTorch ์์
์๋ ์ง์ ์ ์ธ TensorFlow ๋์ฒด๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, `torch.nn.Linear`๋ `tf.keras.layers.Dense`์ ํด๋นํ๊ณ , `torch.nn.Dropout`์ `tf.keras.layers.Dropout`์ ํด๋นํฉ๋๋ค. ํน์ ์์
์ ๋ํด ํ์ ์ด ์๋ ๊ฒฝ์ฐ [TensorFlow ๋ฌธ์](https://www.tensorflow.org/api_docs/python/tf)๋ [PyTorch ๋ฌธ์](https://pytorch.org/docs/stable/)๋ฅผ ์ฐธ์กฐํ ์ ์์ต๋๋ค.
- ๐ค Transformers ์ฝ๋๋ฒ ์ด์ค์์ ํจํด์ ์ฐพ์ผ์ธ์. ์ง์ ์ ์ธ ๋์ฒด๊ฐ ์๋ ํน์ ์์
์ ๋ง๋๋ฉด ๋ค๋ฅธ ์ฌ๋์ด ์ด๋ฏธ ๋์ผํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
- ๊ธฐ๋ณธ์ ์ผ๋ก PyTorch์ ๋์ผํ ๋ณ์ ์ด๋ฆ๊ณผ ๊ตฌ์กฐ๋ฅผ ์ ์งํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด ๋๋ฒ๊น
๊ณผ ๋ฌธ์ ์ถ์ , ๊ทธ๋ฆฌ๊ณ ๋ฌธ์ ํด๊ฒฐ ์ถ๊ฐ๊ฐ ๋ ์ฌ์์ง๋๋ค.
- ์ผ๋ถ ๋ ์ด์ด๋ ๊ฐ ํ๋ ์์ํฌ๋ง๋ค ๋ค๋ฅธ ๊ธฐ๋ณธ๊ฐ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๋ํ์ ์ธ ์๋ก ๋ฐฐ์น ์ ๊ทํ ๋ ์ด์ด์ epsilon์ [PyTorch](https://pytorch.org/docs/stable/generated/torch.nn.BatchNorm2d.html#torch.nn.BatchNorm2d)์์ `1e-5`์ด๊ณ [TensorFlow](https://www.tensorflow.org/api_docs/python/tf/keras/layers/BatchNormalization)์์ `1e-3`์
๋๋ค. ๋ฌธ์๋ฅผ ๋ชจ๋ ํ์ธํ์ธ์!
- PyTorch์ `nn.Parameter` ๋ณ์๋ ์ผ๋ฐ์ ์ผ๋ก TF ๋ ์ด์ด์ `build()` ๋ด์์ ์ด๊ธฐํํด์ผ ํฉ๋๋ค. ๋ค์ ์๋ฅผ ์ฐธ์กฐํ์ธ์: [PyTorch](https://github.com/huggingface/transformers/blob/655f72a6896c0533b1bdee519ed65a059c2425ac/src/transformers/models/vit_mae/modeling_vit_mae.py#L212) /
[TensorFlow](https://github.com/huggingface/transformers/blob/655f72a6896c0533b1bdee519ed65a059c2425ac/src/transformers/models/vit_mae/modeling_tf_vit_mae.py#L220)
- PyTorch ๋ชจ๋ธ์ ํจ์ ์๋จ์ `#copied from ...`๊ฐ ์๋ ๊ฒฝ์ฐ, TensorFlow ๋ชจ๋ธ์ TensorFlow ์ํคํ
์ฒ๊ฐ ์๋ค๋ฉด TensorFlow ๋ชจ๋ธ์ด ํด๋น ํจ์๋ฅผ ๋ณต์ฌํ ์ํคํ
์ฒ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
- TensorFlow ํจ์์์ `name` ์์ฑ์ ์ฌ๋ฐ๋ฅด๊ฒ ํ ๋นํ๋ ๊ฒ์ `from_pt=True` ๊ฐ์ค์น ๊ต์ฐจ ๋ก๋ฉ์ ์ํํ๋ ๋ฐ ์ค์ํฉ๋๋ค. `name`์ ๋๋ถ๋ถ PyTorch ์ฝ๋์ ํด๋น ๋ณ์์ ์ด๋ฆ์
๋๋ค. `name`์ด ์ ๋๋ก ์ค์ ๋์ง ์์ผ๋ฉด ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ๋ก๋ํ ๋ ์ค๋ฅ ๋ฉ์์ง์์ ํ์ธํ ์ ์์ต๋๋ค.
- ๊ธฐ๋ณธ ๋ชจ๋ธ ํด๋์ค์ธ `BrandNewBertModel`์ ๋ก์ง์ ์ค์ ๋ก Keras ๋ ์ด์ด ์๋ธํด๋์ค([์์](https://github.com/huggingface/transformers/blob/4fd32a1f499e45f009c2c0dea4d81c321cba7e02/src/transformers/models/bert/modeling_tf_bert.py#L719))์ธ `TFBrandNewBertMainLayer`์ ์์ต๋๋ค. `TFBrandNewBertModel`์ ์ด ๋ ์ด์ด๋ฅผ ๊ฐ์ธ๊ธฐ๋ง ํ๋ ๋ํผ ์ญํ ์ ํฉ๋๋ค.
- Keras ๋ชจ๋ธ์ ์ฌ์ ํ๋ จ๋ ๊ฐ์ค์น๋ฅผ ๋ก๋ํ๊ธฐ ์ํด ๋น๋๋์ด์ผ ํฉ๋๋ค. ๋ฐ๋ผ์ `TFBrandNewBertPreTrainedModel`์ ๋ชจ๋ธ์ ์
๋ ฅ ์์ ์ธ `dummy_inputs`([์์](https://github.com/huggingface/transformers/blob/4fd32a1f499e45f009c2c0dea4d81c321cba7e02/src/transformers/models/bert/modeling_tf_bert.py#L916)) ์ ์งํด์ผ ํฉ๋๋ค.
- ๋์์ด ํ์ํ ๊ฒฝ์ฐ ๋์์ ์์ฒญํ์ธ์. ์ฐ๋ฆฌ๋ ์ฌ๊ธฐ ์์ด์ ๋์์ ๋๋ฆฌ๊ธฐ ์ํด ์๋ ๊ฒ์
๋๋ค! ๐ค
๋ชจ๋ธ ํ์ผ ์์ฒด ์ธ์๋ ๋ชจ๋ธ ํด๋์ค ๋ฐ ๊ด๋ จ ๋ฌธ์ ํ์ด์ง์ ๋ํ ํฌ์ธํฐ๋ฅผ ์ถ๊ฐํด์ผ ํฉ๋๋ค. ์ด ๋ถ๋ถ์ ๋ค๋ฅธ PR([์์](https://github.com/huggingface/transformers/pull/18020/files))์ ํจํด์ ๋ฐ๋ผ ์์ ํ ์๋ฃํ ์ ์์ต๋๋ค. ๋ค์์ ํ์ํ ์๋ ๋ณ๊ฒฝ ๋ชฉ๋ก์
๋๋ค.
- `src/transformers/__init__.py`์ *BrandNewBert*์ ๋ชจ๋ ๊ณต๊ฐ ํด๋์ค๋ฅผ ํฌํจํฉ๋๋ค.
- `src/transformers/models/auto/modeling_tf_auto.py`์์ *BrandNewBert* ํด๋์ค๋ฅผ ํด๋น Auto ํด๋์ค์ ์ถ๊ฐํฉ๋๋ค.
- `src/transformers/utils/dummy_tf_objects.py`์ *BrandNewBert*์ ๊ด๋ จ๋ ๋ ์ด์ง ๋ก๋ฉ ํด๋์ค๋ฅผ ์ถ๊ฐํฉ๋๋ค.
- `src/transformers/models/brand_new_bert/__init__.py`์์ ๊ณต๊ฐ ํด๋์ค์ ๋ํ import ๊ตฌ์กฐ๋ฅผ ์
๋ฐ์ดํธํฉ๋๋ค.
- `docs/source/en/model_doc/brand_new_bert.md`์์ *BrandNewBert*์ ๊ณต๊ฐ ๋ฉ์๋์ ๋ํ ๋ฌธ์ ํฌ์ธํฐ๋ฅผ ์ถ๊ฐํฉ๋๋ค.
- `docs/source/en/model_doc/brand_new_bert.md`์ *BrandNewBert* ๊ธฐ์ฌ์ ๋ชฉ๋ก์ ์์ ์ ์ถ๊ฐํฉ๋๋ค.
- ๋ง์ง๋ง์ผ๋ก โ
๋
น์ ์ฒดํฌ๋ฐ์ค๋ฅผ TensorFlow ์ด docs/source/en/index.md ์ BrandNewBert์ ์ถ๊ฐํฉ๋๋ค.
๊ตฌํ์ด ๋ง์กฑํ๋ฉด ๋ค์ ์ฒดํฌ๋ฆฌ์คํธ๋ฅผ ์คํํ์ฌ ๋ชจ๋ธ ์ํคํ
์ฒ๊ฐ ์ค๋น๋์๋์ง ํ์ธํ์ธ์.
1. ํ๋ จ ์๊ฐ์ ๋ค๋ฅด๊ฒ ๋์ํ๋ `training` ์ธ์๋ก ๋ถ๋ฆฌ๋ ๋ชจ๋ ๋ ์ด์ด(์: Dropout)๋ ์ต์์ ํด๋์ค์์ ์ ํ๋ฉ๋๋ค.
2. #copied from ...๊ฐ๋ฅํ ๋๋ง๋ค ์ฌ์ฉํ์ต๋๋ค.
3. `TFBrandNewBertMainLayer`์ ๊ทธ๊ฒ์ ์ฌ์ฉํ๋ ๋ชจ๋ ํด๋์ค๋ `call`ํจ์๋ก `@unpack_inputs`์ ํจ๊ป ๋ฐ์ฝ๋ ์ดํฐ ๋ฉ๋๋ค.
4. `TFBrandNewBertMainLayer`๋ `@keras_serializable`๋ก ๋ฐ์ฝ๋ ์ดํฐ ๋ฉ๋๋ค.
5. TensorFlow ๋ชจ๋ธ์ `TFBrandNewBert.from_pretrained(model_repo, from_pt=True)`๋ฅผ ์ฌ์ฉํ์ฌ PyTorch ๊ฐ์ค์น์์ ๋ก๋ํ ์ ์์ต๋๋ค.
6. ์์ ์
๋ ฅ ํ์์ ์ฌ์ฉํ์ฌ TensorFlow ๋ชจ๋ธ์ ํธ์ถํ ์ ์์ต๋๋ค.
### 5. ๋ชจ๋ธ ํ
์คํธ ๊ตฌํ [[5-add-model-tests]]
TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ๋ฅผ ๊ตฌํํ๋ ๋ฐ ์ฑ๊ณตํ์ต๋๋ค! ์ด์ TensorFlow ๋ชจ๋ธ์ ํ
์คํธํ๋ ๊ตฌํ์ ์์ฑํ ์ฐจ๋ก์
๋๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ด ์์๋๋ก ์๋ํ๋์ง ํ์ธํ ์ ์์ต๋๋ค. ์ด์ ์ ์ฐ๋ฆฌ๋ `test_modeling_brand_new_bert.py` ํ์ผ์ `tests/models/brand_new_bert/ into test_modeling_tf_brand_new_bert.py`์ ๋ณต์ฌํ ๋ค, TensorFlow๋ก ๊ต์ฒดํ๋ ๊ฒ์ด ์ข์ต๋๋ค. ์ง๊ธ์, ๋ชจ๋ `.from_pretrained()`์ `from_pt=True`๋ฅผ ์ฌ์ฉํ์ฌ ์กด์ฌํ๋ Pytorch ๊ฐ์ค์น๋ฅผ ๊ฐ์ ธ์ค๋๋ก ํด์ผํฉ๋๋ค.
์๋ฃํ์
จ์ผ๋ฉด, ์ด์ ์ง์ค์ ์๊ฐ์ด ์ฐพ์์์ต๋๋ค: ํ
์คํธ๋ฅผ ์คํํด ๋ณด์ธ์! ๐ฌ
```bash
NVIDIA_TF32_OVERRIDE=0 RUN_SLOW=1 RUN_PT_TF_CROSS_TESTS=1 \
py.test -vv tests/models/brand_new_bert/test_modeling_tf_brand_new_bert.py
```
์ค๋ฅ๊ฐ ๋ง์ด ๋ํ๋ ๊ฒ์ด์ง๋ง ๊ด์ฐฎ์ต๋๋ค! ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ๋๋ฒ๊น
ํ๋ ๊ฒ์ ์
๋ช
๋๊ฒ ์ด๋ ค์ฐ๋ฉฐ ์ฑ๊ณต์ ํต์ฌ ์์๋ ์ธ๋ด์ฌ์
๋๋ค (`breakpoint()`๋ ํ์ํฉ๋๋ค). ์ฐ๋ฆฌ์ ๊ฒฝํ์์ผ๋ก๋ ML ํ๋ ์์ํฌ ์ฌ์ด์ ๋ฏธ๋ฌํ ๋ถ์ผ์น๋ก ์ธํด ๊ฐ์ฅ ์ด๋ ค์ด ๋ฌธ์ ๊ฐ ๋ฐ์ํฉ๋๋ค. ์ด์ ๋ํ ๋ช ๊ฐ์ง ์ง์นจ์ด ์ด ๊ฐ์ด๋์ ๋ ๋ถ๋ถ์ ์์ต๋๋ค. ๋ค๋ฅธ ๊ฒฝ์ฐ์๋ ์ผ๋ฐ ํ
์คํธ๊ฐ ์ง์ ๋ชจ๋ธ์ ์ ์ฉ๋์ง ์์ ์ ์์ผ๋ฉฐ, ์ด ๊ฒฝ์ฐ ๋ชจ๋ธ ํ
์คํธ ํด๋์ค ๋ ๋ฒจ์์ ์ฌ์ ์๋ฅผ ์ ์ํฉ๋๋ค. ๋ฌธ์ ๊ฐ ๋ฌด์์ด๋ ์ง ์๊ด์์ด ๋ฌธ์ ๊ฐ ์์ผ๋ฉด ๋น์ ์ด ๊ณ ๋ฆฝ๋์๋ค๋ฉด draft pull request์์ ๋์์ ์์ฒญํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
๋ชจ๋ ํ
์คํธ๊ฐ ํต๊ณผ๋๋ฉด ์ถํํฉ๋๋ค. ์ด์ ๋ชจ๋ธ์ ๐ค Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์ถ๊ฐํ ์ค๋น๊ฐ ๊ฑฐ์ ์๋ฃ๋ ๊ฒ์
๋๋ค! ๐
ํ
์คํธ๋ฅผ ์ถ๊ฐํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์์ธํ ๋ด์ฉ์ [๐ค Transformers์ ํ
์คํธ ๊ฐ์ด๋](https://huggingface.co/transformers/contributing.html#running-tests)๋ฅผ ์ฐธ์กฐํ์ธ์.
### 6.-7. ๋ชจ๋ ์ฌ์ฉ์๊ฐ ๋น์ ์ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๊ฒ ํ๊ธฐ [[6.-7.-ensure-everyone -can-use-your-model]]
**6. ํ ์์ฒญ ์ ์ถํ๊ธฐ**
๊ตฌํ๊ณผ ํ
์คํธ๊ฐ ์๋ฃ๋๋ฉด ํ ์์ฒญ์ ์ ์ถํ ์๊ฐ์
๋๋ค. ์ฝ๋๋ฅผ ํธ์ํ๊ธฐ ์ ์ ์ฝ๋ ์์ ๋ง์ถ๊ธฐ ์ ํธ๋ฆฌํฐ์ธ `make fixup` ๐ช ๋ฅผ ์คํํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด ์๋์ผ๋ก ์์ ์ค๋ฅ๋ฅผ ์์ ํ๋ฉฐ ์๋ ๊ฒ์ฌ๊ฐ ์คํจํ๋ ๊ฒ์ ๋ฐฉ์งํ ์ ์์ต๋๋ค.
์ด์ ๋๋ํํธ ํ ์์ฒญ์ ์ค์ ํ ์์ฒญ์ผ๋ก ๋ณํํ๋ ์๊ฐ์
๋๋ค. "๋ฆฌ๋ทฐ ์ค๋น๋จ" ๋ฒํผ์ ํด๋ฆญํ๊ณ Joao (`@gante`)์ Matt (`@Rocketknight1`)๋ฅผ ๋ฆฌ๋ทฐ์ด๋ก ์ถ๊ฐํ์ธ์. ๋ชจ๋ธ ํ ์์ฒญ์๋ ์ ์ด๋ 3๋ช
์ ๋ฆฌ๋ทฐ์ด๊ฐ ํ์ํ์ง๋ง, ๊ทธ๋ค์ด ๋น์ ์ ๋ชจ๋ธ์ ์ ์ ํ ์ถ๊ฐ ๋ฆฌ๋ทฐ์ด๋ฅผ ์ฐพ์ ๊ฒ์
๋๋ค.
๋ชจ๋ ๋ฆฌ๋ทฐ์ด๋ค์ด PR ์ํ์ ๋ง์กฑํ๋ฉด ๋ง์ง๋ง์ผ๋ก `.from_pretrained()` ํธ์ถ์์ `from_pt=True` ํ๋๊ทธ๋ฅผ ์ ๊ฑฐํ๋ ๊ฒ์
๋๋ค. TensorFlow ๊ฐ์ค์น๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ์ถ๊ฐํด์ผ ํฉ๋๋ค! ์ด๋ฅผ ์ํํ๋ ๋ฐฉ๋ฒ์ ์๋ ์น์
์ ์ง์นจ์ ํ์ธํ์ธ์.
๋ง์นจ๋ด TensorFlow ๊ฐ์ค์น๊ฐ ๋ณํฉ๋๊ณ , ์ ์ด๋ 3๋ช
์ ๋ฆฌ๋ทฐ์ด ์น์ธ์ ๋ฐ์์ผ๋ฉฐ ๋ชจ๋ CI ๊ฒ์ฌ๊ฐ ํต๊ณผ๋์๋ค๋ฉด, ๋ก์ปฌ๋ก ํ
์คํธ๋ฅผ ํ ๋ฒ ๋ ํ์ธํ์ธ์.
```bash
NVIDIA_TF32_OVERRIDE=0 RUN_SLOW=1 RUN_PT_TF_CROSS_TESTS=1 \
py.test -vv tests/models/brand_new_bert/test_modeling_tf_brand_new_bert.py
```
๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๋ ๋น์ ์ PR์ ๋ณํฉํ ๊ฒ์
๋๋ค! ๋ง์ผ์คํค ๋ฌ์ฑ์ ์ถํ๋๋ฆฝ๋๋ค! ๐
**7. (์ ํ ์ฌํญ) ๋ฐ๋ชจ๋ฅผ ๋ง๋ค๊ณ ์ธ์๊ณผ ๊ณต์ ํ๊ธฐ**
์คํ ์์ค์ ๊ฐ์ฅ ์ด๋ ค์ด ๋ถ๋ถ ์ค ํ๋๋ ๋ฐ๊ฒฌ์
๋๋ค. ๋ค๋ฅธ ์ฌ์ฉ์๋ค์ด ๋น์ ์ ๋ฉ์ง TensorFlow ๊ธฐ์ฌ๋ฅผ ์ด๋ป๊ฒ ์ ์ ์์๊น์? ๋ฌผ๋ก ์ ์ ํ ์ปค๋ฎค๋์ผ์ด์
์ผ๋ก ๊ฐ๋ฅํฉ๋๋ค! ๐ฃ
์ปค๋ฎค๋ํฐ์ ๋ชจ๋ธ์ ๊ณต์ ํ๋ ๋ ๊ฐ์ง ์ฃผ์ ๋ฐฉ๋ฒ์ด ์์ต๋๋ค:
- ๋ฐ๋ชจ ๋ง๋ค๊ธฐ. Gradio ๋ฐ๋ชจ, ๋
ธํธ๋ถ ๋ฐ ๋ชจ๋ธ์ ์๋ํ๋ ๋ค๋ฅธ ์ฌ๋ฏธ์๋ ๋ฐฉ๋ฒ์ ํฌํจํฉ๋๋ค. [์ปค๋ฎค๋ํฐ ๊ธฐ๋ฐ ๋ฐ๋ชจ](https://huggingface.co/docs/transformers/community)์ ๋
ธํธ๋ถ์ ์ถ๊ฐํ๋ ๊ฒ์ ์ ๊ทน ๊ถ์ฅํฉ๋๋ค.
- Twitter์ LinkedIn๊ณผ ๊ฐ์ ์์
๋ฏธ๋์ด์ ์ด์ผ๊ธฐ ๊ณต์ ํ๊ธฐ. ๋น์ ์ ์์
์ ์๋์ค๋ฌ์ํ๊ณ ์ปค๋ฎค๋ํฐ์ ๋น์ ์ ์
์ ์ ๊ณต์ ํด์ผ ํฉ๋๋ค. ์ด์ ๋น์ ์ ๋ชจ๋ธ์ ์ ์ธ๊ณ์ ์์ฒ ๋ช
์ ์์ง๋์ด์ ์ฐ๊ตฌ์๋ค์ ์ํด ์ฌ์ฉ๋ ์ ์์ต๋๋ค ๐! ์ฐ๋ฆฌ๋ ๋น์ ์ ๊ฒ์๋ฌผ์ ๋ฆฌํธ์ํ๊ณ ์ปค๋ฎค๋ํฐ์ ํจ๊ป ๋น์ ์ ์์
์ ๊ณต์ ํ๋ ๋ฐ ๋์์ด ๋ ๊ฒ์
๋๋ค.
## ๐ค ํ๋ธ์ TensorFlow ๊ฐ์ค์น ์ถ๊ฐํ๊ธฐ [[adding-tensorFlow-weights-to-๐ค-hub]]
TensorFlow ๋ชจ๋ธ ์ํคํ
์ฒ๊ฐ ๐ค Transformers์์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค๊ณ ๊ฐ์ ํ๊ณ , PyTorch ๊ฐ์ค์น๋ฅผ TensorFlow ๊ฐ์ค์น๋ก ๋ณํํ๋ ๊ฒ์ ์ฝ์ต๋๋ค!
๋ค์์ ๊ทธ ๋ฐฉ๋ฒ์
๋๋ค:
1. ํฐ๋ฏธ๋์์ Hugging Face ๊ณ์ ์ผ๋ก ๋ก๊ทธ์ธ๋์ด ์๋์ง ํ์ธํ์ญ์์ค. `huggingface-cli login` ๋ช
๋ น์ด๋ฅผ ์ฌ์ฉํ์ฌ ๋ก๊ทธ์ธํ ์ ์์ต๋๋ค. (์ก์ธ์ค ํ ํฐ์ [์ฌ๊ธฐ](https://huggingface.co/settings/tokens)์์ ์ฐพ์ ์ ์์ต๋๋ค.)
2. `transformers-cli pt-to-tf --model-name foo/bar`๋ฅผ ์คํํ์ญ์์ค. ์ฌ๊ธฐ์ `foo/bar`๋ ๋ณํํ๋ ค๋ PyTorch ๊ฐ์ค์น๊ฐ ์๋ ๋ชจ๋ธ ์ ์ฅ์์ ์ด๋ฆ์
๋๋ค.
3. ๋ฐฉ๊ธ ๋ง๋ ๐ค ํ๋ธ PR์์ `@joaogante`์ `@Rocketknight1`์ ํ๊ทธํฉ๋๋ค.
๊ทธ๊ฒ ๋ค์
๋๋ค! ๐
## ML ํ๋ ์์ํฌ ๊ฐ ๋๋ฒ๊น
๐[[debugging-mismatches-across-ml-frameworks]]
์๋ก์ด ์ํคํ
์ฒ๋ฅผ ์ถ๊ฐํ๊ฑฐ๋ ๊ธฐ์กด ์ํคํ
์ฒ์ ๋ํ TensorFlow ๊ฐ์ค์น๋ฅผ ์์ฑํ ๋, PyTorch์ TensorFlow ๊ฐ์ ๋ถ์ผ์น๋ก ์ธํ ์ค๋ฅ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. ์ฌ์ง์ด ๋ ํ๋ ์์ํฌ์ ๋ชจ๋ธ ์ํคํ
์ฒ ์ฝ๋๊ฐ ๋์ผํด ๋ณด์ผ ์๋ ์์ต๋๋ค. ๋ฌด์จ ์ผ์ด ๋ฒ์ด์ง๊ณ ์๋ ๊ฑธ๊น์? ๐ค
๋จผ์ , ์ด๋ฌํ ๋ถ์ผ์น๋ฅผ ์ดํดํ๋ ์ด์ ์ ๋ํด ์ด์ผ๊ธฐํด ๋ณด๊ฒ ์ต๋๋ค. ๋ง์ ์ปค๋ฎค๋ํฐ ๋ฉค๋ฒ๋ค์ ๐ค Transformers ๋ชจ๋ธ์ ๊ทธ๋๋ก ์ฌ์ฉํ๊ณ , ์ฐ๋ฆฌ์ ๋ชจ๋ธ์ด ์์๋๋ก ์๋ํ ๊ฒ์ด๋ผ๊ณ ๋ฏฟ์ต๋๋ค. ๋ ํ๋ ์์ํฌ ๊ฐ์ ํฐ ๋ถ์ผ์น๊ฐ ์์ผ๋ฉด ๋ชจ๋ธ์ด ์ ์ด๋ ํ๋์ ํ๋ ์์ํฌ์ ๋ํ ์ฐธ์กฐ ๊ตฌํ์ ๋ฐ๋ฅด์ง ์์์ ์๋ฏธํฉ๋๋ค. ์ด๋ ๋ชจ๋ธ์ด ์๋ํ ๋๋ก ์๋ํ์ง ์์ ์ ์์์ ๋ํ๋
๋๋ค. ์ด๋ ์์ ์คํ๋์ง ์๋ ๋ชจ๋ธ๋ณด๋ค ๋์ ์ ์์ต๋๋ค! ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ ๋ชจ๋ ๋ชจ๋ธ์ ํ๋ ์์ํฌ ๋ถ์ผ์น๋ฅผ `1e-5`๋ณด๋ค ์๊ฒ ์ ์งํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
๊ธฐํ ์ซ์ ๋ฌธ์ ์ ๋ง์ฐฌ๊ฐ์ง๋ก, ์ธ์ธํ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ธ์ธํจ์ ์ง์คํ๋ ๊ณต์ ์์ ํ์ ์์๋ ์ธ๋ด์ฌ์
๋๋ค. ์ด๋ฌํ ์ข
๋ฅ์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ๋ ๊ถ์ฅ๋๋ ์์
ํ๋ฆ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
1. ๋ถ์ผ์น์ ์์ธ์ ์ฐพ์๋ณด์ญ์์ค. ๋ณํ ์ค์ธ ๋ชจ๋ธ์ ์๋ง๋ ํน์ ์ง์ ๊น์ง ๊ฑฐ์ ๋์ผํ ๋ด๋ถ ๋ณ์๋ฅผ ๊ฐ์ง๊ณ ์์ ๊ฒ์
๋๋ค. ๋ ํ๋ ์์ํฌ์ ์ํคํ
์ฒ์ `breakpoint()` ๋ฌธ์ ๋ฃ๊ณ , ์์์ ์๋๋ก ์ซ์ ๋ณ์์ ๊ฐ์ ๋น๊ตํ์ฌ ๋ฌธ์ ์ ๊ทผ์์ ์ฐพ์๋
๋๋ค.
2. ์ด์ ๋ฌธ์ ์ ๊ทผ์์ ์ฐพ์์ผ๋ฏ๋ก ๐ค Transformers ํ์ ์ฐ๋ฝํ์ธ์. ์ฐ๋ฆฌ๋ ๋น์ทํ ๋ฌธ์ ๋ฅผ ์ด์ ์ ๊ฒช์์ ์ ์์ผ๋ฉฐ ๋น ๋ฅด๊ฒ ํด๊ฒฐ์ฑ
์ ์ ๊ณตํ ์ ์์ต๋๋ค. ์์ธ์ ์ธ ๊ฒฝ์ฐ์๋ StackOverflow์ GitHub ์ด์์ ๊ฐ์ ์ธ๊ธฐ์๋ ํ์ด์ง๋ฅผ ํ์ธํ์ญ์์ค.
3. ๋ ์ด์ ํด๊ฒฐ์ฑ
์ด ์๋ ๊ฒฝ์ฐ, ๋ ๊น์ด ๋ค์ด๊ฐ์ผ ํฉ๋๋ค. ์ข์ ์์์ ๋ฌธ์ ์ ์์ธ์ ์ฐพ์์ผ๋ฏ๋ก ๋๋จธ์ง ๋ชจ๋ธ์ ์ถ์ํํ๊ณ ๋ฌธ์ ๊ฐ ์๋ ๋ช
๋ น์ด์ ์ด์ ์ ๋ง์ถ ์ ์์ต๋๋ค! ๋์ ์์์ ํด๋น ๋ช
๋ น์ด์ ์์ค ๊ตฌํ์ ๋ํด ์์๋ด์ผ ํ๋ค๋ ๊ฒ์
๋๋ค. ์ผ๋ถ ๊ฒฝ์ฐ์๋ ์ฐธ์กฐ ๊ตฌํ์ ๋ฌธ์ ๊ฐ ์์ ์๋ ์์ผ๋ ์
์คํธ๋ฆผ ์ ์ฅ์์์ ์ด์๋ฅผ ์ด๊ธฐ๋ฅผ ๊บผ๋ฆฌ์ง ๋ง์ญ์์ค.
์ด๋ค ๊ฒฝ์ฐ์๋ ๐ค Transformers ํ๊ณผ์ ํ ๋ก ์ ํตํด ๋ถ์ผ์น๋ฅผ ์์ ํ ์ ์์ ์๋ ์์ต๋๋ค. ๋ชจ๋ธ์ ์ถ๋ ฅ ๋ ์ด์ด์์ ๋ถ์ผ์น๊ฐ ๋งค์ฐ ์์ง๋ง ์จ๊ฒจ์ง ์ํ์์ ํฌ๊ฒ ๋ํ๋ ์ ์๊ธฐ ๋๋ฌธ์
๋๋ค. ์ด ๊ฒฝ์ฐ ๋ชจ๋ธ์ ๋ฐฐํฌํ๋ ๊ฒ์ ์ฐ์ ์ํ๊ธฐ ์ํด ๋ถ์ผ์น๋ฅผ ๋ฌด์ํ๊ธฐ๋ก ๊ฒฐ์ ํ ์๋ ์์ต๋๋ค. ์์์ ์ธ๊ธํ `pt-to-tf` CLI์๋ ๊ฐ์ค์น ๋ณํ ์ ์ค๋ฅ ๋ฉ์์ง๋ฅผ ๋ฌด์ํ๋ `--max-error` ํ๋๊ทธ๊ฐ ์์ต๋๋ค.
|