rrayy commited on
Commit
42650ad
·
1 Parent(s): 7268ec0

Changes to be committed: 데이터셋 객체파일 이동, 전처리 저장 실수 복구

Browse files

modified: DIVA_dataset.pt
modified: preprocessing.ipynb
renamed: dataset.py -> utility/dataset.py

DIVA_dataset.pt CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:07100e4d555f15625160754dc19ee21b6b364718bb62799cc13b948d91be3a54
3
- size 120711
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:51a657804e01360dbf4ae774d45e959d3955e3be0b7f9a84e467c5911d5f7cc3
3
+ size 243341
preprocessing.ipynb CHANGED
@@ -169,7 +169,7 @@
169
  },
170
  {
171
  "cell_type": "code",
172
- "execution_count": 1,
173
  "id": "dea532d4",
174
  "metadata": {},
175
  "outputs": [],
@@ -305,22 +305,9 @@
305
  "## 데이터 전처리"
306
  ]
307
  },
308
- {
309
- "cell_type": "markdown",
310
- "id": "7e802a13",
311
- "metadata": {},
312
- "source": [
313
- "## 📬 요약: 지금까지 한 대화\n",
314
- "\n",
315
- "1. 너는 처음에 벡터 → 시퀀스 구조를 **LSTM 기반 PyTorch 모델**로 구현하려고 했고,\n",
316
- "2. 나는 autoregressive 구조, teacher forcing, packing 등을 포함한 버전을 설명했어.\n",
317
- "3. 이후 너가 `Vector2MIDI`라는 실질적인 구현 코드를 공유했고,\n",
318
- "4. 나는 그 코드를 리뷰하고, 우리가 나눈 개념을 반영해서 리팩토링한 버전을 다시 작성해줬어.\n"
319
- ]
320
- },
321
  {
322
  "cell_type": "code",
323
- "execution_count": 2,
324
  "id": "f7b77c0c",
325
  "metadata": {},
326
  "outputs": [
@@ -410,7 +397,7 @@
410
  },
411
  {
412
  "cell_type": "code",
413
- "execution_count": 3,
414
  "id": "dd840788",
415
  "metadata": {},
416
  "outputs": [
@@ -430,7 +417,7 @@
430
  },
431
  {
432
  "cell_type": "code",
433
- "execution_count": 4,
434
  "id": "4f5f5dc1",
435
  "metadata": {},
436
  "outputs": [],
@@ -439,7 +426,7 @@
439
  "\n",
440
  "torch.save({\n",
441
  " \"X\": X_tensor,\n",
442
- " \"Y\": Y_tensor,\n",
443
  " \"lengths\": seq_lengths\n",
444
  "}, \"DIVA_dataset.pt\")"
445
  ]
 
169
  },
170
  {
171
  "cell_type": "code",
172
+ "execution_count": 2,
173
  "id": "dea532d4",
174
  "metadata": {},
175
  "outputs": [],
 
305
  "## 데이터 전처리"
306
  ]
307
  },
 
 
 
 
 
 
 
 
 
 
 
 
 
308
  {
309
  "cell_type": "code",
310
+ "execution_count": 3,
311
  "id": "f7b77c0c",
312
  "metadata": {},
313
  "outputs": [
 
397
  },
398
  {
399
  "cell_type": "code",
400
+ "execution_count": 4,
401
  "id": "dd840788",
402
  "metadata": {},
403
  "outputs": [
 
417
  },
418
  {
419
  "cell_type": "code",
420
+ "execution_count": 5,
421
  "id": "4f5f5dc1",
422
  "metadata": {},
423
  "outputs": [],
 
426
  "\n",
427
  "torch.save({\n",
428
  " \"X\": X_tensor,\n",
429
+ " \"Y\": padded_Y,\n",
430
  " \"lengths\": seq_lengths\n",
431
  "}, \"DIVA_dataset.pt\")"
432
  ]
dataset.py → utility/dataset.py RENAMED
File without changes