Spaces:
Running
Running
File size: 965 Bytes
2b83ee8 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 | """
Hugging Face 데이터셋 로드 유틸리티
MuscleCare-DataSet 데이터셋을 로드하는 함수들을 제공합니다.
"""
from datasets import load_dataset
from typing import Optional
def load_musclecare_dataset(
split: Optional[str] = None,
cache_dir: Optional[str] = None
):
"""
MuscleCare-DataSet 데이터셋을 로드합니다.
Args:
split: 데이터셋 split 이름 (None이면 모든 split 로드)
cache_dir: 캐시 디렉토리 경로
Returns:
Dataset 또는 DatasetDict 객체
"""
dataset = load_dataset(
"Merry99/MuscleCare-DataSet",
split=split,
cache_dir=cache_dir
)
return dataset
if __name__ == "__main__":
print("데이터셋 로딩 중...")
dataset = load_musclecare_dataset()
print("✅ 데이터셋 로드 완료")
if hasattr(dataset, 'keys'):
print(f"총 {len(dataset.keys())}개의 split이 있습니다.")
|