blueflag commited on
Commit
0294a3a
·
verified ·
1 Parent(s): 022aa72

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -39,7 +39,7 @@ prompt = f'''Translate Human sentences into {언어설정. 예를들어 원문
39
  데이터셋을 계속 바꿔가며 파인튜닝 테스트를 하다보니 공개가 늦어지고 있습니다. 처음에는 야심차게 수만개의 데이터를 만들어 돌렸으나 결국 2천개도 되지 않는 데이터만으로도 파인튜닝이 잘된다는걸 깨달았습니다.
40
  ai허브의 샘플 데이터 소량과 직접만든 {영어:한글} 데이터셋으로 학습시켰습니다.
41
  이런 데이터셋을 추가한 이유는 영어 단어 하나만 번역하라고 시켰을 경우 ai의 특성상 '말이 많기 때문에' 번역만 하는게 아니라 필요없는 사족들이 계속 붙어서입니다.
42
- 특별할게 없는 데이터셋이지만 업로드 후 이곳에 다시 알리겠습니다.
43
 
44
  ### 도다리 고급번역 소스 코드는 언제 공개되나요?
45
  지금 코드는 도다리 일반번역과 달리 보통사람들이 사용하기 어려운 ux를 가지고 있습니다. s3코드나 email발송, 사용시간 타이머처럼 일반사람들에게 필요없는 기능들도 있습니다.
 
39
  데이터셋을 계속 바꿔가며 파인튜닝 테스트를 하다보니 공개가 늦어지고 있습니다. 처음에는 야심차게 수만개의 데이터를 만들어 돌렸으나 결국 2천개도 되지 않는 데이터만으로도 파인튜닝이 잘된다는걸 깨달았습니다.
40
  ai허브의 샘플 데이터 소량과 직접만든 {영어:한글} 데이터셋으로 학습시켰습니다.
41
  이런 데이터셋을 추가한 이유는 영어 단어 하나만 번역하라고 시켰을 경우 ai의 특성상 '말이 많기 때문에' 번역만 하는게 아니라 필요없는 사족들이 계속 붙어서입니다.
42
+ ~특별할게 없는 데이터셋이지만 업로드 후 이곳에 다시 알리겠습니다~ → 업로드 완료했습니다.
43
 
44
  ### 도다리 고급번역 소스 코드는 언제 공개되나요?
45
  지금 코드는 도다리 일반번역과 달리 보통사람들이 사용하기 어려운 ux를 가지고 있습니다. s3코드나 email발송, 사용시간 타이머처럼 일반사람들에게 필요없는 기능들도 있습니다.