DeepMorphy / config.yml
niobures's picture
DeepMorphy
0240c6e verified
random_seed: 1917
validation_persent: 2
test_persent: 1
min_word_size: 2
max_word_size: 32
model_key: small #big
prefix_filter_length: 1
dict_path: /media/alex/hybrid/Projects/Resources/dict.opcorpora.xml
dataset_words_path: data/dataset_words.pkl
dict_words_path: data/dict_words.pkl
vect_words_path: data/vec_words.pkl
cls_classes_path: data/classification_classes.pkl
numb_classes_path: data/numb_classes.pkl
numb_data_path: data/numb.pkl
tags_path: data/tags.pkl
dics_path: data/
dataset_path: data/dataset
inflect_templates_path: data/inflect_templates.pkl
export_path: export
save_path: checkpoints/
bad_path: data/
test_results_paths:
- latest_release
publish_net_paths:
- ../../cs/DeepMorphy/NeuralNet/
- latest_release
publish_gramm_paths:
- ../../cs/DeepMorphy/
- latest_release
publish_tags_paths:
- ../../cs/DeepMorphy/
- latest_release
publish_numbers_paths:
- ../../cs/DeepMorphy/Numb
- latest_release
publish_dictionary_paths:
- ../../cs/DeepMorphy/WordDict
- latest_release
publish_dataset_info_paths:
- latest_release
public_inflect_templates_paths:
- latest_release
- ../../cs/DeepMorphy/
publish_tests_path: ../../cs/IntegrationTester/
publish_gram_doc_path: ../../../gram.md
publish_inflect_doc_path: ../../../inflect.md
train_devices:
# - /cpu:0
- /gpu:0
- /gpu:1
- /gpu:2
filler: "############################################################################"
start_token: 36
end_token: 35
main_class_k: 4
train_steps:
#- mood
#- voic
#- post
#- gndr
#- nmbr
#- case
#- tens
#- pers
#- main
#- lemm
- inflect
ignore_restore: []
#- lemm
#- inflect
graph_part_configs:
default:
#learn params
stop_main_metric_delta: 0.1
learn_rate: 0.00001
learn_rate_decay_step: 0.1
min_learn_rate: 0.00000001
return_step: 2
keep_drop: 1
use_weights: true
clip_grads: true
test_batch_size: 2048
train_batch_size: 4096
# common params
char_vector_size: 32
rnn_state_size: 32
rnn_layers_count: 2
rnn_bidirectional: True
use_residual: false
main_metric_type: Loss
#seq2seq params
max_length: 33
encoder:
gram_vector_size: 7
ad_cls_vector_size: 8
char_vector_size: 64
rnn_state_size: 64
rnn_layers_count: 2
rnn_bidirectional: true
use_residual: false
decoder:
gram_vector_size: 14
ad_cls_vector_size: 16
rnn_state_size: 128
rnn_layers_count: 1
keep_drop: 1.0
use_residual: false
pers:
test_batch_size: 256
train_batch_size: 1024
char_vector_size: 8
rnn_state_size: 8
mood:
char_vector_size: 16
rnn_state_size: 16
main:
char_vector_size: 64
rnn_state_size: 64
test_batch_size: 4096
train_batch_size: 4096
lemm:
char_vector_size: 64
batch_size: 8192
main_metric_type: Accuracy
stop_main_metric_delta: 0.00001
inflect:
transfer_init: false
char_vector_size: 64
batch_size: 8192
main_metric_type: Accuracy
stop_main_metric_delta: 0.000001
chars:
- UNDEFINED # неизвестный символ
- а
- б
- в
- г
- д
- е
- ё
- ж
- з
- и
- й
- к
- л
- м
- н
- о
- п
- р
- с
- т
- у
- ф
- х
- ч
- ц
- ш
- щ
- ъ
- ы
- ь
- э
- ю
- я
- "-"
lemma_same_word:
- post: noun
nmbr: sing
case: nomn
gndr: masc
- post: noun
nmbr: sing
case: nomn
gndr: neut
- post: noun
nmbr: sing
case: nomn
gndr: femn
- post: noun
nmbr: sing
case: nomn
gndr: msf
- post: adjf
nmbr: sing
gndr: masc
case: nomn
- post: infn
- post: advb
- post: prep
- post: conj
- post: prcl
- post: intj
- post: prep
- post: pred
tens: pres
other_post_types:
punct:
key_ru: пункт
name_ru: пунктуция
desc_ru: пунктуация
int:
key_ru: цифра
name_ru: цифра
desc_ru: цифра
romn:
key_ru: рим_цифр
name_ru: римская цифра
desc_ru: римская цифра
unkn:
key_ru: неизв
name_ru: неизвестный токен
desc_ru: неизвестный токен
dict_post_types:
npro:
key_ru: мест
power: 2
name_ru: местоимение
desc_ru: местоимение
keys:
- NPRO
prep:
key_ru: предл
power: 2
name_ru: предлог
desc_ru: предлог
keys:
- PREP
conj:
key_ru: союз
power: 2
name_ru: союз
desc_ru: союз
keys:
- CONJ
prcl:
key_ru: част
power: 0
name_ru: частица
desc_ru: частица
keys:
- PRCL
intj:
key_ru: межд
power: 0.5
name_ru: междометие
desc_ru: междометие
keys:
- INTJ
numb:
key_ru: числ
power: 2
name_ru: числительное
desc_ru: числительное
keys:
- NUMR
pred:
key_ru: предик
power: 0
name_ru: предикатив
desc_ru: предикатив
keys:
- PRED
grammemes_types:
post:
index: 0
key_ru: чр
name: часть речи
classes:
noun:
index: 0
key_ru: сущ
name_ru: существительное
desc_ru: существительное
keys:
- NOUN
adjf:
index: 1
key_ru: прил
name_ru: полное прилагательное
desc_ru: полное прилагательное
keys:
- ADJF
adjs:
index: 2
key_ru: кр_прил
name_ru: краткое прилагательное
desc_ru: полное прилагательное
keys:
- ADJS
verb:
index: 3
key_ru: гл
name_ru: личная форма глагола
desc_ru: личная форма глагола
keys:
- VERB
infn:
index: 4
key_ru: инф_гл
name_ru: инфинитив глагола
desc_ru: инфинитив глагола
keys:
- INFN
comp:
index: 5
key_ru: комп
name_ru: компаратив
desc_ru: компаратив
keys:
- COMP
prtf:
index: 6
key_ru: прич
name_ru: причастие
desc_ru: причастие
keys:
- PRTF
prts:
index: 7
key_ru: кр_прич
name_ru: краткое причастие
desc_ru: краткое причастие
keys:
- PRTS
grnd:
index: 8
key_ru: деепр
name_ru: деепричастие
desc_ru: деепричастие
keys:
- GRND
advb:
index: 9
key_ru: нареч
name_ru: наречие
desc_ru: наречие
keys:
- ADVB
gndr:
index: 1
key_ru: род
name: род
classes:
masc:
index: 0
key_ru: муж
name_ru: мужской
desc_ru: мужской род
keys:
- masc
femn:
index: 1
key_ru: жен
name_ru: женский
desc_ru: женский род
keys:
- femn
neut:
index: 2
key_ru: ср
name_ru: средний
desc_ru: средний род
keys:
- neut
msf:
index: 3
key_ru: общ
name_ru: общий
desc_ru: общий род
keys:
- ms-f
nmbr:
index: 2
key_ru: число
name: число
classes:
sing:
index: 0
key_ru: ед
name_ru: единственное
desc_ru: единственное число
keys:
- sing
plur:
index: 1
key_ru: мн
name_ru: множественное
desc_ru: множественное число
keys:
- plur
case:
index: 3
key_ru: падеж
name: падеж
classes:
nomn:
index: 0
key_ru: им
name_ru: именительный
desc_ru: именительный падеж
keys:
- nomn
gent:
index: 1
key_ru: рд
name_ru: родительный
desc_ru: родительный падеж
keys:
- gent
datv:
index: 2
key_ru: дт
name_ru: дательный
desc_ru: дательный падеж
keys:
- datv
accs:
index: 3
key_ru: вн
name_ru: винительный
desc_ru: винительный падеж
keys:
- accs
ablt:
index: 4
key_ru: тв
name_ru: творительный
desc_ru: творительный падеж
keys:
- ablt
loct:
index: 5
key_ru: пр
name_ru: предложный
desc_ru: предложный падеж
keys:
- loct
gent1:
index: 6
key_ru: рд1
name_ru: первый родительный
desc_ru: первый родительный падеж
keys:
- gen1
gent2:
index: 7
key_ru: рд2
name_ru: второй родительный
desc_ru: второй родительный падеж
keys:
- gen2
voct:
index: 8
key_ru: зв
name_ru: звательный
desc_ru: звательный падеж
keys:
- voct
accs2:
index: 9
key_ru: вн2
name_ru: второй винительный
desc_ru: второй винительный падеж
keys:
- acc2
loct1:
index: 10
key_ru: пр1
name_ru: первый предложный
desc_ru: первый предложный падеж
keys:
- loc1
loct2:
index: 11
key_ru: пр2
name_ru: второй предложный
desc_ru: второй предложный падеж
keys:
- loc2
pers:
index: 4
key_ru: лицо
name: лицо
classes:
1per:
index: 0
key_ru: 1л
name_ru: 1 лицо
desc_ru: 1 лицо
keys:
- 1per
2per:
index: 1
key_ru: 2л
name_ru: 2 лицо
desc_ru: 2 лицо
keys:
- 2per
3per:
index: 2
key_ru: 3л
name_ru: 3 лицо
desc_ru: 3 лицо
keys:
- 3per
tens:
index: 5
key_ru: время
name: время
classes:
pres:
index: 0
key_ru: наст
name_ru: настоящее
desc_ru: настоящее время
keys:
- pres
past:
index: 1
key_ru: прош
name_ru: прошедшее
desc_ru: прошедшее время
keys:
- past
futr:
index: 2
key_ru: буд
name_ru: будущее
desc_ru: будущее время
keys:
- futr
mood:
index: 6
key_ru: накл
name: наклонение
classes:
indc:
index: 0
key_ru: изъяв
name_ru: изъявительное
desc_ru: изъявительное наклонение
keys:
- indc
impr:
index: 1
key_ru: повел
name_ru: повелительное
desc_ru: повелительное наклонение
keys:
- impr
voic:
index: 7
key_ru: залог
name: залог
classes:
actv:
index: 0
key_ru: дейст
name_ru: действительный
desc_ru: действительный залог
keys:
- actv
pssv:
index: 1
key_ru: страд
name_ru: страдательный
desc_ru: страдательный залог
keys:
- pssv
ad_tags:
- incl
- excl
- abbr
- surn
- patr
- orgn
- trad
- cmp2
- geox
inflect_ignore_tags:
- incl
- cmp2
dict_ignore_tags:
- patr
- orgn
- surn