File size: 1,320 Bytes
d2593a9 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 | ---
base_model:
- DeepChem/ChemBERTa-10M-MLM
pipeline_tag: feature-extraction
tags:
- chemistry
datasets:
- zpn/zinc20
---
Репозиторий к докладу "Физическое информирование фундаментальных языковых моделей в химии через многозадачную регрессию"
Содержимое репозитория
- `train_model.py`: скрипт обучения модели, гиперпараметры обучения задаются в параметрах скрипта
- `test_model.py`: скрипт валидации модели, тестирующий модель на заданных бенчмарках
- `models/`:
- `models/model_mtr_{x}_mlm_{y}.pth`: чекпоинт с весами одной из 15 моделей где числа `x` и `y` соотносятся весам MTR и MLM функций потерь соответственно
- `support/`:
- `support/*.csv`: файлы с датасетами для тестирования моделей
- `support/normalization_params.pth`: нормализационные параметры для rdkit дескрипторов
- `support/smiles_10k.txt`: пример датасета (первые 640k молекул из ZINC20)
|