Add missing files

Browse files

Files changed (4) hide show

classifier_training.log +0 -57
params.json +0 -14
special_tokens_map.json +1 -0
tokenizer_config.json +1 -0

classifier_training.log DELETED Viewed

@@ -1,57 +0,0 @@
-Git commit: 01fe7efc56319afc04ab13136d485a680a1b8a82
-PyTorch CUDA version: 10.2
-Parameter pretrained: ../bert_reduced_intermediate_pe_50_epochs_VDJdb_PIRD
-Parameter data: ['PIRD']
-Parameter segment: TRB
-Parameter outdir: /home/wukevin/projects/tcr/tcr_models/temp3
-Parameter downsample: 1.0
-Parameter monitor: auprc
-Parameter bs: 128
-Parameter lr: 5e-05
-Parameter epochs: 25
-Parameter warmup: 0.1
-PIRD data 0.1655 data labelled with antigen sequence
-PIRD: Removing 95 entires with non amino acid residues
-Entries with antigen sequence: 8429/51044
-Unique antigen sequences: 73
-PIRD data TRA/TRB instances: Counter({'TRB': 46428, 'TRA': 4011, 'TRA-TRB': 605})
-No alphabet given, assuming alphabet of: ['TAAQAAVVRFQEAAN', 'ADTLQSIGATTVASN', 'LLWNGPMAV', 'RPRGEVRFL', 'ATDALMTGY', 'CINGVCWTV', 'HSKKKCDEL', 'KAFSPEVIPMF', 'KRWIILGLNK', 'KRWIIMGLNK', 'TPQDLNTML', 'EIYKRWII', 'GLNKIVRMY', 'ISPRTL-W', 'QASQEVKNW', 'FLKEKGGL', 'HPKVSSEVHI', 'IIKDYGKQM', 'LPPIVAKEI', 'RFPLTFGWCF', 'RYPLTFGWCF', 'TPGPGVRYPL', 'TQGYFPDWQNY', 'FPRPWLHGL', 'RYPLTFGWCF ', 'RYPLTFGW ', 'RYPLTFGW', 'CVETMCNEY', 'DEEDAIAAY', 'ELKRKMIYM', 'ELRRKMMYM', 'LSEFCRVLCCYVLEE', 'QIKVRVDMV', 'QIKVRVKMV', 'VLEETSVML', 'YILEETSVM', 'ARNLVPMVATVQGQN', 'CPSQEPMSIYVY', 'EDVPSGKLFMHVTLG', 'FPTKDVAL', 'IPSINVHHY', 'NLVPMVATV', 'RPHERNGFTVL', 'TPRVTGGGAM', 'YSEHPTFTSQY', 'VTEHDTLLY', 'YLAMPFATPMEAELARRSLA', 'ALTPVVVTL', 'GLCTLVAML', 'YVLDHLIVV', 'EPLPQGQLTAY', 'GPEPLPQGQLTAY', 'LPEGLPQGQLTAY', 'LPEPLGQGQLTAY', 'LPEPLPQAQLTAY', 'LPEPLPQGGLTAY', 'LPEPLPQGQGTAY', 'LPEPLPQGQLGAY', 'LPEPLPQGQLTAY', 'LPEPLPQGQLTGY', 'RAKFKQLL', 'HPVGEADYFEY', 'FLRGRAYGL', 'EENLLDFVRF', 'AVFDRKSDAK', 'IVTDFSVIK', 'NFIRMVISNPAAT', 'KRGIVEQCCTSISSL', 'KRGIVEQSSTSISSL', 'ENPVVHFFKNIVTPR', 'GILGFVFTL', 'PQPELPYPQPE', 'FWIDLFETIG']
-Generated labels of shape (6235,): [ 0  0  0 ... 72 72 72]
-Retaining 44/73 examples with sufficient examples
-Split train with 4365 examples
-Split valid with 935 examples
-Split test with 935 examples
-Loading BERT classifier with 45 labels
-Best AUROC (index=27): 0.9405
-Best AUROC (index=9): 0.9882
-Best AUROC (index=9): 0.9989
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=15): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=9): 1.0000
-Best AUROC (index=21): 1.0000
-Best AUROC (index=9): 1.0000
-epoch	25.0000
-eval_accuracy	0.7401
-eval_auprc	0.3922
-eval_auroc	0.7881
-eval_loss	1.5623
-eval_runtime	1.3134
-eval_samples_per_second	711.9190

params.json DELETED Viewed

@@ -1,14 +0,0 @@
-{
-    "pretrained": "../bert_reduced_intermediate_pe_50_epochs_VDJdb_PIRD",
-    "data": [
-        "PIRD"
-    ],
-    "segment": "TRB",
-    "outdir": "/home/wukevin/projects/tcr/tcr_models/temp3",
-    "downsample": 1.0,
-    "monitor": "auprc",
-    "bs": 128,
-    "lr": 5e-05,
-    "epochs": 25,
-    "warmup": 0.1
-}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "?", "sep_token": "\|", "pad_token": "$", "cls_token": "*", "mask_token": "."}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"do_lower_case": false, "do_basic_tokenize": true, "never_split": null, "unk_token": "?", "sep_token": "\|", "pad_token": "$", "cls_token": "*", "mask_token": ".", "tokenize_chinese_chars": false, "strip_accents": null, "model_max_len": 45, "padding_side": "right"}