Spaces:

wangjin2000
/

ESM2PPI

Paused

wangjin2000 commited on Sep 20, 2024

Commit

d63575c

verified ·

1 Parent(s): 3175238

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -121,7 +121,7 @@ def finetune(base_model_path):   #, train_dataset, test_dataset):
     return save_path
 def compute_pseudo_perplexity(model, tokenizer, protein_seq, binder_seq):
-    sequence = protein_seq + binder_seq
     original_input = tokenizer.encode(sequence, return_tensors='pt').to(model.device)
     length_of_binder = len(binder_seq)
     print("original_input 125:",original_input)
@@ -132,7 +132,7 @@ def compute_pseudo_perplexity(model, tokenizer, protein_seq, binder_seq):
     print("masked_inputs tokens 129:",masked_inputs[torch.arange(length_of_binder), positions_to_mask])
     masked_inputs[torch.arange(length_of_binder), positions_to_mask] = tokenizer.mask_token_id
-    print("masked_inputs tokens 131:",masked_inputs[torch.arange(length_of_binder), positions_to_mask],masked_inputs[torch.arange(length_of_binder))
     print("masked_inputs tokens 131:",masked_inputs)
     # Prepare labels for the masked tokens

     return save_path
 def compute_pseudo_perplexity(model, tokenizer, protein_seq, binder_seq):
+    sequence = protein_seq + binder_seq
     original_input = tokenizer.encode(sequence, return_tensors='pt').to(model.device)
     length_of_binder = len(binder_seq)
     print("original_input 125:",original_input)
     print("masked_inputs tokens 129:",masked_inputs[torch.arange(length_of_binder), positions_to_mask])
     masked_inputs[torch.arange(length_of_binder), positions_to_mask] = tokenizer.mask_token_id
+    print("masked_inputs tokens 131:",[torch.arange(length_of_binder), positions_to_mask],masked_inputs[torch.arange(length_of_binder), positions_to_mask])
     print("masked_inputs tokens 131:",masked_inputs)
     # Prepare labels for the masked tokens