Spaces:

PlayfulTechnology
/

QARAC

Build error

App Files Files Community

PeteBleackley commited on Mar 12, 2024

Commit

f5599c3

1 Parent(s): 4a7707c

Ensure consistency of device assignment when training

Browse files

Files changed (2) hide show

qarac/corpora/CombinedCorpus.py +4 -3
scripts.py +2 -1

qarac/corpora/CombinedCorpus.py CHANGED Viewed

@@ -58,6 +58,7 @@ class CombinedCorpus(torch.utils.data.IterableDataset):
                                                                                    {},
                                                                                    'consistency'),
                                                          n_samples)
         self.batches = None
         self.pad_token = tokenizer.token_to_id('<pad>')
         self.max_lengths = {}
@@ -145,11 +146,11 @@ class CombinedCorpus(torch.utils.data.IterableDataset):
         X={key:self.pad(value,self.max_lengths[key])
            for (key,value) in X.items()}
-        Y={key:torch.tensor(value,device='cuda').float() if key=='consistency' else self.pad(value,
                                                                        self.max_lengths[key],
                                                                        False)
            for (key,value) in Y.items()}
-        Y['question_answering'] = torch.zeros((n,768),device='cuda')
         return (X,
                 tuple([Y[key]
                          for key in ('encode_decode',
@@ -176,7 +177,7 @@ class CombinedCorpus(torch.utils.data.IterableDataset):
             sample.pad(maxlen,pad_id=self.pad_token)
         input_ids = torch.tensor([sample.ids
                                   for sample in batch],
-                                 device='cuda')
         result = input_ids
         if inputs:
             attention_mask = torch.not_equal(input_ids,

                                                                                    {},
                                                                                    'consistency'),
                                                          n_samples)
+        self.device = kwargs['device']
         self.batches = None
         self.pad_token = tokenizer.token_to_id('<pad>')
         self.max_lengths = {}
         X={key:self.pad(value,self.max_lengths[key])
            for (key,value) in X.items()}
+        Y={key:torch.tensor(value,device=self.device).float() if key=='consistency' else self.pad(value,
                                                                        self.max_lengths[key],
                                                                        False)
            for (key,value) in Y.items()}
+        Y['question_answering'] = torch.zeros((n,768),device=self.device)
         return (X,
                 tuple([Y[key]
                          for key in ('encode_decode',
             sample.pad(maxlen,pad_id=self.pad_token)
         input_ids = torch.tensor([sample.ids
                                   for sample in batch],
+                                 device=self.device)
         result = input_ids
         if inputs:
             attention_mask = torch.not_equal(input_ids,

scripts.py CHANGED Viewed

@@ -131,7 +131,8 @@ def train_models(path,progress=gradio.Progress(track_tqdm=True)):
                                                                 all_text='corpora/all_text.csv',
                                                                 question_answering='corpora/question_answering.csv',
                                                                 reasoning='corpora/reasoning_train.csv',
-                                                                consistency='corpora/consistency.csv')
     n_batches = len(training_data)
     history = {}
     for epoch in range(25):

                                                                 all_text='corpora/all_text.csv',
                                                                 question_answering='corpora/question_answering.csv',
                                                                 reasoning='corpora/reasoning_train.csv',
+                                                                consistency='corpora/consistency.csv',
+                                                                device=trainer.device())
     n_batches = len(training_data)
     history = {}
     for epoch in range(25):