Fix

2021-06-22 00:28:06 +02:00 · 2021-06-22 00:28:06 +02:00 · 6ad8ba24ba
commit 6ad8ba24ba
parent 6939244314
1 changed files with 1 additions and 1 deletions
--- a/fine_tuning.py
+++ b/fine_tuning.py
@ -29,7 +29,7 @@ class CustomDataset(torch.utils.data.Dataset):
        return len(self.encodings["input_ids"])

 data_train = list(zip(data_train_X, data_train_Y))
-data_train = random.sample(data_train, 180000)
+data_train = random.sample(data_train, 50000)

 tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
 train_X = tokenizer([text[0] for text in data_train], truncation=True, padding=True)