antalvdb commited on Feb 23, 2024

Commit

44fa170

verified ·

1 Parent(s): b36b1aa

Training in progress, epoch 1

Browse files

Files changed (22) hide show

model.safetensors +1 -1
run-8/checkpoint-214/config.json +1 -1
run-8/checkpoint-214/model.safetensors +1 -1
run-8/checkpoint-214/optimizer.pt +1 -1
run-8/checkpoint-214/rng_state.pth +1 -1
run-8/checkpoint-214/scheduler.pt +1 -1
run-8/checkpoint-214/trainer_state.json +21 -12
run-8/checkpoint-214/training_args.bin +2 -2
run-8/checkpoint-321/config.json +25 -0
run-8/checkpoint-321/model.safetensors +3 -0
run-8/checkpoint-321/optimizer.pt +3 -0
run-8/checkpoint-321/rng_state.pth +3 -0
run-8/checkpoint-321/scheduler.pt +3 -0
run-8/checkpoint-321/special_tokens_map.json +7 -0
run-8/checkpoint-321/tokenizer.json +0 -0
run-8/checkpoint-321/tokenizer_config.json +55 -0
run-8/checkpoint-321/trainer_state.json +53 -0
run-8/checkpoint-321/training_args.bin +3 -0
run-8/checkpoint-321/vocab.txt +0 -0
runs/Feb23_10-35-48_ec6659c07f12/events.out.tfevents.1708685352.ec6659c07f12.1051.11 +3 -0
runs/Feb23_10-35-48_ec6659c07f12/events.out.tfevents.1708685454.ec6659c07f12.1051.12 +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b461a0f10db195dda246162d1c81b579a0475c7de3d0e5c666b5a94c259f402
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:787954613f44e4663c42543d9fe668f4e267480a972d0f0b3e45c093793760ce
 size 267832560

run-8/checkpoint-214/config.json CHANGED Viewed

@@ -20,6 +20,6 @@
   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.37.1",
   "vocab_size": 30522
 }

   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.38.1",
   "vocab_size": 30522
 }

run-8/checkpoint-214/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1016a5a77f129ce7538745a2501f88da50a1cf573c128f6ace57e1fe87d34a00
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ad6e07cb26f6237b7f0f602f04121b93cd358989897632cabb5aecc3095f305
 size 267832560

run-8/checkpoint-214/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fcd4bb43fcaf58e772534c196699e909dede73e9d213030f70f609a2c9b30960
 size 535727290

 version https://git-lfs.github.com/spec/v1
+oid sha256:3da3afa1ab6d34efa184c300c6ffd1d0cd9bd7caf6ed17f77f16d4f8d6d9d166
 size 535727290

run-8/checkpoint-214/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23d684bf271822b09e5156c87ae8062f033dbbad8c8384527ee7dffaded4e98d
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:78080671ef27bab4d8367805cfe7f616e0d0b385124e8726093ff3663b195c6e
 size 14244

run-8/checkpoint-214/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bbadace382abebfc6ffb538d157c2d8b02298fd9bd638bb54429cb02ac4b0d0b
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:3f02ffc0dc95b6749b4f4b195194be8e0062236dd266f9bec939a604538d47bc
 size 1064

run-8/checkpoint-214/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 0.0,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-8/checkpoint-214",
-  "epoch": 1.0,
   "eval_steps": 500,
   "global_step": 214,
   "is_hyper_param_search": true,
@@ -10,26 +10,35 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 0.6276215314865112,
       "eval_matthews_correlation": 0.0,
-      "eval_runtime": 0.4827,
-      "eval_samples_per_second": 2160.983,
-      "eval_steps_per_second": 136.745,
       "step": 214
     }
   ],
   "logging_steps": 500,
-  "max_steps": 1070,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
-  "train_batch_size": 4,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 1.667181607018999e-06,
-    "num_train_epochs": 5,
-    "per_device_train_batch_size": 4,
     "seed": 36
   }
 }

 {
+  "best_metric": 0.30246066235214725,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-8/checkpoint-214",
+  "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 214,
   "is_hyper_param_search": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5813318490982056,
       "eval_matthews_correlation": 0.0,
+      "eval_runtime": 0.4888,
+      "eval_samples_per_second": 2133.724,
+      "eval_steps_per_second": 135.02,
+      "step": 107
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.6579855680465698,
+      "eval_matthews_correlation": 0.30246066235214725,
+      "eval_runtime": 0.4813,
+      "eval_samples_per_second": 2167.13,
+      "eval_steps_per_second": 137.134,
       "step": 214
     }
   ],
   "logging_steps": 500,
+  "max_steps": 321,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
   "save_steps": 500,
   "total_flos": 0,
+  "train_batch_size": 8,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.438273396233882e-05,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 8,
     "seed": 36
   }
 }

run-8/checkpoint-214/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb0dfd725b53c74b1c8ffd2377bb7b0876680c49a3fc0a67fc0c08a7077bfcd8
-size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:8238f446d69fcc6cc9010ead2f33f328df1196aac5b15d9bdce1a4f9bead8e06
+size 4984

run-8/checkpoint-321/config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "distilbert-base-uncased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "initializer_range": 0.02,
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.1",
+  "vocab_size": 30522
+}

run-8/checkpoint-321/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cbd3890c650c755a4f54ba6ad3c18669e4e24c46dc5c8d77fe2d55ec2d988eec
+size 267832560

run-8/checkpoint-321/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07a995e7cdd339f94b9e4acbf2f4f6bd3accbf0e101b58854127b25ad7daed52
+size 535727290

run-8/checkpoint-321/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ec477d87fb3b0852f22ff98a5c737823705734f907275aca32e5016f0654e4ce
+size 14244

run-8/checkpoint-321/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6a8b6771c68dc52b08a13d75125c76260a0e75d3b8c974f5fdd28893ffff912
+size 1064

run-8/checkpoint-321/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-321/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-8/checkpoint-321/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-321/trainer_state.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "best_metric": 0.3051965941207153,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-8/checkpoint-321",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 321,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.5813318490982056,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 0.4888,
+      "eval_samples_per_second": 2133.724,
+      "eval_steps_per_second": 135.02,
+      "step": 107
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.6579855680465698,
+      "eval_matthews_correlation": 0.30246066235214725,
+      "eval_runtime": 0.4813,
+      "eval_samples_per_second": 2167.13,
+      "eval_steps_per_second": 137.134,
+      "step": 214
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.8824570775032043,
+      "eval_matthews_correlation": 0.3051965941207153,
+      "eval_runtime": 0.4826,
+      "eval_samples_per_second": 2161.247,
+      "eval_steps_per_second": 136.762,
+      "step": 321
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 321,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 3.438273396233882e-05,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 8,
+    "seed": 36
+  }
+}

run-8/checkpoint-321/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8238f446d69fcc6cc9010ead2f33f328df1196aac5b15d9bdce1a4f9bead8e06
+size 4984

run-8/checkpoint-321/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

runs/Feb23_10-35-48_ec6659c07f12/events.out.tfevents.1708685352.ec6659c07f12.1051.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9a11b70863a5f0ffc991f5d54ca4b6d065f05c1ed5290bdf53230d9748f53c66
+size 4877

runs/Feb23_10-35-48_ec6659c07f12/events.out.tfevents.1708685454.ec6659c07f12.1051.12 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0cd13299c3c08ba268b653021df730f92972501d974cf4be6c1ed810bed13145
+size 6535

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8238f446d69fcc6cc9010ead2f33f328df1196aac5b15d9bdce1a4f9bead8e06
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:2c8a2f53a405f321cf90788b9039982bb31601b72430591127a453fbb500d00a
 size 4984