Training in progress, step 4000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Jan28_23-19-38_gpu07.cyverse.org/events.out.tfevents.1674973221.gpu07.cyverse.org.79624.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:28231ed2fa6db3a8ba9dec24805c24d474d5a98e2fc81e01f9dd3ec22fef6617
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb55c91b103628f5be95896e1614ad2bc546605cf6236721f0622634adcd689e
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:188ae5e3d4f5fd4f3ea79612ae9050f69c98af92f2396885f41ca19d41d84d28
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:43e47f260dd1b8c823dbd2ec8239c2bf713fcf544791f3f0b436803f94dc5f60
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fedfd6bd95ed17c2f4580cf3014f35b56bcb8755a40fc6136021f6ca87c22803
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:640548085210c8490898cfba017d8bd1baf3553a19e27f9821a34801ec2b3a88
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2ada1c4bf7218841e7f1bffbf7fa805df783718f35f0ea75965dbcfe82b6b0a0
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:2f245e4bee87e5915781db8b8b7a3b00fd2ef949a525de0dd949823efc21b2f4
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90be8dc230b164dd2d5b3c32eb6c2a7edeaf871fd8d5b65aa972b35423500fc7
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:455fa7fbc6657e0c30aabe935c34b61e115426f0bbb7f1106461aac75d23221b
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.4207764409383577,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-arabic-24h/checkpoint-3000",
-  "epoch": 5.347593582887701,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -753,11 +753,260 @@
       "eval_steps_per_second": 0.149,
       "eval_wer": 0.4207764409383577,
       "step": 3000
     }
   ],
   "max_steps": 5000,
   "num_train_epochs": 9,
-  "total_flos": 3.18401342134272e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.4207764409383577,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-arabic-24h/checkpoint-3000",
+  "epoch": 7.1301247771836005,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.149,
       "eval_wer": 0.4207764409383577,
       "step": 3000
+    },
+    {
+      "epoch": 5.39,
+      "learning_rate": 4.402222222222223e-06,
+      "loss": 0.0152,
+      "step": 3025
+    },
+    {
+      "epoch": 5.44,
+      "learning_rate": 4.346666666666667e-06,
+      "loss": 0.0143,
+      "step": 3050
+    },
+    {
+      "epoch": 5.48,
+      "learning_rate": 4.291111111111112e-06,
+      "loss": 0.0143,
+      "step": 3075
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 4.235555555555556e-06,
+      "loss": 0.0136,
+      "step": 3100
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 4.18e-06,
+      "loss": 0.0173,
+      "step": 3125
+    },
+    {
+      "epoch": 5.61,
+      "learning_rate": 4.124444444444445e-06,
+      "loss": 0.0136,
+      "step": 3150
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 4.0688888888888896e-06,
+      "loss": 0.0154,
+      "step": 3175
+    },
+    {
+      "epoch": 5.7,
+      "learning_rate": 4.013333333333334e-06,
+      "loss": 0.0119,
+      "step": 3200
+    },
+    {
+      "epoch": 5.75,
+      "learning_rate": 3.9577777777777785e-06,
+      "loss": 0.0138,
+      "step": 3225
+    },
+    {
+      "epoch": 5.79,
+      "learning_rate": 3.9022222222222225e-06,
+      "loss": 0.0131,
+      "step": 3250
+    },
+    {
+      "epoch": 5.84,
+      "learning_rate": 3.8466666666666665e-06,
+      "loss": 0.0154,
+      "step": 3275
+    },
+    {
+      "epoch": 5.88,
+      "learning_rate": 3.7911111111111114e-06,
+      "loss": 0.0134,
+      "step": 3300
+    },
+    {
+      "epoch": 5.93,
+      "learning_rate": 3.7355555555555555e-06,
+      "loss": 0.0145,
+      "step": 3325
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 3.6800000000000003e-06,
+      "loss": 0.0125,
+      "step": 3350
+    },
+    {
+      "epoch": 6.02,
+      "learning_rate": 3.624444444444445e-06,
+      "loss": 0.0111,
+      "step": 3375
+    },
+    {
+      "epoch": 6.06,
+      "learning_rate": 3.568888888888889e-06,
+      "loss": 0.0072,
+      "step": 3400
+    },
+    {
+      "epoch": 6.11,
+      "learning_rate": 3.5133333333333337e-06,
+      "loss": 0.0072,
+      "step": 3425
+    },
+    {
+      "epoch": 6.15,
+      "learning_rate": 3.457777777777778e-06,
+      "loss": 0.0068,
+      "step": 3450
+    },
+    {
+      "epoch": 6.19,
+      "learning_rate": 3.4022222222222222e-06,
+      "loss": 0.0076,
+      "step": 3475
+    },
+    {
+      "epoch": 6.24,
+      "learning_rate": 3.346666666666667e-06,
+      "loss": 0.0068,
+      "step": 3500
+    },
+    {
+      "epoch": 6.28,
+      "learning_rate": 3.2911111111111116e-06,
+      "loss": 0.0077,
+      "step": 3525
+    },
+    {
+      "epoch": 6.33,
+      "learning_rate": 3.2355555555555556e-06,
+      "loss": 0.0072,
+      "step": 3550
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 3.1800000000000005e-06,
+      "loss": 0.0082,
+      "step": 3575
+    },
+    {
+      "epoch": 6.42,
+      "learning_rate": 3.124444444444445e-06,
+      "loss": 0.0064,
+      "step": 3600
+    },
+    {
+      "epoch": 6.46,
+      "learning_rate": 3.068888888888889e-06,
+      "loss": 0.0072,
+      "step": 3625
+    },
+    {
+      "epoch": 6.51,
+      "learning_rate": 3.013333333333334e-06,
+      "loss": 0.0063,
+      "step": 3650
+    },
+    {
+      "epoch": 6.55,
+      "learning_rate": 2.957777777777778e-06,
+      "loss": 0.0082,
+      "step": 3675
+    },
+    {
+      "epoch": 6.6,
+      "learning_rate": 2.9022222222222223e-06,
+      "loss": 0.0054,
+      "step": 3700
+    },
+    {
+      "epoch": 6.64,
+      "learning_rate": 2.8466666666666672e-06,
+      "loss": 0.0074,
+      "step": 3725
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 2.7911111111111113e-06,
+      "loss": 0.006,
+      "step": 3750
+    },
+    {
+      "epoch": 6.73,
+      "learning_rate": 2.7355555555555557e-06,
+      "loss": 0.0074,
+      "step": 3775
+    },
+    {
+      "epoch": 6.77,
+      "learning_rate": 2.68e-06,
+      "loss": 0.0061,
+      "step": 3800
+    },
+    {
+      "epoch": 6.82,
+      "learning_rate": 2.6244444444444446e-06,
+      "loss": 0.0089,
+      "step": 3825
+    },
+    {
+      "epoch": 6.86,
+      "learning_rate": 2.568888888888889e-06,
+      "loss": 0.0066,
+      "step": 3850
+    },
+    {
+      "epoch": 6.91,
+      "learning_rate": 2.5133333333333336e-06,
+      "loss": 0.0071,
+      "step": 3875
+    },
+    {
+      "epoch": 6.95,
+      "learning_rate": 2.457777777777778e-06,
+      "loss": 0.0065,
+      "step": 3900
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 2.4022222222222225e-06,
+      "loss": 0.0053,
+      "step": 3925
+    },
+    {
+      "epoch": 7.04,
+      "learning_rate": 2.346666666666667e-06,
+      "loss": 0.0049,
+      "step": 3950
+    },
+    {
+      "epoch": 7.09,
+      "learning_rate": 2.2911111111111114e-06,
+      "loss": 0.0021,
+      "step": 3975
+    },
+    {
+      "epoch": 7.13,
+      "learning_rate": 2.235555555555556e-06,
+      "loss": 0.004,
+      "step": 4000
+    },
+    {
+      "epoch": 7.13,
+      "eval_loss": 0.3123507499694824,
+      "eval_runtime": 4382.7686,
+      "eval_samples_per_second": 2.382,
+      "eval_steps_per_second": 0.149,
+      "eval_wer": 0.4251609673577187,
+      "step": 4000
     }
   ],
   "max_steps": 5000,
   "num_train_epochs": 9,
+  "total_flos": 4.245301687799808e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:188ae5e3d4f5fd4f3ea79612ae9050f69c98af92f2396885f41ca19d41d84d28
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:43e47f260dd1b8c823dbd2ec8239c2bf713fcf544791f3f0b436803f94dc5f60
 size 6173655480

runs/Jan28_23-19-38_gpu07.cyverse.org/events.out.tfevents.1674973221.gpu07.cyverse.org.79624.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4c5e71c8a208596e260a1b1a53ca941ba4612a5a88ad5428422911ad98f8b3d5
-size 24192

 version https://git-lfs.github.com/spec/v1
+oid sha256:c20785d93f929c6776fb55f65c13ef81d9ad4f46d8a0e0fdba027f22601ec447
+size 30790