salbatarni
/

arabert_cross_organization_task2_fold3

TensorBoard

Safetensors

bert

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

salbatarni commited on Sep 3, 2024

Commit

5ba998a

verified ·

1 Parent(s): 29705bb

Training in progress, step 150

Browse files

Files changed (3) hide show

README.md +93 -36
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,20 +3,20 @@ base_model: aubmindlab/bert-base-arabertv02
 tags:
 - generated_from_trainer
 model-index:
-- name: arabert_cross_organization_task2_fold3
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# arabert_cross_organization_task2_fold3
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7318
-- Qwk: 0.7231
-- Mse: 0.7318
 ## Model description
@@ -36,45 +36,102 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 16
-- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
 |:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
-| No log        | 0.0351 | 2    | 3.0419          | -0.0034 | 3.0419 |
-| No log        | 0.0702 | 4    | 1.8869          | 0.1395  | 1.8869 |
-| No log        | 0.1053 | 6    | 1.4292          | 0.2184  | 1.4292 |
-| No log        | 0.1404 | 8    | 1.3664          | 0.3325  | 1.3664 |
-| No log        | 0.1754 | 10   | 1.2945          | 0.3069  | 1.2945 |
-| No log        | 0.2105 | 12   | 1.1858          | 0.3425  | 1.1858 |
-| No log        | 0.2456 | 14   | 1.0066          | 0.4943  | 1.0066 |
-| No log        | 0.2807 | 16   | 0.9666          | 0.5455  | 0.9666 |
-| No log        | 0.3158 | 18   | 1.0309          | 0.6146  | 1.0309 |
-| No log        | 0.3509 | 20   | 0.9279          | 0.6790  | 0.9279 |
-| No log        | 0.3860 | 22   | 0.8194          | 0.6983  | 0.8194 |
-| No log        | 0.4211 | 24   | 0.7374          | 0.7035  | 0.7374 |
-| No log        | 0.4561 | 26   | 0.7332          | 0.7111  | 0.7332 |
-| No log        | 0.4912 | 28   | 0.6942          | 0.7176  | 0.6942 |
-| No log        | 0.5263 | 30   | 0.6539          | 0.6922  | 0.6539 |
-| No log        | 0.5614 | 32   | 0.6470          | 0.6857  | 0.6470 |
-| No log        | 0.5965 | 34   | 0.6500          | 0.6841  | 0.6500 |
-| No log        | 0.6316 | 36   | 0.6656          | 0.6486  | 0.6656 |
-| No log        | 0.6667 | 38   | 0.6720          | 0.6442  | 0.6720 |
-| No log        | 0.7018 | 40   | 0.6727          | 0.6390  | 0.6727 |
-| No log        | 0.7368 | 42   | 0.6808          | 0.6174  | 0.6808 |
-| No log        | 0.7719 | 44   | 0.6829          | 0.6114  | 0.6829 |
-| No log        | 0.8070 | 46   | 0.6950          | 0.6422  | 0.6950 |
-| No log        | 0.8421 | 48   | 0.7206          | 0.6856  | 0.7206 |
-| No log        | 0.8772 | 50   | 0.7448          | 0.7211  | 0.7448 |
-| No log        | 0.9123 | 52   | 0.7489          | 0.7160  | 0.7489 |
-| No log        | 0.9474 | 54   | 0.7395          | 0.7277  | 0.7395 |
-| No log        | 0.9825 | 56   | 0.7318          | 0.7231  | 0.7318 |
 ### Framework versions

 tags:
 - generated_from_trainer
 model-index:
+- name: arabert_cross_organization_task2_fold2
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# arabert_cross_organization_task2_fold2
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.0548
+- Qwk: 0.1458
+- Mse: 1.0548
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
 |:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
+| No log        | 0.1176 | 2    | 4.4485          | -0.0131 | 4.4485 |
+| No log        | 0.2353 | 4    | 1.8009          | -0.0153 | 1.8009 |
+| No log        | 0.3529 | 6    | 1.1944          | 0.0437  | 1.1944 |
+| No log        | 0.4706 | 8    | 1.2459          | -0.0439 | 1.2459 |
+| No log        | 0.5882 | 10   | 1.1688          | -0.0450 | 1.1688 |
+| No log        | 0.7059 | 12   | 1.1521          | 0.0379  | 1.1521 |
+| No log        | 0.8235 | 14   | 1.1603          | -0.0096 | 1.1603 |
+| No log        | 0.9412 | 16   | 1.1948          | -0.0723 | 1.1948 |
+| No log        | 1.0588 | 18   | 1.3189          | -0.0617 | 1.3189 |
+| No log        | 1.1765 | 20   | 1.4608          | -0.0017 | 1.4608 |
+| No log        | 1.2941 | 22   | 1.2409          | -0.0661 | 1.2409 |
+| No log        | 1.4118 | 24   | 1.1260          | 0.0513  | 1.1260 |
+| No log        | 1.5294 | 26   | 1.1582          | 0.0639  | 1.1582 |
+| No log        | 1.6471 | 28   | 1.1974          | -0.0637 | 1.1974 |
+| No log        | 1.7647 | 30   | 1.2427          | -0.0072 | 1.2427 |
+| No log        | 1.8824 | 32   | 1.2670          | -0.0237 | 1.2670 |
+| No log        | 2.0    | 34   | 1.2862          | -0.0775 | 1.2862 |
+| No log        | 2.1176 | 36   | 1.2811          | -0.0301 | 1.2811 |
+| No log        | 2.2353 | 38   | 1.2493          | 0.0198  | 1.2493 |
+| No log        | 2.3529 | 40   | 1.3023          | -0.0524 | 1.3023 |
+| No log        | 2.4706 | 42   | 1.1620          | 0.0963  | 1.1620 |
+| No log        | 2.5882 | 44   | 1.2006          | 0.0203  | 1.2006 |
+| No log        | 2.7059 | 46   | 1.1721          | -0.0203 | 1.1721 |
+| No log        | 2.8235 | 48   | 1.1251          | 0.0909  | 1.1251 |
+| No log        | 2.9412 | 50   | 1.1646          | 0.0614  | 1.1646 |
+| No log        | 3.0588 | 52   | 1.1537          | 0.1100  | 1.1537 |
+| No log        | 3.1765 | 54   | 1.1619          | 0.0397  | 1.1619 |
+| No log        | 3.2941 | 56   | 1.1446          | 0.0356  | 1.1446 |
+| No log        | 3.4118 | 58   | 1.1100          | 0.1366  | 1.1100 |
+| No log        | 3.5294 | 60   | 1.0950          | 0.0927  | 1.0950 |
+| No log        | 3.6471 | 62   | 1.1914          | 0.0668  | 1.1914 |
+| No log        | 3.7647 | 64   | 1.1642          | 0.0734  | 1.1642 |
+| No log        | 3.8824 | 66   | 1.0702          | 0.1452  | 1.0702 |
+| No log        | 4.0    | 68   | 1.0704          | 0.1474  | 1.0704 |
+| No log        | 4.1176 | 70   | 1.1170          | 0.0391  | 1.1170 |
+| No log        | 4.2353 | 72   | 1.1800          | 0.0595  | 1.1800 |
+| No log        | 4.3529 | 74   | 1.0993          | 0.1283  | 1.0993 |
+| No log        | 4.4706 | 76   | 1.1934          | -0.0135 | 1.1934 |
+| No log        | 4.5882 | 78   | 1.3754          | -0.0259 | 1.3754 |
+| No log        | 4.7059 | 80   | 1.2204          | -0.0135 | 1.2204 |
+| No log        | 4.8235 | 82   | 1.1114          | 0.1016  | 1.1114 |
+| No log        | 4.9412 | 84   | 1.3701          | 0.0289  | 1.3701 |
+| No log        | 5.0588 | 86   | 1.3316          | 0.0728  | 1.3316 |
+| No log        | 5.1765 | 88   | 1.0952          | 0.1185  | 1.0952 |
+| No log        | 5.2941 | 90   | 1.1314          | 0.0453  | 1.1314 |
+| No log        | 5.4118 | 92   | 1.2064          | -0.0035 | 1.2064 |
+| No log        | 5.5294 | 94   | 1.1624          | 0.0524  | 1.1624 |
+| No log        | 5.6471 | 96   | 1.0616          | 0.1805  | 1.0616 |
+| No log        | 5.7647 | 98   | 1.0707          | 0.1579  | 1.0707 |
+| No log        | 5.8824 | 100  | 1.0682          | 0.1543  | 1.0682 |
+| No log        | 6.0    | 102  | 1.0755          | 0.1611  | 1.0755 |
+| No log        | 6.1176 | 104  | 1.1047          | 0.1146  | 1.1047 |
+| No log        | 6.2353 | 106  | 1.0839          | 0.1630  | 1.0839 |
+| No log        | 6.3529 | 108  | 1.1070          | 0.1144  | 1.1070 |
+| No log        | 6.4706 | 110  | 1.1227          | 0.1144  | 1.1227 |
+| No log        | 6.5882 | 112  | 1.1078          | 0.1050  | 1.1078 |
+| No log        | 6.7059 | 114  | 1.1016          | 0.1871  | 1.1016 |
+| No log        | 6.8235 | 116  | 1.0973          | 0.1835  | 1.0973 |
+| No log        | 6.9412 | 118  | 1.0879          | 0.1622  | 1.0879 |
+| No log        | 7.0588 | 120  | 1.1030          | 0.1077  | 1.1030 |
+| No log        | 7.1765 | 122  | 1.0923          | 0.1497  | 1.0923 |
+| No log        | 7.2941 | 124  | 1.0894          | 0.1520  | 1.0894 |
+| No log        | 7.4118 | 126  | 1.0755          | 0.1253  | 1.0755 |
+| No log        | 7.5294 | 128  | 1.0677          | 0.1253  | 1.0677 |
+| No log        | 7.6471 | 130  | 1.0610          | 0.1520  | 1.0610 |
+| No log        | 7.7647 | 132  | 1.1106          | 0.0794  | 1.1106 |
+| No log        | 7.8824 | 134  | 1.0932          | 0.0888  | 1.0932 |
+| No log        | 8.0    | 136  | 1.0392          | 0.1335  | 1.0392 |
+| No log        | 8.1176 | 138  | 1.0756          | 0.1295  | 1.0756 |
+| No log        | 8.2353 | 140  | 1.1032          | 0.1371  | 1.1032 |
+| No log        | 8.3529 | 142  | 1.0707          | 0.1344  | 1.0707 |
+| No log        | 8.4706 | 144  | 1.0399          | 0.1754  | 1.0399 |
+| No log        | 8.5882 | 146  | 1.0486          | 0.1205  | 1.0486 |
+| No log        | 8.7059 | 148  | 1.0606          | 0.1379  | 1.0606 |
+| No log        | 8.8235 | 150  | 1.0717          | 0.1241  | 1.0717 |
+| No log        | 8.9412 | 152  | 1.0674          | 0.1379  | 1.0674 |
+| No log        | 9.0588 | 154  | 1.0527          | 0.1066  | 1.0527 |
+| No log        | 9.1765 | 156  | 1.0449          | 0.1458  | 1.0449 |
+| No log        | 9.2941 | 158  | 1.0540          | 0.1907  | 1.0540 |
+| No log        | 9.4118 | 160  | 1.0626          | 0.1548  | 1.0626 |
+| No log        | 9.5294 | 162  | 1.0605          | 0.1577  | 1.0605 |
+| No log        | 9.6471 | 164  | 1.0583          | 0.1605  | 1.0583 |
+| No log        | 9.7647 | 166  | 1.0560          | 0.1458  | 1.0560 |
+| No log        | 9.8824 | 168  | 1.0549          | 0.1458  | 1.0549 |
+| No log        | 10.0   | 170  | 1.0548          | 0.1458  | 1.0548 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:13173b5d3f194fd50964dff0cbce45207abbf37b8f622daf549bbfbefd8b851c
 size 540799996

 version https://git-lfs.github.com/spec/v1
+oid sha256:0779e2e15a73a35dd3d664f7b018c9a53516a68da7ceb68e39c9d87af2ca1715
 size 540799996

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:943d8a309eeb57d8af02fc720589fff74d63332b3a8dad952627d91fb1462fd2
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:5135ddf942b51dda72bc4bde6a054c657f610866748b0bf4e3a473e4a4162792
 size 5240