salbatarni
/

arabert_cross_vocabulary_task3_fold2

TensorBoard

Safetensors

bert

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

salbatarni commited on Sep 1, 2024

Commit

77cc047

verified ·

1 Parent(s): c4af2f1

End of training

Browse files

Files changed (1) hide show

README.md +40 -36

README.md CHANGED Viewed

@@ -3,20 +3,20 @@ base_model: aubmindlab/bert-base-arabertv02
 tags:
 - generated_from_trainer
 model-index:
-- name: arabert_cross_vocabulary_task3_fold1
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# arabert_cross_vocabulary_task3_fold1
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5285
-- Qwk: 0.4405
-- Mse: 0.5285
 ## Model description
@@ -47,37 +47,41 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
 |:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
-| No log        | 0.0317 | 2    | 8.4052          | 0.0     | 8.4052 |
-| No log        | 0.0635 | 4    | 5.1861          | -0.0063 | 5.1861 |
-| No log        | 0.0952 | 6    | 2.9254          | 0.0185  | 2.9254 |
-| No log        | 0.1270 | 8    | 1.8370          | 0.0864  | 1.8370 |
-| No log        | 0.1587 | 10   | 1.1161          | 0.0869  | 1.1161 |
-| No log        | 0.1905 | 12   | 0.8855          | 0.1061  | 0.8855 |
-| No log        | 0.2222 | 14   | 1.2541          | 0.1523  | 1.2541 |
-| No log        | 0.2540 | 16   | 1.9970          | 0.1566  | 1.9970 |
-| No log        | 0.2857 | 18   | 1.0435          | 0.2378  | 1.0435 |
-| No log        | 0.3175 | 20   | 0.6890          | 0.3618  | 0.6890 |
-| No log        | 0.3492 | 22   | 0.5804          | 0.4399  | 0.5804 |
-| No log        | 0.3810 | 24   | 0.5528          | 0.4709  | 0.5528 |
-| No log        | 0.4127 | 26   | 0.5886          | 0.4445  | 0.5886 |
-| No log        | 0.4444 | 28   | 0.8824          | 0.37    | 0.8824 |
-| No log        | 0.4762 | 30   | 0.8947          | 0.3615  | 0.8947 |
-| No log        | 0.5079 | 32   | 0.6729          | 0.4052  | 0.6729 |
-| No log        | 0.5397 | 34   | 0.5355          | 0.4536  | 0.5355 |
-| No log        | 0.5714 | 36   | 0.4786          | 0.4846  | 0.4786 |
-| No log        | 0.6032 | 38   | 0.4704          | 0.4846  | 0.4704 |
-| No log        | 0.6349 | 40   | 0.4945          | 0.4637  | 0.4945 |
-| No log        | 0.6667 | 42   | 0.6100          | 0.4202  | 0.6100 |
-| No log        | 0.6984 | 44   | 0.6733          | 0.3645  | 0.6733 |
-| No log        | 0.7302 | 46   | 0.6704          | 0.3694  | 0.6704 |
-| No log        | 0.7619 | 48   | 0.6390          | 0.3820  | 0.6390 |
-| No log        | 0.7937 | 50   | 0.5726          | 0.4157  | 0.5726 |
-| No log        | 0.8254 | 52   | 0.5435          | 0.4449  | 0.5435 |
-| No log        | 0.8571 | 54   | 0.5097          | 0.4543  | 0.5097 |
-| No log        | 0.8889 | 56   | 0.5010          | 0.4503  | 0.5010 |
-| No log        | 0.9206 | 58   | 0.5122          | 0.4418  | 0.5122 |
-| No log        | 0.9524 | 60   | 0.5275          | 0.4351  | 0.5275 |
-| No log        | 0.9841 | 62   | 0.5285          | 0.4405  | 0.5285 |
 ### Framework versions

 tags:
 - generated_from_trainer
 model-index:
+- name: arabert_cross_vocabulary_task3_fold2
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# arabert_cross_vocabulary_task3_fold2
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.2889
+- Qwk: 0.1455
+- Mse: 1.2889
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
 |:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
+| No log        | 0.0282 | 2    | 8.9247          | 0.0     | 8.9247 |
+| No log        | 0.0563 | 4    | 6.0585          | -0.0018 | 6.0585 |
+| No log        | 0.0845 | 6    | 3.3683          | 0.0     | 3.3683 |
+| No log        | 0.1127 | 8    | 1.9295          | 0.0353  | 1.9295 |
+| No log        | 0.1408 | 10   | 1.1575          | 0.0     | 1.1575 |
+| No log        | 0.1690 | 12   | 0.8179          | 0.0531  | 0.8179 |
+| No log        | 0.1972 | 14   | 0.7602          | -0.0155 | 0.7602 |
+| No log        | 0.2254 | 16   | 0.7582          | -0.0014 | 0.7582 |
+| No log        | 0.2535 | 18   | 0.7660          | 0.0643  | 0.7660 |
+| No log        | 0.2817 | 20   | 0.7464          | 0.0434  | 0.7464 |
+| No log        | 0.3099 | 22   | 0.7568          | 0.0     | 0.7568 |
+| No log        | 0.3380 | 24   | 0.7822          | 0.0     | 0.7822 |
+| No log        | 0.3662 | 26   | 0.8311          | 0.0     | 0.8311 |
+| No log        | 0.3944 | 28   | 0.8980          | 0.0     | 0.8980 |
+| No log        | 0.4225 | 30   | 0.9093          | 0.0     | 0.9093 |
+| No log        | 0.4507 | 32   | 0.8669          | 0.0     | 0.8669 |
+| No log        | 0.4789 | 34   | 0.8507          | 0.0     | 0.8507 |
+| No log        | 0.5070 | 36   | 0.8627          | 0.0     | 0.8627 |
+| No log        | 0.5352 | 38   | 0.8443          | 0.0     | 0.8443 |
+| No log        | 0.5634 | 40   | 0.8722          | 0.0     | 0.8722 |
+| No log        | 0.5915 | 42   | 0.9229          | 0.0     | 0.9229 |
+| No log        | 0.6197 | 44   | 0.9827          | 0.0     | 0.9827 |
+| No log        | 0.6479 | 46   | 1.0396          | 0.0     | 1.0396 |
+| No log        | 0.6761 | 48   | 1.1196          | 0.0     | 1.1196 |
+| No log        | 0.7042 | 50   | 1.1654          | 0.0     | 1.1654 |
+| No log        | 0.7324 | 52   | 1.1934          | 0.0086  | 1.1934 |
+| No log        | 0.7606 | 54   | 1.2497          | 0.0603  | 1.2497 |
+| No log        | 0.7887 | 56   | 1.2723          | 0.0272  | 1.2723 |
+| No log        | 0.8169 | 58   | 1.2595          | 0.1040  | 1.2595 |
+| No log        | 0.8451 | 60   | 1.2516          | 0.1696  | 1.2516 |
+| No log        | 0.8732 | 62   | 1.2442          | 0.1807  | 1.2442 |
+| No log        | 0.9014 | 64   | 1.2514          | 0.1696  | 1.2514 |
+| No log        | 0.9296 | 66   | 1.2627          | 0.1524  | 1.2627 |
+| No log        | 0.9577 | 68   | 1.2780          | 0.1455  | 1.2780 |
+| No log        | 0.9859 | 70   | 1.2889          | 0.1455  | 1.2889 |
 ### Framework versions