salbatarni
/

arabert_baseline_grammar_task6_fold0

TensorBoard

Safetensors

bert

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

salbatarni commited on Aug 29, 2024

Commit

7c8c75d

verified ·

1 Parent(s): 7522dcc

End of training

Browse files

Files changed (1) hide show

README.md +27 -37

README.md CHANGED Viewed

@@ -3,20 +3,20 @@ base_model: aubmindlab/bert-base-arabertv02
 tags:
 - generated_from_trainer
 model-index:
-- name: arabert_baseline_grammar_task5_fold1
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# arabert_baseline_grammar_task5_fold1
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4829
-- Qwk: 0.6262
-- Mse: 0.4829
 ## Model description
@@ -45,38 +45,28 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
-|:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
-| No log        | 0.3333 | 2    | 2.4374          | 0.0250  | 2.4374 |
-| No log        | 0.6667 | 4    | 0.9732          | -0.0090 | 0.9732 |
-| No log        | 1.0    | 6    | 0.5943          | 0.3165  | 0.5943 |
-| No log        | 1.3333 | 8    | 0.5108          | 0.3182  | 0.5108 |
-| No log        | 1.6667 | 10   | 0.4747          | 0.3137  | 0.4747 |
-| No log        | 2.0    | 12   | 0.4634          | 0.3165  | 0.4634 |
-| No log        | 2.3333 | 14   | 0.4798          | 0.4509  | 0.4798 |
-| No log        | 2.6667 | 16   | 0.4795          | 0.4737  | 0.4795 |
-| No log        | 3.0    | 18   | 0.5467          | 0.5327  | 0.5467 |
-| No log        | 3.3333 | 20   | 0.5831          | 0.5327  | 0.5831 |
-| No log        | 3.6667 | 22   | 0.5213          | 0.6269  | 0.5213 |
-| No log        | 4.0    | 24   | 0.6213          | 0.7087  | 0.6213 |
-| No log        | 4.3333 | 26   | 0.6774          | 0.7236  | 0.6774 |
-| No log        | 4.6667 | 28   | 0.6694          | 0.7236  | 0.6694 |
-| No log        | 5.0    | 30   | 0.5668          | 0.7     | 0.5668 |
-| No log        | 5.3333 | 32   | 0.5235          | 0.7059  | 0.5235 |
-| No log        | 5.6667 | 34   | 0.5216          | 0.7059  | 0.5216 |
-| No log        | 6.0    | 36   | 0.5070          | 0.5957  | 0.5070 |
-| No log        | 6.3333 | 38   | 0.5038          | 0.6047  | 0.5038 |
-| No log        | 6.6667 | 40   | 0.5220          | 0.6606  | 0.5220 |
-| No log        | 7.0    | 42   | 0.5420          | 0.6377  | 0.5420 |
-| No log        | 7.3333 | 44   | 0.5474          | 0.6667  | 0.5474 |
-| No log        | 7.6667 | 46   | 0.5400          | 0.6262  | 0.5400 |
-| No log        | 8.0    | 48   | 0.5341          | 0.6262  | 0.5341 |
-| No log        | 8.3333 | 50   | 0.5282          | 0.6262  | 0.5282 |
-| No log        | 8.6667 | 52   | 0.5146          | 0.6262  | 0.5146 |
-| No log        | 9.0    | 54   | 0.4982          | 0.6262  | 0.4982 |
-| No log        | 9.3333 | 56   | 0.4857          | 0.6262  | 0.4857 |
-| No log        | 9.6667 | 58   | 0.4846          | 0.6262  | 0.4846 |
-| No log        | 10.0   | 60   | 0.4829          | 0.6262  | 0.4829 |
 ### Framework versions

 tags:
 - generated_from_trainer
 model-index:
+- name: arabert_baseline_grammar_task6_fold0
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# arabert_baseline_grammar_task6_fold0
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4892
+- Qwk: 0.6051
+- Mse: 0.4892
 ## Model description
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Qwk    | Mse    |
+|:-------------:|:-----:|:----:|:---------------:|:------:|:------:|
+| No log        | 0.5   | 2    | 1.0890          | 0.2687 | 1.0890 |
+| No log        | 1.0   | 4    | 0.7915          | 0.3000 | 0.7915 |
+| No log        | 1.5   | 6    | 0.8650          | 0.3529 | 0.8650 |
+| No log        | 2.0   | 8    | 0.7927          | 0.3529 | 0.7927 |
+| No log        | 2.5   | 10   | 0.6821          | 0.2602 | 0.6821 |
+| No log        | 3.0   | 12   | 0.6081          | 0.4793 | 0.6081 |
+| No log        | 3.5   | 14   | 0.6266          | 0.5882 | 0.6266 |
+| No log        | 4.0   | 16   | 0.7668          | 0.5191 | 0.7668 |
+| No log        | 4.5   | 18   | 0.7382          | 0.6164 | 0.7382 |
+| No log        | 5.0   | 20   | 0.5722          | 0.7651 | 0.5722 |
+| No log        | 5.5   | 22   | 0.5444          | 0.6755 | 0.5444 |
+| No log        | 6.0   | 24   | 0.5298          | 0.6755 | 0.5298 |
+| No log        | 6.5   | 26   | 0.5351          | 0.7651 | 0.5351 |
+| No log        | 7.0   | 28   | 0.5998          | 0.6957 | 0.5998 |
+| No log        | 7.5   | 30   | 0.5874          | 0.6957 | 0.5874 |
+| No log        | 8.0   | 32   | 0.5369          | 0.6216 | 0.5369 |
+| No log        | 8.5   | 34   | 0.4961          | 0.6480 | 0.4961 |
+| No log        | 9.0   | 36   | 0.4879          | 0.6051 | 0.4879 |
+| No log        | 9.5   | 38   | 0.4895          | 0.6051 | 0.4895 |
+| No log        | 10.0  | 40   | 0.4892          | 0.6051 | 0.4892 |
 ### Framework versions