salbatarni
/

arabert_cross_organization_task1_fold2

TensorBoard

Safetensors

bert

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

salbatarni commited on Sep 3, 2024

Commit

a69dc59

verified ·

1 Parent(s): fc19bf7

Training in progress, step 170

Browse files

Files changed (3) hide show

README.md +90 -42
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,20 +3,20 @@ base_model: aubmindlab/bert-base-arabertv02
 tags:
 - generated_from_trainer
 model-index:
-- name: arabert_cross_organization_task1_fold2
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# arabert_cross_organization_task1_fold2
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.1151
-- Qwk: 0.0397
-- Mse: 1.1151
 ## Model description
@@ -36,49 +36,97 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 16
-- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
-|:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
-| No log        | 0.0308 | 2    | 8.1063          | 0.0     | 8.1063 |
-| No log        | 0.0615 | 4    | 4.3611          | 0.0014  | 4.3611 |
-| No log        | 0.0923 | 6    | 2.2521          | 0.0584  | 2.2521 |
-| No log        | 0.1231 | 8    | 1.4384          | 0.0131  | 1.4384 |
-| No log        | 0.1538 | 10   | 1.0665          | 0.1602  | 1.0665 |
-| No log        | 0.1846 | 12   | 1.0608          | 0.0513  | 1.0608 |
-| No log        | 0.2154 | 14   | 1.0636          | 0.0036  | 1.0636 |
-| No log        | 0.2462 | 16   | 1.0686          | 0.0036  | 1.0686 |
-| No log        | 0.2769 | 18   | 1.0668          | 0.0036  | 1.0668 |
-| No log        | 0.3077 | 20   | 1.0565          | 0.0036  | 1.0565 |
-| No log        | 0.3385 | 22   | 1.0769          | 0.0289  | 1.0769 |
-| No log        | 0.3692 | 24   | 1.0972          | 0.0487  | 1.0972 |
-| No log        | 0.4    | 26   | 1.1159          | 0.0549  | 1.1159 |
-| No log        | 0.4308 | 28   | 1.1270          | 0.0151  | 1.1270 |
-| No log        | 0.4615 | 30   | 1.1101          | 0.0506  | 1.1101 |
-| No log        | 0.4923 | 32   | 1.0734          | 0.0639  | 1.0734 |
-| No log        | 0.5231 | 34   | 1.0767          | 0.0     | 1.0767 |
-| No log        | 0.5538 | 36   | 1.0893          | -0.0185 | 1.0893 |
-| No log        | 0.5846 | 38   | 1.0994          | -0.0366 | 1.0994 |
-| No log        | 0.6154 | 40   | 1.1021          | -0.0710 | 1.1021 |
-| No log        | 0.6462 | 42   | 1.1002          | -0.0366 | 1.1002 |
-| No log        | 0.6769 | 44   | 1.1002          | -0.0366 | 1.1002 |
-| No log        | 0.7077 | 46   | 1.0992          | -0.0366 | 1.0992 |
-| No log        | 0.7385 | 48   | 1.0933          | -0.0366 | 1.0933 |
-| No log        | 0.7692 | 50   | 1.0949          | 0.0170  | 1.0949 |
-| No log        | 0.8    | 52   | 1.1043          | 0.0338  | 1.1043 |
-| No log        | 0.8308 | 54   | 1.1170          | 0.0169  | 1.1170 |
-| No log        | 0.8615 | 56   | 1.1228          | 0.0651  | 1.1228 |
-| No log        | 0.8923 | 58   | 1.1212          | 0.0474  | 1.1212 |
-| No log        | 0.9231 | 60   | 1.1220          | 0.0474  | 1.1220 |
-| No log        | 0.9538 | 62   | 1.1176          | 0.0397  | 1.1176 |
-| No log        | 0.9846 | 64   | 1.1151          | 0.0397  | 1.1151 |
 ### Framework versions

 tags:
 - generated_from_trainer
 model-index:
+- name: arabert_cross_organization_task1_fold1
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# arabert_cross_organization_task1_fold1
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.9947
+- Qwk: 0.0679
+- Mse: 0.9916
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Qwk     | Mse    |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|
+| No log        | 0.125 | 2    | 5.2049          | -0.0008 | 5.2020 |
+| No log        | 0.25  | 4    | 1.9284          | -0.0122 | 1.9256 |
+| No log        | 0.375 | 6    | 1.0209          | 0.0513  | 1.0167 |
+| No log        | 0.5   | 8    | 0.8405          | 0.0824  | 0.8373 |
+| No log        | 0.625 | 10   | 0.8656          | 0.1060  | 0.8628 |
+| No log        | 0.75  | 12   | 0.8332          | 0.1240  | 0.8306 |
+| No log        | 0.875 | 14   | 0.8775          | 0.0730  | 0.8754 |
+| No log        | 1.0   | 16   | 0.9183          | 0.0104  | 0.9162 |
+| No log        | 1.125 | 18   | 0.9057          | 0.0508  | 0.9032 |
+| No log        | 1.25  | 20   | 0.8886          | 0.1273  | 0.8859 |
+| No log        | 1.375 | 22   | 0.9957          | 0.0849  | 0.9930 |
+| No log        | 1.5   | 24   | 1.0595          | 0.1181  | 1.0564 |
+| No log        | 1.625 | 26   | 1.2289          | 0.0182  | 1.2258 |
+| No log        | 1.75  | 28   | 1.2976          | 0.0182  | 1.2948 |
+| No log        | 1.875 | 30   | 0.9648          | 0.1402  | 0.9617 |
+| No log        | 2.0   | 32   | 0.9714          | 0.1016  | 0.9684 |
+| No log        | 2.125 | 34   | 0.9511          | 0.0710  | 0.9483 |
+| No log        | 2.25  | 36   | 0.8591          | 0.1425  | 0.8564 |
+| No log        | 2.375 | 38   | 0.8696          | 0.1182  | 0.8667 |
+| No log        | 2.5   | 40   | 1.0662          | 0.0360  | 1.0635 |
+| No log        | 2.625 | 42   | 1.1724          | 0.0360  | 1.1696 |
+| No log        | 2.75  | 44   | 1.3100          | 0.0182  | 1.3071 |
+| No log        | 2.875 | 46   | 1.3304          | 0.0182  | 1.3275 |
+| No log        | 3.0   | 48   | 1.0676          | 0.0424  | 1.0645 |
+| No log        | 3.125 | 50   | 0.9732          | 0.0668  | 0.9701 |
+| No log        | 3.25  | 52   | 1.1173          | 0.0279  | 1.1143 |
+| No log        | 3.375 | 54   | 1.2420          | 0.0182  | 1.2393 |
+| No log        | 3.5   | 56   | 1.1410          | 0.0155  | 1.1382 |
+| No log        | 3.625 | 58   | 0.9316          | 0.0268  | 0.9285 |
+| No log        | 3.75  | 60   | 0.8907          | 0.1122  | 0.8876 |
+| No log        | 3.875 | 62   | 1.0183          | 0.0253  | 1.0153 |
+| No log        | 4.0   | 64   | 1.1271          | 0.0279  | 1.1242 |
+| No log        | 4.125 | 66   | 1.1742          | 0.0300  | 1.1712 |
+| No log        | 4.25  | 68   | 1.2066          | 0.0682  | 1.2034 |
+| No log        | 4.375 | 70   | 1.2604          | 0.0377  | 1.2572 |
+| No log        | 4.5   | 72   | 1.1679          | 0.0830  | 1.1646 |
+| No log        | 4.625 | 74   | 1.1770          | 0.0966  | 1.1739 |
+| No log        | 4.75  | 76   | 1.1163          | 0.0966  | 1.1131 |
+| No log        | 4.875 | 78   | 0.9754          | 0.0695  | 0.9721 |
+| No log        | 5.0   | 80   | 0.9489          | 0.0767  | 0.9456 |
+| No log        | 5.125 | 82   | 0.9900          | 0.0994  | 0.9868 |
+| No log        | 5.25  | 84   | 0.8622          | 0.0654  | 0.8588 |
+| No log        | 5.375 | 86   | 0.8621          | 0.1028  | 0.8586 |
+| No log        | 5.5   | 88   | 1.0043          | 0.0807  | 1.0011 |
+| No log        | 5.625 | 90   | 1.0565          | 0.0448  | 1.0533 |
+| No log        | 5.75  | 92   | 0.9899          | 0.0848  | 0.9866 |
+| No log        | 5.875 | 94   | 1.1141          | 0.0466  | 1.1111 |
+| No log        | 6.0   | 96   | 1.3040          | 0.0906  | 1.3012 |
+| No log        | 6.125 | 98   | 1.2856          | 0.1112  | 1.2829 |
+| No log        | 6.25  | 100  | 1.3671          | 0.0962  | 1.3644 |
+| No log        | 6.375 | 102  | 1.2601          | 0.1091  | 1.2574 |
+| No log        | 6.5   | 104  | 1.2039          | 0.1595  | 1.2011 |
+| No log        | 6.625 | 106  | 1.1272          | 0.0913  | 1.1244 |
+| No log        | 6.75  | 108  | 1.0754          | 0.0958  | 1.0725 |
+| No log        | 6.875 | 110  | 1.0818          | 0.0777  | 1.0790 |
+| No log        | 7.0   | 112  | 1.0175          | 0.0670  | 1.0146 |
+| No log        | 7.125 | 114  | 0.9552          | 0.0569  | 0.9521 |
+| No log        | 7.25  | 116  | 0.8938          | 0.1278  | 0.8906 |
+| No log        | 7.375 | 118  | 0.9486          | 0.0697  | 0.9455 |
+| No log        | 7.5   | 120  | 0.9351          | 0.0773  | 0.9319 |
+| No log        | 7.625 | 122  | 0.8928          | 0.0870  | 0.8895 |
+| No log        | 7.75  | 124  | 0.8558          | 0.1373  | 0.8524 |
+| No log        | 7.875 | 126  | 0.8561          | 0.1606  | 0.8527 |
+| No log        | 8.0   | 128  | 0.9205          | 0.0389  | 0.9174 |
+| No log        | 8.125 | 130  | 1.0514          | 0.0941  | 1.0484 |
+| No log        | 8.25  | 132  | 1.0795          | 0.1246  | 1.0765 |
+| No log        | 8.375 | 134  | 1.0151          | 0.0977  | 1.0120 |
+| No log        | 8.5   | 136  | 0.9815          | 0.0716  | 0.9784 |
+| No log        | 8.625 | 138  | 0.9817          | 0.0668  | 0.9786 |
+| No log        | 8.75  | 140  | 0.9721          | 0.0597  | 0.9690 |
+| No log        | 8.875 | 142  | 0.9865          | 0.0668  | 0.9834 |
+| No log        | 9.0   | 144  | 0.9956          | 0.0716  | 0.9925 |
+| No log        | 9.125 | 146  | 0.9824          | 0.0807  | 0.9793 |
+| No log        | 9.25  | 148  | 0.9599          | 0.0721  | 0.9568 |
+| No log        | 9.375 | 150  | 0.9488          | 0.0858  | 0.9456 |
+| No log        | 9.5   | 152  | 0.9443          | 0.0858  | 0.9411 |
+| No log        | 9.625 | 154  | 0.9603          | 0.0721  | 0.9572 |
+| No log        | 9.75  | 156  | 0.9767          | 0.0770  | 0.9735 |
+| No log        | 9.875 | 158  | 0.9906          | 0.0679  | 0.9874 |
+| No log        | 10.0  | 160  | 0.9947          | 0.0679  | 0.9916 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c1e8fdeba182bb588c1e16558a4d8f6f5786f9f972d049e51ba54c8658233dd0
 size 540799996

 version https://git-lfs.github.com/spec/v1
+oid sha256:825f9a97caf0f2752a6f550bfa35bfa69f4a105240d35faf116c26fac90562d8
 size 540799996

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d5b11ff22823da1c2ee8ff8a4b221e7834e23685ac2dea0ce5a00a26c08a35e9
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:c303af4c3c89a48a93b68c66bc209c72d186813399ceeb23f456e2a63d6f5ed8
 size 5240