sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO

1 contributor

History: 35 commits

sergiopaniego's picture

Training in progress, step 10

ca2ae78 verified 22 days ago

runs
Training in progress, step 10 22 days ago
.gitattributes

1.57 kB

Training in progress, step 10 24 days ago
README.md

2.14 kB

End of training 23 days ago
adapter_config.json

719 Bytes

Training in progress, step 10 24 days ago
adapter_model.safetensors

2.18 MB
LFS

Training in progress, step 10 22 days ago
added_tokens.json

80 Bytes

Training in progress, step 10 24 days ago
merges.txt

1.67 MB

Training in progress, step 10 24 days ago
special_tokens_map.json

367 Bytes

Training in progress, step 10 24 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 10 24 days ago
tokenizer_config.json

1.36 kB

Training in progress, step 10 24 days ago
training_args.bin
Detected Pickle imports (10)
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.training_args.OptimizerNames",
- "torch.device",
- "accelerate.state.PartialState",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "trl.trainer.grpo_config.GRPOConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.utils.dataclasses.DistributedType"
How to fix it?
5.56 kB
LFS

Training in progress, step 10 22 days ago
vocab.json

2.78 MB

Training in progress, step 10 24 days ago