sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO / README.md

Commit History

End of training

9ae8351
verified

sergiopaniego commited on 22 days ago

Model save

5644c6d
verified

sergiopaniego commited on 22 days ago

End of training

e4a2529
verified

sergiopaniego commited on 23 days ago

Model save

b82cdac
verified

sergiopaniego commited on 23 days ago

End of training

6acb439
verified

sergiopaniego commited on 24 days ago

Model save

1662395
verified

sergiopaniego commited on 24 days ago