sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO

Commit History

Training in progress, step 20

51bb1fc
verified

sergiopaniego commited on 24 days ago

Training in progress, step 10

a7bd6e4
verified

sergiopaniego commited on 24 days ago

initial commit

1306475
verified

sergiopaniego commited on 24 days ago