sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO / runs

1 contributor

History: 46 commits

sergiopaniego's picture

Training in progress, step 170

f9264f2 verified 21 days ago