CohenQu
/

DeepSeek-R1-Distill-Qwen-7B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-GRPO / model-00003-of-00004.safetensors

Commit History

Training in progress, step 80

eb10412
verified

CohenQu commited on 13 days ago

Training in progress, step 60

0fc30e2
verified

CohenQu commited on 14 days ago

Training in progress, step 40

6dc48a1
verified

CohenQu commited on 14 days ago

Training in progress, step 20

fe77746
verified

CohenQu commited on 15 days ago

Training in progress, step 40

069ea2c
verified

CohenQu commited on 15 days ago

Training in progress, step 20

17e8d9c
verified

CohenQu commited on 15 days ago