taozihuahua
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO

Commit History

End of training

73c5e9c
verified

taozihuahua commited on 5 days ago

Model save

44254b8
verified

taozihuahua commited on 5 days ago

Model save

c3f27a0
verified

taozihuahua commited on 6 days ago

Model save

91e7fcf
verified

taozihuahua commited on 7 days ago

initial commit

97bdf4e
verified

taozihuahua commited on 7 days ago