skyimple
/

SmolGRPO-135M

Text Generation

Reasoning-Course

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

SmolGRPO-135M / config.json

Commit History

Upload LlamaForCausalLM

f8b4970
verified

skyimple commited on 2 days ago