nbd22
/

Llama-3.1-8B-Instruct-GRPO-gsm8k-ft-lora

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-GRPO-gsm8k-ft-lora

Commit History

Model save

d9efc2f
verified

nbd22 commited on 24 days ago

Training in progress, step 233, checkpoint

9d3d93e
verified

nbd22 commited on 24 days ago

Training in progress, step 233

b47735a
verified

nbd22 commited on 24 days ago

initial commit

37f8b3c
verified

nbd22 commited on 25 days ago