nbd22
/

Llama-3.1-8B-Instruct-GRPO-gsm8k-ft-lora

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-GRPO-gsm8k-ft-lora / README.md

Commit History

Model save

d9efc2f
verified

nbd22 commited on 25 days ago