kenhktsui
/

Qwen2.5-3B-Instruct-GRPO-basic-sampling_temp_05

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GRPO-basic-sampling_temp_05

1 contributor

History: 2 commits

kenhktsui's picture

Upload README.md with huggingface_hub

fdae725 verified 8 days ago