Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

AutoTrain Compatible

4-bit precision

Carbon Emissions

8-bit precision

Misc with no match

text-embeddings-inference

Mixture of Experts

Models

413

Full-text search

Active filters: grpo

yooneo/qwen-0.5b-r1-aha

Updated 14 days ago

yooneo/qwen-1.5b-r1-aha

Updated 14 days ago

spinech/qwen2.5-3b-r1-rearc-stage1

Text Generation • Updated 14 days ago • 136

hyunw3/qwen-2.5-0.5b-r1-countdown

Text Generation • Updated 14 days ago • 5

hyunw3/qwen-2.5-0.5b-r1-countdown_lr1.0e-6

Text Generation • Updated 14 days ago • 3

mgaimm/qwen-2.5-3b-r1-countdown

Text Generation • Updated 13 days ago • 10

tuyentx/qwen-2.5-3b-r1-countdown

Text Generation • Updated 13 days ago • 9

pablo-chocobar/qwen-2.5-3b-r1-countdown

Text Generation • Updated 11 days ago • 8

mradermacher/Qwen2.5-1.5B-Open-R1-GRPO-GGUF

Updated 13 days ago • 341

Julian-Sheeper/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • Updated 13 days ago • 7

pullpull/qwen-2.5-3b-r1-countdown

Text Generation • Updated 12 days ago • 2

justinj92/Qwen2.5-1.5B-Thinking-Q8_0-GGUF

Updated 12 days ago • 23

justinj92/Qwen2.5-1.5B-Thinking-Q5_K_M-GGUF

Updated 12 days ago • 25

spinech/qwen2.5-3b-r1-arc-train

Text Generation • Updated 12 days ago • 130

howardzhou/Qwen2.5-3B-Open-R1-GRPO

Text Generation • Updated 10 days ago • 7

jainamit/qwen-2.5-3b-r1-countdown

Text Generation • Updated 8 days ago • 8

GitBag/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • Updated 11 days ago • 4

justinj92/Qwen2.5-1.5B-Thinking-v1.1-Q8_0-GGUF

Updated 11 days ago • 13

justinj92/Qwen2.5-1.5B-Thinking-v1.1-Q5_K_M-GGUF

Updated 11 days ago • 25

Dongwei/Qwen-2.5-7B

Text Generation • Updated 12 days ago • 7

emre/Qwen-0.5B-GRPO

Text Generation • Updated 12 days ago • 41

peulsilva/reasoning-qwen-epoch0

Text Generation • Updated 12 days ago • 4

peulsilva/reasoning-qwen-epoch1

Text Generation • Updated 12 days ago • 6

spinech/qwen2.5-3b-r1-arc-train-synthetic

Text Generation • Updated 11 days ago • 28

peulsilva/reasoning-qwen-epoch2

Text Generation • Updated 12 days ago • 4

laolaorkk/Qwen2.5-1.5B-R1-GRPO-debug

Text Generation • Updated 9 days ago • 11

Dongwei/DeepSeek-R1-Distill-Qwen-7B-GRPO_Math

Text Generation • Updated 11 days ago • 69

Dongwei/Qwen-2.5-7B_Math

Text Generation • Updated 11 days ago • 23

Dongwei/Qwen2.5-1.5B-Open-R1-GRPO_Math

Text Generation • Updated 11 days ago • 18

Dongwei/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_Math

Text Generation • Updated 11 days ago • 21