interesting - a sebastianrcnt Collection

sebastianrcnt 's Collections

interesting

updated 8 days ago

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 19 days ago • 66
Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published 21 days ago • 28
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published 20 days ago • 11
Large Language Diffusion Models

Paper • 2502.09992 • Published 24 days ago • 99
Distillation Scaling Laws

Paper • 2502.08606 • Published 26 days ago • 46
Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach

Paper • 2502.05171 • Published about 1 month ago • 122