xwm
/

SciWorld-MPO

Reinforcement Learning

text-generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

SciWorld-MPO / training_loss.png

xwm's picture

xwm

Upload folder using huggingface_hub

8fffc3c verified 21 days ago

40.6 kB