1 2 10

Ye Zhiling

yzlnew

https://yzlnew.com

yzlnew

AI & ML interests

Deep Learning

Recent Activity

liked a Space 2 days ago

nanotron/ultrascale-playbook

liked a model 7 days ago

Qwen/QwQ-32B

liked a dataset 22 days ago

Congliu/Chinese-DeepSeek-R1-Distill-data-110k

View all activity

Organizations

None yet

yzlnew's activity

liked a Space 2 days ago

2.23k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

liked a model 7 days ago

Qwen/QwQ-32B

Text Generation • Updated 2 days ago • 256k • • 2.08k

liked a dataset 22 days ago

Congliu/Chinese-DeepSeek-R1-Distill-data-110k

Viewer • Updated 20 days ago • 110k • 7.74k • 519

liked a model 28 days ago

deepseek-ai/DeepSeek-V3

Text Generation • Updated 17 days ago • 3.12M • • 3.63k

liked a model 3 months ago

Datou1111/shou_xin

Text-to-Image • Updated Dec 9, 2024 • 1.99k • 866

upvoted an article 3 months ago

Article

🐺🐦‍⬛ LLM Comparison/Test: 25 SOTA LLMs (including QwQ) through 59 MMLU-Pro CS benchmark runs

•

Dec 4, 2024

• 76

upvoted an article 5 months ago

Article

A Short Summary of Chinese AI Global Expansion

Oct 3, 2024

• 22

liked 2 datasets 7 months ago

HuggingFaceTB/cosmopedia

Viewer • Updated Aug 12, 2024 • 31.1M • 26.8k • 592

argilla/magpie-ultra-v0.1

Viewer • Updated Nov 26, 2024 • 50k • 957 • 222

liked 2 datasets over 1 year ago

EleutherAI/proof-pile-2

Updated Oct 25, 2023 • 10.5k • 194

Skywork/SkyPile-150B

Viewer • Updated Dec 7, 2023 • 1.76M • 3.75k • 364

commented a paper over 1 year ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 170 •

liked a Space about 2 years ago

Latex Ocr

👀