1 2 1

MZ

Shahradmz

https://emzedi.github.io/website/#

EMZEDI

AI & ML interests

LLMs, Graph Learning, Temporal Graph Learning, RL, Continual RL, Optimization

Recent Activity

updated a model about 16 hours ago

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_0

updated a model about 16 hours ago

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_1

published a model about 16 hours ago

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_1

View all activity

Organizations

Collections 1

Papers 2

arxiv:2410.15460

arxiv:2401.17574

models 104

datasets 8

Shahradmz/cppo_continual_dataset_rl_others

Viewer • Updated 3 days ago • 75.7k • 34

Shahradmz/cppo_continual_dataset_rl_relationships

Viewer • Updated 3 days ago • 93.9k • 37

Shahradmz/cppo_continual_dataset_reward_others

Viewer • Updated 3 days ago • 78.5k • 36

Shahradmz/cppo_continual_dataset_reward_relationships

Viewer • Updated 3 days ago • 97.4k • 36

Shahradmz/ca_constitution_1

Viewer • Updated Nov 25, 2024 • 33.7k • 72

Shahradmz/ca_constitution_2

Viewer • Updated Nov 23, 2024 • 35.8k • 82

Shahradmz/assertiveness-corpus

Viewer • Updated Jul 30, 2024 • 6k • 87

Shahradmz/2MSampled_OpenWebText

Updated Jan 10, 2024 • 2

MZ

AI & ML interests

Recent Activity

Organizations

Collections 1

Shahradmz/ca_constitution_2

Shahradmz/ca_constitution_1

Shahradmz/OLMo-1B-hf-DPO-constitution-full-2

Shahradmz/OLMo-1B-hf-DPO-constitution-1

Papers 2

models 104

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_0

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_1

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

Shahradmz/Qwen2-0.5B-Reward-LoRA

Shahradmz/llama8b_SEND_1B-alpaca-5

Shahradmz/llama8b_SEND_1B-legalbench-5

Shahradmz/llama8b_SEND_1B-codesearchnet-5

Shahradmz/llama8b_SEND_1B-helm-5

Shahradmz/llama8b_SEND_1B-codesearchnet-4

Shahradmz/llama8b_SEND_1B-alpaca-4

datasets 8

Shahradmz/cppo_continual_dataset_rl_others

Shahradmz/cppo_continual_dataset_rl_relationships

Shahradmz/cppo_continual_dataset_reward_others

Shahradmz/cppo_continual_dataset_reward_relationships

Shahradmz/ca_constitution_1

Shahradmz/ca_constitution_2

Shahradmz/assertiveness-corpus

Shahradmz/2MSampled_OpenWebText

MZ

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 2

models 104 Sort: Recently updated

datasets 8 Sort: Recently updated

models 104

datasets 8