Jinyang Wu's picture

Jinyang Wu

Jinyang23

·

https://orcid.org/my-orcid?orcid=0009-0006-0220-616X

jinyangwu

AI & ML interests

large language models, reasoning, agentic rl

Recent Activity

updated a model about 18 hours ago

Jinyang23/OPID-ALFWorld-1.7B

published a model about 18 hours ago

Jinyang23/OPID-ALFWorld-1.7B

upvoted a paper about 19 hours ago

OPID: On-Policy Skill Distillation for Agentic Reinforcement Learning

View all activity

Organizations

None yet

Papers 14

arxiv:2606.13707

arxiv:2606.09131

arxiv:2605.22177

arxiv:2605.06234

models 5

Jinyang23/OPID-ALFWorld-1.7B

Reinforcement Learning • 2B • Updated about 17 hours ago

Jinyang23/Maestro-4B

5B • Updated May 22 • 9

Jinyang23/Spark-1.5B-ScienceWorld

Reinforcement Learning • 2B • Updated Jan 30 • 9

Jinyang23/Spark-1.5B-WebShop

Reinforcement Learning • 2B • Updated Jan 30 • 2

Jinyang23/Spark-1.5B-ALFWorld

Reinforcement Learning • 2B • Updated Jan 30 • 4

datasets 1

Jinyang23/NoiserBench

Preview • Updated May 31, 2025 • 66 • 3