Fuxiang Zhang | Homepage

About Me

I am a Ph.D. candidate at the College of Computing and Data Science, Nanyang Technological University, starting from January 2025, advised by Prof. Bo An. I am part of an industrial post-graduate program (IPP) with Skywork AI.

I obtained my Master's and Bachelor's degrees from Nanjing University. During my time at Nanjing University, I was a member of the LAMDA group, in a reinforcement learning team led by Prof. Zongzhang Zhang.

Research Interests

Large Language Models, Reinforcement Learning, Multi-Agent Reinforcement Learning

Publications

Preprint Manuscripts

Skywork Open Reasoner 1 Technical Report

Jujie He, Jiacai Liu, Chris Yuhao Liu, Rui Yan, Chaojie Wang, Peng Cheng, Xiaoyu Zhang, Fuxiang Zhang, Jiacheng Xu, Wei Shen, Siyuan Li, Liang Zeng, Tianwen Wei, Cheng Cheng, Bo An, Yang Liu, Yahui Zhou
Technical Report, 2025
[Paper]

Skywork-Reward-V2: Scaling Preference Data Curation via Human-AI Synergy

Chris Yuhao Liu, Liang Zeng, Yuzhen Xiao, Jujie He, Jiacai Liu, Chaojie Wang, Rui Yan, Wei Shen, Fuxiang Zhang, Jiacheng Xu, Yang Liu, Yahui Zhou
Technical Report, 2025
[Paper] [Code]

Conference Papers

Incentivizing LLMs to Self-Verify Their Answers

Fuxiang Zhang, Jiacheng Xu, Chaojie Wang, Ce Cui, Yang Liu, Bo An
Conference on Neural Information Processing Systems (NeurIPS), 2025
[Paper] [Code]

Q-Adapter: Customizing Pre-trained LLMs to New Preferences with Forgetting Mitigation

Yi-Chen Li*, Fuxiang Zhang*, Wenjie Qiu, Lei Yuan, Chengxing Jia, Zongzhang Zhang, Yang Yu, Bo An
International Conference on Learning Representations (ICLR), 2025
[Paper] [Code]

Disentangling Policy from Offline Task Representation Learning via Adversarial Data Augmentation

Chengxing Jia*, Fuxiang Zhang*, Yi-Chen Li, Chenxiao Gao, Xu-Hui Liu, Lei Yuan, Zongzhang Zhang, and Yang Yu
International Conference on Autonomous Agents and Multiagent Systems (AAMAS), 2024
[Paper] [Code]

Policy Rehearsing: Training Generalizable Policies for Reinforcement Learning

Chengxing Jia, Chenxiao Gao, Hao Yin, Fuxiang Zhang, Xiyao Chen, Tian Xu, Lei Yuan, Zongzhang Zhang, Zhi-Hua Zhou
International Conference on Learning Representations (ICLR), 2024
[Paper]

Internal Logical Induction for Pixel-Symbolic Reinforcement Learning

Jiacheng Xu, Chao Chen, Fuxiang Zhang, Lei Yuan, Zongzhang Zhang, Yang Yu
ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2023
[Paper]

Policy Regularization with Dataset Constraint for Offline Reinforcement Learning

Yuhang Ran*, Yi-Chen Li*, Fuxiang Zhang, Zongzhang Zhang, and Yang Yu
International Conference on Machine Learning (ICML), 2023
[Paper] [Code]

Discovering Generalizable Multi-agent Coordination Skills from Multi-task Offline Data

Fuxiang Zhang*, Chengxing Jia*, Yi-Chen Li, Lei Yuan, Yang Yu, Zongzhang Zhang
International Conference on Learning Representations (ICLR), 2023
[Paper] [Code]

Multi-Agent Concentrative Coordination with Decentralized Task Representation

Lei Yuan, Chenghe Wang, Jianhao Wang, Fuxiang Zhang, Feng Chen, Cong Guan, Zongzhang Zhang, Chongjie Zhang, Yang Yu
International Joint Conference on Artificial Intelligence (IJCAI), 2022
[Paper] [Code]

Towards Deployment-Efficient and Collision-Free Multi-Agent Path Finding (Student Abstract)

Feng Chen, Chenghe Wang, Fuxiang Zhang, Haotian Ding, Qiyu Zhong, Shi Pu, Zongzhang Zhang
AAAI Conference on Artificial Intelligence (AAAI), Student Abstract, 2023
[Paper]

Multi-Agent Incentive Communication via Decentralized Teammate Modeling

Lei Yuan*, Jianhao Wang*, Fuxiang Zhang*, Chenghe Wang, Zongzhang Zhang, Yang Yu, and Chongjie Zhang
AAAI Conference on Artificial Intelligence (AAAI), 2022
[Paper] [Code]

Journal Papers

Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models

Fuxiang Zhang, Junyou Li, Yi-Chen Li, Zongzhang Zhang, Yang Yu, Deheng Ye
IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2025
[Paper] [Code]

Generalizable Multi-Modal Adversarial Imitation Learning for Non-Stationary Dynamics

Yi-Chen Li, Ningjing Chao, Zongzhang Zhang, Fuxiang Zhang, Lei Yuan, Yang Yu
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025
[Paper] [Code]

Multiagent Continual Coordination via Progressive Task Contextualization

Lei Yuan, Lihe Li, Ziqian Zhang, Fuxiang Zhang, Cong Guan, Yang Yu
IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2025
[Paper] [Code]

Model Gradient: Unified Model and Policy Learning in Model-based Reinforcement Learning

Chengxing Jia*, Fuxiang Zhang*, Tian Xu, Jing-Cheng Pang, Zongzhang Zhang, and Yang Yu
Frontiers of Computer Science, 2024
[Paper]

* denotes equal contribution