Ziang Song

20212022202320244 29 63 50

Public access

2 articles

0 articles

available

not available

Based on funding mandates

Song MeiAssistant Professor at UC BerkeleyVerified email at berkeley.edu
Yu BaiOpenAIVerified email at salesforce.com
Weijie SuAssociate Professor, University of PennsylvaniaVerified email at wharton.upenn.edu
Tianle CaiPhD Student, Princeton UniversityVerified email at princeton.edu
Jason D. LeeAssociate Professor of Electrical Engineering and Computer Science, Princeton UniversityVerified email at princeton.edu
Tiancheng YuTwo SigmaVerified email at mit.edu
Chi JinAssistant Professor, Princeton UniversityVerified email at princeton.edu

Ziang Song

Verified email at stanford.edu


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
When can we learn general-sum Markov games with a large number of players sample-efficiently? Z Song, S Mei, Y Bai arXiv preprint arXiv:2110.04184, 2021	96	2021
Efficient Phi-regret minimization in extensive-form games via online mirror descent Y Bai, C Jin, S Mei, Z Song, T Yu Advances in Neural Information Processing Systems 35, 22313-22325, 2022	19	2022
Reward collapse in aligning large language models Z Song, T Cai, JD Lee, WJ Su arXiv preprint arXiv:2305.17608, 2023	15	2023
Sample-efficient learning of correlated equilibria in extensive-form games Z Song, S Mei, Y Bai Advances in Neural Information Processing Systems 35, 4099-4110, 2022	14	2022
Reward Collapse in Aligning Large Language Models: A Prompt-Aware Approach to Preference Rankings Z Song, T Cai, JD Lee, WJ Su ICML 2023 Workshop The Many Facets of Preference-Based Learning, 2023	2	2023

The system can't perform the operation now. Try again later.

Articles 1–5

Citations per year