Ruo Yu Tao

120

20182019202020212022202320247 28 41 58 64 108 31

Marc-Alexandre CôtéMicrosoft ResearchПодтвержден адрес электронной почты в домене usherbrooke.ca
Layla El AsriResearch Lead at Borealis AIПодтвержден адрес электронной почты в домене borealisai.com
Joelle PineauSchool of Computer Science, McGill University; FAIR, Meta AI; MilaПодтвержден адрес электронной почты в домене cs.mcgill.ca
Vincent François-LavetVU AmsterdamПодтвержден адрес электронной почты в домене vu.nl
Adam WhiteUniversity of Alberta, Amii (Alberta Machine Intelligence Institute)Подтвержден адрес электронной почты в домене ualberta.ca
Marlos C. MachadoUniversity of AlbertaПодтвержден адрес электронной почты в домене ualberta.ca

Ruo Yu Tao

Подтвержден адрес электронной почты в домене brown.edu - Главная страница


Название По числу цитат По году По названию	Процитировано Процитировано	Год
Textworld: A learning environment for text-based games MA Côté, Á Kádár, X Yuan, B Kybartas, T Barnes, E Fine, J Moore, ... arXiv preprint arXiv:1806.11532, 2018	281	2018
Novelty Search in representational space for sample efficient exploration RY Tao, V François-Lavet, J Pineau Advances in Neural Information Processing Systems 33, 2020	41	2020
Towards solving text-based games by producing adaptive action spaces RY Tao, MA Côté, X Yuan, LE Asri arXiv preprint arXiv:1812.00855, 2018	14	2018
Measuring and mitigating interference in reinforcement learning V Liu, H Wang, RY Tao, K Javed, A White, M White Conference on Lifelong Learning Agents, 781-795, 2023	3	2023
Agent-state construction with auxiliary inputs RY Tao, A White, MC Machado arXiv preprint arXiv:2211.07805, 2022	1	2022
Resolving Partial Observability in Decision Processes via the Lambda Discrepancy C Allen, AT Kirtland, RY Tao, D Scott, S Lobel, N Petrocelli, O Gottesman, ...		2023
RL: Generic reinforcement learning codebase in TensorFlow BM Li, A Cowen-Rivers, P Kozakowski, D Tao, SR Kamalakara, ... Journal of Open Source Software 4 (42), 1524, 2019		2019
Robust Linear Reinforcement Learning S Lobel, RY Tao, T Akbulut

В данный момент система не может выполнить эту операцию. Повторите попытку позднее.

Статьи 1–8

Ссылок за год