Mohammad Ghavamzadeh

Процитировано

	Все	Начиная с 2019 г.
Статистика цитирования	13083	9671
h-индекс	57	44
i10-индекс	118	110

2900

1450

725

2175

2005200620072008200920102011201220132014201520162017201820192020202120222023202436 50 58 69 107 104 181 232 200 263 297 355 412 578 916 1186 1677 2091 2804 989

Общий доступ

Просмотреть все

14 статей

0 статей

доступно

недоступно

На основе финансирования

Соавторы

Yinlam ChowResearch Scientist, Google ResearchПодтвержден адрес электронной почты в домене google.com
Alessandro LazaricResearch Scientist, Facebook Artificial Intelligence ResearchПодтвержден адрес электронной почты в домене inria.fr
Shie MannorProfessor of Electrical Engineering @ Technion & Researcher @ Nvidia ResearchПодтвержден адрес электронной почты в домене technion.ac.il
Branislav KvetonAmazonПодтвержден адрес электронной почты в домене amazon.com
Sridhar MahadevanDirector, Data Science Lab, Adobe Research & Professor, University of Massachusetts, AmherstПодтвержден адрес электронной почты в домене cs.umass.edu
Rémi MunosDeepMindПодтвержден адрес электронной почты в домене inria.fr
Csaba SzepesvariDeepMind & University of AlbertaПодтвержден адрес электронной почты в домене cs.ualberta.ca
Georgios TheocharousAdobe ResearchПодтвержден адрес электронной почты в домене adobe.com
Amir-massoud FarahmandUniversity of TorontoПодтвержден адрес электронной почты в домене cs.toronto.edu
Craig BoutilierPrincipal Scientist, GoogleПодтвержден адрес электронной почты в домене google.com
Marek PetrikUniversity of New HampshireПодтвержден адрес электронной почты в домене cs.unh.edu
Ofir NachumOpenAIПодтвержден адрес электронной почты в домене openai.com
Philip ThomasUniversity of Massachusetts AmherstПодтвержден адрес электронной почты в домене cs.umass.edu
Shalabh BhatnagarProfessor in the Department of Computer Science and Automation, Indian Institute of ScienceПодтвержден адрес электронной почты в домене iisc.ac.in
Richard S. SuttonKeen, Amii, and University of AlbertaПодтвержден адрес электронной почты в домене richsutton.com
Hung BuiResearch Scientist, Google DeepMindПодтвержден адрес электронной почты в домене google.com
Zheng WenGoogle DeepMindПодтвержден адрес электронной почты в домене google.com
Aviv TamarTechnionПодтвержден адрес электронной почты в домене technion.ac.il
Bo LiuAAAI SM, IEEE SMПодтвержден адрес электронной почты в домене cs.umass.edu
Matthieu GeistCohere (ex Google, on leave of Professor, Université de Lorraine)Подтвержден адрес электронной почты в домене univ-lorraine.fr

Mohammad Ghavamzadeh

Amazon

Подтвержден адрес электронной почты в домене amazon.com - Главная страница

Reinforcement Learning Online Learning Machine Learning Control AI


Название По числу цитат По году По названию	Процитировано Процитировано	Год
A Review of Uncertainty Quantification in Deep Learning: Techniques, Applications and Challenges M Abdar, F Pourpanah, S Hussain, D Rezazadegan, L Liu, ... Information Fusion, 2021	1686	2021
Natural Actor–critic Algorithms S Bhatnagar, RS Sutton, M Ghavamzadeh, M Lee Automatica 45 (11), 2471-2482, 2009	1087*	2009
A Lyapunov-based Approach to Safe Reinforcement Learning Y Chow, O Nachum, E Duenez-Guzman, M Ghavamzadeh Neural Information Processing Systems, 8103-8112, 2018	528	2018
Bayesian Reinforcement Learning: A Survey M Ghavamzadeh, S Mannor, J Pineau, A Tamar Foundations and Trends in Machine Learning 8 (5-6), 359-483, 2015	524	2015
Risk-constrained Reinforcement Learning with Percentile Risk Criteria Y Chow, M Ghavamzadeh, L Janson, M Pavone Journal of Machine Learning Research (JMLR) 18, 6070-6120, 2017	497	2017
Algorithms for CVaR Optimization in MDPs Y Chow, M Ghavamzadeh Advances in Neural Information Processing Systems, 3509-3517, 2014	397	2014
Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence V Gabillon, M Ghavamzadeh, A Lazaric Neural Information Processing Systems, 3221-3229, 2012	339	2012
Actor-Critic Algorithms for Risk-sensitive MDPs LA Prashanth, M Ghavamzadeh Neural Information Processing Systems, 252-260, 2013	336*	2013
High-confidence Off-policy Evaluation P Thomas, G Theocharous, M Ghavamzadeh AAAI, 3000-3006, 2015	304	2015
More Robust Doubly Robust Off-policy Evaluation M Farajtabar, Y Chow, M Ghavamzadeh ICML, 1447-1456, 2018	252	2018
Safe Policy Learning for Continuous Control Y Chow, O Nachum, A Faust, E Duenez-Guzman, M Ghavamzadeh Conference on Robot Learning (CoRL), 2020	246*	2020
High Confidence Policy Improvement P Thomas, G Theocharous, M Ghavamzadeh ICML, 2380-2388, 2015	214	2015
Speedy Q-learning M Ghavamzadeh, H Kappen, M Azar, R Munos Neural Information Processing Systems 24, 2411-2419, 2011	202*	2011
Supervised actor-critic reinforcement learning MT Rosenstein, AG Barto, J Si, A Barto, W Powell, D Wunsch Learning and approximate dynamic programming: scaling up to the real world …, 2004	197	2004
Hierarchical Multi-agent Reinforcement Learning R Makar, S Mahadevan, M Ghavamzadeh International Conference on Autonomous Agents, 246-253, 2001	194	2001
Personalized Ad Recommendation Systems for Life-time Value Optimization with Guarantees G Theocharous, PS Thomas, M Ghavamzadeh IJCAI, 1806-1812, 2015	191*	2015
Benchmarking Batch Deep Reinforcement Learning Algorithms S Fujimoto, E Conti, M Ghavamzadeh, J Pineau arXiv preprint arXiv:1910.01708, 2019	189	2019
Finite-Sample Analysis of Proximal Gradient TD Algorithms B Liu, J Liu, M Ghavamzadeh, S Mahadevan, M Petrik UAI, 504-513, 2015	172*	2015
Hierarchical Multi-agent Reinforcement Learning M Ghavamzadeh, S Mahadevan, R Makar Journal of Autonomous Agents and Multi-Agent Systems (JAAMAS) 13 (2), 197-229, 2006	172	2006
Regularized Policy Iteration AM Farahmand, M Ghavamzadeh, C Szepesvári, S Mannor Neural Information Processing Systems, 441-448, 2008	162	2008

В данный момент система не может выполнить эту операцию. Повторите попытку позднее.

Статьи 1–20

Ссылок за год

Повторяющиеся цитирования

Объединенные цитирования

СоавторыСоавторы

Подписаться

Процитировано

Соавторы