Matthew Rahtz

Процитировано

	Все	Начиная с 2019 г.
Статистика цитирования	2278	1263
h-индекс	7	6
i10-индекс	6	6

520

260

130

390

201620172018201920202021202220232024166 427 407 235 158 121 93 145 509

Общий доступ

Просмотреть все

1 статья

0 статей

доступно

недоступно

На основе финансирования

Matthew Rahtz

Google DeepMind

Подтвержден адрес электронной почты в домене google.com - Главная страница


Название По числу цитат По году По названию	Процитировано Процитировано	Год
Ensembl 2016 A Yates, W Akanni, MR Amode, D Barrell, K Billis, D Carvalho-Silva, ... Nucleic acids research 44 (D1), D710-D716, 2016	1633	2016
Gemini: a family of highly capable multimodal models G Team, R Anil, S Borgeaud, Y Wu, JB Alayrac, J Yu, R Soricut, ... arXiv preprint arXiv:2312.11805, 2023	467	2023
Specification gaming: the flip side of AI ingenuity V Krakovna, J Uesato, V Mikulik, M Rahtz, T Everitt, R Kumar, Z Kenton, ...	95	2020
Tracr: Compiled transformers as a laboratory for interpretability D Lindner, J Kramár, S Farquhar, M Rahtz, T McGrath, V Mikulik Advances in Neural Information Processing Systems 36, 2024	30	2024
Does circuit analysis interpretability scale? Evidence from multiple choice capabilities in Chinchilla T Lieberum, M Rahtz, J Kramár, G Irving, R Shah, V Mikulik arXiv preprint arXiv:2307.09458, 2023	26	2023
The hydra effect: Emergent self-repair in language model computations T McGrath, M Rahtz, J Kramar, V Mikulik, S Legg arXiv preprint arXiv:2307.15771, 2023	17	2023
Safe deep RL in 3D environments using human feedback M Rahtz, V Varma, R Kumar, Z Kenton, S Legg, J Leike arXiv preprint arXiv:2201.08102, 2022	7	2022
A Mechanism-Based Approach to Mitigating Harms from Persuasive Generative AI S El-Sayed, C Akbulut, A McCroskery, G Keeling, Z Kenton, Z Jalan, ... arXiv preprint arXiv:2404.15058, 2024	1	2024
Evaluating Frontier Models for Dangerous Capabilities M Phuong, M Aitchison, E Catt, S Cogan, A Kaskasoli, V Krakovna, ... arXiv preprint arXiv:2403.13793, 2024	1	2024
An extensible interactive interface for agent design M Rahtz, J Fang, AD Dragan, D Hadfield-Menell arXiv preprint arXiv:1906.02641, 2019	1	2019

В данный момент система не может выполнить эту операцию. Повторите попытку позднее.

Статьи 1–10

Ссылок за год

Повторяющиеся цитирования

Объединенные цитирования

СоавторыСоавторы

Подписаться

Процитировано