Csaba Szepesvari

La nomination

Titulaire de chaire en IA Canada-CIFAR

Stratégie pancanadienne en matière d’IA

Connect

Université de l’Alberta

Google Scholar

À Propos

Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2020

Csaba Szepesvári est titulaire d’une chaire en IA Canada-CIFAR à l’Amii et professeur au département d’informatique de l’Université de l’Alberta. Il est également chercheur principal chez DeepMind à Edmonton, en Alberta.

Il travaille sur la théorie de l’apprentissage par renforcement, en créant et en analysant des algorithmes qui apprennent de manière efficace et effective tout en interagissant avec leur environnement de manière séquentielle. Il s’intéresse aux problèmes découlant des interactions continues d’une machine avec son environnement alors qu’elle essaie de découvrir une bonne façon d’interagir avec lui de manière autonome. Ces problèmes d’apprentissage interactif en ligne sont étudiés dans diverses disciplines, notamment en « théorie du double contrôle », une branche de la théorie du contrôle, ou en apprentissage automatique dans le domaine de l’apprentissage par renforcement.

Prix

Boursier, European Laboratory for Learning and Intelligent Systems, 2019
Prix Test of Time, ECML/PKDD, 2016
2e meilleur article, UAI, 2014
Prix d’excellence pour un article, ICML, 2014
Prix de l’instructeur inspirant, Société interdépartementale des étudiants en sciences de l’University de l’Alberta, 2012
Prix du nouveau professeur, Alberta Ingenuity, 2008

Publications Pertinentes

Lattimore, T., Szepesvári, C. (2020). Bandit algorithms, Presses universitaires de Cambridge.
Abbasi-Yadkori, Y., Pál, D., Szepesvári, C. (2011). « Improved algorithms for linear stochastic bandits », Advances in Neural Information Processing Systems, 24:2312-2320.
Bubeck, S., Munos, R., Stoltz, G., Szepesvári, C. (2011). « X-Armed Bandits », Journal of Machine Learning Research, 12(5).
Szepesvári, C. (2010). « Algorithms for reinforcement learning », Synthesis Lectures on Artificial Intelligence and Machine Learning, 4(1), 1-103.
Kocsis, L., Szepesvári, C. (2006). « Bandit based monte-carlo planning », European Conference on Machine Learning, p. 282-293.

institut

Amii

DeepMind

Université de l'Alberta

Département

Informatique

Éducation

PhD (probabilité et statistique), Université Attila József
MSc (mathématiques), Université Attila József
MSc (informatique), Université Attila József

Pays

Canada

Soutenez-nous

Le CIFAR est un organisme de bienfaisance enregistré qui reçoit le soutien des gouvernements du Canada et du Québec, ainsi que de fondations, de donateurs individuels, d’entreprises et de partenaires canadiens et internationaux.

Dons

Suivez-nous