Csaba Szepesvari
La nomination
Titulaire de chaire en IA Canada-CIFAR
Stratégie pancanadienne en matière d’IA
À Propos
Titulaire de chaire en IA Canada-CIFAR – Nouveau mandat – 2020
Csaba Szepesvári est titulaire d’une chaire en IA Canada-CIFAR à l’Amii et professeur au département d’informatique de l’Université de l’Alberta. Il est également chercheur principal chez DeepMind à Edmonton, en Alberta.
Il travaille sur la théorie de l’apprentissage par renforcement, en créant et en analysant des algorithmes qui apprennent de manière efficace et effective tout en interagissant avec leur environnement de manière séquentielle. Il s’intéresse aux problèmes découlant des interactions continues d’une machine avec son environnement alors qu’elle essaie de découvrir une bonne façon d’interagir avec lui de manière autonome. Ces problèmes d’apprentissage interactif en ligne sont étudiés dans diverses disciplines, notamment en « théorie du double contrôle », une branche de la théorie du contrôle, ou en apprentissage automatique dans le domaine de l’apprentissage par renforcement.
Prix
- Boursier, European Laboratory for Learning and Intelligent Systems, 2019
- Prix Test of Time, ECML/PKDD, 2016
- 2e meilleur article, UAI, 2014
- Prix d’excellence pour un article, ICML, 2014
- Prix de l’instructeur inspirant, Société interdépartementale des étudiants en sciences de l’University de l’Alberta, 2012
- Prix du nouveau professeur, Alberta Ingenuity, 2008
Publications Pertinentes
- Lattimore, T., Szepesvári, C. (2020). Bandit algorithms, Presses universitaires de Cambridge.
- Abbasi-Yadkori, Y., Pál, D., Szepesvári, C. (2011). « Improved algorithms for linear stochastic bandits », Advances in Neural Information Processing Systems, 24:2312-2320.
- Bubeck, S., Munos, R., Stoltz, G., Szepesvári, C. (2011). « X-Armed Bandits », Journal of Machine Learning Research, 12(5).
- Szepesvári, C. (2010). « Algorithms for reinforcement learning », Synthesis Lectures on Artificial Intelligence and Machine Learning, 4(1), 1-103.
- Kocsis, L., Szepesvári, C. (2006). « Bandit based monte-carlo planning », European Conference on Machine Learning, p. 282-293.
Soutenez-nous
Le CIFAR est un organisme de bienfaisance enregistré qui reçoit le soutien des gouvernements du Canada et du Québec, ainsi que de fondations, de donateurs individuels, d’entreprises et de partenaires canadiens et internationaux.