AlphaZero qui bat les meilleurs joueurs du monde au Go, le robot d’OpenAI qui manipule un cube sous toutes ses faces ou qui résout le Rubik’s cube, un groupe d’agents qui bat des joueurs professionnels à StartCraft ou Dota2, un algorithme qui diminue de 40 % la facture de refroidissement des centres de calcul de Google, autant de succès très médiatisés de l’apprentissage par renforcement qui en ont fait une composante majeure de l’intelligence artificielle. Cette formation vous donnera les bases pour comprendre l’apprentissage par renforcement et vous guidera vers la mise en œuvre des algorithmes les plus utilisés dans le domaine.
Domaine : Intelligence artificielle - Thématique : IA, data et calcul
Public et pré-requis
Public :
Ingénieurs ou équivalent possédant une expérience en apprentissage automatique et en programmation Python, qui souhaitent comprendre en profondeur les principes de l’apprentissage par renforcement et en développer une maîtrise pratique.
Pré-requis :
Connaissances en informatique: algorithme et syntaxe Python. Bon niveau en mathématiques: algèbre, statistiques et optimisation numérique, Une première expérience avec une librairie de différentiation automatique (tensorflow, pytorch, keras…) est requise.
Pour candidater
Vous êtes une entreprise et souhaitez un accompagnement pour la construction de votre projet sur-mesure ou une proposition intra pour cette formation ?