Qu'est-ce que l'apprentissage par renforcement ? L'apprentissage de l'IA par la récompense