Le jeu de Nim
Dans l’apprentissage automatique, un systéme IA tire des conclusions à partir de caractéristiques dans les données dont il dispose. Une méthode de l’apprentissage automatique est l’apprentissage par renforcement. Tout comme les êtres humains apprennent en interagissant avec leur environnement et en recevant des récompenses et des punitions, les systèmes d’IA apprennent également grâce à l’apprentissage par renforcement. Les systèmes saisissent d’abord l’état de leur environnement et effectuent une action. Le système développe ensuite des règles par rapport aux récompenses et aux punitions. En cas de récompense, le système exécute l’action plus souvent, en cas de punition, moins souvent. Après de nombreux cycles, seules les actions qui mènent à une récompense subsistent : le système a appris de manière autonome. Les êtres humains utilisent des stratégies d’apprentissage similaires : punitions à l’école, bonnes notes à un test, contraventions routières, permis à points et bien d’autres encore.
Découvrez plus
Comment une intelligence artificielle apprend-elle ?