Présentation

La science des données est l’extraction de connaissance d’ensembles de données. C’est une discipline qui s’appuie sur des outils de mathématiques, de statistique, d’informatique, et de visualisation des données.

Cet atelier propose une initiation à la science des données basée sur un exemple classique d’apprentissage automatique ou, comme on dit aujourd’hui, d’intelligence articielle: la reconnaissance optique de caractères.

Les participants à la formation auront l’occasion de toucher à toutes les principales étapes de modélisation en intelligence artificielle: utilisation d’une grande quantité de données d’entrainement; choix d’une règle de décision; application à des nouvelles données; prévision.

La formation utilise R pour l’analyse et la visualisation des données, ainsi que les paquetages additionnels RSKC et magick. Aucune connaissance préalable de R n’est nécessaire.

Auteur

Vincent Goulet, professeur titulaire, École d’actuariat, Université Laval

Édition

2022.05 Notes de mise à jour

Matériel pédagogique

L’archive .zip contient le matériel pédagogique suivant: