Présentation
La science des données est l’extraction de connaissance d’ensembles de données. C’est une discipline qui s’appuie sur des outils de mathématiques, de statistique, d’informatique, et de visualisation des données.
Cet atelier propose une initiation à la science des données basée sur un exemple classique d’apprentissage automatique ou, comme on dit aujourd’hui, d’intelligence articielle: la reconnaissance optique de caractères.
Les participants à la formation auront l’occasion de toucher à toutes les principales étapes de modélisation en intelligence artificielle: utilisation d’une grande quantité de données d’entrainement; choix d’une règle de décision; application à des nouvelles données; prévision.
La formation utilise R pour l’analyse et la visualisation des données, ainsi que les paquetages additionnels RSKC et magick. Aucune connaissance préalable de R n’est nécessaire.
Auteur
Vincent Goulet, professeur titulaire, École d’actuariat, Université Laval
Édition
2022.05 Notes de mise à jour
Matériel pédagogique
L’archive .zip
contient le matériel pédagogique suivant:
- les diapositives de la formation sur l’utilisation de l’analyse en composantes principales pour effectuer la reconnaissance de caractères écrits à la main;
- le fichier de script R permettant d’effectuer l’analyse de manière interactive;
- une banque d’images numérisées de chiffres écrits à la main qui peuvent servir pour illustrer le calcul de prévisions;
- le code source d’une application Shiny.