Chapitre I : Introduction aux sciences des données
Ce chapitre porte sur les enjeux des sciences des données.
Analyse de données
Nature des données
Visualisation graphique
Statistiques descriptives
Recherche de corrélation
Préparation des données
Les apprentissages
L'apprentissage automatique
Les 3 grands types d'apprentissages
Entraînement d'un modèle
Enjeux de l'apprentissage
Quantité et qualité des données
Représentativité et équilibre des données
Pertinence des variables
Sur-apprentissage / sous-apprentissage
Test, validation et hyperparamètres
Import de données et fichiers CSV
Outils Python pour l'apprentissage
Pandas
Scikit-Learn
Keras-Tensorflow, Pytorch