Objectifs :
Maîtriser les principaux concepts d’apprentissage automatique et d’exploration de données
Comprendre la hiérarchie des besoins en données
Comprendre les applications scientifiques et commerciales de l’apprentissage automatique
Outils à maîtriser :
Python
Carnet Jupyter
Collab Google
Module 1 : L’ère des données
Introduction
Big data (big data)
Apprentissage automatique et intelligence artificielle
Traitement des données avec Python et Scala
Langage de programmation Python
Module 2 : Gestion de projets axés sur les données
La pyramide des données
Kdd
CRISP- DM
Méthodes agiles pour les data scientists
Module 3: Python – Jupyter IDE
L’IDE interactif
Cahiers en cours d’exécution avec jupyter
Collab Google
Enquête sur les bases de programmation python
Gestion des données avec python
Module 4 : Préparation des données avec pandas
Les données disponibles nécessitent-elles un pré-traitement?
Accès aux données avec python
Préparation des données avec Pandas : processus ETL
Module 5 : Techniques d’exploration de données
Exploration et analyse de données
Science des données et exploration de données
Techniques minières
Exploitation minière Règles relatives aux articlesfréquents et aux associations
Algorithmes de recommandation
Cas d’utilisation commerciale
Module 6 : Techniques d’apprentissage automatique
Apprentissage supervisé : le concept
Classification
Régression
Formation, test et évaluation de modèles
Apprentissage non supervisé
Cas d’utilisation commerciale
Module 7 : Analyse des données exploratoires : EDA
Repères UCI
Résumé des ensembles de données
Eda
Outils statistiques pour l’AED
Visualisation de données
Explorer visuellement les données