Machine Learning

Durée : 28 heures – Évaluation : Projet individuel

Présentation

Ce cours s’adresse aux architectes en Intelligence Artificielle et data scientists. Il permet à tout développeur d’IA d’avoir une connaissance et maîtrise des outils et environnement.

La formation vise à fournir une base solide en Machine Learning. Après un cours en programmation avancée sur les algorithmes des modèles d’apprentissage, elle approfondit chaque étape d’un projet de Machine Learning, de sa conception à sa validation.

À l’issue de la formation, les étudiants seront capables d’utiliser efficacement les bibliothèques Python pour construire des modèles automatiques performants, adaptés à divers cas d’usage en entreprise. La formation couvre les architectures classiques et de nouveau la gestion des données, incluant leur collecte et leur nettoyage pour garantir leur qualité. Une attention particulière est portée à la sélection de caractéristiques et à la réduction de dimensions afin d’améliorer les performances des modèles. Il est essentiel de choisir les bons modèles et de disposer de bonnes données pour simplifier leur manipulation avec les outils de programmation. La compréhension des métriques d’évaluation permet d’interpréter correctement les résultats.

Des techniques avancées comme la validation croisée, l’optimisation des hyper-paramètres et la régularisation sont enseignées pour prévenir le sur-apprentissage (ou sous-apprentissage). La sensibilisation aux enjeux éthiques reste indispensable et obligatoire pour assurer la transparence, la confiance et la fiabilité des modèles d’IA produits par un data scientist.

Docteur Cyril-Alexandre PACHON

Titulaire d'un Doctorat en Informatique, Systèmes et Communication à l'Université Grenoble-Alpes, le D^r PACHON s'est spécialisé dans l'enseignement supérieur notamment sur la thématique de l'Intelligence Artificielle. Il est concepteur et modéliste d'agents communicants ce qui lui a permis également de faire de la robotique ; où il conçoit les projets portés au FabLab du Campus de Molsheim. Enfin, le D^r PACHON encadre les travaux de rédaction des Mémoires de fins d'études de nos étudiants en 5^ème année.

Objectifs pédagogiques

Comprendre les fondamentaux du Machine Learning, ses données, ses applications, avec l’environnement Python et les bibliothèques principales (scikit-learn, etc.)
Construire et évaluer des modèles de Machine Learning utilisant des techniques classiques et avancées, avec validation, performance, et sélection du meilleur modèle
Développer des pipelines automatisés pour le traitement, l’entraînement et le déploiement des modèles
Appliquer des techniques avancées comme la réduction de dimension, la gestion du déséquilibre de classes, et assurer l’interprétation des modèles pour réduire les biais
Réaliser un projet complet de bout en bout sur un jeu de données complexe, incluant le prétraitement avancé, l’optimisation et l’évaluation comparative
Assurer la surveillance continue du modèle, détecter d’éventuelles dérives, et prendre en compte les aspects éthiques liés au Machine Learning

Plan du module

Introduction au Machine Learning et préparation des données (7 heures)
- Introduction au Machine Learning
- Mise en place de l’environnement Python
- Présentation d’architectures de la bibliothèque Python
- Application : préparation et exploration des données et apprentissage automatique
Théorie et compréhension – évaluation des modèles (7 heures)
- Mesures d’erreur pour la régression
- Mesure pour l’évaluation des paramètres
- Mesures d’erreur pour la classification
- Estimations et mesures pour les modèles probabilistes
- Mesures pour l’évaluation de la performance et la généralisation
- Estimation de la complexité du modèle
- Ajustement des hyper-paramètres
- Application
Machine Learning avec le Web (7 heures)
- Construction du pipeline
- Développement d’une interface utilisateur simple
- Application
- Théorie et compréhension : amélioration et optimisation
- Cas d’usage avancés
Techniques avancées en Machine Learning (7 heures)
- Architecture et modélisations
- Sélection et optimisation des modèles
- Interprétations et explication des modèles
- Technique de stacking et méta-modèles
- Cas pratique : mise en œuvre d’un projet complet

Bibliographie et ressources

Mathématiques du numérique 3, Analyse de données et optimisation (Gérard-Michel Cochard, Mhand Hifi, éditeur : ISTE Editions Limited, ISBN : 9781789481969, 1789481961 – 2025)
Machine Learning, Implémentation en Python avec Scikit-learn (Virginie Mathivet, éditeur : Éditions ENI, ISBN : 9782409044823, 2409044824 – 2024)
Machine Learning avec Scikit-Learn – 3ème édition, Mise en oeuvre et cas concrets (Aurélien Géron, éditeur : Dunod, ISBN : 9782100865376, 2100865374 – 2023)
Introduction au Machine Learning – 2ème édition (Chloé-Agathe Azencott, éditeur : Dunod, ISBN : 9782100841431, 2100841432 – 2022)

Ce module fait partie de notre parcours Mastère Intelligence Artificielle (Bac+5) en première année.

Plutôt envie de découvrir ce module en immersion avant de vous inscrire ?
Participez à une de nos prochaines journées découvertes.