Construction de data-sets
Durée : 28 heures – Évaluation : Travaux pratiques
Présentation
La formation vise à fournir une base solide en matière de manipulation et d’organisation des données. Les préparations se font par l’utilisation des outils R, Python voire des tableurs. Il permet de comprendre les enjeux éthiques, et présente des valeurs et organisations exploitables. Ce cours aide à mieux appréhender l’utilisation des données dans l’IA et à appliquer ses compétences dans un contexte professionnel.
À l’issue du cours, les élèves doivent comprendre comment disposer des valeurs de données en fonction de leurs caractéristiques pour en fournir une base d’informations pour les cours de mathématiques, Big Data, Machine Learning, …
Arthur est Architecte des systèmes d'information dans les processus industriels, avec une spécialisation en Intelligence Artificielle. Il a débuté sa carrière professionnelle dans l'informatique au sein de la jeune pousse Oky Doky, en qualité de Chargé de projets IA.
Objectifs pédagogiques
- Comprendre les différents types de data-sets et leur importance dans l’analyse
- Acquérir des compétences pratiques en manipulation de données avec R et Python
- Maîtriser l’organisation et le tri des données en appliquant la théorie des ensembles
- Développer des compétences en présentation écrite et orale des résultats d’analyse
Plan du module
- Introduction à l’importance des Données pour l’IA
- Types de données et leur importance
- Introduction aux Data-sets
- Génération de données simulées
- Introduction à R pour la manipulation des données
- Introduction à Python pour la manipulation des données
- Organisation des Données
- Théorie des Ensembles et Présentation des Données
- Création de Visualisations avec R et Python
- Structurer une Présentation de Data-sets
Bibliographie et ressources
- L’intelligence artificielle décryptée – Comprendre les enjeux et risques éthiques de l’IA pour mieux l’appréhender (Kathleen Desveaud, éditeur : éditions EMS, ISBN : 9782376879619, 2376879612 – 2024)
- Les fondamentaux de la visualisation de données (Tiffany Andry, Suzanne Kieffer, François Lambotte, éditeur : De Boeck supérieur, EAN 9782807341579, ISBN 978-2-8073-4157-9 – 2022)
- Pratique de la data science avec R – Arranger, visualiser, analyser et présenter des données ( Christian Paroissin, éditeur : éditions Ellipses, ISBN : 9782340054837, 2340054834 – 2021)
- Devenez un data pionnier – Comprendre et exploiter les données en entreprise (Gauthier Vasseur – MARDAGA – ISBN 978-2-8047-2033-9, 2804720330 – 2021)
- Data visualisation de l’extraction des données à leur représentation graphique (Nathan Yau, traducteur/contributeur : Xavier Guesnu, éditeur : Eyrolles, ISBN : 9782212135992, 2212135998 – 2013)
Ce module fait partie de notre parcours Mastère Intelligence Artificielle (Bac+5) en première année.
Plutôt envie de découvrir ce module en immersion avant de vous inscrire ?
Participez à une de nos prochaines journées découvertes.