GE0S906T - Qualité et fouille de données

Semestre Semestre 1
Crédits ECTS 3
Volume horaire total 25

Responsables

David SHEEREN

Objectifs

Sensibilisation à la qualité des données spatiales et à son évaluation. Approfondissement de la démarche d’apprentissage machine à l’ère du Big data.

Contenu

Concept de qualité, terminologie, notions de qualité interne et externe, terrain nominal, normes, composantes de la qualité (précision et exactitude géométrique, sémantique, complétude, cohérence logique, actualité), appariement et méthodes de calcul des indicateurs.
Apprentissage machine avec Scikit-Learn (Python) : fondamentaux (compromis biais/variance, surapprentissage, partitionnement des données de référence, validation croisée), méthodes non paramétriques (arbre de décision, SVM), méthodes ensemblistes (Random Forest, Gradient Boosting), réduction de dimension et sélection de variables.
Réseau de neurones et apprentissage profond avec Keras (Python)
Initiation au SOLAP.

Bibliographie

Azencott C.-A. 2019. Introduction au Machine Learning, Dunod, 240 p.
Brunsdon C. and Comber A. 2021. Geographical data science and spatial data analysis: an introduction in R. SAGE Publications Ltd., 360 p.
Chollet F. 2020. L’apprentissage profond avec Python. Ed. Machinelearning.fr, 512 p.
Géron A. 2019. Machine Learning avec Scikit-Learn - 2e éd. - Mise en oeuvre et cas concrets, Dunod, 320 p.
Géron A. 2020. Deep Learning avec Keras et TensorFlow - 2e éd. - Mise en oeuvre et cas concrets, Dunod, 576 p.
Hastie T., R., , J. 2009. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition.