020MMDES4 | Mining massive datasets |
---|---|
Introduction : Les enjeux des données massives, Calcul distribué, HPFS et MapReduce, Analyse des liens et PageRank, Ensembles similaires (MinHashing et Local Sensitive Hashing), Sous-ensembles similaires (A-priori alogithm), Détection des communautés dans les graphes (clustering et BigClam), Traitement des flots de données, Systèmes de recommandation, Détection des ensembles séparables. Temps présentiel : 35 heures Charge de travail étudiant : 65 heures Méthode(s) d'évaluation : Examen final, Examen partiel, Travail personnel |