020BIGES4 | Big Data |
---|---|
Introduction : Les enjeux des données massives, Calcul distribué, HPFS et MapReduce, Analyse des liens et PageRank, Ensembles similaires (MinHashing et Local Sensitive Hashing), Sous-ensembles similaires (A-priori alogithm), Détection des communautés dans les graphes (clustering et BigClam), Traitement des flots de données, Systèmes de recommandation, Détection des ensembles séparables. Temps présentiel : 35 heures Charge de travail étudiant : 60 heures Méthode(s) d'évaluation : Examen final |