020BDFRM3 | Big Data frameworks |
---|---|
Conceptuellement, le cours est divisé en deux parties. La première couvre les concepts fondamentaux de l'informatique parallèle MapReduce, à travers les yeux de Hadoop, MrJob et Spark, tout en plongeant profondément dans Spark, des trames de données, le Spark Shell, Spark Streaming, Spark SQL, MLlib. Les élèves utiliseront MapReduce pour les applications et les déploiements industriels pour différents domaines, y compris la publicité, la finance, la santé et les moteurs de recherche. La deuxième partie se concentre sur la conception algorithmique et le développement dans les environnements informatiques parallèles (Spark), le développement d'algorithmes (arbre de décision apprentissage), des algorithmes de traitement graphique (pagerank / court chemin), les algorithmes de newton, les support vector machines. Temps présentiel : 35 heures Charge de travail étudiant : 70 heures Méthode(s) d'évaluation : Examen final |
Ce cours est proposé dans les diplômes suivants | |
---|---|
Master en data sciences |