048DSTGM3

Theoretical guidelines for high-dimensional data analysis

Le but de ce cours est de fournir aux étudiants une introduction aux différents types de méthodes de recherche quantitative et des techniques statistiques pour analyser les données. Nous commençons avec un accent sur la mesure, inférence statistique et l'inférence causale. Ensuite, nous allons explorer une gamme de techniques et de méthodes statistiques en utilisant le langage des statistiques open-source, (R ou Python). Nous allons utiliser des techniques différentes pour l'analyse et la visualisation de données, avec un accent sur l'application de ces connaissances à des problèmes de données du monde réel. Les techniques incluses sont: statistiques descriptives et déductives, échantillonnage, la conception expérimentale, tests paramétriques et non paramétriques de la différence, régression des moindres carrés, et de régression logistique.


Temps présentiel : 20 heures


Charge de travail étudiant : 100 heures


Méthode(s) d'évaluation : Projets


Référence :
• Inge Koch, Analysis of multivariate and high dimensional data, Cambridge series in statistical and probabilistic mathematics, 2013 • Peter Bühlmann, Statistics for high-dimensional data: methods, theory and application, Springer series in statistics, 2011 • Christophe Giraud, Introduction to high-dimensional statistics, CRC Press, 2014

Ce cours est proposé dans les diplômes suivants
 Master en data sciences