DATA ANALYSIS FOR SOCIAL SCIENCES

Marco Mingione

Obiettivi formativi

Analisi di dati univariati e multivariati in ambito economico e sociale.

Prerequisiti

Concetti base di Matematica.

Risultati di apprendimento attesi

Lo studente alla fine del corso dovrà essere in grado di analizzare diverse tipologie di dati mediante opportune metodologie statistiche. L'analisi dei dati sarà effettuata con il software statistico R il cui insegnamento è parte integrante del corso.

Contenuti Del Corso

1) Concetti base di statistica e programmazione in R 2) I diversi tipi di dati 3) Analisi esplorativa preliminare 4) Modello di regressione lineare 5) Modelli lineari generalizzati 6) Tentative: Analisi delle Reti 7) Tentative: Analisi di dati testuali

Testi Di Riferimento

PRINCIPALE: C. Chapman and E. McDonnell Feit (2015) R for Marketing Research and Analytics, Springer. SUGGERITI per R: - Venables, William N., David M. Smith, and R Development Core Team. "An introduction to R." (2009). https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf - Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. " O'Reilly Media, Inc.", 2016. https://r4ds.had.co.nz/ SUGGERITI per TEORIA: - James, Gareth, et al. An introduction to statistical learning. Vol. 112. New York: springer, 2013. https://www.statlearning.com/

Metodologie Didattiche

Testo di riferimento, slides, appunti, codici R

Modalità di verifica dell'apprendimento

Almeno una prova scritta ed un progetto su un dataset reale

Criteri per l’assegnazione dell’elaborato finale

TBD

Settimana 1

1) Concetti base di statistica e programmazione in R: - Introduzione al linguaggio R e all'interfaccia RStudio - Introduzione alla statistica

Settimana 2

2) I diversi tipi di dati: - quantitativi: - numerici, continui, discreti - qualitativi (o categoriali): - nominali, ordinali, dicotomici - dati testuali - i diversi tipi di dati in R

Settimana 3

3) Analisi esplorativa: - Statistiche di base: minimo, media, moda, quantili, massimo, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R - Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc. - La visualizzazione dei dati in R con ggplot2 - Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson - Le distribuzioni di probabilità in R

Settimana 4

3) Analisi esplorativa: - Statistiche di base: minimo, media, moda, quantili, massimo, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R - Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc. - La visualizzazione dei dati in R con ggplot2 - Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson - Le distribuzioni di probabilità in R

Settimana 5

5) Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 6

5) Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 7

5) Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 8

5) Modelli lineari generalizzati - Formalizzazione del modello - Metodi di stima - Interpretazione dei parametri e diagnostiche del modello - Modelli lineari generalizzati in R

Settimana 9

5) Modelli lineari generalizzati - Formalizzazione del modello - Metodi di stima - Interpretazione dei parametri e diagnostiche del modello - Modelli lineari generalizzati in R

Settimana 10

6) Analisi di Reti: - Introduzione alla teoria dei grafi e statistiche di sintesi - Come gestire i grafi in R

Settimana 11

7) Analisi di dati testuali: - Introduzione al text mining - Come gestire i dati testuali in R

Settimana 12

Riassunto del programma Presentazione progetti finali