DATA ANALYSIS FOR SOCIAL SCIENCES

Marco Mingione

Obiettivi formativi

Analisi di dati univariati e multivariati in ambito economico e sociale.

Prerequisiti

Concetti base di Matematica.

Risultati di apprendimento attesi

Lo studente alla fine del corso dovrà essere in grado di analizzare diverse tipologie di dati mediante opportune metodologie statistiche. L'analisi dei dati sarà effettuata con il software statistico R il cui insegnamento è parte integrante del corso.

Contenuti Del Corso

1) Concetti base di statistica e programmazione in R 2) I diversi tipi di dati 3) Analisi esplorativa preliminare 4) Big Data e riduzione dimensionale 5) Il modello di regressione lineare 6) Analisi delle Reti 7) Analisi di dati testuali

Testi Di Riferimento

PRINCIPALE: C. Chapman and E. McDonnell Feit (2015) R for Marketing Research and Analytics, Springer. SUGGERITI per R: - Venables, William N., David M. Smith, and R Development Core Team. "An introduction to R." (2009). https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf - Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. " O'Reilly Media, Inc.", 2016. https://r4ds.had.co.nz/ SUGGERITI per TEORIA: - James, Gareth, et al. An introduction to statistical learning. Vol. 112. New York: springer, 2013. https://www.statlearning.com/

Metodologie Didattiche

Testo di riferimento, slides, appunti, codici R

Modalità di verifica dell'apprendimento

TBD

Criteri per l’assegnazione dell’elaborato finale

TBD

Il syllabus affronta temi collegati alla sostenibilità?

Sì, nel mostrare l'applicazione di tecniche statistiche a casi reali di studio, affronteremo il tema della sostenibilità

Settimana 1

1) Concetti base di statistica e programmazione in R: - Introduzione al linguaggio R e all'interfaccia RStudio - Introduzione alla statistica

Settimana 2

2) I diversi tipi di dati: - quantitativi: - numerici, continui, discreti - qualitativi (o categoriali): - nominali, ordinali, dicotomici - dati testuali - i diversi tipi di dati in R

Settimana 3

3) Analisi esplorativa: - Statistiche di base: minimo, media, moda, quantili, massimo, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R - Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc. - La visualizzazione dei dati in R con ggplot2 - Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson - Le distribuzioni di probabilità in R

Settimana 4

3) Analisi esplorativa: - Statistiche di base: minimo, media, moda, quantili, massimo, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R - Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc. - La visualizzazione dei dati in R con ggplot2 - Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson - Le distribuzioni di probabilità in R

Settimana 5

4) Big Data e riduzione dimensionale: - Big Data: volume, varietà, velocità, veracità - Analisi in Componenti Principali - Analisi in Componenti Principali con R - Analisi dei gruppi - Analisi dei gruppi con R

Settimana 6

4) Big Data e riduzione dimensionale: - Big Data: volume, varietà, velocità, veracità - Analisi in Componenti Principali - Analisi in Componenti Principali con R - Analisi dei gruppi - Analisi dei gruppi con R

Settimana 7

5) Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 8

5) Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 9

5) Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 10

6) Analisi di Reti: - Introduzione alla teoria dei grafi e statistiche di sintesi - Come gestire i grafi in R

Settimana 11

7) Analisi di dati testuali: - Introduzione al text mining - Come gestire i dati testuali in R

Settimana 12

Riassunto del programma Presentazione progetti finali