DATA ANALYSIS FOR SOCIAL SCIENCES

Michele Gallo

Obiettivi formativi

Il corso ha come obiettivo quello di introdurre i principali strumenti per l'analisi univariata e multivariata.

Prerequisiti

Lo studente alla fine del corso dovrà essere in grado di analizzare dati sociali ed economici utilizzando le tecniche statistiche più adeguate. Le operazioni di analisi saranno effettuate mediante il software statistico R, il cui insegnamento è parte integrante del corso.

Risultati di apprendimento attesi

Concetti base di Matematica.

Contenuti Del Corso

1) Concetti base di statistica e programmazione in R 2) I diversi tipi di dati 3) Analisi esplorativa preliminare 4) Regressione lineare 5) Analisi multivariata

Testi Di Riferimento

MAIN: C. Chapman and E. McDonnell Feit (2015) R for Marketing Research and Analytics, Springer. SUGGESTED for R: Venables, William N., David M. Smith, and R Development Core Team. "An introduction to R." (2024). https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf Wickham, Hadley, and Garrett Grolemund. R for data science (2e). " O'Reilly Media, Inc.", 2023. https://r4ds.hadley.nz/ SUGGESTED for the THEORY James, Gareth, et al. An introduction to statistical learning. Vol. 112. New York: Springer, 2023. https://www.statlearning.com/

Metodologie Didattiche

Testo di riferimento, slides, appunti, codici R

Modalità di verifica dell'apprendimento

Almeno una prova scritta ed un progetto su un dataset reale

Criteri per l’assegnazione dell’elaborato finale

TBD

Settimana 1

1) Concetti base di statistica e programmazione in R - Introduzione al linguaggio R e all'interfaccia RStudio - Introduzione alla statistica

Settimana 2

2) I diversi tipi di dati - Dati quantitativi (numerici, continui, discreti) - Dati categoriali (nominali, ordinali, dicotomici) - Diversi tipi di dati in R - Open data e Datasets

Settimana 3

2) I diversi tipi di dati - Distribuzione unitaria - Distribuzione di frequenza - Distribuzione in classi - Oggetti in R (vector, matrix, data frame, list)

Settimana 4

3) Analisi esplorativa: Descrivere i dati - Indici di sintesi (indici di posizione, di variabilità etc.) - Rappresentazioni grafiche (grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc.) - Statistiche di base in R - Visualizzazione dei dati in R con ggplot2

Settimana 5

3) Analisi esplorativa: Descrivere i dati per gruppo - Tabelle - Indici di sintesi per gruppo Rappresentazioni grafiche (grafico a dispersione, grafico di correlazione, istogramma condizionale, etc.) Ralazioni tra variabili - Coefficiente di correlazione - Chi quadrato Tabelle e statistiche di base in R Visualizzazione dei dati in R con ggplot2

Settimana 6

4) Regressione lineare - Principali distribuzioni di probabilità (Normale, Binomiale, Poisson etc.) - Ripasso di inferenza statistica Inferenza in R

Settimana 7

4) La regressione lineare - Regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello Regressione lineare in R

Settimana 8

Riassunto del programma Test Intermedio Progetto applicativo su dati reali

Settimana 9

5) Analisi multivariata Riduzione della dimensionalità dei dati - Concetti basilari - Standardizzazione e rappresentazione grafica Analisi Multivariata in R

Settimana 10

5) Analisi multivariata - Analisi in Componenti Principale (PCA) - Decomposizione in Valori Singolari (SVD) Analisi Multivariata in R

Settimana 11

5) Analisi multivariata Multidimensional Scaling - Concetti basilari - Analisi dei gruppi Analisi Multivariata in R

Settimana 12

Riassunto del programma Presentazione progetti finali