Obiettivi formativi
Il corso ha come obiettivo quello di introdurre i principali strumenti per l'analisi univariata e multivariata.
Prerequisiti
Lo studente alla fine del corso dovrà essere in grado di analizzare dati sociali ed economici utilizzando le tecniche statistiche più adeguate. Le operazioni di analisi saranno effettuate mediante il software statistico R, il cui insegnamento è parte integrante del corso.
Risultati di apprendimento attesi
Concetti base di Matematica.
Contenuti Del Corso
1) Concetti base di statistica e programmazione in R
2) I diversi tipi di dati
3) Analisi esplorativa preliminare
4) Regressione lineare
5) Analisi multivariata
Testi Di Riferimento
MAIN:
C. Chapman and E. McDonnell Feit (2015) R for Marketing Research and Analytics, Springer.
SUGGESTED for R:
Venables, William N., David M. Smith, and R Development Core Team. "An introduction to R." (2024). https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf
Wickham, Hadley, and Garrett Grolemund. R for data science (2e). " O'Reilly Media, Inc.", 2023. https://r4ds.hadley.nz/
SUGGESTED for the THEORY
James, Gareth, et al. An introduction to statistical learning. Vol. 112. New York: Springer, 2023. https://www.statlearning.com/
Metodologie Didattiche
Testo di riferimento, slides, appunti, codici R
Modalità di verifica dell'apprendimento
Almeno una prova scritta ed un progetto su un dataset reale
Criteri per l’assegnazione dell’elaborato finale
TBD
Settimana 1
1) Concetti base di statistica e programmazione in R
- Introduzione al linguaggio R e all'interfaccia RStudio
- Introduzione alla statistica
Settimana 2
2) I diversi tipi di dati
- Dati quantitativi (numerici, continui, discreti)
- Dati categoriali (nominali, ordinali, dicotomici)
- Diversi tipi di dati in R
- Open data e Datasets
Settimana 3
2) I diversi tipi di dati
- Distribuzione unitaria
- Distribuzione di frequenza
- Distribuzione in classi
- Oggetti in R (vector, matrix, data frame, list)
Settimana 4
3) Analisi esplorativa:
Descrivere i dati
- Indici di sintesi (indici di posizione, di variabilità etc.)
- Rappresentazioni grafiche (grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc.)
- Statistiche di base in R
- Visualizzazione dei dati in R con ggplot2
Settimana 5
3) Analisi esplorativa:
Descrivere i dati per gruppo
- Tabelle
- Indici di sintesi per gruppo
Rappresentazioni grafiche (grafico a dispersione, grafico di correlazione, istogramma condizionale, etc.)
Ralazioni tra variabili
- Coefficiente di correlazione
- Chi quadrato
Tabelle e statistiche di base in R
Visualizzazione dei dati in R con ggplot2
Settimana 6
4) Regressione lineare
- Principali distribuzioni di probabilità (Normale, Binomiale, Poisson etc.)
- Ripasso di inferenza statistica
Inferenza in R
Settimana 7
4) La regressione lineare
- Regressione lineare
- Il metodo dei minimi quadrati
- Interpretazione dei risultati e valutazione del modello
Regressione lineare in R
Settimana 8
Riassunto del programma
Test Intermedio
Progetto applicativo su dati reali
Settimana 9
5) Analisi multivariata
Riduzione della dimensionalità dei dati
- Concetti basilari
- Standardizzazione e rappresentazione grafica
Analisi Multivariata in R
Settimana 10
5) Analisi multivariata
- Analisi in Componenti Principale (PCA)
- Decomposizione in Valori Singolari (SVD)
Analisi Multivariata in R
Settimana 11
5) Analisi multivariata
Multidimensional Scaling
- Concetti basilari
- Analisi dei gruppi
Analisi Multivariata in R
Settimana 12
Riassunto del programma
Presentazione progetti finali