Obiettivi formativi
Analisi di dati univariati e multivariati in ambito economico e sociale.
Prerequisiti
Concetti base di Matematica.
Risultati di apprendimento attesi
Lo studente alla fine del corso dovrà essere in grado di analizzare diverse tipologie di dati mediante opportune metodologie statistiche. L'analisi dei dati sarà effettuata con il software statistico R il cui insegnamento è parte integrante del corso.
Contenuti Del Corso
1) Concetti base di statistica e programmazione in R
2) I diversi tipi di dati
3) Analisi esplorativa preliminare
4) Big Data e riduzione dimensionale
5) Il modello di regressione lineare
6) Analisi delle Reti
7) Analisi di dati testuali
Testi Di Riferimento
PRINCIPALE:
C. Chapman and E. McDonnell Feit (2015) R
for Marketing Research and Analytics, Springer.
SUGGERITI per R:
- Venables, William N., David M. Smith, and R Development Core Team. "An introduction to R." (2009). https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf
- Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. " O'Reilly Media, Inc.", 2016. https://r4ds.had.co.nz/
SUGGERITI per TEORIA:
- James, Gareth, et al. An introduction to statistical learning. Vol. 112. New York: springer, 2013. https://www.statlearning.com/
Metodologie Didattiche
Testo di riferimento, slides, appunti, codici R
Modalità di verifica dell'apprendimento
TBD
Criteri per l’assegnazione dell’elaborato finale
TBD
Il syllabus affronta temi collegati alla sostenibilità?
Sì, nel mostrare l'applicazione di tecniche statistiche a casi reali di studio, affronteremo il tema della sostenibilità
Settimana 1
1) Concetti base di statistica e programmazione in R:
- Introduzione al linguaggio R e all'interfaccia RStudio
- Introduzione alla statistica
Settimana 2
2) I diversi tipi di dati:
- quantitativi:
- numerici, continui, discreti
- qualitativi (o categoriali):
- nominali, ordinali, dicotomici
- dati testuali
- i diversi tipi di dati in R
Settimana 3
3) Analisi esplorativa:
- Statistiche di base: minimo, media, moda, quantili, massimo, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc.
- Le statistiche di base in R
- Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc.
- La visualizzazione dei dati in R con ggplot2
- Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson
- Le distribuzioni di probabilità in R
Settimana 4
3) Analisi esplorativa:
- Statistiche di base: minimo, media, moda, quantili, massimo, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc.
- Le statistiche di base in R
- Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc.
- La visualizzazione dei dati in R con ggplot2
- Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson
- Le distribuzioni di probabilità in R
Settimana 5
4) Big Data e riduzione dimensionale:
- Big Data: volume, varietà, velocità, veracità
- Analisi in Componenti Principali
- Analisi in Componenti Principali con R
- Analisi dei gruppi
- Analisi dei gruppi con R
Settimana 6
4) Big Data e riduzione dimensionale:
- Big Data: volume, varietà, velocità, veracità
- Analisi in Componenti Principali
- Analisi in Componenti Principali con R
- Analisi dei gruppi
- Analisi dei gruppi con R
Settimana 7
5) Il modello di regressione lineare
- Ripasso di inferenza statistica
- Il modello di regressione lineare
- Il metodo dei minimi quadrati
- Interpretazione dei risultati e valutazione del modello
- La regressione lineare in R
Settimana 8
5) Il modello di regressione lineare
- Ripasso di inferenza statistica
- Il modello di regressione lineare
- Il metodo dei minimi quadrati
- Interpretazione dei risultati e valutazione del modello
- La regressione lineare in R
Settimana 9
5) Il modello di regressione lineare
- Ripasso di inferenza statistica
- Il modello di regressione lineare
- Il metodo dei minimi quadrati
- Interpretazione dei risultati e valutazione del modello
- La regressione lineare in R
Settimana 10
6) Analisi di Reti:
- Introduzione alla teoria dei grafi e statistiche di sintesi
- Come gestire i grafi in R
Settimana 11
7) Analisi di dati testuali:
- Introduzione al text mining
- Come gestire i dati testuali in R
Settimana 12
Riassunto del programma
Presentazione progetti finali