DATA ANALYSIS FOR SOCIAL SCIENCES

Lorenzo Federico

Obiettivi formativi

Analisi di dati univariati e multivariati in ambito economico e sociale.

Prerequisiti

Concetti base di Matematica.

Risultati di apprendimento attesi

Lo studente alla fine del corso dovrà essere in grado di analizzare diverse tipologie di dati mediante opportune metodologie statistiche. L'analisi dei dati sarà effettuata con il software statistico R il cui insegnamento è parte integrante del corso.

Contenuti Del Corso

Concetti base di statistica I diversi tipi di dati Analisi esplorativa preliminare Modello di regressione lineare Modelli lineari generalizzati Analisi delle Reti Analisi di dati testuali Programmazione in R

Testi Di Riferimento

Suggerito: C. Chapman and E. McDonnell Feit (2015) R for Marketing Research and Analytics, Springer. James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning with applications in R. Slides del docente.

Metodologie Didattiche

Testo di riferimento, slides, appunti, codici R

Modalità di verifica dell'apprendimento

Due prove intermedie scritte (1/3), un progetto di gruppo (1/3) e un esame orale (33%). Per gli studenti non frequentanti (non-compliant ed esentati) un esame scritto (1/3) al posto delle prove intermedie.

Criteri per l’assegnazione dell’elaborato finale

TBD

Settimana 1

Introduzione alla statistica I diversi tipi di dati: - quantitativi: numerici, continui, discreti - qualitativi (o categoriali): nominali, ordinali, dicotomici - dati testuali

Settimana 2

Introduzione a R: interfaccia e manipolazione base di dati. - Statistiche di base: minimo, media, moda, quantili,, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R

Settimana 3

Analisi esplorativa: - Statistiche di base: minimo, media, moda, quantili,, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R - Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc. - La visualizzazione dei dati in R con ggplot2 - Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson - Le distribuzioni di probabilità in R

Settimana 4

Analisi esplorativa: - Statistiche di base: minimo, media, moda, quantili,, varianza, deviazione standard, coefficiente di variazione, correlazione, covarianza, etc. - Le statistiche di base in R - Visualizzazione dei dati: grafici a barre, istogrammi, mappe, grafici a torta, boxplot, etc. - La visualizzazione dei dati in R - Le principali distribuzioni di probabilità: Normale, Bernoulli, Binomiale, Poisson -Distribuzioni in R

Settimana 5

Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 6

Il modello di regressione lineare - Ripasso di inferenza statistica - Il modello di regressione lineare - Il metodo dei minimi quadrati - Interpretazione dei risultati e valutazione del modello - La regressione lineare in R

Settimana 7

Modelli lineari generalizzati - Formalizzazione del modello - Metodi di stima - Interpretazione dei parametri e diagnostiche del modello - Modelli lineari generalizzati in R

Settimana 8

Modelli lineari generalizzati - Formalizzazione del modello - Metodi di stima - Interpretazione dei parametri e diagnostiche del modello - Modelli lineari generalizzati in R

Settimana 9

Analisi di Reti: - Introduzione alla teoria dei grafi e statistiche di sintesi - Come gestire i grafi in R

Settimana 10

Analisi di Reti: - Introduzione alla teoria dei grafi e statistiche di sintesi - Come gestire i grafi in R

Settimana 11

Analisi di dati testuali: - Introduzione all’analisi testuale - Come gestire i dati testuali in R

Settimana 12

Riassunto del programma ed esercitazioni.