BIG DATA ANALYSIS
Obiettivi formativi
Al completamento con successo del corso, gli studenti saranno in grado di:
Formulare modelli quantitativi per problemi aziendali ed economici
Rappresentare insiemi di dati utilizzando vettori e matrici
Analizzare funzioni multivariabili che descrivono le relazioni tra variabili
Applicare metodi di algebra lineare a dati ad alta dimensionalità
Utilizzare derivate e gradienti per studiare la sensibilità nei modelli matematici
Risolvere problemi di ottimizzazione che emergono in contesti decisionali
Interpretare modelli probabilistici utilizzati nella previsione e nell’analisi del rischio
Prerequisiti
Calcolo I e statistica introduttiva
Contenuti Del Corso
Questo corso introduce i fondamenti matematici alla base dei moderni processi decisionali basati sui dati nei contesti aziendali. L’enfasi è posta sulle strutture matematiche utilizzate per rappresentare e analizzare grandi insiemi di dati.
Il corso si concentra sui metodi matematici provenienti da:
• Algebra lineare
• Calcolo multivariabile
• Ottimizzazione
• Probabilità
Le applicazioni saranno tratte da problemi quali la modellizzazione della domanda, l’analisi del rischio di credito, i sistemi di raccomandazione, l’analisi di marketing e la previsione.
Pur essendo motivato da applicazioni aziendali, il corso mantiene una forte enfasi sulla formulazione e sull’analisi matematica.
Testi Di Riferimento
• Strang, G. Introduction to Linear Algebra
• Deisenroth, Faisal, Ong. Mathematics for Machine Learning
• Boyd and Vandenberghe. Introduction to Applied Linear Algebra
Metodologie Didattiche
Lezioni in classe ed esercitazioni
Modalità di verifica dell'apprendimento
Midterm, esame final che puo includere anche un progetto. Esame Orale su richiesta del docente
Settimana 1
Revisione degli autovalori, degli autovettori e delle proprietà spettrali delle matrici e delle matrici di covarianza
Settimana 2
Analisi delle Componenti Principali e dati ad alta dimensionalità.
Questa parte del corso introduce metodi di algebra lineare per analizzare dataset ad alta dimensionalità, comunemente presenti in finanza, contabilità e marketing. L’attenzione è posta sull’identificazione della struttura nei dati e sulla riduzione della complessità, preservando al contempo le informazioni essenziali.
Il materiale viene sviluppato attraverso i seguenti casi di studio rappresentativi:
∗ Riduzione dei dati finanziari e indicatori di performance:
I dataset finanziari contengono spesso molte variabili correlate (ad es. liquidità, leva finanziaria, redditività). Queste vengono rappresentate in forma matriciale. Utilizzando matrici di covarianza e metodi basati sugli autovalori, si individuano le direzioni principali nei dati. Questo approccio, noto come Analisi delle Componenti Principali (PCA), consente di costruire un numero ridotto di variabili che riassumono la performance finanziaria complessiva e il rischio.
Settimana 3
Analisi delle componenti Principale e dati ad alta dimensionalita (continuazione)
∗ Analisi dei dati di clienti e marketing:
I grandi dataset di marketing includono molteplici indicatori del comportamento dei clienti. Gli autovettori delle matrici di covarianza vengono utilizzati per identificare i pattern dominanti e ridurre il numero di variabili necessarie per l’analisi. Ciò permette di costruire rappresentazioni semplificate dei segmenti di clientela e dei comportamenti.
Settimana 4
Funzioni multivariate:
Il corso introduce le funzioni di più variabili come strumento fondamentale per modellizzare le relazioni tra molteplici fattori economici e finanziari. L’attenzione è posta sulle proprietà geometriche e analitiche di tali funzioni, nonché sul loro ruolo nei processi decisionali quantitativi. I seguenti concetti vengono sviluppati e motivati attraverso problemi rappresentativi:
• Curve di livello e analisi degli isoquanti:
Gli isoquanti sono curve di livello delle funzioni di produzione che rappresentano combinazioni di input in grado di generare lo stesso livello di output e sono utilizzati per analizzare i trade-off tra variabili nei modelli economici e finanziari.
Le funzioni vengono analizzate attraverso i loro insiemi di livello, che rappresentano combinazioni di variabili che producono lo stesso risultato. Questo approccio viene utilizzato per studiare problemi come l’individuazione di combinazioni di prezzo e domanda che generano un ricavo costante, oppure combinazioni di indicatori finanziari corrispondenti allo stesso livello di performance.
Le curve di livello forniscono un’interpretazione geometrica dei trade-off tra variabili.
Settimana 5
Derivate parziali e analisi marginale:
Le derivate parziali sono introdotte per misurare la sensibilità di un risultato rispetto a singole variabili.
Queste quantità sono interpretate come effetti marginali in applicazioni quali la valutazione dell’impatto di variazioni del prezzo, della spesa pubblicitaria o di indicatori finanziari su ricavi, profitti o rischio.
Ciò fornisce una base matematica per l’analisi comparativa statica nei modelli economici e finanziari e per i metodi di ottimizzazione globale.
Settimana 6
Gradiente e ottimizzazione direzionale:
Il vettore gradiente viene studiato come la direzione di massima crescita di una funzione. Questo concetto viene applicato a problemi di ottimizzazione di obiettivi economici e finanziari, come la massimizzazione dei ricavi o la minimizzazione dei costi, nonché alla comprensione di come variazioni simultanee di più variabili influenzino i risultati.
Il gradiente fornisce un collegamento tra l’analisi di sensibilità locale e i metodi di ottimizzazione globale.
Settimana 7
Ottimizzazione vincolata e allocazione delle risorse:
Molti problemi decisionali comportano l’ottimizzazione di una funzione obiettivo soggetta a vincoli. Problemi di questo tipo vengono studiati utilizzando il metodo dei moltiplicatori di Lagrange.
Questo approccio viene applicato a problemi quali l’allocazione ottimale di un budget fisso tra attività concorrenti, l’allocazione ottimale di un portafoglio sotto vincoli di rischio e la distribuzione efficiente delle risorse finanziarie.
Settimana 8
Introduzione ai modelli probabilistici e all’analisi del rischio:
Il corso introduce la teoria della probabilità come quadro matematico per modellizzare l’incertezza nei sistemi economici e finanziari. L’attenzione è posta sulla formulazione di modelli probabilistici e sulla loro interpretazione nel contesto del rischio e dei processi decisionali.
Settimana 9
Variabili casuali e modellizzazione dell’incertezza:
Le grandezze aleatorie sono rappresentate come variabili casuali. Questo approccio viene utilizzato per modellizzare risultati quali i rendimenti degli asset, i default dei clienti o le fluttuazioni della domanda.
Formalizzando l’incertezza in termini di variabili casuali, fenomeni complessi di natura economica e finanziaria possono essere analizzati all’interno di una struttura matematica rigorosa.
Settimana 10
Valore atteso e criteri decisionali:
Il valore atteso è introdotto come misura del risultato medio di una variabile casuale. Viene utilizzato per valutare decisioni in condizioni di incertezza, come la stima della redditività attesa di investimenti, strategie di prezzo o contratti finanziari.
Ciò fornisce una base matematica per il confronto tra diverse alternative decisionali.
Settimana 11
Varianza e misurazione del rischio:
La varianza viene studiata come misura della dispersione attorno al valore atteso. Nelle applicazioni finanziarie, la varianza è interpretata come una misura del rischio, in quanto cattura l’incertezza associata a risultati quali rendimenti o perdite.
Questo consente il confronto quantitativo tra alternative con diversi profili di rischio.
Settimana 12
Modelli probabilistici nell’analisi del rischio:
I modelli probabilistici vengono utilizzati per descrivere e analizzare il rischio in contesti finanziari e manageriali.
Esempi includono la modellizzazione della probabilità di default, la variabilità dei flussi di cassa o l’incertezza della domanda.
Questi modelli forniscono un quadro per la quantificazione del rischio e supportano i processi decisionali in ambiti quali l’analisi del credito, la valutazione degli investimenti e il controllo finanziario.