QUANTITATIVE MODELS FOR DATA SCIENCE

QUANTITATIVE MODELS FOR DATA SCIENCE

Marta Leocata, Alessandro Bondi

Obiettivi formativi

Il corso si propone di fornire agli studenti adeguate basi matematiche di algebra lineare e calcolo multivariabile e di introdurli ai metodi matematici utilizzati nella scienza dei dati. Gli studenti utilizzeranno anche il linguaggio di programmazione MATLAB e con l'ausilio di questo strumento verranno discussi degli esempi.

Risultati di apprendimento attesi

Conoscenza e comprensione: il corso fornirà agli studenti una solida base matematica in algebra lineare e calcolo e fornirà loro strumenti e metodi matematici per analizzare i dati. Gli studenti acquisiranno inoltre una conoscenza di base del linguaggio di programmazione MATLAB. Applicazione delle conoscenze e della comprensione: grazie a un'ampia gamma di esempi discussi durante il corso (utilizzando anche metodi didattici innovativi, come la "flipped classroom") e grazie al project work, gli studenti saranno in grado di: - Comprendere le basi matematiche dei problemi della scienza dei dati. - Utilizzare metodi matematici per analizzare i dati e proporre soluzioni quantitative a problemi di business e di economia. - Utilizzare il linguaggio di programmazione MATLAB per fornire analisi numeriche e visualizzare i risultati. Capacità di giudizio: gli studenti saranno in grado di valutare la validità dei modelli utilizzati nell'analisi dei dati e di interpretare criticamente i risultati ottenuti per fornire soluzioni innovative ai processi aziendali. Abilità comunicative: gli studenti saranno in grado di illustrare efficacemente i modelli matematici e i metodi utilizzati nell'analisi dei dati, grazie alla corretta comprensione di questi strumenti e alla capacità di interpretarne criticamente i risultati. Gli studenti saranno inoltre in grado di visualizzare e spiegare i risultati delle analisi dei dati, grazie al linguaggio di programmazione MATLAB. Queste competenze saranno verificate durante il corso grazie a metodi di insegnamento innovativi, come la "flipped classroom", e al project work. Capacità di apprendimento: gli studenti saranno in grado di applicare i modelli matematici e i metodi comunemente utilizzati nella scienza dei dati, di determinare quale metodo sia più adatto al problema in esame e di interpretare e illustrare i risultati ottenuti.

Contenuti Del Corso

Calcolo in più variabili: dominio, insiemi di livelli, limiti e continuità, differenziabilità, vettore gradiente, differenziali del secondo ordine, matrice Hessiana. Ottimizzazione non vincolata di funzioni a valore reale. Introduzione ai problemi di ottimizzazione vincolata. Applicazioni al metodo dei minimi quadrati e al data fitting. Algebra lineare: ortogonalità, algoritmo di Gram-Schmidt, problema degli autovalori, diagonalizzazione. Breve introduzione alle matrici simmetriche e alle forme quadratiche. Applicazioni al metodo dei minimi quadrati e all'adattamento dei dati. Introduzione al linguaggio di programmazione MATLAB.

Testi Di Riferimento

- Stewart, James. Calculus: Early Transcendentals. Eighth ed. Boston: Cengage learning, 2016. https://tinyurl.com/ydvcla3z - Lay, David C., Steven R. Lay, Judith McDonald, Judi J. McDonald, Judith Joanne McDonald, and J. J. McDonald. Linear Algebra and its Applications. Fifth, Global ed. Boston: Pearson, 2016. https://tinyurl.com/yz8gqugq Ulteriore materiale verrà fornito tramite la pagina del Corso, tramite la piattaforma learn.luiss.it .

Metodologie Didattiche

Lezioni ed esercitazioni. Parti delle lezioni saranno dedicate a sessioni interattive su MATLAB e alla discussione di esempi e casi di studio, adottando eventualmente il metodo di insegnamento flipped classroom. La partecipazione degli studenti alle lezioni è fortemente incoraggiata.

Modalità di verifica dell'apprendimento

Esame intermedio, esame finale scritto, project work.

Criteri per l’assegnazione dell’elaborato finale

Colloquio con l'insegnante

Settimana 1

Introduzione al corso. Ripasso delle curve cartesiane. Ripasso dell'algebra lineare. Ripasso dell'algebra lineare. Calcolo multivariato: motivazioni, esempi. Dominio, intervallo, grafico. Insiemi di livello.

Settimana 2

Curve in forma esplicita, implicita e parametrica. Elementi di topologia euclidea. Calcolo multivariato: Limiti e continuità di funzioni di più variabili. Derivate direzionali.Derivate parziali; vettore gradiente e suo significato. Sessione di esercizi su domini di funzioni e insiemi di livelli.

Settimana 3

Gradiente come direzione di massimo incremento. Differenziabilità. Differenziale del primo ordine e piano tangente. Linearizzazione e approssimazione di funzioni. Derivate direzionali e parziali del secondo ordine, teorema di Schwarz. Sessione di esercizi sulle derivate direzionali e parziali e sul gradiente.

Settimana 4

Matrice Hessiana. Differenziale del secondo ordine. Teorema di Taylor per funzioni doppiamente differenziabili. Introduzione all'ottimizzazione. Estremi locali e globali delle funzioni. Condizione necessaria del primo ordine e punti critici. Funzioni convesse. Condizioni di secondo ordine per la convessità. Sessione di esercizi su differenziali, piani tangenti, linearizzazione.

Settimana 5

Introduzione a MATLAB e all'importazione dei dati. Condizione sufficiente del primo ordine per i punti estremi di funzioni convesse. Definizione di punto di sella. Classificazione dei punti critici. Metodi ad hoc per trovare punti estremi globali. Metodo dei minimi quadrati. Sessione di esercizi su differenziali del secondo ordine e funzioni convesse.

Settimana 6

Sessione MATLAB sulla visualizzazione dei dati e sui problemi dei minimi quadrati. Problemi di ottimizzazione vincolata per funzioni reali di due variabili con un vincolo di uguaglianza. Condizione necessaria del primo ordine; funzione di Lagrange. Sessione di esercizi sull'ottimizzazione non vincolata e sui problemi dei minimi quadrati.

Settimana 7

Midterm Ottimizzazione vincolata. Condizione necessaria del primo ordine. Ottimizzazione vincolata. Metodi per trovare soluzioni. Esercizi sull'ottimizzazione vincolata

Settimana 8

Introduzione alle proiezioni ortogonali; ripasso di algebra lineare. Insiemi ortogonali. Proiezioni ortogonali Esercizi sui sistemi lineari e sull'inversa delle matrici.

Settimana 9

Teoremi di rappresentazione e decomposizione ortogonale. Algoritmo di Gram-Schmidt Decomposizione QR. Il metodo dei minimi quadrati e le applicazioni al data fitting. Sessione di esercizi sulle proiezioni ortogonali e sull'algoritmo di Gram-Schmidt.

Settimana 10

Problemi di minimi quadrati e decomposizione QR. Sessione MATLAB. Sessione MATLAB: problemi di minimi quadrati e adattamento dei dati. Introduzione all'analisi delle componenti principali. Autovalori e autovettori. Sessione di esercizi sulla fattorizzazione QR e sui problemi dei minimi quadrati.

Settimana 11

Autovettori, spazi degli autovalori e molteplicità geometrica. Autovalori, equazione caratteristica, polinomio caratteristico, molteplicità algebrica e sua relazione con la molteplicità geometrica. Diagonalizzazione di matrici. Sessione di esercizi sul problema degli autovalori. Diagonalizzazione di matrici.

Settimana 12

Matrici simmetriche: diagonalizzazione ortogonale. Teorema spettrale, assi principali. Analisi delle componenti principali. Sessione di esercizi sulla diagonalizzazione.