PYTHON AND R FOR DATA SCIENCE (LAB)
Obiettivi formativi
Il corso si propone di fornire competenze tecniche sugli aspetti di programmazione dell’analisi dei dati. Il linguaggio di programmazione Python e l’ambiente R vengono illustrati con un focus specifico su quelle librerie, moduli e funzioni che permettono agli studenti di gestire i dati in modo efficace. Il corso offre una comprensione approfondita degli approcci per pre-processare, pulire, visualizzare e analizzare dati relativi a diversi contesti. Gli studenti acquisiranno principalmente competenze pratiche, necessarie per analizzare dati reali.
Prerequisiti
Sono richieste competenze di base nella programmazione informatica.
Contenuti Del Corso
Il corso affronterà i seguenti argomenti: - Linguaggi di programmazione Python e R - Caricamento dei dati e principali formati di file - Pulizia dei dati - Manipolazione e trasformazione dei dati - Visualizzazione dei dati Saranno presentati diversi framework, librerie, moduli e pacchetti, tra cui: numpy, pandas, matplotlib, seaborn, scikit-learn, ggplot2 e dplyr.
Testi Di Riferimento
Le dispense e il materiale del corso saranno disponibili sulla piattaforma e-learning. Letture consigliate: - “Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython”, 2nd Edition by Wes McKinney.Publisher: O'Reilly Media, Inc. Release Date: October 2017. ISBN: 9781491957660. - “R for Data Science: Import, Tidy, Transform, Visualize, and Model Data” by Garrett Grolemund and Hadley Wickham. Release Date: December 2016. ISBN: 978-1491910399.
Metodologie Didattiche
Il corso prevede un approccio didattico misto, combinando lezioni frontali ed esercitazioni pratiche. Le metodologie adottate mirano a favorire una comprensione approfondita dei concetti di data science e a sviluppare competenze pratiche nell'uso degli strumenti di programmazione Python e R.
Modalità di verifica dell'apprendimento
Per superare il corso, gli studenti devono raggiungere almeno l'80% del punteggio totale disponibile sia nella componente Python che in quella R durante le seguenti prove: 1) Esame scritto intermedio (Settimane 6–7) 2) Esame scritto finale (alla fine del corso) Entrambi gli esami includeranno domande scritte ed esercizi di programmazione incentrati su concetti di programmazione, astrazioni e sull’uso delle librerie rilevanti in Python e R. Nota: Gli studenti che non sosterranno o non supereranno l’esame intermedio dovranno completare domande aggiuntive nell’esame finale per coprire i contenuti non affrontati.
Criteri per l’assegnazione dell’elaborato finale
Una tesi verrà assegnata (su richiesta specifica al docente) agli studenti che dimostrino un interesse serio e motivato per gli argomenti del corso.
Settimana 1
Python and R Language: basics (part I)
Settimana 2
Python and R Language: basics (part II)
Settimana 3
Python and R Language: basics (part III)
Settimana 4
Python and R language: Caricamento dei Dati e Formati di File
Settimana 5
Pulizia, Preparazione e Manipolazione dei Dati. Pacchetto Python: Pandas.
Settimana 6
Python and R language: Visualizzazione dei Dati (parte I) Pacchetto Python: Matplotlib
Settimana 7
Python and R language: Visualizzazione dei Dati (parte II) Pacchetto Python: Seaborn
Settimana 8
Python and R language: Oggetti e classi
Settimana 9
Python and R language: esercizi
Settimana 10
Python and R language: funzionalità avanzate (parte I)
Settimana 11
Python and R language: funzionalità avanzate (parte II)
Settimana 12
Python and R language: riepilogo finale