PYTHON AND R FOR DATA SCIENCE (LAB)

PYTHON AND R FOR DATA SCIENCE (LAB)

Lorenzo Ariemma

Obiettivi formativi

Il corso si propone di fornire competenze tecniche sugli aspetti di programmazione dell’analisi dei dati. Il linguaggio di programmazione Python e l’ambiente R vengono illustrati con un focus specifico su quelle librerie, moduli e funzioni che permettono agli studenti di gestire i dati in modo efficace. Il corso offre una comprensione approfondita degli approcci per pre-processare, pulire, visualizzare e analizzare dati relativi a diversi contesti. Gli studenti acquisiranno principalmente competenze pratiche, necessarie per analizzare dati reali.

Prerequisiti

Sono richieste competenze di base nella programmazione informatica.

Contenuti Del Corso

Il corso affronterà i seguenti argomenti: - Linguaggi di programmazione Python e R - Caricamento dei dati e principali formati di file - Pulizia dei dati - Manipolazione e trasformazione dei dati - Visualizzazione dei dati Saranno presentati diversi framework, librerie, moduli e pacchetti, tra cui: numpy, pandas, matplotlib, seaborn, scikit-learn, ggplot2 e dplyr.

Testi Di Riferimento

Le dispense e il materiale del corso saranno disponibili sulla piattaforma e-learning. Letture consigliate: - “Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython”, 2nd Edition by Wes McKinney.Publisher: O'Reilly Media, Inc. Release Date: October 2017. ISBN: 9781491957660. - “R for Data Science: Import, Tidy, Transform, Visualize, and Model Data” by Garrett Grolemund and Hadley Wickham. Release Date: December 2016. ISBN: 978-1491910399.

Metodologie Didattiche

Il corso prevede un approccio didattico misto, combinando lezioni frontali ed esercitazioni pratiche. Le metodologie adottate mirano a favorire una comprensione approfondita dei concetti di data science e a sviluppare competenze pratiche nell'uso degli strumenti di programmazione Python e R.

Modalità di verifica dell'apprendimento

Per superare il corso, gli studenti devono raggiungere almeno l'80% del punteggio totale disponibile sia nella componente Python che in quella R durante le seguenti prove: 1) Esame scritto intermedio (Settimane 6–7) 2) Esame scritto finale (alla fine del corso) Entrambi gli esami includeranno domande scritte ed esercizi di programmazione incentrati su concetti di programmazione, astrazioni e sull’uso delle librerie rilevanti in Python e R. Nota: Gli studenti che non sosterranno o non supereranno l’esame intermedio dovranno completare domande aggiuntive nell’esame finale per coprire i contenuti non affrontati.

Criteri per l’assegnazione dell’elaborato finale

Una tesi verrà assegnata (su richiesta specifica al docente) agli studenti che dimostrino un interesse serio e motivato per gli argomenti del corso.

Settimana 1

Python and R Language: basics (part I)

Settimana 2

Python and R Language: basics (part II)

Settimana 3

Python and R Language: basics (part III)

Settimana 4

Python and R language: Caricamento dei Dati e Formati di File

Settimana 5

Pulizia, Preparazione e Manipolazione dei Dati. Pacchetto Python: Pandas.

Settimana 6

Python and R language: Visualizzazione dei Dati (parte I) Pacchetto Python: Matplotlib

Settimana 7

Python and R language: Visualizzazione dei Dati (parte II) Pacchetto Python: Seaborn

Settimana 8

Python and R language: Oggetti e classi

Settimana 9

Python and R language: esercizi

Settimana 10

Python and R language: funzionalità avanzate (parte I)

Settimana 11

Python and R language: funzionalità avanzate (parte II)

Settimana 12

Python and R language: riepilogo finale