Dai dati alle decisioni. Data visualization e Data Analytics.
Presentazione del corso
Con l’espressione Data Analytics si indica il processo di preparazione e analisi di dati allo scopo di sviluppare e monitorare modelli statistici o tecniche di machine learning per produrre informazioni che siano di supporto alle decisioni del management. L’utilizzo intelligente di una enorme quantità di dati oggi disponibili può consentire all’azienda di acquisire importanti vantaggi competitivi, ad esempio stimando potenzialità di un mercato.
Obiettivi
Al termine del corso il partecipante sarà in grado di:
- Comprendere l’utilità delle analisi grafiche per l’esplorazione e il trattamento dei dati
- Individuare il modello statistico piu’ opportuno sulla base della tipologia dei dati e dell’obiettivo dell’analisi
- Valutare l’affidabilità di un modello.
A chi è rivolto ?
Il Corso si rivolge a coloro che operano nei settori industriale, finanziario e assicurativo con funzioni che richiedono l’analisi di grandi volumi di dati, al fine di estrarre le informazioni in essi contenute e valutarne il potenziale impatto.
Programma
Introduzione
- Definizione di Data Analytics
Analisi grafica dei dati e operazioni di data handling
- Box-and-whiskers plot, Scatterplot , Scatterplot matrix, Heatmap, Coplot
- Identificazione di outlier, Missing value
- Trasformazione dei dati
Modelli statistici
- Modelli statistici: regressione lineare e polinomiale, metodi di shinkage (LASSO), metodi di riduzione della dimensionalità. Valutazione dell’accuratezza dei modelli
Metodi ad albero
- Alberi decisionali, bagging, random forest e boosting
Applicazioni a dataset con utilizzo del software R
Metodologia
Il corso sarà erogato online con la piattaforma interattiva Webex Meeting.
I partecipanti dovranno scaricare il Software R alla pagina https://cran.r-project.org e l’interfaccia R-Studio alla pagina https://rstudio.com