Sei sulla pagina 1di 2

Discorso seduta di laurea

Presentazione
La mia tesi di laurea riguarda la creazione un software che potesse automatizzare alcune funzionalità al fine
di analisi per la business Intelligence. In particolare, l’utilità del programma è di poter estrarre dei dati da
un database e poi in seguito esportarli in diversi formati, all’interno anche di un data warehouse.

Data warehouse
I data warehouse sono dei sistemi di archiviazione di informazioni che coprono un ampio lasso di tempo
dedicati unicamente all’analisi statistica per generare simulazioni di previsione del futuro.

Data Mart
Per effettuare scansioni in maniera ottimizzata invece si “categorizzano” le informazioni del data
warehouse formando dei sott’insiemi chiamati Data Mart.

OLAP E OLTP
La differenza sostanziale tra un database comune e il data warehouse sono le interrogazioni che si possono.
Nei database tradizionali troviamo le interrogazioni OLTP che significa Online Transaction Processing e
prevede (solitamente) l’utilizzo di pochi dati i quali possono essere modificati pur restando sempre
consistenti.

Nelle interrogazioni OLAP, invece, che significa Online Analytical Processing, prevede solitamente una
gamma molto ampia di dati e non è detto che debbano essere tutti consistenti.

Applicazione
Tecnologie usate
Tra le tecnologie usate per l’applicazione troviamo innanzitutto PowerShell che è una shell a linea di
comando più avanzata di quella standard che è servita a creare un evento nel Windows Task Scheduler per
avviare il programma automaticamente. Il Windows Task Scheduler appunto è l’utilità di windows che
permette di creare, modificare e pianificare eventi che devono essere eseguiti automaticamente
specificando la ripetitività e le scadenze varie. Come linguaggio di programmazione è stato scelto Java e per
connettersi al database da cui estrarre le informazioni, il connettore JDBC che permette di eseguire in
maniera molto semplice delle query SQL. Tra i formati dei file utilizzati troviamo JSON che è servito per
creare i file di configurazione potendo accedere facilmente ai valori delle etichette e CSV per esportare il
CSV su Git. Git ha il compito di archiviare in maniera che tutti i terminali contemporaneamente possano
andare a vedere gli storici dei file creati.

Casi d’uso
L’utente avvia un programma che “esporta” tutto il necessario e, una volta configurato, si potrà avviare un
file di tipo batch. Da questo momento finisce l’interazione dell’utente e le uniche volte in cui potrà operare
lui sarà per andare a modificare le configurazioni. Il resto delle interazioni le gestirà Windows Task
Scheduler.

Architettura
Una volta creato l’evento con lo script Powershell, il programma si interfaccia con il File System per
recuperare le configurazioni necessarie, si connette al database tramite JDBC per poi estrarre dei dati
tramite delle query contenute in dei file nel file system. Successivamente si va a esportarle in CSV e a
caricarle sulla repository Git e al data warehouse.
Funzionalità Aggiuntive
Interfaccia Grafica
E’ predisposta un’interfaccia grafica per facilitare l’utente a configurare il programma

Sicurezza
Per garantire sicurezza ho utilizzato git-secret che va a crittografare i dati contenuti nel repository di git. Git
inoltre garantisce sicurezza nella trasmissione dei dati

Grazie per l’attenzione