Sei sulla pagina 1di 27

BIG DATA

DATA MINING
NEURAL NETWORKS
AN HOLISTIC APROACH

Dnyaneshwar Pasquali 868826


Osemwengie Cyril Simeon 868355
Massimiliano Scaramuzza 865719
BIG DATA
CHE COS’È?
Raccolta di dati molto estesa

CONCETTI GENERALI
l’evento del dato che esprime la dinamica
dell’informazione stessa

CARATTERISTICHE
3V + 2

3
PERCHÉ É IMPORTANTE?
Portano ad uno sviluppo di:
- Delle metodologia analisi dei dati
- Delle infrastrutture e delle tecnologie

I benefici aziendali e sociali


- Per le azienda comporta un vantaggio competitivo
- Per il sociale ( Big Data e Turismo Big Data e Sanità
Analytics per l’innovazione sociale)

Come possono essere utilizzati


I Big Data Analytics hanno un impatto in tutti i processi

4
BIG DATA ANALYTICS

DESCRIPTIVE ANALYTICS

PREDICTIVE ANALYTICS

PRESCRIPTIVE ANALYTICS

AUTOMATED ANALYTICS

5
In Italia
Raccolta di dati molto estesa

Big Data e PMI italiane


- Il peso delle PMI nel mercato Big Data
- I vantaggi dei Big Data Analytics per le PMI

6
Da Big Data a Data mining

7
DATA MINING
CHE COS’E IL DATA MINING?
Il data mining è un sottocampo
interdisciplinare di informatica e
statistica che ha l'obiettivo generale di
estrarre informazioni (con metodi
intelligenti) da un set di dati e
trasformare le informazioni in una
struttura comprensibile per un
ulteriore utilizzo.

N.B: Lo scopo è di trovare ed estrarre patterns e


informazioni da grandi quantità di dati. NON la ricerca di
dati.

9
DATA MINING ≠ DATA COLLECTION

10
PERCHÉ È IMPORTANTE?

11
APPLICAZIONE
• Business

• Finance

• Healthcare

• Government

• Security

12
BACKBONE OF DATAMINING:
Classification

Predictive Prediction

Regression

Time Series Analysis

Data Mining

Clustering

Summarization
Descriptive
Association Rules

Anomaly Detection
13
COM’È POSSIBILE TUTTO CIO’?

• Selezionare attentamente i dati

• «Plasmarli» in modo giusto

• Determinare come interpretare i


risultati

14
NEURAL NETWORKS
Overview
:

16
PERCHÉ USARE L’IA?

• Per una persona, o un team, è


impossibile avere la visione olistica di
un dataset
• L’IA permette un enorme guadagno
di produttività.

17
Network Neurali

 Nodi – Neuroni
 Pesi – Sinapsi

 Ogni strato ha diversi


livelli
di astrazione
DATI DATI DATI

• I Network Neurali devono IMPARARE


• Per imparare hanno bisogno di
essere esposti a dati già categorizzati.
• Cosa è un gatto? Spiegarlo
algoritmicamente è impossibile
• Per imparare il network ha bisogno di
molti esempi, per cambiare i pesi che
collegano ogni layer l’un l’altro

20
Google L’IA assistente

https://www.youtube.com/watch?v=yDI5oVn0RgM&feature=youtu.be&t=48
Non è tutto Rose e Fiori

 Per alcuni tipi di


“training” servono dati
dal mondo reale

 Le comagnie incoraggiano
un
eccessiva fiducia in
sistemi non ancora del tutto
collaudati
DEEP FAKES

“Da grandi poteri vengono


Grandi responsabilità”.

I network neurali sono uno


Strumento.
Possono essere usate per
bene e per male.

In una società che produce


e consuma datie informazioni
ad una velocità mai vista
prima
bisgona essere cauti.

https://www.businessinsider.com/deepfakes-explained-the-rise-of-fake-realistic-videos-online-2019-6
DEMONSTRATION!
• Aim: Predict the likelihood of
diabetes

• Platform used: https://bigml.com/

• Dataset used:
https://kaggle.com/uciml/pima-
indians-diabetes-database

26
SOURCES

• https://pixabay.com/illustrations/analytics-information-innovation-3088958/

• https://en.wikipedia.org/wiki/Data_mining

• https://www.sas.com/en_us/insights/analytics/data-mining.html

• https://www.youtube.com/watch?v=EH3bp5335IU

• https://techdifferences.com/difference-between-descriptive-and-predictive-data-mining.html

• https://www.wideskills.com/data-mining-tutorial/05-data-mining-tasks

• http://academicscience.co.in/admin/resources/project/paper/f201709171505667190.pdf

• https://www.educba.com/data-mining-techniques-2/

27