Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Costruire linfrastruttura
Big Data
Figura 1
D. La vostra organizzazione utilizza o ha intenzione di utilizzare le seguenti tecnologie?
Database relazionale
Search index
Rules engines
Database colonnare o orientato a colonne
Memorizzazione documentale
Motori di elaborazione di eventi complessi
Database in-memory
Appliance di data warehouse che combina software e
hardware preconfigurato in una singola unit
Aree di memorizzazione di tipo chiave/valore
Hadoop
0
10
20
Gi in uso
30
40
50
60
70
80
90
100
Non in programma
Fonte: IDC and Computerworld BI and Analytics Survey Research Group IT Survey, 2012, n = 111
Capire i costi
Limplementazione delle capacit
di gestione dei Big Data pu avere
ripercussioni su molti aspetti
dellinfrastruttura IT. Prima di avviare
uniniziativa in questambito, unazienda
deve essere certa di avere le idee chiare
sui costi totali che essa comporta.
A questo scopo, deve prendere in
considerazione vari fattori, quali:
Costo dellhardware, inclusi server,
risorse di storage e networking.
Costo del software, inclusi software
di gestione dei Big Data (come
Hadoop e il suo ecosistema) e
connettori necessari per lintegrazione
con i database tradizionali e i tool di
business intelligence.
Costi di implementazione, per
esempio per ricerca, progettazione
e pianificazione, installazione e
configurazione, integrazione con le
applicazioni di business intelligence
esistenti; sviluppo e testing postinstallazione.
Capire la piattaforma
di Big Data
I benefici derivanti dalla capacit di
sfruttare i Big Data sono evidenti e
considerevoli. Ma evidenti e considerevoli
sono anche le sfide che i Big Data
rappresentano per il data center. Gli
addetti allinfrastruttura IT dovranno
gestire non solo gli enormi volumi di
dati, ma anche la complessit delle varie
tipologie e la sempre maggiore velocit
con cui quei dati devono muoversi. Inoltre,
non tutte queste informazioni hanno
un valore di business, di conseguenza
lIT deve supportare i data scientists
nel setacciare queste enormi masse di
dati per trovare il cosiddetto ago nel
pagliaio, ossia le informazioni utili per
aumentare il patrimonio informativo ai
fini di business.
Nel complesso i Big Data richiederanno
uninfrastruttura per archiviare, spostare
e combinare i dati con maggiore velocit
e pi agilmente - e le infrastrutture IT
tradizionali semplicemente non sono
progettate per soddisfare questa esigenza.
Naturalmente, tecnicamente possibile
convertire i dati non strutturati in una
forma strutturata e poi utilizzare sistemi
di gestione di database relazionali per
manipolarli. Il processo di conversione,
tuttavia, richiede una considerevole
quantit di tempo, incrementando i costi e
ritardando il raggiungimento del risultato
finale. In generale, il problema non
tanto tecnologico quanto finanziario:
lutilizzo dellinfrastruttura tradizionale
per gestire i Big Data semplicemente non
unopzione economicamente sostenibile.
Fonti di dati
Analisi BI
MPP Agile
Data Marts
Advanced Analytics
Non
strutturati
Hive
Data Ingestion
Esterni
ODS
HBase
HDFS
Rack
Node
Disk
CPU
Rack
Node
Disk
CPU
Rack
Node
Disk
CPU
Data Integration
Map/Reduce
RDBMS
Real time
Analytics engine
App di interazione
con il cliente
Low-latency Systems:
Cassandra/HBase
Compute/Storage
Hadoop/HDFS Based
Pianificare
lInfrastruttura
Casi d'uso
Dettagli
Piattaforma di tipo
commodity con risorse
di storage locali
Piattaforma di tipo
commodity con risorse
di storage condivise
1. Implementazione medio-piccola
2. Competenze di implementazione di
Hadoop facilmente accessibili
3. Esigenze di sviluppo o di accesso a
un'architettura di riferimento per
l'implementazione di Hadoop
Implementazione in
cloud (single-tenant
o multi-tenant)
Mantenere la
Focalizzazione sul
Business
Se vero che esistono molte differenze
fra infrastruttura per i Big Data e
infrastruttura tradizionale, anche vero
che esse sono accomunate da un aspetto
fondamentale: la necessit di garantire
che lIT supporti i risultati di business.
Questo impone alle aziende di valutare
attentamente e monitorare il TCO
dellinfrastruttura mentre si orientano
verso le piattaforme di gestione dei
Big Data.
Al tempo stesso, esse devono guardare
al di l dei costi e mirare ad acquisire
capacit infrastrutturali in grado di
supportare agilit e crescita del business.
La ricerca di Accenture mostra che le
aziende ad alte performance tendono
a porre laccento su una serie di fattori
importanti, quali la formulazione di
strategie operabili e adattive in un
ambiente in divenire e il raggiungimento
Semplificare
lImplementazione
dei Big Data
Unimplementazione di Big Data,
comprendente lintegrazione di vari
componenti infrastrutturali, pu
essere un compito complesso che
richiede competenze specialistiche.
Inoltre, a fronte della sempre
maggiore rilevanza dei Big Data
per le aziende, diventer anche
pi importante che la relativa
infrastruttura sia caratterizzata dal
livello di performance, sicurezza
e supporto proprio di altre
soluzioni aziendali di importanza
nevralgica. Tenendo presenti queste
considerazioni, le aziende potrebbero
valutare lipotesi di orientarsi verso
Figura 4: Due Approcci: Creare un proprio Sistema Big Data versus Usare soluzione preconfigurata Oracle
Creare un proprio modello
Variet
dei dati
Approccio Oracle
Big Data Appliance
Cloudera CDH 3
Cloudera Manager
Big Data Connections
NoSQL Database CE
File system
distribuito
Soluzioni Map/Reduce
Nessuno
schema
Transazioni
(key/value)
oppure
Schema
DBMS
(OLTP)
Acquisizione
ETL
10
DBMS Data
Warehouse Advanced
Analytics
Organizzazione
Oracle Exadata
OTLP e DW
Data mining e Oracle
Semantics
Spatial
Analisi
Acquisizione
Organizzazione
Oracle
Exalytics
Analisi
alla
velocit
del
pensiero
Analisi
La scelta di unappliance pu
inoltre facilitare lintegrazione delle
piattaforme Big Data con il resto
dellinfrastruttura. Molte aziende, per
esempio, utilizzano database Oracle
e Oracle Big Data Appliance offre
speciali connettori software che
permettono di integrare lappliance
con i database Oracle, oltre che con
la soluzione Oracle Exadata. (Vedere
figura 5.) Oracle Big Data Appliance
utilizza collegamenti InfiniBand
ad alta velocit per connettersi
con questi altri sistemi Oracle,
permettendo alle aziende di creare un
ambiente di elaborazione di altissimo
profilo, anche in questo caso con
il beneficio di un unico fornitore a
supportare lintero ambiente. Nel
complesso, questo approccio pu
Oracle
Big Data
Connectors
Oracle Big Data Appliance
Stream
Acquisizione
Organizzazione
Oracle Exadata
Oracle Exalytics
Analisi e Visualizzazione
11
Accenture
Accenture unazienda globale di
consulenza direzionale, servizi tecnologici
e outsourcing che conta circa 259 mila
professionisti in oltre 120 paesi del
mondo. Combinando unesperienza unica,
competenze in tutti i settori di mercato
e nelle funzioni di business e grazie ad
unampia attivit di ricerca sulle aziende
di maggior successo al mondo, Accenture
collabora con i suoi clienti, aziende e
pubbliche amministrazioni, per aiutarli a
raggiungere alte performance. A livello
globale, i ricavi netti per lanno fiscale
2012 (settembre 2011 agosto 2012)
ammontano a 27,9 miliardi di dollari. In
Italia presente con circa 10.500 persone
e nellanno fiscale 2012 ha registrato ricavi
netti per 1 miliardo e 85 milioni di euro.
www.accenture.it - www.accenture.com
mc411