Lezione 1

NETEZZA
APPLIANCE
Danilo De Benedictis danilode@gmail.com
ARCHITETTURA
FAST BUSINESS DECISIONS
Obiettivo primario delle Aziende: compiere

decisioni di business in tempo veloce
Nasce
la Business Intelligence a supporto dei

Business Decision Makers (Data-Driven Decision
Makers)
Le Aziende puntano su piattaforme con
Performance estreme, ma con semplicit di
accesso ai dati.
OLTP:
ON LINE TRANSACTION PROCESSING
OLTP un processo tipico dei sistemi
OPERAZIONALI (es. Conto Corrente Bancario).
Tratta dati correnti, con poca profondit storica.
I processi OLTP eseguono numerose piccole
transazioni, su uno scope di dati limitato.
Sebbene OLTP processi in READ anche grosse moli
di dati, il suo focus sono le WRITE (INS, UPD, DEL).
OLTP: utilizzo di INDICI per ottimizzare lacceso ai
dati su Disco, prima di trasferirli in memoria per il
processing.
OLTP: strutturati in 3 FN (Normalizzazione spinta).
FORME NORMALI
HTTP://IT.WIKIPEDIA.ORG/WIKI/NORMALIZZAZIONE_(INFORMATICA)
1 FN: Esiste PK + attributi definiti su dominio atomico

(!= gruppo di valori). Esempio tabellaVOTI:
Matricola
Studente
Materia
Voto
0000-000-01
Pietro
Basi di Dati
1 sem, B ; 2 sem, F
0000-000-02
Pietro
Basi di Dati
1 sem, A ; 2 sem, A
0000-000-03
Sara
Basi di Dati
1 sem, B ; 2 sem, A
Matricola
Studente
Materia
Semestre
Voto
0000-000-01
Pietro
Basi di Dati
0000-000-01
Pietro
Basi di Dati
0000-000-02
Pietro
Basi di Dati
0000-000-02
Pietro
Basi di Dati
0000-000-03
Sara
Basi di Dati
0000-000-03
Sara
Basi di Dati
FORME NORMALI
2 FN: 1 FN + attributi dipendono da intera PK e

non da parte di essa. Esempio tabella VOTI:
id_corso_laurea id_esame
id_studente
voto
data
Voto, data dipendono dallintera chiave, non da

parte di essa. Esempio:
se
voto o data
dipendessero
solo da (id_corso_laurea , id_esame)

=> non sapremmo a che id_studente si riferiscono.
FORME NORMALI
3 FN: 2 FN + tutti gli attributi non PK

dipendono dallintera chiave e soltanto
dallintera chiave.
I Database Operazionali ottimizzati tendono
alla 3 FN.
I Database DHW sono spesso denormalizzati,
per favorire la reperibilit dei dati senza
operare molteplici join.
OLAP:
ON LINE ANALITICAL PROCESSING
OLAP: un processo che fa parte del DWH.
Tratta dati correnti (quasi up-to-date) + dati
storici.
Focus: pesanti operazioni di READ - piuttosto
che WRITE - anche su tabelle con miliardi di
righe.
Denormalizzazione parziale, per ottimizzare
laccesso ai dati.
Forte (crescente) utilizzo di indici.
NETEZZA DWH CLASSIFICATION
FIRST-GENERATION DWH:
Caricati
di notte (overnight batch)

Pesanti moli di dati spostate via rete (bottleneck)
Forniscono informazioni ai Business Analyst tramite
query/report/dashboard.
Esplosione di indici, orientati alle query (bottleneck
per le INSERT)
Grossi limiti con le crescite annue dei dati tipiche
dellultimo decennio (batch runtime increase).
SLA non raggiunti!
NETEZZA DWH CLASSIFICATION
SECOND-GENERATION DWH:
Piccoli
e frequenti data feeding.

Evitare al massimo gli spostamenti dei dati, quindi
INTEGRAZIONE delle Componenti.
I Sistemi di Data Warehouse raggiungono alti livelli
prestazionali quando tutte le parti (sw & hw) sono
ottimizzate allo scopo.
Parallelizzazione del data-processing su 10s (100s)
di Nodi
NETEZZA PERFORMANCE SERVER
NETEZZA
Data Warehouse
Appliance
Netezza: parola Urdu che
significa Risultati.
COMPANY TIMELINE
12$ X SHARE
IBM ACQUISTA NETEZZA
Il 20 Settembre 2010 NETEZZA acquisita da

IBM per:
1,7
B$
27$ x share
Annual Revenues
SERVER + RDBMS + STORAGE
APPLIANCE: PRINCIPI ARCHITETTURALI

Data processing close-to-source
Architettura Bilanciata e Parallela
Piattaforma per Advanced Analytics
Appliance = semplicit
Innovazione Accelerata, aumento
delle prestazioni
Configurazione flessibile ed estrema
scalabilit
DATA PROCESSING CLOSE-TO-SOURCE
Semplice principio dellinformatica:

Quando
si opera su grosse moli di dati, evitare gli

spostamenti se non strettamente indispensabili.
Netezza utlizza gli FPGA (Field Programmable

Gate Arrays)
nel
processo di estrazione, i dati inutili vengono

eliminati prima possibile nel data stream (close-tothe-source)
ARCHITETTURA BILANCIATA E PARALLELA
ASYMMETRIC MASSIVELY PARALLEL PROCESSING

(AMPP): Combinazione di
SMP (Symmetric Multi-Processing): sistemi

multiprocessore (o multi-core) dove tutti i processori:
accedono
alla stessa memoria condivisa

sono coordinati dallo stesso S.O.
MPP (Massively Parallel Processing): sistemi a memoria

distribuita dove i singoli nodi:
Possono
essere dei SMP

Eseguono computazioni indipendenti
Sono tutti connessi tramite una rete
Massima distribuzione del carico di lavoro tra gli

MPP (1000s parallel processing streams)
Bassi costi di manutenzione
PIATTAFORMA PER ADVANCED ANALYTICS

Il principio di processare i dati close-to-source
si applica anche alle Funzioni Analitiche
Avanzate su grosse moli di dati.
I complessi algoritmi analitici vengono
processati on streaming, quindi non appena i
dati sono disponibili, evitando costosi
spostamenti verso altro HW.
GG5
APPLIANCE = SEMPLICIT
Lautomatizzazione dei processi interni
allappliance, esonera il cliente dalla
complessa gestione della piattaforma.
Nessun tuning richiesto, come per altri sistemi.
Installazione, upgrade, alta affidabilit,
business continuity sono eseguiti con
semplicit.
INNOVAZIONE ACCELERATA, AUMENTO DELLE

PRESTAZIONI
FIELD PROGRAMMABLE GATE ARRAY: Circuito
Integrato Digitale con funzionalit programmabile
via software.
Lutilizzo dei FPGA rende possibile un rapido
processo di innovazione e quindi di aumento delle
prestazioni.
Netezza Performance:
X 4 / 2 years
Legge di Gordon Moore: # of transistor/chip
X 2 / 2 years
CONFIGURAZIONE FLESSIBILE ED ESTREMA

SCALABILIT
Netezza in grado di scalare in maniera

modulare:
100s
di Gb -> 10s di Pb di Dati
Componenti OPEN-BLADE:
Bilanciamento,
per diverse esigenze, tra
Disk
Processor
Memory
Facile
orientare Netezza verso le prestazioni oppure

verso la capacit.
NEXT-GENERATION BI
LEGACY DATABASE SOLUTION

Client
SOLARIS
AIX
TRU64
HP-UX
WINDOWS
LINUX
Database
Server
Storage
SQL
DATA
Red
Brick
CACHE
CACHE
KAIO
Optimizer
Logging
ETL Server
DBA CLI
Source
Systems
3rd Party
Apps
DATA
Lock Mgr
CACHE
DSS Query
FastLoad
Partitioning
Pre-Mat
High Performance
Loader
Views
CACHE
I/O
Raw/Cook
Lock Mgr
I/O
Raid
I/O
Vol
Mgr
Lock Mgr
I/O
APPLIANCE APPROACH
NETEZZA SYSTEM

Logical
View (SMP+SPUs)
NETEZZA SYSTEM
ASYMMETRIC MASSIVELY PARALLEL PROCESSING

(AMPP) = MPP(SMP, ..... , SMP, SMP)
Massively
Parallel
Processing
ogni nodo :
Symmetric
Multi
Processing
NETEZZA SYSTEM
HOST
Server
Linux ad alta prestazione (High Performance)

Cluster Active/Passive (High Availability)
Interfaccia standard verso Client Tools
Compilatore: SQL queries -> exe code (SNIPPETS)
Genera Query Plan ottimizzati
Distribuisce gli SNIPPETS sugli Snippet Processing Unit
(SPU) per lesecuzione.
SMP HOST
SPU
SQL
SNIPPET
NETEZZA SYSTEM
SNIPPET BLADES (S-BLADES)

Disk
-> Memory ASAP

I Dati compressi vengono spostati in memoria con
algoritmi intelligenti che assicurano la presenza in
cache dei dati pi acceduti.
NETEZZA SYSTEM
SNIPPET BLADES (S-BLADES) i.e. FAST engine

Nodi
indipendenti con
Multi-core
CPU
Multi-engine FIELD PROGRAMMABLE GATE ARRAY (FPGA)
GBs di RAM
CPU
+ FPGA + FPGA + ...+ FPGA + = FAST
ENGINE
NETEZZA SYSTEM
Field Programmable Gate Array

FPGA
il cuore dellarchitettura di Netezza

Esegue funzioni primarie.
Basato su 3 concetti
FAST
Engine composto da funzioni analitiche cablate

elettronicamente nei FPGA.
FAST Engine dinamicamente riconfigurabile (i.e.
estendibile, disabilitabile)
FAST Engine customizzato run-time per ogni snippet,
quindi funge da HW dedicato per ciascuna tipologia di
query ( = snippet).
FPGA-ACCELERATED STREAMING TECHNOLOGY

(FAST) : FPGA
FAST TECHNOLOGY: FPGA
CONTROL ENGINE: gestione I/O tramite Zone

Maps (similare ad Oracle Partition)
I
dati vengono partizionati per Zone, con intervalli

ini-end conosciuti.
Le Zone ottimizzano laccesso, consentendo la
scansione della sola porzione di dati necessaria
Tutti i campi hanno Zone Map, anche quelli non
DISTRIBUTED
Le Zone Map sono manutenute automagically, in
modo trasparente allutente.
PARSE ENGINE:
ECC
(riduzione retry su disco)
Error
Parse
Code Correction: su byte con redundancy bit
dei dati, fornendo alle 3 componenti

successive i dati nel formato necessario ad ognuna.
VISIBILITY ENGINE:
Implementa il paradigma ACID:

Atomicity: concetto di transazione (1/0, tutto/niente)
Consistency: preservare stato di coerenza, cio l integrit
referenziale.
Isolation: isolamento delle transazioni (tra loro) e non interferibilit
(tra loro)
Durability: dopo linizio della COMMIT, i dati non devono pi essere
persi (Per evitare che nel lasso di tempo fra il momento in cui la
base di dati si impegna a scrivere le modifiche, e quello in cui scrive
i dati effettivamente, si verifichino perdite di dati dovuti a
malfunzionamenti, vengono tenuti dei registri di log dove sono
annotate tutte le operazioni sul DB).
Elimina le righe inutili al particolare snippet in esecuzione

marked as DELETED
INSERTED dopo linizio della query
UPDATED dopo linizio della query (fornisce dato precedente)
PROJECT ENGINE:
Vertical
Data Filtering:
Solo
i campi utilizzati dallo statement SQL vengono

passati ai processi sucessivi
Ogni colonna della tabella non utilizzata viene filtrata
prima che la riga sia inviata alla CPU/Memory per
lelaborazione
Significativa
query acceleration, soprattutto per

tabelle con molte colonne
qui che si realizza il filtering as-fast-as-streamed
from disk
RESTRICT ENGINE:
Horizontal
Viene
Data Filtering:
applicata la WHERE.
Solo i record che soddisfano le condizioni, proseguono il
percorso verso gli step successivi
FAST ENGINE: esempio

SELECT
STATE, GENDER, AGE, COUNT(*)
FROM
8_BILLION_ROW_TABLE
WHERE
DOB < '01/04/2000
AND
DOB > 31/12/1999
AND
ZIP = 32605
GROUP BY STATE, GENDER, AGE;
SELECT
FROM
8_BILLION_ROW_TABLE
WHERE
DOB < '01/04/2000
AND
DOB > 31/12/1999
AND
ZIP = 32605
1. CONTROL ENGINE accelera la ricerca sui

dischi, limitandola alle sole ZoneMap con Date
Of Birth tra il 1 Gennaio 2000 ed il 31 Marzo
2000 (3 mesi).
SELECT
FROM
8_BILLION_ROW_TABLE
WHERE
DOB < '01/04/2000
AND
DOB > 31/12/1999
AND
ZIP = 32605
2. PARSE ENGINE eventuamente correge, e

prepara i dati ai 3 motori successivi.
SELECT
FROM
8_BILLION_ROW_TABLE
WHERE
DOB < '01/04/2000
AND
DOB > 31/12/1999
AND
ZIP = 32605
3. VISIBILITY ENGINE implementa ATOM,

fornendo dati corretti ed eliminando eventuali
modifiche sopraggiunte DOPO linizio della
TRAN.
SELECT
FROM
8_BILLION_ROW_TABLE
WHERE
DOB < '01/04/2000
AND
DOB > 31/12/1999
AND
ZIP = 32605
4. RESTRICT ENGINE filtra le righe in base alla

condizione ZIP = 32605.
SELECT
FROM
8_BILLION_ROW_TABLE
WHERE
DOB < '01/04/2000
AND
DOB > 31/12/1999
AND
ZIP = 32605
5. PROJECT ENGINE limita le colonne alle sole

STATE, GENDER, AGE.
ALLA FINE:
Alla
CPU/Memoria della SPU arriva soltanto una

porzione minimale di dati, su cui applicare le regole
di aggregazione.
NETEZZA SYSTEM
Network Fabric
Tutte
le componenti del sistema sono connesse da

una rete ad alta velocit
Protocollo IP custom ottimizzato per eliminare
congestioni sotto traffico di rete elevato.
Rete ottimizzata per scalare a 1000+ nodi
Interconnessione tra tutti i nodi.
NETEZZA SYSTEM
DISKs
Alta
densit
Alta prestazione
RAID (Alta Afidabilit): Redundant Array of
Indipendent Disks
http://en.wikipedia.org/wiki/RAID
Ogni
disco contiene una fetta di dati di ogni

tabella.
I dischi sono connessi alle S-Blades con una rete
dedicata ad alta velocit.
NETEZZA SYSTEM
RAID 0 (non utilizzato da Netezza)

n
dischi in Striping (round-robin, I/O a blocco)

non e esattamente un raid
non e fault tollerance
alta prestazione (dati distribuiti)
NETEZZA SYSTEM
RAID 1 (I/O a blocco, utilizzato da Netezza)

Mirroring
tra 2 dischi
Alta affidabilit: in caso di fault, laltro disco
continua ad erogare.
Lettura ottimizzata: i dati vengono letti da entrambi
i dischi
Scrittura: prestazioni invariate, potendo scrivere su
entambi i dischi in parallelo
October 12 | Confidential
SPU MIRRORING
Esempio di mirroring: configurazione da 112 SPUs
108 active
4 hot spares
Mirroring gestito automaticamente

La partizione primaria scritta sulle tracce pi esterne del disco,
per garantire un accesso ottimizzato.
Tutti i dati e metadati sono in mirror con le seguenti regole:
Le SPU non sono in mirroring reciproco (i.e. se la SPU 1 ha il mirror della

SPU 2, la SPU 2 non pu avere il mirror della SPU 1).
Il mirror di una SPU su unaltra SPU, attestata su un altro power supply.
In una configurazione multi-rack, il mirror di una SPU su un altro rack
Il mirroring realizzato tramite comunicazione diretta tra le SPU, senza
coinvolgimento dellhost.
SPU SELF-HEALING
Active Replication
Automatic Failover
Se una SPU diventa non disponibile, il suo mirror entra in funzione

automaticamente per non dare disservizio alle query.
Background Regeneration
I dati di ogni SPU sono automaticamente replicati sulla corrispondente

partizione in mirror.
I dati della SPU non disponibile vengono rigenerati su una SPU spare
La rigenerazione viene eseguita in background mentre le query
continuano ad essere eseguite
Automatic Fail-back
Una volta che i dati sono stati rigenerati sulla SPU spare, essa viene
riattivata.
Lintera operazione di self-healing completamente automatica e
trasparente allutente.
SELF-HEALING
Client
SOLARIS
AIX
TRU64
HP-UX
WINDOWS
LINUX
Netezza Performance Server System
Redundant
Everything
ODBC 3.X
JDBC Type 4
SQL/92
Gb
Switch
ETL Server
DBA CLI
Source
Systems
High-speed
Loader/Unloader
Hosts
Fans
Power
Network
Auto Call
Home
Gb
Switch
SPU 1
SPU 2
SPU 3
SPU 4
SPU 5
SPU 6
SPARE
3rd Party
Apps
Intelligent MPP Storage

High Performance
Loader
SELF-HEALING
Client
SOLARIS
AIX
TRU64
HP-UX
WINDOWS
LINUX
Redundant
Everything
ODBC 3.X
JDBC Type 4
SQL/92
Gb
Switch
ETL Server
DBA CLI
Source
Systems
3rd Party
Apps
High Performance
Loader
High-speed
Loader/Unloader
Hosts
Fans
Power
Network
Auto Call
Home
Gb
Switch
SPU 1
SPU 2
SPU 3
SPU 4
SPU 5
SPU 6
Failover:
SPU#2 handles B & D data
Starts Regen Process
Call Home
SPARE
SELF-HEALING
Client
SOLARIS
AIX
TRU64
HP-UX
WINDOWS
LINUX
Redundant
Everything
ODBC 3.X
JDBC Type 4
SQL/92
Gb
Switch
ETL Server
DBA CLI
Source
Systems
3rd Party
Apps
High Performance
Loader
High-speed
Loader/Unloader
Hosts
Fans
Power
Network
Auto Call
Home
Automatic Regen:
Recreate SPU#2 on SPU#6
Copies Spu5:B to SPU#6
Copies Spu4:D to SPU#6
Bring SPU#6 Online
Gb
Switch
SPU 1
SPU 2
SPU 3
SPU 4
SPU 5
SPU 6
SELF-HEALING
Client
SOLARIS
AIX
TRU64
HP-UX
WINDOWS
LINUX

Call Home:
Hot Swap new SPU
This becomes Spare
Redundant
Everything
ODBC 3.X
JDBC Type 4
SQL/92
Gb
Switch
ETL Server
DBA CLI
Source
Systems
High-speed
Loader/Unloader
SPU 1
Hosts
Fans
Power
Network
Auto Call
Home
SPU 2
Gb
Switch
A
SPARE
B
E
D
SPU 3
SPU 4
SPU 5
SPU 6
3rd Party
Apps

High Performance
Loader
NETEZZA SYSTEM
COMPRESS
ENGINE
Progettata
principalmente per le Performance

non essenzialmente per aumentare lo Storage
2-3X
Agisce
i.e. 100%-200% up on performances
per COLONNA, non per RIGA.

Obiettivo : aumentare leffettiva bandwidth !
NETEZZA SYSTEM
COMPRESS
ENGINE
In
fase di WRITE-TO-DISK (data load, insert, update)

i dati vengono
Compressi
in un formato compilato
Compressi colonna x colonna
Sostituiti con linstruction set necessario alla
uncompress (decompilazione).
NETEZZA SYSTEM
COMPRESS
ENGINE
In
fase di READ-FROM-DISK (select) il Compress

Engine
Legge
linstruction set necessario a riassemblare i dati

Lo esegue (ricordiamo che gli ENGINE sono HW
configurabili run-time)
In questo modo ricostruisce i dati
60
MB/sec => 200 MB/sec ( = 0,68 TB / h)
NETEZZA SYSTEM
COMPRESS ENGINE
NETEZZA SYSTEM
COMPRESS ENGINE (fastengine.pdf)
NETEZZA
TWINFIN 6.0.x
ARCHITETTURA
NETEZZA SYSTEM
NETEZZA TWINFIN
Ultima versione: TWINFIN.
Esce in diverse modelli
Single
Rack / Multi Rack

Up to 6 S-Blade x chassis
8 Proc x S-Blade
NETEZZA TWINFIN SKIMMER
Netezza Skimmer:
Per
ambienti small, non H.A., Development, Test.

Basato su architettura TwinFin
Costo: 125K$
NETEZZA TWINFIN
HOST
KMV:
keyb, mouse, video

2 Linux-HA
Servizi
raggruppati in Resource Group

Cluster A/P with Heartbeat per ogni Resource Group
RED HAT ENTERPRISE LINUX (RHEL) 5.3
Controllo / coordinamento / ottimizzazione query
Consolidamento / restituzione dati al client
Controllo intero Sistema
DISTRIBUTED
Mirror
REPLICATOR BLOCK DEVICE (DRBD)
contenuto degli host disk, sulle partizioni
/nz
/export/home
NETEZZA TWINFIN
NETEZZA SNIPPET PROCESS ARRAY (SPA):

1
/ 2 SPU CHASSIS:
/ 6 S-BLADE DUAL BOARD (occupano 2 slot):

8 CPU
1 NETEZZA DATABASE ACCELERATOR CARD
FPGA Query Engine

Memory
I/O <-> Disk Array
STORAGE
2
ARRAY
/ 4 DISK ENCLOSURES
10 DISK ONLINE
2 DISK SPARE
STORAGE ARRAYS
1 Storage Array =
1 Disk Enclouser =
12 Dischi
Snippet Processing
Array (SPA) =
SNIPPET BLADE (S-BLADE)
Responsabile dellesecuzione degli snippet
Dual board:
CPU
Netezza Database Accelerator Card
2 o 4 Disk
Enclousers, a
seconda del
modello.
S-Blade chassis +
Storage Array
In ogni SPA, 2
Dischi sono Spare
entrano in
funzione in caso di
failure di un Disco
nella stessa SPA.
NETEZZA BACKUP / RESTORE
3 METODI per backup/restore user data

Full
/ incremental backup/restore
(nzbackup/nzrestore)
Unload / reload singola tabella in formato internal
compresso (CREATE EXTERNAL TABLE)
Unload / reload singola tabella in formato text
(CREATE EXTERNAL TABLE)
NETEZZA BACKUP / RESTORE
NETEZZA TWINFIN
DIFFERENZE CON MODELLI PRECEDENTI:

Ciascua
SPU non ha pi dischi interni, come i

vecchi modell, ma usa dischi dello Storage Array
O.S.:
TwinFin:
Red Hat Enterprise Linux (RHEL) 5.3

Precedenti versioni O.S.:
RHEL version 5.2
RHEL version 4.0
Red Hat Linux Advanced Server (LAS) 2.1
NETEZZA TWINFIN
COMPRESS:
new engine CTA2: supporto per String
Old engine CTA1
Upgrade: CTA1->CTA2: CTA2 disabilitata: abilitarla
manualmente.
Use the GROOM TABLE SQL command per convertire la
tabella al formato CTA2 compresso.
Usare CREATE TABLE AS per creare una nuova tabella
da una esistente CTA1.
Reload / restore Netezza user data (applica la
compressione CTA2 a tutti i dati durante il
reload/restore).
NETEZZA TWINFIN12
Connessione...
REFUSI
Company Timeline
Enhanced Product Line
Doubling Performance
First GA Product
Sydney, Washington, DC
& Tokyo Office Openings
London Office
Opening
Framingham HQ
Opening
Company
Founding
2000
2001
Series A
Financing
$8M
2002
2003
Series B
Financing
$25M
Staffing:
62
2004
2005
Series C
Financing
$20M
Series D
Financing
$15M
Staffing:
80
2006
Staffing:
185
2007
Staffing:
200+
Over 100 customers & over 210 systems shipped to date
ADVANCES IN DW INFRASTRUCTURE:
THE APPLIANCE APPROACH
Client
SOLARIS
AIX
TRU64
HP-UX
WINDOWS
LINUX
ODBC 3.X
JDBC Type 4
SQL-92
SQL-99
Analytics
ETL Server
DBA CLI
Source
Systems
3rd Party
Apps
High Performance
Loader
RDBMS
+
Server
+
Storage
NETEZZA SYSTEM
ECC:
http://en.wikipedia.org/wiki/Hamming_code

Lezione 1

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Lezione 1

Caricato da

Copyright:

Formati disponibili

NETEZZA

FAST BUSINESS DECISIONS

Obiettivo primario delle Aziende: compiere

la Business Intelligence a supporto dei

1 FN: Esiste PK + attributi definiti su dominio atomico

2 FN: 1 FN + attributi dipendono da intera PK e

Voto, data dipendono dallintera chiave, non da

solo da (id_corso_laurea , id_esame)

3 FN: 2 FN + tutti gli attributi non PK

NETEZZA DWH CLASSIFICATION

di notte (overnight batch)

NETEZZA DWH CLASSIFICATION

e frequenti data feeding.

NETEZZA PERFORMANCE SERVER

IBM ACQUISTA NETEZZA

Il 20 Settembre 2010 NETEZZA acquisita da

SERVER + RDBMS + STORAGE

APPLIANCE: PRINCIPI ARCHITETTURALI

DATA PROCESSING CLOSE-TO-SOURCE

Semplice principio dellinformatica:

si opera su grosse moli di dati, evitare gli

Netezza utlizza gli FPGA (Field Programmable

processo di estrazione, i dati inutili vengono

ARCHITETTURA BILANCIATA E PARALLELA

ASYMMETRIC MASSIVELY PARALLEL PROCESSING

SMP (Symmetric Multi-Processing): sistemi

alla stessa memoria condivisa

MPP (Massively Parallel Processing): sistemi a memoria

essere dei SMP

Massima distribuzione del carico di lavoro tra gli

PIATTAFORMA PER ADVANCED ANALYTICS

INNOVAZIONE ACCELERATA, AUMENTO DELLE

Legge di Gordon Moore: # of transistor/chip

CONFIGURAZIONE FLESSIBILE ED ESTREMA

Netezza in grado di scalare in maniera

di Gb -> 10s di Pb di Dati

per diverse esigenze, tra

orientare Netezza verso le prestazioni oppure

LEGACY DATABASE SOLUTION

NETEZZA PERFORMANCE SERVER

NETEZZA PERFORMANCE SERVER

ASYMMETRIC MASSIVELY PARALLEL PROCESSING

Linux ad alta prestazione (High Performance)

SNIPPET BLADES (S-BLADES)

-> Memory ASAP

SNIPPET BLADES (S-BLADES) i.e. FAST engine

+ FPGA + FPGA + ...+ FPGA + = FAST

Field Programmable Gate Array

il cuore dellarchitettura di Netezza

Engine composto da funzioni analitiche cablate

FPGA-ACCELERATED STREAMING TECHNOLOGY

FAST TECHNOLOGY: FPGA

CONTROL ENGINE: gestione I/O tramite Zone

dati vengono partizionati per Zone, con intervalli

FAST TECHNOLOGY: FPGA

(riduzione retry su disco)

Code Correction: su byte con redundancy bit

dei dati, fornendo alle 3 componenti

FAST TECHNOLOGY: FPGA

Implementa il paradigma ACID:

Elimina le righe inutili al particolare snippet in esecuzione

FAST TECHNOLOGY: FPGA

i campi utilizzati dallo statement SQL vengono