Sei sulla pagina 1di 42

GESTIONE E ANALISI DEI DATI

QUALE INFORMAZIONE?
Informazione

= Contenuto + Struttura
Contenuto: loggetto che si intende comunicare/
rappresentare attraverso
Testo,

linguaggio naturale
Immagine, linguaggio visuale
Suono,

linguaggio audiovisivo

Struttura:

la organizzazione della comunicazione, che


esplicita, attraverso astrazioni, i tratti salienti della
rappresentazione
2

INFORMAZIONE = CONTENUTO +
STRUTTURA

Informazione

Molto contenuto, poca struttura


Un romanzo e il suo indice (magari solo capitoli
numerati)

Informazione

non strutturata

strutturata

Molta struttura, contenuto rigidamente codificato


I sistemi informativi delle organizzazioni, le basi di
dati

INFORMAZIONE STRUTTURATA
VS. NON STRUTTURATA
Due

situazioni estreme
Informazione strutturata

- Rigida a costruirsi e ad alimentarsi


+ Adatta e flessibile ad interrogarsi per estrarre
conoscenza

Informazione

non strutturata (testo)

+ Flessibile a costruirsi e ad alimentarsi


- Difficile ad interrogarsi per estrarre conoscenza

FRA I DUE ESTREMI ...


Linformazione

semi-strutturata, vari possibii


compromessi fra contenuto e struttura
Rappresentazioni dellinformazione, dei
documenti multimediali, che cercano di
combinare i vantaggi dei due estremi.
Sullo sfondo, il Web, una sorgente sterminata di
informazione semi-strutturata (a struttura
crescente) da cui difficile estrarre conoscenza

CONTENUTI (E STRUTTURA ...) DEL CORSO

INFORMAZIONE STRUTTURATA
Le

basi di dati relazionali


Lalgebra relazionale e il linguaggio di
interrogazione SQL (Structured Query Language)
La sperimentazione (interrogare una base di
dati)
Analizzare e estrarre le proprieta dei dati.

UNA RAPIDA PANORAMICA SUI DATI

Dallinformazione strutturata alla informazione


semi-strutturata

MODELLO DEI DATI


Insieme

di meccanismi di astrazione per la


rappresentazione di informazioni

MODELLO RELAZIONALE DEI DATI


i

dati sono organizzati in tabelle


la tabella un insieme di record (ennuple)
con un insieme di attributi
di tipi opportuni (numeri, stringhe, date )
i dati in tabelle diverse sono correlati sulla base
dei valori

10

studenti

Matricola
6554
8765
9283
3456

Cognome
Pinco
Neri
Verdi
Rossi

Nome
Pallino
Paolo
Luisa
Maria

esami

Studente
3456
3456
9283
6554

Voto
30
24
28
26

corsi

Codice
01
02
04

Data di nascita
05/12/1978
03/11/1976
12/11/1979
01/02/1978
Corso
04
02
01
01

Titolo
Docente
Analisi Sempronio
Chimica
Bruni
Chimica
Verdi

11

MODELLO CONCETTUALE DEI DATI


i

dati sono organizzati in classi


ogni classe rappresenta un insieme di oggetti
con un insieme di propriet
le classi sono organizzate in ontologie
oggetti diversi sono correlati sulla base di
identificatori

12

13

14

MODELLO SEMI-STRUTTURATO: XML


i

dati sono organizzati in strutture gerarchiche


(alberi)
ogni albero ha un insieme di nodi (elementi)
oggetti diversi sono correlati sulla base di
relazioni di contenimento

15

studenti

studente

studente

matricola

cognome

nome

dataNascita

6554

Pinco

Pallino

5/12/1978

studente

esame

esamiSost

esame
voto

corso
codice

titolo

docente

01

Analisi

Sempronio

26
16

17

IN OGNI MODELLO ESISTONO


Lo

schema: la descrizione della struttura


stabile nel tempo

Listanza:

i valori (cio i dati)

variabile nel tempo

studenti

Matricola
6554
8765
9283
3456

Cognome
Pinco
Neri
Verdi
Rossi

Nome
Pallino
Paolo
Luisa
Maria

Data di nascita
05/12/1978
03/11/1976
12/11/1979
01/02/1978 18

LINGUAGGIO DI INTERROGAZIONE
Linguaggio

per richiedere al DBMS (Database


Management System) il recupero di informazione
Ogni modello ha i suoi linguaggi
DBMS relazionali: SQL
XML: XPath, XQuery

19

SQL: UN ESEMPIO
SELECT Matricola, Cognome, AVG(Voto)
FROM Studenti, Esami
WHERE Matricola = Studente
GROUP BY Matricola, Cognome
Matricola
6554
8765
3456

Cognome AVG(voto)
Pinco
26
Neri
28
Rossi
27
20

21

SISTEMI INFORMATIVI

Definizione Un sistema informativo di


unorganizzazione una combinazione di risorse,
umane e materiali, e di procedure organizzate per:

la raccolta,

larchiviazione,

lelaborazione e

lo scambio

delle informazioni necessarie alle attivit:

operative (informazioni di servizio),

di programmazione e controllo (informazioni di gestione), e

di pianificazione strategica (informazioni di governo).

22

ESEMPIO DI SISTEMI INFORMATIVI


Azienda

manifatturiera

Gestione

degli ordini dei clienti

Gestione

degli ordini e dei pagamenti di materiali ai

fornitori
Gestione del magazzino
Pianificazione della produzione e controllo dei costi

23

ESEMPIO DI SISTEMI INFORMATIVI


Un

Comune

Gestione

dei servizi demografici (anagrafe, stato

civile, servizio elettorale e vaccinale) e della rete


viaria.
Gestione

dellattivit finanziaria secondo la


normativa vigente.
Gestione del personale per il calcolo della retribuzione
in base al tipo di normativa contrattuale.
Gestione dei servizi amministrativi e sanitari delle
Unit Sanitarie Locali.
Gestione della cartografia generale e tematica del
territorio.

24

SISTEMA INFORMATIVO NELLE


ORGANIZZAZIONI

25

SISTEMI INFORMATICI
Il

sistema informatico linsieme delle tecnologie


informatiche e della comunicazione (Information and
Communication Technologies, ICT) a supporto delle
attivit di unorganizzazione.
Il sistema informativo automatizzato quella
parte del sistema informativo in cui le informazioni
sono raccolte, elaborate, archiviate e scambiate
usando un sistema informatico.
Terminologia
sistema

informativo sistema informativo

automatizzato
sistema informativo automatizzato sistema
informatico

26

SISTEMA INFORMATICO NELLE


ORGANIZZAZIONI

27

COMPONENTI DI UN SISTEMA
INFORMATICO

28

CLASSIFICAZIONE DEI SISTEMI


INFORMATICI
Sistemi
informatici
direzionali

Sistemi informatici
operativi

29

SISTEMI INFORMATICI OPERATIVI


I

dati sono organizzati in BD


Le applicazioni li usano per svolgere le classiche
attivit strutturate e ripetitive dell'azienda nelle aree
amministrativa e finanziaria, vendite, produzione,
risorse umane ecc.
Terminologia anglosassone
Data

processing (DP), Electronic Data processing (EDP)

Transaction

Processing Systems (TPS)

30

SISTEMA INFORMATICO OPERATIVO


(CONT.)

31

ELABORAZIONI SU BD: OLTP (ONLINE TRANSACTION PROCESSING)


Uso

principale dei DBMS


Tradizionale elaborazione di transazioni, che
realizzano i processi operativi per il funzionamento di
organizzazioni:
Operazioni
Ogni

predefinite e relativamente semplici

operazione coinvolge pochi dati


Dati di dettaglio, aggiornati

32

SISTEMI INFORMATICI
DIREZIONALI
I

dati sono organizzati in Data Warehouse (DW) e


gestiti da un opportuno sistema
Le applicazioni, dette di Business intelligence,
sono strumenti di supporto ai processi di controllo
delle prestazioni aziendali e di decisione manageriale
Terminologia anglosassone:
Management
Decision

Information Systems (MIS)

support systems (DSS), data or model based


Executive Information System (EIS)

33

SISTEMA INFORMATICO
DIREZIONALE

34

ELABORAZIONI SU DW: OLAP (ONLINE ANALYTICAL PROCESSING)


Uso

principale dei data warehouse


Analisi dei dati di supporto alle decisioni

Operazioni complesse e casuali

Ogni operazione pu coinvolgere molti dati


Dati aggregati, storici, anche non attualissimi

35

DATA BASE MANAGEMENT SYSTEMS DBMS

Definizione: Un DBMS un sistema centralizzato o


distribuito che offre opportuni linguaggi per:

definire lo schema di una basi di dati (lo schema va definito


prima di creare dati),

scegliere le strutture dati per la memorizzazione dei dati,


memorizzare i dati rispettando i vincoli definiti nello
schema;
recuperare e modificare i dati interattivamente (linguaggio di
interrogazione o query language) o da programmi.

36

ARCHITETTURA DEI DBMS


CENTRALIZZATI

DBMS
Prodotti

software (complessi) disponibili sul


mercato; esempi:

DB2
Oracle
SQLServer
MySQL
PostgreSQL
Access

LE BASI DI DATI SONO ... GRANDI


dimensioni

(molto) maggiori della


memoria centrale dei sistemi di calcolo
utilizzati
il limite deve essere solo quello fisico dei
dispositivi
esempi di dimensioni molto grandi

500 Gigabyte (dati transazionali)


10 Terabyte (dati decisionali)
500 Terabyte (dati scientifici)
100 miliardi di record

LE BASI DI DATI SONO ... PERSISTENTI


hanno

un tempo di vita indipendente dalle


singole esecuzioni dei programmi che le
utilizzano

LE BASI DI DATI SONO ... CONDIVISE


Ogni

organizzazione (specie se grande) divisa in


settori o comunque svolge diverse attivit
Ciascun settore/attivit ha un (sotto)sistema
informativo (non necessariamente disgiunto)

ARCHIVI E BASI DI DATI

Gestione
orario lezioni

Archivio 1:
orario lezioni

Gestione
ricevimento

Archivio 2:
ricevimento

ARCHIVI E BASI DI DATI

Gestione
orario lezioni
Base di dati
Gestione
ricevimento