Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Stage
Massimiliano Del Ferraro
1 Febbraio 2013
1
Sommario
• I Linked Open Data (LOD)
• Approccio metodologico utilizzato
• L’architettura del sistema
• Il sottosistema di Data Integration
• L’analisi delle sorgenti informative
• L’ontologia degli atti di indirizzo e controllo
• Le regole di mapping
• I risultati ottenuti
2
Linked Open Data (LOD)
3
Standard e tecnologie coinvolti
4
La metodologia utilizzata
5
I Dataset
• Anagrafica dei deputati, dei senatori e dei membri
non parlamentari del Governo
• Organi parlamentari (Assemblea, Commissioni,
giunte)
• Gruppi parlamentari
• Progetti di Legge
• Atti di indirizzo e controllo (mozioni, interpellanze)
• Dibattiti
• Votazioni
6
Classificazione delle ontologie
7
Analisi e modellazione
(approccio utilizzato)
8
Architettura del sistema
Sottosistema di Data Integration
Regole di mapping
Sorgenti
9
Architettura completa
Virtuoso Open Source (VOS)
(intercactive) Endpoint SPARQL (processable)
Regole di mapping
Data
Integration
System
Sorgenti
10
Ontologia
atti di indirizzo e controllo presentatore
versioneTestoAtto cofirmatario deputato data
legislatura lavori
dibattito
ultimoTestoRiformulato string
rif_leg statoIter tipoAtto
votazione dibattitoAIC
iter
numeroAtto boolean
concluso
attoIndirizzoControllo (AIC)
votazioneAtto testoRiformulato seduta
sedutaPresentazione
trasformatoIn/
trasformatatoDa
attoIndirizzo attoControllo
dataRisposta
indirizzatoA
natura1 natura7 natura9
RispostaOrale RispostaScritta
delegatoARispondere
natura6 natura8 natura0
destinatario
rispostaScritta
conclusoDa natura2 natura5 natura4
governo
parereAtto
natura3
commissioneAssegnataria
CommissioneAssegnataria testoRisposta
rispostaOrale
organo
firmaRisposta
CommissioneAssegnataria
parereGovern parere
intervento membroGoverno
interventoGoverno
string organoGoverno
o
11
Datastore: Virtuoso Open Source
12
Document vs Data
http://www.camera.it http://dati.camera.it
13
Endpoint SPARQL
14
Processo di produzione delle triple
RDF (esempio)
testoRisposta firmaRisposta membroGoverno
Dataset RDF
Regole di mapping
15
Regole di mapping: un esempio
Query SPARQL sul Global Schema
SELECT ?testo ?ministro
FROM <http://dati.camera.it/ocd/>
WHERE { ?testo a ocd:testoRisposta .
?ministro a ocd:membroGoverno .
?testo ocd:firmaRisposta ?ministro }
16
Le triple RDF (esempio)
@prefix ocd: <http://dati.camera/ocd/> .
ocd:testoRisposta.rdf/tr_aic4_00014_16_20080714_1 ocd:firmaRisposta ocd:membroGoverno.rdf/mg33410_3_61_6_20080507
ocd:testoRisposta.rdf/tr_aic4_00022_16_20100908_1 ocd:firmaRisposta ocd:membroGoverno.rdf/mg33230_27_61_1_20080512
ocd:testoRisposta.rdf/tr_aic4_00042_16_20081023_1 ocd:firmaRisposta ocd:membroGoverno.rdf/mg301449_3_61_196_20080507
ocd:testoRisposta.rdf/tr_aic4_00056_16_20081205_1 ocd:firmaRisposta ocd:membroGoverno.rdf/mg302748_5_61_195_20080512
ocd:testoRisposta.rdf/tr_aic4_00124_16_20081007_1 ocd:firmaRisposta ocd:membroGoverno.rdf/mg23880_3_61_198_20080507
ocd:testoRisposta.rdf/tr_aic4_00250_16_20081023_1 ocd:firmaRisposta ocd:membroGoverno.rdf/mg300452_3_61_15_20080512
…..
17
Questioni aperte
• Ontologie leggere o pesanti ?
• Livelli di interoperabilità
18