Sei sulla pagina 1di 36

www.forward.recentiprogressi.

it
02
Assediati
dai dati
04
Una nuova sfida
per lepidemiologia
Eliana Ferroni
06
Un approccio semantico
Alessandro Rosa
08
Le impronte
Big data
digitali al servizio
dellepidemiologia
Daniela Paolotti
Caterina Rizzo
10
Cercare i piccoli numeri
nei grandi numeri
Francesca Dominici
11
Collegare i big data
biomedici
alla persona malata
Intervista a
Grin M. Weber
I big data trasformeranno la medicina.
12
Predire il futuro Affinch possano essere utili bisogna
Intervista a
Ziad Obermeyer analizzarli e interpretarli correttamente.
13 Ziad Obermeyer, Ezekiel J. Emanuel
La grandezza risiede
nella partecipazione
Giulia Annovi
16
Larte e i big data
20
Big data e innovazione
farmaceutica
Luca Pani
21
Come cambia
la sorveglianza
post-marketing
Gianluca Trir
Valentina Ientile
22
Interrogare i flussi
amministrativi
Nello Martini
24
Verso una nuova
cooperazione
pubblico-privato
Maurizio Belglio
Cristina Mencarelli
Lara Pippo
25
La ricerca in un mare
di dati
Eugenio Santoro
26
Quando i big data
possono diventare
scomodi
Intervista a
Carlo Alberto Perucci
29
Il labile confine
tra riservatezza
ed esposizione
Cristina Da Rold
31
Internet
non un mondo a parte
Rebecca De Fiore
33
Big data e psicopolitica:
ancora e sempre fatti
vs interpretazione?
Luciano De Fiore

Il Pensiero
Scientifico
Editore

1116-FWD-04_xweb.indd 1 17/11/2016 16:59:48


2 | forward BIG DATA 4 / 2016

Assediati dai dati


Una storia in continua accelerazione che riguarda anche la clinica e la sanit pubblica

THE SCHOLAR AND THE FUTURE


OF THE RESEARCH LIBRARY
Fremont Rider, bibliotecario,
ipotizza in un suo libro che ASSALTO ALLA PRIVACY
il patrimonio delle biblioteche Laccusa di Arthur Miller
americane raddoppi ogni in unopera che lascia
sedici anni. il segno.

1944 1971

1961

SCIENCE SINCE BABYLON Nellarticolo Tracking the flow


In questo libro, si tratteggia of information, uscito su
la crescita della conoscenza Science, Ithiel de Sola Pool
scientifica come un processo afferma che la disponibilit
esponenziale e non lineare. di parole aumenta
Lautore Derek de Solla Price. dell8,9% ogni anno.

E
ra il 1662 quando John Graunt pub-
blic a Londra il Natural and po-
litical observations mentioned in a
following index, and made upon the
bills of mortality. Secondo Stephen Mooney,
Kimberly Westreich e Abdulrahman El-Sayed
era la sintesi di un lavoro da demografo e
statistico che anticipava alcuni tratti dellepi-
demiologia moderna. Leditoriale Epidemio-
logy in the era of big data1, uscito sulla rivista
Epidemiology, celebra dunque Graunt, mentre
altre note recenti2 indicano in John Snow lan-
tesignano del lavoro sui big data orientato alla
salute.
Se vero che nella locuzione big data il
termine chiave il secondo, c da dare ragione
a chi vede i precursori in quanti hanno sapu-
to lavorare con intelligenza sulle associazioni,
muovendo dalle correlazioni alle ipotesi e alla un rapido usso costante crediamo comunque e renderla universalmente accessibile e utile.
determinazione delle cause. Ci premesso, di essere alle prese con i big data. Limpressione di disorientamento: la pre-
quella dei big data storia recente, con una Al contrario, lelemento dirompente visione di Chris Anderson sullobsolescenza
straordinaria progressiva accelerazione che ri- nellessere i dati generati in modo sponta- del metodo scientico conseguente alla resa
schia di rendere superata nel volgere di pochis- neo: come il diluvio descritto nelle pagine allo tsunami di dati si traduce nello smarri-
simo tempo qualsiasi timeline. Volume, varia- del dossier dellEconomist del 2009, la pioggia mento di chi teme lincapacit di governare
bilit e velocit sono le caratteristiche fondanti torrenziale di fatti e cifre non richiede una un usso di informazioni in crescita espo-
dei big data, ma laffermarsi di questa novit rilevazione attiva e si modica losservazio- nenziale. Ci si consola nella fantascienza
stato talmente dirompente che spesso si - ne tradizionale, afdandone lanalisi ad al- della internet of things, con la speranza di un
nisce con laccettare per big data qualsiasi ag- goritmi costantemente afnati. il caso, per ecosistema addestrato a risolverci i problemi
gregazione di dati che sia caratterizzata anche esempio, dei dati ambientali, sul clima o sul- invece che a complicarci la vita: il frigorifero
solo da uno degli elementi che teoricamente la qualit dellaria o delle informazioni che che ci avverte che il latte nito, la caldaia
dovrebbero concorrere insieme a denirli. In costantemente aggiornano Google Trends che si avvia sollecitata dal meteo, lautomo-
altre parole, di fronte a tanti dati o che giun- che non manca di ricordare che il suo obiet- bile che ci porta a destinazione nel pi breve
gono da fonti diverse o che ci raggiungono in tivo organizzare linformazione planetaria tempo possibile informata dagli spostamenti

1116-FWD-04_xweb.indd 2 17/11/2016 16:59:55


www.forward.recentiprogressi.it forward | 3

ORIGINI
INFLUWEB In una conferenza, il chairman Special issue della
QUANTA INFORMAZIONE? In Belgio e Olanda di Google, Erick Schmidt, afferma Harvard Business Review
Peter Lyman viene lanciata che ogni due giorni prodotta dedicato a: Big data:
e Hal R. Varian la prima piattaforma una eguale quantit di dati di the management revolution.
della UC di Berkeley web per il monitoraggio quella prodotta dalle origini
pubblicano dellinfluenza. della civilt al 2003. La NPR dichiara big data
How much espressione dellanno.
information?:
il primo studio RIVOLUZIONE
BIG DATA che quantifica Esce su Wired larticolo
Un documento della Nasa, in termini di storage Tim OReilly nel libro di Chris Anderson:
lagenzia spaziale statunitense, informatico il totale What is Web 2.0? The end of theory:
cita per la prima volta dei dati disponibili scrive: The data is the data deluge makes
lespressione big data. su carta, cd, dvd e the next Intel inside. the scientific method Il governo Usa lancia
supporti magnetici. obsolete. la Partnership
Viene creato for Resilience
GENOMA Hadoop, NATURE and Preparedness
Completamento un framework Numero speciale sui big data. che intende favorire
del primo draft open source laccesso a una
del genoma per la raccolta di 100 MILIONI UTENTI SU FB BIG DATA piattaforma
umano. big data di Apache. Il social network EUROPE open source
di Mark Zuckerberger Apre il sito per il controllo
Fondazione del primo
raggiunge una prima dellUnione del cambiamento
grande portale
significativa milestone. europea. climatico.
di e-commerce.

1994 1997 2000 2003 2005 2008 2010 2012 2015 2016

1983 1996 1998 2001 2004 2006 2009 2011 2013 2014

TITOLI
Nella libreria
di Amazon,
EXPEDIA THE
il catalogo di libri
Nasce il primo sito ECONOMIST
sui big data
di turismo online. Pubblica il dossier
supera le 250
sulla presenza
unit.
ubiquitaria
TWITTER dei dati:
Apre il primo canale Data, data
LE TRE V di microblogging online. everywhere. BIG DATA.
Esce il paper Lideatore Jack Dorsey. SEIZING
di Doug Laney DATA.GOV OPPORTUNITIES,
del Meta Group Decolla la digital Apre il portale PRESERVING
che introduce epidemiology degli open data VALUES
i criteri chiave con Healthmap. del governo Usa. Esce il report
di volume, della Casa Bianca.
variabilit
e velocit. Chiude
Google
MC KINSEY
flu trends.
Esce il report
GOOGLE Big data:
Alluniversit di Stanford, Sergey Brin e Larry Page the next frontier
costruiscono il motore di ricerca che cambier il web. for innovation,
competition,
and productivity.

FACEBOOK
Nasce la rete sociale diMark Zuckerberg.
di chi ha lasciato traccia sullo stesso nostro
percorso. In questo modo riportiamo i big
data a un livello pi rassicurante: quello della
nostra spesa o dello scaldabagno. Spaventati
dallevidenza che i big data si riferiscono a
quello che si pu fare su larga e non su picco- 1. Mooney SJ, Westreich DJ, El-Sayed AM.
la scala, che d nuove suggestioni o crea nuo- Epidemiology in the era of big data.
Epidemiology 2015;26:390-4.
ve forme di valore, con modi che cambiano
2. Khoury MJ, Ioannidis JP. Big data meets
i mercati, le organizzazioni, le relazioni tra
public health. Science 2014;346:1054-5.
cittadini e governi3.
3. Mayer-Schonhuber V, Cukier K. Big data:
Mettendo da parte la preoccupazione prin- A revolution that will transform how we
cipale: levidenza che internet lo spazio non live, work, and think. Boston: Houghton
governato pi grande del mondo, il pi gran- Mifflin Harcourt, 2013.
de esperimento di anarchia mai tentato nella 4. Schmidt E, Cohen J. The new digital age.
storia4. F New York: Knopf, 2013.

1116-FWD-04_xweb.indd 3 17/11/2016 16:59:55


F

4 | forward BIG DATA 4 / 2016

Una nuova sda per lepidemiologia


Un uso responsabile dei big data che generi conoscenza e migliori la salute

P
er decenni, lepidemiologia ha for-
nito un fondamento scientico per
la salute pubblica e la prevenzio- Variet
ne delle malattie1, contribuendo
a importanti scoperte scientiche. La nuova
Dati strutturati,
sda per lepidemiologia del nostro secolo non strutturati,
affrontare lo tsunami di dati, i cosiddetti big semi-strutturati,
data, che coprono lo spettro di informazioni
genomiche, molecolari, cliniche, epidemiolo- di diversa natura
giche, ambientali e digitali. La fusione di dati e provenienti
provenienti da tutte queste fonti ha in s tutto
il potenziale necessario per inuenzare i pro- da pi fonti.
cessi decisionali del singolo medico e, pi in
generale, in sanit pubblica2.
Il termine big data ha cominciato a esse-
re utilizzato nelle pubblicazioni accademiche
e non solo per descrivere la rapida inte-
grazione e analisi di una grande mole di dati.
Da quando stato coniato nel 1997, per fare
Le
dei big data
3V
riferimento a dati troppo grandi per essere
memorizzati nei sistemi di storage dellepo-
ca, la denizione di big data si evoluta e ad
oggi quella pi accettata ruota intorno alle 3
V: alta variet, alto volume e alta velocit. In
Veridicit
base a questa denizione, alta variet si ri- Credibilit,
ferisce alle varie tipologie di dati, provenienti
da fonti diverse (strutturate e non); alto vo- autenticit,
lume allordine di grandezza in termini di origine,
osservazioni e di variabili contenuti nei da-
taset; alta velocit al processo di generazio- accessibilit,
ne e analisi del dato in tempo reale o quasi,
spesso grazie ad algoritmi che operano senza
accountability.
lintervento umano3.
In ambito epidemiologico, il linkage di
dati provenienti da varie fonti e con caratte-
Volume
ristiche diverse non rappresenta una novit, Terabyte di dataset,
e se laumento delle fonti informative dispo- record,
nibili da un lato pu alimentare nuove op-
portunit di ricerca, dallaltro alimenta anche transazioni,
il rischio di dover gestire dati di qualit va- tabelle e file.
riabile. In questo contesto diviene senzaltro
fondamentale indirizzare correttamente il
processo di raccolta dati, al ne di assicurarne
qualit e validit. Oltre a suggerire limpor-
tanza di una valutazione rigorosa del dato,
laumento della variet sopra descritto ha an-
che portato a un aumento del volume. Gra-

Una grande quantit di dati diversi e caotici gi disponibile,


ma attualmente questi dati formano solo un rivolo dacqua: arrivato
il momento di prepararsi allimminente inondazione.
Stephen J. Mooney, Daniel J. Westreich, Abdulrahman M. El-Sayeda

zie alle innovazioni in ambito tecnologico si pretare al meglio i risultati. Lacquisizione di del colera a Haiti dopo il terremoto del 2010
potr quindi includere, ad esempio, un mag- dati in tempo reale potr senzaltro favorire ha richiesto unimportante risposta in condi-
gior numero di soggetti negli studi clinici, a un miglioramento in termini di salute pub- zioni avverse6. La pronta identicazione dei
benecio della potenza dello studio stesso e blica: ad esempio, esistono gi diverse appli- soggetti con linfezione e la rapida distribu-
in pi con un notevole risparmio in termini cazioni che raccolgono dati in modo istanta- zione del vaccino sarebbero senzaltro state
economici: le tecnologie web-based e della neo provenienti da ricerche web geolocaliz- facilitate dalluso di tecnologie ad alta veloci-
telefonia mobile consentono gi oggi, infat- zate per la sorveglianza epidemiologica5. Ve- t quali le reti cellulari. In realt, purtroppo, il
ti, di reclutare soggetti e seguirli nel tempo a locizzare la raccolta dati pu aiutare, inoltre, vaccino non venne distribuito nelle prime fasi
costi molto inferiori rispetto ai sondaggi tele- a implementare interventi di sanit pubblica, dellepidemia a causa della difcolt di indi-
Eliana Ferroni fonici4. Aumentare il volume dei dati richie- in particolare quelli che devono rispondere viduare la popolazione target che ne avrebbe
Servizio de anche un maggiore impegno in termini immediatamente a una minaccia per la salute beneciato7.
epidemiologico di tecniche statistiche e analitiche, che deve della popolazione e dove trasferire informa- La gestione dei big data richieder lacqui-
regionale andare di pari passo con lampliamento delle zioni ad alta velocit fondamentale per ga- sizione di nuove competenze, in particolare
del Veneto conoscenze per poter essere in grado di inter- rantirne il successo. Ad esempio, la diffusione nellambito della programmazione informa-

1116-FWD-04_xweb.indd 4 17/11/2016 16:59:55


F

www.forward.recentiprogressi.it forward | 5

tica, grazie alle quali sar possibile, con le etiche emerse con lavvento dei big data, ac-
autorizzazioni necessarie, costruire dataset compagnate da alcune proposte per poterle
utilizzando dati pubblicamente disponibili affrontare9.
tramite programmi web scraping che leggo- Uno dei problemi principali conciliare
no e registrano i dati delle pagine web8. Allo lutilizzo dei big data per il bene comune con
stesso modo si potranno monitorizzare e im- i diritti, tra cui quello alla privacy, e le liber-
plementare interventi di promozione della t individuali. Una cosa infatti utilizzare i
salute sfruttando le applicazioni mobili. Di- dati digitali, come quelli dei social network,
verse applicazioni sono state gi sviluppate per promuovere la salute e il benessere dei
allo scopo di incoraggiare la popolazione a cittadini, ben altra cosa farlo per mere nalit
seguire stili di vita sani (ad esempio, Noom, aziendali come quelle pubblicitarie. Emerge,
RunKeeper, MyFitnessPal). Esse permettono quindi, la necessit di realizzare norme ad hoc
Velocit di accumulare un gran volume di dati sulla e modalit speciche per la gestione di dati
salute e sul comportamento dei cittadini, di provenienti da una vasta gamma di fonti.
Trattamento notevole interesse per la ricerca epidemiolo- Un altro aspetto rilevante legato al rispet-
dei dati gica; per tale motivo auspicabile che il mon- to dei diritti e degli interessi delle persone
in real time, do scientico colga presto lopportunit di proprietarie del dato rispetto alla sua raccol-
collaborare con le aziende produttrici di tali ta e analisi, in particolare nei progetti di ricer-
near real time, applicazioni. ca che permettono laccesso e la condivisione
batch o streaming. Tutte queste attivit di ricerca rientrano di dati globali, includendo quindi diversi pa-
nellambito dellepidemiologia digitale, disci- esi e culture con standard diversi per la tutela
plina che sfrutta la nuova generazione di siste- della privacy.
mi di sorveglianza, insieme allaccesso diffuso Una riessione etica va fatta anche sul-
a internet e la crescita esplosiva dei dispositi- la provenienza dei dati: per gli studi epide-
vi mobili e delle piattaforme di condivisione miologici dovrebbero essere utilizzati dati di
online, in grado di generare continuamente pubblico dominio o per i quali i titolari delle
una grande mole di dati contenenti informa- informazioni abbiano espresso il loro esplici-
zioni sulla salute. Quindi nellera dei big data to consenso alluso in ambito medico-scien-
la nuova sda integrare le conoscenze delle- tico. Tuttavia, sebbene in linea di principio
pidemiologia tradizionale con nuove capacit i dati di dominio pubblico sono accessibili e
tecniche quali la programmazione3. Attraver- possono essere utilizzati a ni di salute pub-
so luso di dati digitali globali, lepidemiolo- blica, cosa costituisca dominio pubblico su
Valore gia digitale promette di rilevare tempestiva-
mente il focolaio di una malattia, di valutare
internet tuttora oggetto di accesi dibattiti10.
Non chiaro, ad esempio, se gli utenti siano a
Validit, il comportamento e gli atteggiamenti di salute conoscenza delle modalit con cui i dati del-
della popolazione, nonch di dare un gros- le loro interazioni sui social network possano
statistica, so contributo nellambito della farmacovigi- essere utilizzati e chi possa accedervi. Qualun-
eventi, lanza. Tutti questi buoni propositi non sono que progetto di ricerca dovr necessariamente
esenti da rischi, in particolare quelli legati alla considerare questi aspetti, allo scopo di garan-
correlazioni, sensibilit dei dati raccolti. In un recente arti- tire la massima trasparenza e il rispetto dei di-
colo vengono elencate alcune problematiche ritti e della dignit individuali. F
ipotesi.

Una componente fondamentale del valore futuro


del nostro campo sta nellintegrazione della conoscenza
dellepidemiologia con una migliore abilit tecnica.
Stephen J. Mooney, Daniel J. Westreich, Abdulrahman M. El-Sayeda

Alle tradizionali 3V 1. Koplan JP, Thacker SB, Lezin NA. Epidemiology in the 21st
century: calculation, communication, and intervention. Am J
6. Frerichs R, Keim P, Barrais R, et al. Nepalese origin of cholera
epidemic in Haiti. Clinical Microbiology and Infection
Public Health 1999;89:1153-5. 2012;18:E158-E163.
dei big data se ne 2. Khoury MJ, Lam TK, Ioannidis JP, et al. Transforming 7. Date KA, Vicari A, Hyde TB, et al. Considerations for Oral
epidemiology for 21st century medicine and public health. Cholera Vaccine Use during Outbreak after Earthquake
stanno aggiungendo Cancer Epidemiol Biomarkers Prev 2013;22:508-16. in Haiti, 20102011. Emerging infectious diseases
3. Mooney SJ, Westreich DJ, El-Sayed AM. Epidemiology in the 2011;17:2105.
altre, man mano era of big data. Epidemiology 2015;26:390-4. 8. Lee BK. Epidemiologic research and Web 2.0 the user-
4. Cook C, Heath F, Thompson RL. A meta-analysis of response driven Web. Epidemiology 2010;21:760-3.
che la riflessione rates in web-or internet-based surveys. Educational and 9. Vayena E, Salath M, Madoff LC, et al. Ethical challenges of
psychological measurement 2000;60:821-36. big data in public health. PLoS Comput Biol 2015;11:1-7.
procede. 5. Lampos V, Cristianini N. Tracking the flu pandemic by 10.Nissenbaum H. Privacy in Context: Technology, Policy, and
monitoring the social web. 2nd International Workshop on the Integrity of Social Life. Stanford (California): Stanford
Cognitive Information Processing (CIP). New York: IEEE Press University Press, 2010.
2010:411-6.

Cosa accade ogni secondo nel web...

7366 4880 745 132.618 2297 56.585 38.530 2.528.974


tweet aggiornamenti foto caricate video chiamate ricerche gigabyte di traffico email inviate
di status su Facebook su Instagram su You Tube su Skype su Google (internet) (il 67% spam)

Social media,
Mainframe Client/server Internet big data,
cloud

1116-FWD-04_xweb.indd 5 17/11/2016 16:59:59


6 | forward BIG DATA 4 / 2016

Un approccio semantico
Sfide e opportunit per lepidemiologia 2.0

B
ig data. Un rivoluzionario approc- rapida integrazione e analisi su larga scala; che relativa al tasso di produzione dei dati.
cio per lepidemiologia, la chiave di tuttavia, una chiara denizione di big data importante aggiungere che i big data
volta del futuro sistema sanitario, rimane sfuggente. Le modalit con le quali vengono generati automaticamente da ope-
un nuovo strumento per monitora- i big data potrebbero inuenzare il futuro razioni di interazione persona-macchina
re e contrastare, in modo tempestivo, il ma- della ricerca epidemiologica e di intervento (un esempio, in ambito nanziario, sono i
nifestarsi di epidemie? Un capovolgimento sanitario sulla popolazione rimangono, al dati transazionali), persona-persona (social
di metodologia, labbandono dellinferenza momento, poco chiare. network) e macchina-macchina (si pensi ai
in sostituzione del machine learning? La dati inviati dai sensori direttamente ai tele-
possibilit, no a pochi decenni fa inimma- Il peso della terminologia foni cellulari). Nella convenzione universal-
ginabile, di poter seguire le fasi di cura del Il corretto approccio alla tematica forse Alessandro Rosa mente accettata si associano ad enormi moli
paziente in tempo reale, mediante sensori ha senso a partire dallaspetto semantico, e Dipartimento di volume: si passa dai terabyte (1 tb = 1012
direttamente collegati con il proprio medico conseguentemente concettuale, della deni- di Epidemiologia b) e petabyte (1 pb = 1015 b), no ad arri-
curante? Big data per mappare la sequenza zione ormai celebre di big data riassunta nel Servizio sanitario vare agli exabyte e addirittura agli zettabyte.
del genoma umano? O per prevedere il dif- primo modello teorizzato delle 3 V: volume, regionale del Lazio Devono presentare un tasso di produzione
fondersi persino di pandemie sfruttando le variet e velocit. Un primo passo propedeu- alto e, inoltre, possono essere di provenienza
ricerche testuali su Google, effettuate dalla tico alla formulazione di ipotesi idonee alla varia e talvolta non convenzionale: parliamo
popolazione, per ottenere la geo-localizza- ricerca e alla formazione di un background anche di documenti testuali, immagini, au-
zione di una determinata patologia? Oppu- realmente critico risiede nella terminologia: dio, video, dati da sensori o Gps.
re, i big data sono solo un grande bluff? cercare di fare chiarezza su cosa differenzi i I big data, in sintesi, presentano congiun-
Secondo alcuni solo unoperazione di big data, nella loro natura, dai dati ottenuti tamente le tre caratteristiche sopra elencate e
marketing. O poco pi. Una moda, uno dei dalle fonti tradizionali. In sostanza si torna sono la materializzazione (per usare un os-
tanti prodotti transeunti della modernit: alla domanda iniziale: cosa sono i big data? simoro) dellinternet of things, cio la visione
tutti parlano di grandi insiemi dati e di nuo- Big, ad esempio, di per s un attributo secondo cui gli oggetti nel mondo informa-
vi ussi (data deluge), nonostante nessuno generico e poco calzante che fa esclusiva- tizzato creano un sistema pervasivo e inter-
li abbia mai visti davvero. Anche in ambito mente riferimento al volume, alla mole di connesso avvalendosi di molteplici tecnolo-
epidemiologico e scientico, non mancano dati, che ha unaccezione soggettiva e non gie di comunicazione. In pratica, parliamo
le critiche sul possibile contributo informa- indica nulla di quantitativo. Ad esempio, di dati e ussi continui.
tivo dei big data, rafforzate dalla consapevo- anche le schede di dimissione ospedaliera Le caratteristiche sopra elencate differen-
lezza che ai grandi numeri non necessaria- della Regione Lazio dovrebbero appartenere ziano pertanto i big data veri e propri dai
mente corrispondano grandi informazioni ai big data in quanto composte da milioni di dati desunti dalle fonti tradizionali. Tuttavia,
o, comunque, informazioni di validit scien- record. La percezione del concetto di gran- a causa di un problema denitorio, lincom-
tica o di qualit. dezza ovviamente soggettiva. pleta espressione big data porta a fare con-
Il ricercatore appartenente a questo pe- La variet: i dati possono presentare ete- fusione con le fonti attualmente disponibili,
riodo storico, che possiamo far idealmente rogeneit nel tipo, nella rappresentazione proprio per il fatto che, anche queste ultime
partire dal 2010, anno in cui il termine big e nellinterpretazione semantica. Possono vertono su considerevoli moli di volume.
data ha ottenuto una diffusione planetaria, essere di qualsiasi natura (strutturati, semi- In ambito sanitario, ad esempio, lespres-
si trover probabilmente nel limbo dellin- strutturati o non strutturati). Pertanto, ad sione la tale struttura sta avviando unini-
decisione, tra scetticismo e curiosit, come esempio, considerando un ipotetico linkage ziativa di big data dovrebbe essere sostitui-
se dovesse scegliere tra il nuovo approccio tra sistemi informativi riguardanti farmaceu- ta dalla pi aderente formulazione secondo
di indagine che fa uso dei big data oppure tica, ricoveri e assistenza specialistica, pos- cui la tale struttura intende combinare i dati
quello tradizionale, come se i due ambiti siamo parlare di big data? sanitari in formato elettronico e i dati geno-
fossero mutuamente esclusivi. La velocit: alle nuove informazioni estrai- mici per applicare ai pazienti trattamenti
La stampa popolare e accademica ha bili dai dati viene spesso associata una fun- personalizzati, posto che la tale struttura
con notevole entusiasmo iniziato a utiliz- zione di utilit che degrada velocemente con stia davvero portando avanti un progetto sui
zare il termine big data per descrivere la il passare del tempo. La velocit inoltre an- big data.

1116-FWD-04_xweb.indd 6 17/11/2016 16:32:09


www.forward.recentiprogressi.it forward | 7

VEDI ANCHE

Occorre separare il segnale vero dal rumore


di fondo: non n facile n immediato ma la sfida che
Big data necessario vincere per tradurre le informazioni sempre pi
e analytics numerose di cui disponiamo in benessere e salute per i cittadini.
tradizionale Il titolo della rubrica della rivista Science nella quale stata
pubblicata la nota di Muin J. Khoury e John P. A. Ioannidis
programmatico: Insights1. Poco pi di una pagina ricca di
indicazioni essenziali che giungono da due autori
Big data Analytics tradizionale
di istituzioni in certo modo complementari: da una
parte i Centers for disease control and prevention
Tipologia dei dati Non strutturati Ordinati per righe e colonne e dallaltra il Meta-Research innovation center di
Stanford. Pubblico e privato, est e ovest degli Stati
Uniti.
Volume dei dati Da cento terabyte ai petabyte Decine di terabyte (o meno)
Big error can plague big data, avvertono gli autori
citando il caso del monitoraggio dellandamento
Flusso dei dati Flusso costante di dati Pool statistico di dati Muin J. Khoury dellepidemia influenzale attraverso Google flu
trends (ne parliamo a pagina 9): paradossalmente,
la proporzione di falsi allarmi allinterno di quanto
Metodi di analisi Machine learning Per ipotesi
registrato si moltiplica quando loggetto di
misurazione diviene pi ampio. Allo stesso modo, la
Scopo principale Prodotti data based Servizi, supporto alle decisioni tentazione di correlazioni spurie e bizzarre diventa
quasi irresistibile, cos che possiamo finire col
Fonte: Davenport T. Big data @l Lavoro. Milano: Franco Angeli Edizioni, 2015.
leggere su riviste anche teoricamente rispettabili
John P.A. Ioannidis
che la produzione di miele da parte di colonie di api
si correla alla frequenza di arresti per detenzione di marijuana
Nuove linguaggi, nuove competenze mette lettura ed elaborazione di dati desunti nei giovani delle zone dove si trovano gli alveari La forza dei
Approfondito laspetto formale, avendo dal web.
natura e struttura differenti rispetto allap- I big data, in farmacologia, sono rappre- big data nel trovare associazioni e non nel mostrare che queste
proccio classico, i big data necessitano ine- sentabili mediante aggregazioni di informa- associazioni abbiano significato, ricordano gli autori.
vitabilmente di tecniche di acquisizione, zioni legate alle caratteristiche delle popola-
selezione, normalizzazione, storage, calcolo zioni che assumono i farmaci, ovvero: dati Come migliorare il potenziale insito nei big data di migliorare la
e conseguente analisi statistica del tutto para- biometrici (tra questi, ad esempio, peso, pres- salute delle popolazioni e prevenire le malattie? I big data sono
metrati alle nuove esigenze. sione, altezza e quantit di grasso corporeo), per definizione di tipo osservazionale e come tali sono esposti alle
La vastit dellargomento richiederebbe un dati correlati alle abitudini delle popolazioni,
approfondimento ma appare evidente come dati omogenei sugli obiettivi che si vogliono distorsioni pi varie, ma possono essere embedded in popolazioni
lapproccio globale del ricercatore a dati di raggiungere con la terapia, dati di riferimento epidemiologicamente ben caratterizzate e rappresentative.
questa tipologia risulti rivoluzionato, nel me- sullandamento naturale delle stesse patolo- questa la chiave per rendere utili le rilevazioni estese o
todo e negli strumenti. La nuova sda delle- gie, dati sulla durata della risposta farmaco-
spontanee di dati strutturati e non strutturati.
pidemiologo, pertanto, potrebbe consistere logica nel tempo. Secondo alcune previsioni,
nella capacit di cogliere nei big data elemen- crescer nel prossimo futuro sia lo sviluppo Un passo in questa direzione stato fatto dallInstitute for Health
ti di confronto con i risultati precedentemen- di app sanitarie che potranno essere utiliz-
te ottenuti. In che modo? Gli esempi potreb- zate come tramite tra il medico curante e il metrics and evaluation che ha deciso di affidare al Lancet la
bero essere molteplici ma rimane il dubbio paziente, sia il numero di coloro che utilizze- pubblicazione del Global burden of diseases, injuries, and
posto inizialmente. Ricavare informazioni da ranno mezzi tecnologici per memorizzare e risk factors study 2015, la rilevazione dei dati epidemiologici
enormi database, sovente destrutturati, impo- trasmettere documentazione sanitaria.
di 195 paesi e territori, per anno, et e genere2. Si tratta di un
ne una riessione sulla qualit del dato. Ov- In ambito di sanit pubblica, le decisioni
vero: gli algoritmi, utili a identicare pattern pensate per un rapido intervento possono documento molto rappresentativo della volont di sistematizzare
e a effettuare previsioni, possono produrre aver bisogno di sfruttare applicazioni sui cel- linformazione disponibile riguardante la salute, per trasformarla
risultati consistenti per la ricerca scientica? lulari, incamerando i dati in server centraliz-
in conoscenza: This is the science of making data meaningful,
Qual il punto di incontro tra le tecniche di zati (data warehouse).
data mining (lanalisi, da un punto di vista Un ulteriore sviluppo, inne, potrebbe afferma leditoriale della rivista inglese. La pubblicazione di un
matematico, eseguita su database di grandi riguardare lampliamento delle modalit riferimento di questo tipo in una rivista accademica una scelta
dimensioni, senza formulazioni di ipotesi attraverso le quali gli studi epidemiologici significativa perch rende visibile limpegno per garantire ai dati
a priori) e la statistica basata sullinferenza, possono migliorare, nel concreto, la salute
per cui partendo da un campione si tenta di della popolazione. Ad esempio, enti che si il massimo rigore, anche per aver superato il processo di peer
generalizzare le conclusioni sullintera popo- occupano di benessere e che incoraggiano review al quale ogni contributo pubblicato dal Lancet deve essere
lazione? I due approcci potranno interagire stili di vita sani, accumulando big data sulle sottoposto.
e trovare un punto di incontro nella ricerca abitudini di vita della propria popolazione di
epidemiologica? studio, potrebbero vedere negli epidemiologi
Il futuro probabilmente richieder ai ri- una valida opportunit di collaborazione, per 1. Khoury MJ, Ioannidis JPA. Big data meets public health.
cercatori di abbracciare nuove competenze benecio sia accademico sia industriale. Science 2014;346:1054-5.
tecnologiche, in particolare linguaggi di pro- 2. Editorial. GBD 2015: from big data to meaningful change.
grammazione ad hoc. Ad esempio, i dataset Lancet 2016;388:1447.
analitici possono essere accompagnati da me-
Parafrasando Alan Kay,
tadati, fruibili dal pubblico, generati tramite il miglior modo per predire
programmi di web scraping, tecnica che per- il futuro inventarlo. F

1116-FWD-04_xweb.indd 7 17/11/2016 16:32:11


8 | forward BIG DATA 4 / 2016

Le impronte digitali al servizio


dellepidemiologia
Le potenzialit della digital epidemiology per la salute sono rilevanti

l lavoro dellepidemiologo un po utilizzati dati censuali italiani che hanno per- Lepidemiologia digitale ha un record di

I come quello dellinvestigatore: si


basa sulla ricerca di tracce da analiz-
zare, e oggi gran parte di queste tracce
sono dati digitali lasciati quotidianamente da
messo di costruire una popolazione sintetica,
allinterno della quale si potuto simulare il
modello di trasmissione dellinuenza pan-
demica e le relative misure da adottare per
successi ormai decennale. Basti pensare alla
piattaforma Healthmap, fondata 10 anni fa
da John Brownstein della Harvard School.
Brownstein stato il primo a utilizzare le trac-
chi interagisce su internet attraverso i social ridurre il contagio (misure di distanziamento ce digitali che in ogni istante vengono lasciate
media e le app. Grazie alle dettagliate infor- sociale, chiusura delle scuole, uso di antivi- sui blog, sui siti istituzionali e sui social media
mazioni sulla mobilit degli esseri umani rali, uso dei vaccini, ecc.). Queste previsioni per avere informazioni sulle epidemie e sulla
su scala globale, lanalisi di questi dati rende si sono dimostrate un valido supporto per le diffusione delle malattie a livello globale. He-
possibile predire come epidemie e pandemie Daniela Paolotti autorit sanitarie indicando in anticipo con althmap adotta il classico approccio passivo
si propaghino: fotografando in modo det- Fondazione precisione il picco della pandemia in Italia alla rete che si basa, per lappunto, sullanalisi
tagliato come gli individui si muovono con Isi Istituto per al momento della dichiarazione di emergen- delle tracce digitali generate per scopi diversi
aerei o treni, nel momento in cui arriva una linterscambio za di sanit pubblica internazionale da parte da quelli epidemiologici ma che possono es-
pandemia, si possono determinare predizioni scientifico dellOrganizzazione mondiale della sanit. sere usati per studi in questo campo.
e previsioni su quando e quanti casi verranno Project manager Ma questi sono soltanto alcuni dei tan- Esiste poi un approccio attivo, che utiliz-
importati nei vari paesi. proprio ci che di Influweb ti esempi che illustrano le potenzialit della za la rete per reclutare volontari a cui chiedere
stato fatto nel 2009 durante la pandemia di digital epidemiology, la disciplina che utilizza informazioni circa la loro condizione di sa-
H1N1 da un team di ricerca della Fondazio- il web come luogo di raccolta di dati di inte- lute. Si tratta sempre di dati digitali genera-
ne Isi Istituto per linterscambio scientico, resse epidemiologico rimodellando i conni ti tramite web ma appositamente per scopi
che, grazie ai dati sulla mobilit degli esseri dellepidemiologia tradizionale, senza per epidemiologici. Lapproccio attivo quello
umani e a un sosticato framework computa- sostituirla. In pratica, essa rappresenta un si- su cui si fonda, ad esempio, InuenzaNet,
zionale in grado di modellizzare la propaga- stema di vigilanza della salute collettiva che, una piattaforma web interattiva volta a rac-
zione della pandemia, riuscito a predire con con lintervento di una modellistica computa- cogliere dati sullinuenza stagionale con
tre, quattro mesi di anticipo il picco pandemi- zionale, integra i sistemi di analisi dellepide- una risoluzione geograca e temporale mol-
co di H1N1 nellemisfero nord. miologia tradizionale con i dati digitali glo- to alta per informare modelli predittivi. La
Si pu anche predire cosa accadr in termi- bali per costruire un quadro della diffusione sorveglianza viene condotta su una coorte di
ni di diffusione e impatto sulla popolazione. Caterina Rizzo di una malattia in un determinato momento volontari che annualmente, allinizio della
Utilizzando un modello di simulazione a base e anche fare previsioni a lungo termine. stagione inuenzale, vengono invitati a ripor-
Centro nazionale
individuale lIstituto superiore di sanit (Iss), di epidemiologia,
sempre nel 2009, ha potuto simulare e preve- sorveglianza
dere landamento della pandemia inuenzale e promozione
in Italia per valutare limpatto delle possibili
Invece di concentrarci sulla rivoluzione dei big data forse
della salute
misure di contenimento adottate in Italia. Per Istituto superiore arrivato il momento di focalizzarci sulla rivoluzione di tutti i dati.
ottenere il modello di popolazione sono stati di sanit David Lazer, Ryan Kennedy, Gary King, Alessandro Vespignani

Ebola fuori dallAfrica Traffico passeggeri


(Numero di passeggeri alla settimana)
Le previsioni temporali della diffusione internazionale del
virus Ebola hanno tenuto conto del traffico aereo dallAfri- 6000+ 1500-3000
ca occidentale al resto del mondo. Secondo le stime del
gruppo di ricerca di Alessandro Vespignani della Northe-
3000-6000 300-1500
astern University di Boston, lEuropa era a rischio di con-
tagio con un ampio numero di rotte dai paesi francofoni
Guinea, Sierra Leone e Liberia da e per Parigi. Focolai originari Paesi colpiti da Ebola
Fonte: Gomes MFC, et al. Plos Curr 2014.

1116-FWD-04_xweb.indd 8 17/11/2016 16:32:14


www.forward.recentiprogressi.it forward | 9

tare la loro condizione di salute sia che stiano solito viene effettuata attraverso le segnala-
bene sia che abbiano dei sintomi respiratori. zioni dei medici o della popolazione. uno
Con questo approccio non si raggiungono le
dimensioni dei big data, poich il numero
degli individui raggiunti con questa modali-
strumento potenzialmente molto importante
perch consente di catturare tutto ci che vie-
ne avvertito dai cittadini come evento avverso
Il flop di Google flu trends
t non paragonabile ai milioni di utenti di che per la sanit pubblica molto difcile da
Facebook o Twitter, ma il numero tale per identicare. Lattivit dei motori di ricerca quali Google che conta centinaia
cui il segnale epidemiologico che si ottiene di milioni di utenti attivi potenzialmente un segnale affidabile
sufcientemente accurato. Inoltre, con la mo- Questioni aperte ma non sempre preciso. Un esempio di ci Google flu trends,
dalit della sorveglianza partecipativa si pos- Chiaramente i tipi di dati su cui si basa le- considerato un vero e proprio flop. Google flu trends si basava
sono ottenere informazioni da persone che pidemiologia digitale non sono raccolti per sullanalisi delle ricerche fatte tramite il motore di ricerca di Go-
non si recano dal medico in caso di febbre, scopi epidemiologici, e quindi non si tratta
ogle di parole collegate ai sintomi influenzali quali febbre, mal
ma che non hanno problemi a compilare un di una coorte di pazienti selezionati in modo
questionario sul web quando sono a casa da rappresentativo, ben controllata. I limiti di di gola, raffreddore. Il numero di volte che gli utenti chiedevano
malati. InuenzaNet stato sperimentato per questo approccio sono legati, in parte, al co- al motore di ricerca queste informazioni veniva utilizzato come
la prima volta in Olanda e Belgio nella stagio- siddetto selection bias, cio il problema di se- specchio del numero di casi di influenza fra la popolazione.
ne inuenzale 2003/2004. Ora viene utilizza- lezionare adeguatamente il campione da ana- Dopo diversi inverni di mappature perfette delle epidemie
to in 10 paesi europei, tra cui lItalia con la lizzare. Si pone una duplice problematica: da influenzali, nel 2013 il sistema aveva fallito clamorosamente so-
Fondazione Isi e lIss, la Francia con lInserm un lato il segnale rilevabile da questi dati non vrastimando i casi di influenza. Il problema che Google usava
e lInghilterra con la Public health England, e pulito, dallaltro nei paesi in via di sviluppo un modello statistico impiegato per produrre previsioni da una
ha inoltre ispirato delle piattaforme analoghe laccesso al web limitato. per tale ragione
settimana allaltra e che veniva allenato soltanto sui dati della
negli Stati Uniti e in Australia. Si quindi cre- che i dati di Twitter funzionano bene per la
ato un sensore digitale globale di volontari, sorveglianza dellinuenza in quei paesi in stagione corrente, quando invece la dinamica dellinfluenza
sia dellemisfero nord che di quello sud, che cui questo tipo di social network molto dif- tale per cui si osserva sempre lo stesso andamento stagionale,
ogni anno durante la stagione inuenzale ri- fuso, ma non altrettanto bene in paesi come ma se si analizza nel dettaglio si osserva che ogni stagione di-
portano il proprio stato di salute. Questo un lItalia dove ancora sottoutilizzato. versa. Inoltre, il fatto che una persona cerchi la parola influenza
enorme passo avanti nella sorveglianza glo- Tuttavia i vantaggi della digital epidemiology con Google non indicativo del motivo per cui lo fa: potrebbe
bale dellinuenza. sono tali che questo tipo di limite superabi- eseguire la ricerca perch ha linfluenza o perch ne ha sentito
le. Diversi articoli scientici hanno vericato parlare molto dai media.
Le applicazioni dei big e small data per esempio che il dato sullincidenza dellin-
Il flop di Google flu trends potrebbe per essere imputabile
Lepidemiologia digitale viene spesso asso- uenza misurato contando il numero di volte
ciata ai big data che, secondo la denizione che gli utenti menzionano su Twitter parole non tanto alla qualit dei dati digitali quanto piuttosto al modello
contenuta in un rapporto del Congresso Usa legate alle sindromi inuenzali strettamen- di calcolo impiegato che non mai stato reso noto alla comunit
del 2012, rappresentano grandi volumi di te correlato al tipo di segnale rilevato con la scientifica. Prima del 2013 e quindi della sua chiusura, Google flu
dati ad alta velocit, complessit e variabilit sorveglianza nazionale, ovvero dai medici trends veniva usato estensivamente in tanti paesi dove era assen-
che richiedono tecniche e tecnologie avan- sentinella che riportano settimanalmente il te un sistema esteso di medici sentinella e, al di l dei suoi limiti,
zate per la raccolta, limmagazzinamento, la numero di casi di inuenza diagnosticati tra rappresentava comunque uno strumento importante di sorve-
distribuzione, la gestione e lanalisi dellin- i loro pazienti. Quindi vero che il segnale di
glianza per sanit pubblica. Migliorandolo nella modellistica per
formazione. Ma in realt si pu parlare di Twitter rumoroso e non rappresentativo, ma
questi paesi potrebbe rappresentare comunque uno strumento
epidemiologia anche per gli small data. Non labbondanza dei dati tale per cui aggregan-
necessariamente tutti i dati che si raccolgono dolo a livello di paese la curva che si ottiene valido per lepidemiologia e integrare i dati ottenuti attraverso i
dal web, dai social media o dai cellulari devo- strettamente simile a quella ottenuta attraver- sistemi di sorveglianza.
no essere big. Possono essere small nel senso so la sorveglianza basata sui medici sentinella.
che sono sempre digitali ma le dimensioni E questo ci conforta perch nonostante tutti
del dataset non sono talmente grandi da ri- i problemi legati al tipo di dati il segnale che I picchi di influenza
chiedere software e tecnologie particolari per si ottiene comunque robusto e afdabile. La Previsioni della percentuale della popolazione statunitense
poter processare in modo efciente lenorme stessa cosa stata fatta anche per altri sistemi. con sindrome simil influenzale fatte utilizzando lalgoritmo
di Google flu trends, i dati dei Centers of disease control
ammontare di dati in tempi ragionevoli. E Ad esempio, lo stesso Brownstein aveva pub- della rete sentinella di medici e Flu Near You, la piattaforma
viceversa dati della genomica raccolti per vie blicato un articolo dove dimostrava che negli sviluppata da HealthMap insieme all'American Public Health
tradizionali possono rientrare nella categoria Usa il numero di click degli utenti di Wiki- Association in cui gli utenti inseriscono settimanalmente
i propri sintomi. Nel 2013 Google flu trends aveva
dei big data. Sarebbe quindi pi corretto rife- pedia su articoli il cui titolo conteneva parole sovrastimato il picco influenzale.
rirsi non alla dimensione del volume dei dati collegate ai sintomi inuenzali generava una
bens alla sorgente parlando quindi di dati incidenza fortemente correlata a quella rile- 12
digitali. vata con i dataset tradizionali dai Centers for
Questi dati vengono usati non solo per disease control.
contare quanti casi di una certa malattia ven- Google flu trends
% stimata della popolazione con sindrome simil influenzale

gono osservati in una certa popolazione o Conclusioni 10


per capire se la diffusione di un certo com- Nonostante le criticit, le potenzialit che
portamento, come smettere di fumare, pu la digital epidemiology porta allepidemiologia
avere un impatto positivo sulla salute della tradizionale e alla salute pubblica sono nu-
persona. Si impiegano anche per sondare se merose e rilevanti. Anzitutto la disponibilit 8
la popolazione favorevole o meno alle vac- di dati in tempo reale consente di monitora-
cinazioni (il cosiddetto sentiment) oppure per re costantemente levolvere per esempio di
monitorare i fattori di rischio comportamen- unepidemia, o, nellambito della farmacovi- CDC data
tali per patologie legate allobesit, al fumo, gilanza, di identicare segnali relativamente 6
allabuso di sostanze alcoliche, alla non attivi- a eventi avversi a farmaci che possono com-
t sica. Infatti, sono state messe a punto del- pletare la sorveglianza routinaria e la farma-
Flu Near You
le tecniche per estrapolare i comportamenti a covigilanza, solitamente effettuate attraverso
4
rischio degli utenti iscritti ai social media ed le segnalazioni da parte degli operatori sa-
eventualmente inviare a questi soggetti mes- nitari. Questo paradigma della sorveglian-
saggi specici che possano inuire e determi- za partecipativa stato esteso anche a paesi
nare un cambiamento o un miglioramento meno sviluppati in cui il sistema sanitario 2
del loro stile di vita. non perfettamente funzionante ma in cui
Unaltra applicazione di notevole impatto la gran parte della popolazione dispone di
la sorveglianza sugli eventi avversi ai farma- un telefono cellulare attraverso il quale pu
ci. LAgenzia europea dei medicinali ha iden- accedere al web e compilare un questionario 0
ticato le esigenze dellutilizzo di questi dati sui propri sintomi. Lidea, oltre che sda, per Gennaio Gennaio Gennaio
provenienti dai social media, e in generale dai lepidemiologia di integrare la sorveglianza 2011 2012 2013
media, per identicare segnali che possano routinaria con il digitale e con un approc-
aiutare la farmacovigilanza routinaria che di cio partecipativo per avere infor- a p.10
ap

1116-FWD-04_xweb.indd 9 da p.9 17/11/2016 16:32:14


10 | forward BIG DATA 4 / 2016

da p.9 mazioni epidemiologiche mol- Brownstein JS, Freifeld CC, Reis BY, Mandl KD. based participatory surveillance of infectious
to accurate. Con la disponibilit di dataset Surveillance sans frontieres: internet-based diseases: the Influenzanet participatory
amministrativi e di dati provenienti dal web emerging infectious disease intelligence and surveillance experience. Clinical Microbiology
e con lo sviluppo di sistemi innovati per il the HealthMap project. PLoS Med 2008;5:e151. and Infection 2014;20:17-21.
caricamento, lo storage e lanalisi di grandi Ginsberg J, Mohebbi MH, Patel RS, et al. Zhang Q, Gioannini C, Paolotti D, et al. Social
quantit di dati, buona parte dei quali Detecting influenza epidemics using search Data Mining and Seasonal Influenza Forecasts:
non strutturati, lepidemiologia si trova ad engine query data. Nature 2009;457:1012-4. The FluOutlook Platform. Computer Science
affrontare un cambiamento critico: riuscire Hay SI, George DB, Moyes CL, Brownstein 2015; 9286:237-40.
a integrare dati da sorgenti tradizionali JS. Big Data Opportunities for Global Cantarelli P, Debin M, Turbelin C, et al., The
e nuove, e garantire una comprensione Infectious Disease Surveillance. PLoS Med representativeness of a European multicenter
pi chiara e accurata del mondo. Come 2013;10:e1001413. network for influenza-like-illness participatory
hanno sottolineato Alessandro Vespignani Salath M, Bengtsson L, Bodnar TJ, et al. surveillance. BMC Public Health 2014;14:984.
e colleghi non dovremmo tanto parlare di Digital epidemiology. PLoS Comput Biol Lazer D, Kennedy R, King G, Vespignani A. Big
rivoluzione dei big data ma di rivoluzione 2012;8:e1002616. data. The parable of Google Flu: traps in big
di tutti i dati. F Paolotti D, Carnahan A, Colizza V, et al. Web- data analysis. Science 2014;343:1203-5.

Incidenza

7,0

Google flu trends Il peso della parole di Twitter


6,0 nei sistemi di sorveglianza
Twitter Flu
Nel grafico viene confrontata la proiezione
5,0 Cdc statunitense della sindrome simil influenzale del
sistema di sorveglianza dei Centers for disease control
Twitter Ecdc di Atlanta (celeste), con la curva elaborata da Google
4,0 flu trends (verde), la curva generata dai tweet degli
statunitensi che contengono la parola flu o similari
(blu), e la curva generata dallestrazione dei tweet
3,0 in Usa contenenti sintomi e segni che rispondono
alla definizione di caso di sindrome simil influenzale
dellEuropean centre for disease prevention and
2,0 control (in rosso). La correlazione fra i dati dei Ccd
e quelli di Twitter Ecdc dello 0,97.
Fonte: Gesualdo F, et al. Plos One 2013;8:e82489.
1,0

0,0

-1,0

-2,0
47 48 49 50 51 52 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Settimana dellanno
dalla 47esima (novembre 2012) alla 17esima (maggio 2013)

Cercare i piccoli numeri nei grandi numeri


I database amministrativi al servizio dellepidemiologia

I
n ambito epidemiologico generalmen- Disporre di una grande quantit di dati rent beneciary survey di 34.427 iscritti a
te per big data si intendono i dati sulla in poco tempo, anche se non accurati, un Medicare con 5355 diversi codici postale e li
salute della popolazione estrapolati dai valore aggiunto in diversi ambiti epidemio- abbiamo incrociati con i livelli medi annui
cosiddetti dati amministrativi, come ad logici, ad esempio per gli studi sugli effetti di pm 2,5 rilevati in ogni codice postale. Alla
esempio le ricevute rilasciate al paziente al negativi dellinquinamento atmosferico sulla Johns Hopkins Bloomberg school of public
momento di una visita medica, di un esame salute umana che, essendo effetti di piccole health, della University di Baltimora, stato
clinico o di un ricovero. Diversamente dalle dimensioni, richiedono ampi campioni per condotto uno studio sullassociazione cau-
informazioni registrate nella cartella clinica essere rilevati attraverso metodi statistici che sale tra malattie cardiache e respiratorie ed
del paziente, i dati amministrativi peccano tengano conto delle interazione dei vari fat- esposizione alle polveri sottili estrapolando
di scarsa accuratezza perch non danno delle tori. Sia negli Usa sia in Europa, si sta quindi dalla banca dati National claims history di
Francesca indicazioni diagnostiche precise, ragione per sperimentando la strada di incrociare i data- Medicare i dati di 11,5 milioni di iscritti a
Dominici cui spesso vengono criticati. Di contro per base amministrativi dellintera popolazione Medicare, con pi di 65 anni, che vivevano
PhD, Harvard hanno il vantaggio di coprire popolazioni di con le rilevazioni dei principali inquinanti in 204 contee urbane statunitensi.
T.H. Chan School grandi dimensioni difcilmente raggiungibi- presenti nellaria ottenute dalle stazioni di importante precisare che questi studi
of public health li con uno studio epidemiologico tradiziona- monitoraggio e dai satelliti. vengono effettuati sempre combinando i
le, disegnato in modo mirato per misurare Ad esempio alla Harvard T.H. Chan Scho- dati amministrativi con i dati epidemiologi-
una serie di fattori di rischio e di malattie su ol of public health abbiamo potuto vericare ci. Lanalisi dei dati non pu, infatti, ignora-
campioni di popolazione numericamente sui grandi numeri che la riduzione del par- re quanto gi conosciamo delle relazioni tra
molto inferiori. ticolato sottile al di sotto degli standard an- inquinanti e condizioni di salute e sui fattori
nuali per la qualit dellaria riduce i decessi di rischio. Essenzialmente il valore aggiunto
Il valore aggiunto dei big data di aumentare e le ospedalizzazioni per tutte le cause e per dei big data di aumentare linformazione
linformazione gi presente negli studi malattie respiratorie o circolatorie. Abbiamo gi presente negli studi epidemiologici tradi-
epidemiologici tradizionali. raccolto i dati registrati dalla Medicare cur- zionali. F

1116-FWD-04_xweb.indd 10 17/11/2016 16:32:15


www.forward.recentiprogressi.it forward | 11

Collegare i big data biomedici


alla persona malata
Ragionare sulle potenzialit dei dati significa guardare
oltre il sistema sanitario e definire policy condivise

N
ellarticolo Finding the missing S, e la prima sda che ci si trova ad af- responsabilit sul paziente, dandogli il con-
link for biomedical data,1 da lei frontare usando bene i big data biomedici trollo sui propri dati. Ad ogni modo, come
preparato insieme a Kenneth D. quella di identicare le potenziali fonti di abbiamo osservato in passato a proposito di
Mandl e Isaac S. Kohane, scriveva informazioni riguardanti la salute e come dati molto meno privati, le persone sono por-
che i big data diventano un elemento determinare il valore che pu essere ottenu- tate a condividere in pubblico i propri dati
di cambiamento quando diversi dataset to collegando le une con le altre. Per esem- salvo lamentarsi successivamente quando
possono essere collegati a livello della pio, le cartelle cliniche elettroniche possono questi stessi dati sono utilizzati in un modo
singola persona. Qual la situazione scendere pi in profondit comprendendo inizialmente non previsto. Perci potrebbe
negli Stati Uniti, a questo riguardo? appunti, note cliniche e immagini diagnosti- essere lora di convocare un forum pubblico
Negli Stati Uniti la sanit molto fram- che raccolte nel corso del percorso di cura del Intervista a nel quale tutti i portatori dinteresse, compre-
mentata e vede i pazienti trattati in molti singolo paziente, mentre i dati amministra- Griffin M. Weber si i cittadini, la comunit che governa lassi-
ospedali e ambulatori diversi, con un passag- tivi possono svilupparsi longitudinalmente Department stenza sanitaria e chi commercializza il dato
gio frequente da unassicurazione a unaltra. con la sintesi delle codiche di fatturazione of Biomedical possano incontrarsi e denire le policy da cui
A causa delle preoccupazioni per la riserva- lungo un ampio periodo della storia sanitaria informatics la legislazione e le procedure tecniche per la
tezza, i dati sono deliberatamente mantenuti di un malato. Social media, documentazio- Harvard Medical protezione dei dati sanitari individuali possa-
isolati in ciascuno di questi grandi contenito- ne di acquisto con le carte di credito, record School, Boston, MA no svilupparsi.
ri e c una forte resistenza a creare un codice anagraci e molti altri tipi di dati, nonostante Department
di identicazione personale che possa avere siano caratterizzati da una qualit variabile, of Medicine, Quali sono i suoi principali progetti
valore nazionale. Tutto ci rende molto dif- possono contribuire a determinare una vi- Beth Israel Deaconess nellambito della social network
cile integrare tutte le informazioni che riguar- sione olistica del paziente e, in particolare, Medical Center, analysis?
dano una singola persona. a chiarire i fattori sociali e ambientali in gra- Boston, MA Uno degli altri ambiti di ricerca di mio in-
do di inuenzare la salute. Comunque, non teresse riguarda la modalit con cui gli scien-
Quali opportunit offrono i big data alla necessario collegare tutti questi tipi diversi ziati trovano collaboratori e formano gruppi
ricerca sanitaria? di dati. La chiave nel selezionare quelli che collaborativi. un problema importante per-
Lespressione big data pu avere diversi possono rivelarsi pi utili per rispondere al ch sappiamo che le grandi sde del XXI se-
signicati nellambito della ricerca sanitaria. quesito di ricerca. colo potranno essere vinte soltanto se esperti
Nuove tecnologie informatiche, come gli con diversi background uniranno le forze per
strumenti di interrogazione e ricerca allin- lavorare come gruppo. Uno dei prodotti della
terno di diversi centri ospedalieri, stanno La prima sda che ci si trova ad affrontare mia ricerca un sito di social networking per
garantendo ai ricercatori laccesso alle tradi- ricercatori chiamato Proles Research Net-
zionali informazioni sanitarie come quelle
usando bene i big data biomedici identicare working Software che utilizzato da dozzine
contenute nelle cartelle cliniche elettroniche le potenziali fonti di informazioni riguardanti di universit in tutto il mondo per aiutare a
o nelle richieste amministrative di risarci- la salute e come determinare il valore che pu trovare esperti in aree differenti. Questo sof-
mento di decine di milioni di pazienti. In essere ottenuto collegando le une con le altre. tware crea automaticamente dei proli di ri-
questo caso, laddove i big data si riferiscono cercatori collegando diverse fonti di dati, tipo
alla numerosit dei malati, i ricercatori pos- quelli che provengono dai sistemi di gestione
sono disporre di campioni sufcientemen- Come affrontare i problemi legati alla delle risorse umane interne alle universit,
te vasti per notare piccole variazioni nella riservatezza? letteratura tratta da PubMed e dati che deriva-
morbilit tra sottopopolazioni diverse per La preoccupazione per la privacy e la sicu- no da database di grant pubblici e di brevetti.
caratteristiche demograche o geograche, rezza una sda che si pone a livello sociale I ricercatori possono loggarsi per inserire con-
identicando effetti di geni o monitorando nel perseguire lobiettivo di collegare i diversi tenuti aggiuntivi o per controllare le imposta-
gli effetti indesiderati anche rari di alcuni dati biomedici: tanto pi si procede col col- zioni della privacy. F
medicinali. legare dati, tanto maggiori diventano le dif-
Ragionare sui big data biomedici pu an- colt di rendere anonimi i dati su cui si la-
che signicare guardare oltre il sistema sa- vora. Una risposta costruttiva potrebbe essere
nitario, individuando altre fonti di dati che nello stabilire delle norme che regolino ci Potrebbe essere lora di convocare un forum
possano essere collegate alla salute dei citta- che eticamente accettabile e ci che non lo pubblico nel quale tutti i portatori dinteresse
dini. Per esempio, i modelli di acquisto nei , per garantire che i beneci prevalgano sui
negozi di alimentari possono implementare rischi e coinvolgere il paziente nel processo
possano incontrarsi e denire le policy da cui
e migliorare dei pattern predittivi sulla preva- di decision making. In alternativa, lapproc- legislazione e procedure tecniche per la protezione
lenza di obesit e diabete di tipo 2; i dispo- cio potrebbe essere quello di spostare tutta la dei dati sanitari individuali possano svilupparsi.
sitivi wearable che tracciano lesercizio sico
possono fornire indicazioni sullazione dei
farmaci per la riduzione dei livelli di coleste-
rolo; la distanza tra labitazione del paziente
dallospedale o dalla farmacia pu inuenza-
re lutilizzo dei presidi di assistenza sanitaria
e anche il costo; e gli amici su Facebook dei
pazienti possono inuenzare le scelte sugli
stili di vita e laderenza alle terapie.

Nellarticolo pubblicato sul Jama,


avete presentato un framework in cui
convergono molte forme diverse di
informazione sanitaria, comprese quelle
che possono fornire dati provenienti da
flussi esterni al sistema sanitario stesso, 1. Weber GM, Mandl KD, Kohane IS. Finding the missing link for big
quali per esempio i social media biomedical data. Jama 2014;311:2479-80.

1116-FWD-04_xweb.indd 11 17/11/2016 16:32:15


12 | forward BIG DATA 4 / 2016

Predire il futuro
Gli algoritmi aiuteranno il medico. Cambieranno il suo modo
di lavorare. Soprattutto, i big data potranno rivelarsi
una buona notizia per i malati

Sono gli algoritmi e non i dataset che dimostreranno di essere un agente


di cambiamento. Questa la frase a effetto che apre larticolo Predicting the future:
big data, machine learning, and clinical medicine, di Ziad Obermeyer
e Ezekiel J. Emanuel, uscito sul New England of Medicine a fine settembre 2016.
La ragione della convinzione dei due autori collegata allimportanza che avr in futuro lintelligenza
computazionale (machine learning). Ne abbiamo parlato con uno dei due autori, Ziad Obermeyer, che studia
da tempo gli algoritmi a supporto delle decisioni cliniche.

Stiamo iniziando a intravedere questo problema viene gestito rilasciando qualcosa per cui questi algoritmi sono estre-

[...] un uso nuovo dei computer in


medicina. Oggi, usiamo i com-
puter per applicare delle regole:
un set di dati a chi in gara per lo sviluppo
degli algoritmi, e una volta che gli algoritmi
nali sono uploadati vengono testati per la
mamente adatti.
Migliorer anche laccuratezza diagnostica:
saranno suggeriti esami ad alto valore aggiun-
ci avvertono se proviamo a prescrivere la ci- valutazione su un dataset completamente se- to e potr ridursi la richiesta di test inutili.
prooxacina insieme al coumadin. Sono re- parato. Questo principio di separare i dati uti- Questo per pi complicato, e dovremmo
gole che gi conosciamo e che talvolta sem- li allo sviluppo del modello da quelli per la attendercelo in un futuro meno prossimo,
plicemente dimentichiamo, perch notte valutazione di questultimo estremamente perch persino il medico spesso non ha chia-
fonda o perch troppo presto al mattino importante, come sa gi chi lavora alla pro- ro quale sia il gold standard da indicare alla
oppure perch non sappiamo che quel pa- Intervista a duzione di algoritmi non basati sullanalisi macchina per farle apprendere come formula-
ziente assume il coumadin. Ziad Obermeyer computazionale. re la diagnosi corretta! un aspetto che rende
In un futuro neanche troppo distante, de- Assistant Professor pi difcile laddestramento degli algoritmi.
gli algoritmi ci diranno del nostro paziente of Emergency La qualit dei dati collegata alla loro Un punto collegato che gli algoritmi
cose che non sappiamo: ci comunicheranno medicine e quantit? sottrarranno molto lavoro ai radiologi e agli
la probabilit che il malato possa morire av- Assistant Professor Ehm, probabilmente inversamente pro- anatomopatologi, che lavorano su dati digita-
viando un determinato regime chemiotera- of Health care policy porzionale... li che potrebbero essere invece inviati a una
pico o ci avvertiranno del rischio di infarto Harvard Medical macchina. E inne interpreteranno un usso
School
miocardico di un altro paziente nei sette La correlazione non implica la causalit: di dati dalla anestesiologia e dalla terapia in-
giorni successivi al momento della nostra in- un bel problema in epidemiologia tensiva.
terrogazione, sulla base della sua storia clini- clinica. Dovremmo aspettarci una Cos, in 20 anni, i radiologi non esisteran-
ca. Sar entusiasmante, non solo per la pra- soluzione dal machine learning? no da nessuna parte del mondo nella forma
tica clinica, ma anche come guida per nuovi Ne dubito. Ci sono alcuni ricercatori che attuale: dovranno adattarsi al cambiamento,
modi di comprendere la salute e la malattia stanno svolgendo un lavoro molto interes- un po come i lavoratori delle costruzioni che
utilizzando dati molto complessi. sante in questo ambito, utilizzando lanalisi fanno oggi un lavoro del tutto differente da
computazionale per costruire dei metodi mi- quello che compivano prima della mecca-
Perch ritenete che lasciar parlare i gliori di aggiustamento del rischio, propen- nizzazione avvenuta cento anni fa. I cassieri
dati da soli possa essere problematico? sity score e variabili strumentali, ma alla ne in banca non maneggiano pi contante ma
Come possiamo affrontare un problema questi algoritmi trovano delle correlazioni, e devono essere capaci di eseguire transazioni
del genere? questa la loro forza. improbabile che pos- molto pi complesse di una volta. La tecno-
Quando sviluppiamo un algoritmo, te- sano risolvere anche qualcuno dei problemi logia non sempre elimina il lavoro; talvolta lo
miamo molto il fenomeno del cosiddetto fondamentali della inferenza causale nei da- cambia e coloro che devono adattarsi posso-
overtting (che si verica quando il modello taset sperimentali. no nire col diventare i veri vincitori. F
stesso ha troppi parametri relativi al numero
di osservazioni, condizione che porta a so- Quali sono le aree della medicina che lei
1. Obermeyer Z, Emanuel EJ. Predicting the
vrastimarne lutilit, ndr). Possiamo predire e Ezekiel J. Emanuel ritenete possano Future: Big Data, Machine Learning, and Clinical
molto bene un determinato esito sulla base Gli algoritmi essere davvero radicalmente cambiate Medicine. N Engl J Med 2016;375:1216-9.
di un dataset ma a causa di alcune bizzarrie sono tanto dalla trasformazione del dato in
2. Parikh RB, Obermeyer Z, Bates DW. Making
nei dati possiamo scoprire che le conclusioni afdabili conoscenza? Predictive Analytics a Routine Part of Patient
alle quali siamo arrivati non funzionano una Certamente, questa trasformazione aiuter
volta che sono applicate al mondo reale. In
quanto lo sono il medico nella formulazione della prognosi:
Care. Harvard Business Review 2016; 21 aprile.
hbr.org/2016/04/making-predictive-analytics-a-
molte delle gare per scienziati che vengono i dati su cui comprendere quando un paziente morir o routine-part-of-patient-care - Ultimo accesso 14
organizzate ma non relative alla medicina sono basati. se un cancro metastatizzer. Predire il futuro ottobre 2016.

1116-FWD-04_xweb.indd 12 17/11/2016 16:32:15


www.forward.recentiprogressi.it forward | 13

La grandezza risiede
nella partecipazione
La condivisione dei dati individuali sanitari pu
migliorare la salute della societ e anche della ricerca

N
avigando sul web assistiamo sempre usso. Luso e lelaborazione dei dati raccolti nit di una sanit guidata da nuove evidenze
pi spesso alla generazione di con- dal web spesso non avvengono alla luce del scientiche che possono scaturire dallanalisi
tenuti che sono perfettamente cuciti sole e linformazione generata non fruibile di una grande quantit di dati. Se da un lato
sulle nostre preferenze. La ricerca di dallutente iniziale, colui che di fatto ha gene- nessuno sembra porsi il problema di cedere
Google traccia i nostri percorsi per compren- rato questa immensa ricchezza. informazioni personali a piattaforme o di-
dere quali tipologie di pagine e documenti Ecco perch cos urgente una riessione spositivi elettronici, la scarsa comunicazione
apriamo pi di frequente. Ogni sito o piatta- sui big data in ambito sanitario. Se rispetto da parte delle istituzioni, le agende poco chia-
forma ci propone la pubblicit degli oggetti ad altri ambiti della scienza la medicina re e linsufciente trasparenza sul controllo e
che preferiamo. I social network che frequen- ancora un passo indietro nella condivisio- la propriet dei dati relativi alla salute, creano
tiamo tracciano intorno a noi una rete tridi- ne dei dati (si pensi ad esempio al progetto imbarazzo nel momento in cui viene richie-
mensionale, che evidenzia le nostre relazioni genoma o ai dati ottenuti dal telescopio spa- sta la loro condivisione a soggetti terzi.
e ci inserisce allinterno di categorie rilevabili ziale Hubble), occorre cogliere questo ritardo La discrepanza cui assistiamo non que-
allinterno di una popolazione1. La capacit come loccasione per superare le barriere che stione di ingenuit dei cittadini ma di impo-
predittiva o analitica di internet scaturisce uninformazione cos personale, come quella stazione della richiesta. Occorre pensare at-
dallenorme ammontare di dati che seminia- sulla salute, introduce e come lopportunit tentamente alla formulazione del consenso,
mo nel web, quando visitiamo i siti o espri- per costruire strutture e infrastrutture capaci perch il cittadino non abbia limpressione
miamo le nostre preferenze con un click del di garantire accesso e coinvolgimento tanto ai di perdere il controllo dei dati personali, una
mouse o lasciamo volontariamente i nostri pazienti quanto al personale sanitario. volta che si rivolto a un ente per un proble-
dati ai gestori di piattaforme. Ormai il web
permea ogni ambito della nostra esistenza e
quindi sono molteplici le occasioni di produ- Occorre sviluppare una cultura per cui la condivisione
zione ma soprattutto di raccolta di dati.
Anche la medicina non immune alla rac-
di un dato personale rappresenti un benecio per lintera comunit.
colta di informazioni sui pazienti. Anzi la cli- Harlan Krumholz
nica sembra avere gi a disposizione possibili
sistemi per la collezione di dati provenienti Laccesso ai dati implica partecipazione ma di salute. La mancanza di trasparenza in
dai pazienti, tra laltro senza dover spendere Viviamo in unepoca in cui sono attivi fase di condivisione o elaborazione del dato
cifre esose per ottenerli. Infatti sono i pazien- movimenti quali il crowdsourcing o la sorve- potrebbe destare sducia e sospetti nei con-
ti stessi a generare dati nella loro quotidia- glianza partecipativa, e dove il fatto di donare fronti delle istituzioni. Diverso il discorso
nit, ad esempio nel momento in cui usu- dati viene percepito come un impegno indi- per le piattaforme e i dispositivi elettronici,
fruiscono delle strutture sanitarie o quando viduale, addirittura attraverso la quantica- dove il cittadino acconsente a donare i pro-
sfruttano strumenti elettronici per monito- zione di parametri siologici tramite dispo- pri dati, nel momento in cui crea un proprio
rare i propri parametri o comportamenti, al sitivi elettronici. Questo fermento andrebbe account e sottoscrive termini e condizioni di
ne di migliorare la propria condizione di sfruttato per contribuire a una maggiore utilizzo4.
salute. Lintroduzione della cultura del dato conoscenza delle malattie, a una diagnosi Per superare la difdenza, occorre inco-
nella ricerca biomedica o nella pratica clini- sempre pi puntuale e a cure e trattamenti raggiare il coinvolgimento dei cittadini nel
ca produrr conoscenza sia per i medici sia pi personalizzati. La ricerca, lanalisi e la si- processo di produzione, di gestione e di frui-
per i pazienti, mentre a livello della ricerca stematizzazione delle informazioni generate zione dei dati. Dialogo e trasparenza sono gli
potrebbe dare impulso a commistioni di idee dalla popolazione sono una ricchezza per la elementi fondanti per recuperare la ducia,
e tecniche. societ tutta, ma sono anche facile preda di perch lassenza di dibattito elimina la possi-
Tuttavia lutilizzo di questi dati, nora mire commerciali. E le persone se ne stanno bilit di costruire una consapevolezza. Occor-
La ricerca dei trends
ancora poco sfruttati, non deve sfuggire a accorgendo. Lo dimostra liniziativa Care. re chiarire e rafforzare il concetto dei diritti
di Google, focalizzata
unattenta riessione. Secondo la Shared na- data3 condotta nel Regno Unito, che ha ri- legati alle proprie informazioni personali,
sugli ultimi cinque
tionwide interoperability roadmap, la condi- scosso scarso successo a causa del fatto che perch sia piena la comprensione dei rischi e anni, evidenzia che
visione dei dati dovrebbe aiutare a mettere il le persone non hanno condiviso lidea che dei beneci legati alla condivisione dei dati. cresce linteresse nei
paziente al centro di tutto il processo di cura2. le proprie informazioni sanitarie venissero Sono inoltre incoraggianti le storie di succes- confronti dei big data
Il confronto con levoluzione che il fenome- cedute alla ricerca e, soprattutto, ad aziende so, che aiutano a mettere in evidenza lutilit relativi alla salute,
no sta avendo sul web ci mette in guardia: il concentrate sul protto. della condivisione dei dati. Oltre al coinvol- mentre quello per gli
rischio di creare una grande mole di infor- Per non perdere laccesso ai dati relativi gimento, occorre assicurare sistemi capaci di open data mantiene
mazioni in continuo movimento, senza che alla salute, c un conitto che va risolto tra rafforzare la trasparenza nel processo di am- un andamento
le persone siano poste al centro di questo il diritto di preservare la privacy e lopportu- ministrazione del dato e di garan- a p.14 costante. Il tema
dellaccessibilit ai
dati dovrebbe essere
maggiormente
La passione per i big data dibattuto.

100

75 Health Open Data Health Bigdata

50

25

0
16 ott 2011 30 giu 2013 15 mar 2015 Media

1116-FWD-04_xweb.indd 13 17/11/2016 16:32:16


a p.14

14 | forward BIG DATA 4 / 2016

da p.13 tire la gestione dei dati in modo di diffondere una cultura basata sul concetto dati provenienti da diverse fonti consente di
anonimo. Lintroduzione di consensi infor- di open science, chiedendo ai suoi autori di creare corrispondenze tra sintomi, malattie,
mati che mettano lutente nelle condizioni di condividere i dati generati dai trial clinici e diagnosi, trattamenti e prescrizioni, amplian-
scegliere i destinatari dei propri dati sarebbe di considerarlo come un dovere morale7. do la conoscenza e permettendo di produrre
di grande vantaggio. Cos come lintroduzio- Secondo Krumholz, tale richiesta potrebbe nuove evidenze10.
ne di meccanismi di notica in grado di in- inaugurare una tendenza culturale, capace Il fatto di rendere disponibili i dati la
formare lutente di possibili violazioni. perno di spingere i pazienti a una maggiore chiave per trovare relazioni tra fenomeni che
Altro elemento rassicurante potrebbe esse- partecipazione agli studi clinici. altrimenti difcilmente sarebbero identica-
re un sistema legislativo5 pi omogeneo, dato Tuttavia, afnch i big data possano ap- bili. Occorre dunque permettere lo scambio e
che le diverse scelte adottate da Stati Uniti e portare beneci reali alla clinica e alla so- in seguito larmonizzazione di tutti i dati le-
Europa sono disorientanti. ciet intera indispensabile modicare le gati alla salute, che risiedono in luoghi diversi
Occorre sviluppare una cultura per cui la impostazioni di ricerca. Il metodo scientico e che sono archiviati in differenti formati11.
condivisione di un dato personale rappresen- nora applicato in medicina prevede il pi Combinare set di dati che non sono basati su
ti un benecio per lintera comunit, ha af- delle volte di formulare unipotesi che deve modelli comuni, a volte generano duplicati o
fermato Harlan Krumholz in unintervista al essere in seguito vericata. Qui invece si trat- informazioni conittuali e in generale posso-
New England Journal of Medicine6. Nel proces- terebbe di partire dai dati raccolti dallosser- no introdurre problemi nella pratica.
so di condivisione ogni persona deve essere vazione dei pazienti, per poi formulare una La possibilit di accedere ai dati non
messa in grado di vedere il dato, comprender- spiegazione del fenomeno. Il ragionamento dunque sufciente per creare beneci. Biso-
lo ed eventualmente usarlo. deduttivo verrebbe quindi sostituito da quel- gna avanzare nella tecnica e nelle capacit
lo induttivo, unimpostazione che spaventa, analitiche e sviluppare nuove applicazioni.
La partecipazione declinata perch potrebbe introdurre risultati falsi po- Per maneggiare la variet e il volume di infor-
nel contesto della ricerca clinica sitivi. Per scongiurare tale possibilit occorre mazioni che caratterizzano i big data non si
sulla base di tale prospettiva che nel 2011 un robusto sistema di validazione dei dati, pu prescindere dalla collaborazione tra di-
Krumholz ha avviato il progetto Yale open soprattutto quando si vogliono ricreare delle verse gure professionali, provenienti sia dal
data access (Yoda) perch nel caso della ri- relazioni causali. Appellarsi ai principi della mondo del machine learning e del data mi-
cerca biomedica non mancano solo gli stan- open science e alla condivisione dei risultati ning sia dallambito tipicamente biomedico,
dard ma spesso anche le piattaforme capaci diventa quindi cruciale per validare i risultati che ha gli strumenti per interpretare e valutare
di garantire al contempo privacy, accessibili- tramite la replicazione, che non pu avvenire i risultati.
t, condivisione e riconoscimento degli au- Accanto alle competenze servono piatta-
tori della ricerca. Lo Yoda nasce proprio per forme che rendano questi dati facilmente
rispondere a questi bisogni, presentandosi condivisibili e maneggiabili. Le applicazioni
come un partner indipendente che fornisce per gestire i dati devono essere semplicate
supporto e assicura imparzialit e trasparen- afnch diventino accessibili a tutti8. LHit
za a chiunque voglia condividere i dati di strategic plan per il 20152020 rafforza il
trial clinici. I principi guida della piattaforma concetto dellaccessibilit ponendo lobietti-
sono il rispetto della privacy dei partecipan- vo di migliorare la salute del singolo indi-
ti coinvolti, mediante la sottoscrizione di un viduo e delle comunit attraverso luso delle
consenso informato. Chiara la dichiarazio- informazioni derivate dalla tecnologia, che
ne dei ni per cui i dati vengono raccolti: i devono essere accessibili se rilevanti per pi
progetti ammessi alla piattaforma Yoda per la persone12.
condivisione dei dati hanno solo ni scien- Qual dunque la possibilit del singolo
tici, volti a migliorare la salute pubblica e o delle comunit, anche non scientica, di
rifuggono qualsiasi utilizzo commerciale. Il interfacciarsi con i big data? In denitiva, os-
principio cardine la trasparenza che impone servati dalla prospettiva dei cittadini, essi po-
la tracciabilit delle decisioni e la condivisio- trebbero migliorare la comprensione di una
ne dei risultati. La trasparenza, infatti, ga- Bisogna superare la cultura per cui malattia, perfezionare le terapie per le patolo-
rantita proprio dallaccesso allelaborazione gie croniche oppure offrire tutti gli elementi
delle informazioni e dalla possibilit di con-
solo il produttore del dato in grado di capire per curarsi da casa. Allargando lo sguardo al
divisione. Bisogna superare la cultura per come usarlo e interpretarlo. sociale, sarebbero loccasione per sottolineare
cui solo il produttore del dato in grado di Harlan Krumholz le disuguaglianze o le necessit proprie di al-
capire come usarlo e interpretarlo, ha conti- cune aree. I cittadini e le comunit locali, se
nuato Krumholz. Per questo motivo neces- se i dati non sono aperti e se non c la possi- opportunamente istruiti, potrebbero trovare
sario accompagnare il dato con metadati che bilit di vericare la riproducibilit di quanto risposte per problemi locali e disegnare pos-
spieghino come un risultato stato ottenuto affermato dai risultati ottenuti in differenti sibili soluzioni4.
e come pu essere interpretato. condizioni e coinvolgendo diversi gruppi di Occorre creare delle metriche riportate
Yoda dunque il tentativo di proporre uno pazienti8. Oggi la maggior parte dei dati pro- pubblicamente per assicurare un facile accesso
standard accessibile a vari livelli, capace di as- dotti dai trial clinici non passa attraverso la re- ai dati per i pazienti che si rivolgono agli ospe-
sicurare linteroperabilit nella gestione delle visione della peer review. Per fare un esempio dali o ai sistemi sanitari. Oggi, a volte, non
banche dati. Ci si traduce nella realizzazio- che descrive il fenomeno, l88% degli autori sono nemmeno accessibili le note inserite
ne allinterno del progetto di una piattafor- di articoli comparsi su giornali nanziati dai nella cartella clinica, secondo quanto sostiene
ma utile allelaborazione dei dati e predispo- National institutes of health statunitensi non il movimento OpenNotes. C ancora molto
sta per una sicura condivisione dei risultati. deposita i propri dati allinterno degli apposi- da fare nella realizzazione di piattaforme che
Dobbiamo offrire una piattaforma afda- ti registri. Come conseguenza questa cultura promuovano la ricerca, laccesso, la possibilit
bile ed essere responsabili nella gestione dei scientica inefciente e irriproducibile. Se- di operare e inne il riuso dei dati13.
dati, per dimostrare a tutti che questa azione condo Eric L. Uhlmann e Raphael Silberzahn unopportunit unica per le persone sen-
volta a migliorare la societ, ha spiegato questo meccanismo oltre a rallentare il pro- za una preparazione medica il fatto di avere
Krumholz. Dunque la partecipazione signi- gresso scientico sta sprecando gli investi- dati di confronto con altre centinaia di malati
cativa anche a un altro livello, quello della menti pubblici e disonora chi contribuisce che hanno caratteristiche cliniche simili e che
gestione del dato e del coinvolgimento del alla ricerca9. hanno provato determinati trattamenti. Con
personale sanitario e dei medici. Senza contare che rilasciare i dati in for- queste informazioni possibile porre basi so-
Per procedere a pi larghi passi la ricerca ha mato aperto un benecio tanto per lambito lide per una discussione basata su evidenze
bisogno dei dati. Lo dimostrano le richieste clinico quanto per la ricerca, perch permette scientiche con i clinici14. Se le persone potes-
di dati avanzate nei confronti dellindustria di correlare tra loro informazioni differenti in sero esprimere la propria opinione su come
farmaceutica, che ha risposto in alcuni casi un sistema denito linked data, che pu inclu- i loro dati vengono utilizzati, per garantire
predisponendo programmi di condivisione dere anche elementi provenienti dal mondo migliore qualit, informazioni pi aggiornate
delle informazioni cliniche e sperimentali della biologia, delleconomia o dalle caratte- e pi complete, probabilmente si arriverebbe
raccolte. Questo tipo di impostazione raf- ristiche demograche o ambientali: un tale veramente ad aiutare tutti quegli individui
forzata dallInternational committee of medi- grado di complessit ci che contraddistin- che si trovano ad affrontare problemi simili.
cal journal editors (Icmje) che sta tentando gue i big data. La correlazione semantica di [Pagine a cura di Giulia Annovi]

1116-FWD-04_xweb.indd 14 17/11/2016 16:32:16


www.forward.recentiprogressi.it forward | 15

I cinque obiettivi dellHealth It strategic plan 2015-2020 statunitense

1. Lazer D, Pentland A, Adamic L, et al. for a learning health system.


Social science. Computational social Health Affairs 2014;33:1163-70. VEDI ANCHE
science. Science 2009;323:721-3. 9. Silberzahn R, Uhlmann EL.
2. The office of the national Crowdsourced research: many
coordinator for Health information
technology. Connecting Health
and Care for the Nation. A Shared
Nationwide Interoperability
hands make tight work. Nature
2015;526:189-91.
10.European Commission. The
socio-economic impact of
C ondividere, governare e utilizzare i dati
favorisce un sistema sanitario capace di apprendere
costantemente dallesperienza: ne convinto Harlan
Krumholz che tornato a esporre il proprio punto di vista
Roadmap. Final version 1.0, 2015. interoperable electronic health in una nota pubblicata nel numero speciale del Jama curato
3. Goldacre B. Care.data is in chaos. record (Ehr) and ePrescribing dallInstitute of medicine statunitense1. Purtroppo, per, questo
It breaks my heart. The Guardian systems in Europe and beyond. scenario ostacolato da diversi fattori: in primo luogo, chi
2014; 28 febbraio. 2009. detiene il dato (il pi delle volte il ricercatore) non incentivato
4. Kostkova P, Brewer H, de Lusignan 11.Murugiah K, Ritchie JD, Desai NR, a condividerlo, soprattutto perch su di lui (o sulla sua
S, et al. Who owns the data? Open et al. Availability of clinical trial istituzione) ricade la totalit dei costi necessari per lattivit di
data for healthcare. Front Public data from industry-sponsored sharing. Inoltre, linteroperabilit dei dati ancora un miraggio.
Health 2016; 4:7. cardiovascular trials. J Am Heart
In denitiva, i problemi sono di ordine etico e di natura
Assoc 2016;5:e003307.
5. Lupton D. Health promotion in the tecnologica: serve una cultura nuova, in cui la non condivisione
digital era: a critical commentary. 12.The Office of the national delle informazioni sia vista come un oltraggio al progresso.
coordinator for health
Health Promot Int 2014; 30:174-83.
information technology. Federal 1. Krumholz HM, Terry SF, Waldstreicher J. Data acquisition, curation, and
6. Krumholz HM, Waldstreicher J. health It strategic plan: 2015-
The Yale open data access (Yoda) use for a continuously learning health system. Jama 2016;316:1669-70.
2010. 2014.
project A mechanism for data
13.Wilkinson MD, Dumontier
sharing. N Engl J Med 2016;375:403-
M, Aalbersberg IJ, el al. The
5.
Fair guiding principles for
7. Taichman DB, Backus J, Baethge scientific data management
C, et al. Sharing clinical trial data: and stewardship. Sci Data
a proposal from the International 3016;3:160018.
committee of medical journal 14.Krumholz HM, Terry SF,
editors. Ann Intern Med 2016; 64: Waldstreicher J. Data acquisition,
505-6. curation, and use for a
8. Krumholz HM. Big data and new continuously learning health
knowledge in medicine: the system. Jama 2016; doi: 10.1001/
thinking, training, and tools needed jama.2016.12537

1116-FWD-04_xweb.indd 15 17/11/2016 16:32:16


16 | forward BIG DATA 4 / 2016

Aaron Koblin, Flow just ow.

Timo Arnall, InternetMachine 01, 2014.

Larte e i big data


Rischiare il dolore e rottamare
D
opo Barcellona, Madrid, Buenos Aires, elaborazione dei big data: quello dellazienda
Londra e Santiago la mostra itinerante Telefnica, ad Alcal, in Spagna. Ho voluto la vecchia estetica. Virginia Heffernan
Big Bang Data decollata per la guardare oltre il mito infantile della nuvola,
prima volta nel continente asiatico, negli spazi andando a vedere come sono fatte realmente
espositivi del museo ArtScience di Singapore: le infrastrutture della rete e a sentire Nella parte dedicata alla Data explosion ha
un percorso articolato in otto capitoli che lenergia che si percepisce stando vicino grande visibilit il lavoro di Lisa Jevbratt, artista
esplorano la relazione tra lesplosione dei dati alle macchine e ai sistemi che garantiscono svedese oggi docente allArt Department
prodotti grazie alle tecnologie e il real world. la conservazione, la sicurezza dei dati e il and in the Media Art Technology program
Una delle opere pi sorprendenti del rareddamento della tecnologia. Intorno della University of California, Santa Barbara.
capitolo Understanding the cloud quella al grande edicio, altri silos di acqua gelida I suoi progetti si richiamano alla prospettiva
di Timo Arnall, fotografo e lmmaker che pronti a entrare in azione in caso di incendio. di Virginia Heernan, critica ed editorialista
ha ripreso uno dei centri pi imponenti di [http://www.elasticspace.com/] del New York Times per la quale internet

1116-FWD-04_xweb.indd 16 17/11/2016 16:32:16


www.forward.recentiprogressi.it forward | 17

Lisa Jevbratt, InternetMachine 01.

Black Shoals: Dark Matter di Joshua Portway


e Lise Autogena. Linstallazione proietta stelle Hello world! or how I learned to stop
che modicano la loro luminosit a seconda listening and love the noise di Christopher
dellandamento dei mercati azionari cui sono Baker: uninstallazione audiovisiva con oltre
collegate in tempo reale. 5 mila video-diario presi da internet.

semplicemente loggetto che ogni giorno era of knowledge. Dopo lesperienza nello uso a scopo di protto. Il tema della privacy
creiamo, portatore di una propria specica sta di Google, Koblin tra i maggiori esperti e dellannullamento della riservatezza
estetica: Per dare un senso al nuovo mondo in di data visualization. Con il progetto With.in memorabilmente toccato dal progetto
cui viviamo in tutta la sua velocit, diversit ha prodotto una sintesi tra realt virtuale e I know where your cat lives3. Un milione di
ed eccentricit per capire veramente lalta storytelling2: la mostra di Singapore mette di gatti stato geolocalizzato attraverso i tag
velocit di un medium nuovo e rapace, che ha fronte alla evidenza di unarte costantemente delle fotograe e dei video postati su web:
sia ricreato sia distrutto le forme tradizionali in divenire, alla transitoriet di qualsiasi opera insomma, i big data siamo noi e ci che
di espressione, abbiamo bisogno di rischiare che, informata da dati, si trasforma sotto abbiamo di pi caro F
il dolore e rottamare la vecchia estetica e gli occhi di chi guarda. Siamo dati sembra
prenderne in considerazione una nuova e la essere il messaggio in mostra, col signicato 1. Heffernan V. Magic and loss. 2. with.in/
moralit a lei propria1. ambiguo dellessere un dato e dellessersi The Internet as art. New York: 3. iknowwhereyourcatlives.com/
Aaron Koblin leroe del capitolo A new consegnati a chi, dei nostri dati, gi oggi fa un Simon and Shuster, 2016. about/

1116-FWD-04_xweb.indd 17 17/11/2016 16:32:17


TM | forward BIG DATA 4 / 2016

Le parole dellinnovazione in sanit


1a R I U N I O N E A N N U A L E

ROMA
2 6 G E N N A I O 2 0 17
C e n t r o c o n g r e s s i F o n t a n a d i Tr e v i

Il sistema sanit in costante cambiamento

e Forward intende interpretare questa

evoluzione. Il convegno il punto di arrivo

di una serie di approfondimenti e workshop

sui temi che stanno rivoluzionando il mondo

della medicina. Il congresso sar loccasione

per avviare altri mesi di riessione

e confronto.

1116-FWD-04_xweb.indd 18 17/11/2016 16:32:18


www.forward.recentiprogressi.it forward | TM

www.forward.recentiprogressi.it
Con il patrocinio del
(in richiesta)

Il Pensiero
Scientifico
Editore

PROGRAMMA
Saluti delle Autorit

Precision medicine
Giovanni Leonardi chairman | Francesco Perrone discussant
Roberto F. Labianca Vinay Prasad
Direttore del Cancer center Assistant professor of Medicine
ASST San Giovanni XXIII division of Hematology oncology
Bergamo in the Knight Cancer Institute
Department of Public health
and Preventive medicine
Senior Scholar in the Center
for Health care ethics
Oregon Health & Science University
Valore / Valori
Walter Ricciardi chairman | Francesco Forastiere discussant
Iona C. Heath Elena Granaglia
Past President, Royal College Professore ordinario di Economia,
of General practitioners etica e mercati
Chair, Scientic Committee Facolt di Giurisprudenza
The BMJ Universit degli studi Roma Tre

Empowerment / Engagement
Angelo Tanese chairman | Sandro Spinsanti discussant
Sally Crowe Mario Melazzini
Crowe associates Presidente
London Agenzia italiana del farmaco
Patient panel member,
The BMJ

Big data
Carlo Perucci chairman | Giuseppe Ippolito discussant
Ciro Cattuto Rodolfo Saracci
Scientic director Senior visiting scientist
Institute for scientic International agency
interchange Isi for research on cancer

Il progetto Forward realizzato anche grazie al contributo non condizionato di

1116-FWD-04_xweb.indd 19 17/11/2016 16:32:18


20 | forward BIG DATA 4 / 2016

p.7
Big data e innovazione farmaceutica
Il punto di vista regolatorio

e potenzialit dei big data nellevo-

L luzione della scienza medica e re-


golatoria sono ormai riconosciute a
livello globale, ma la portata e lim-
patto del fenomeno richiedono una rivisita-
zione radicale delle competenze e degli stru-
menti nora adottati per guidare le decisioni
politiche, regolatorie e cliniche nel mondo
del farmaco e della sanit.
Luca Pani Se per le autorit regolatorie la sda cru-
ciale dei prossimi anni sar denire, rico-
Direttore generale, noscere e premiare linnovazione farma-
Agenzia italiana
ceutica per garantire ai cittadini laccesso a
del farmaco
medicinali efcaci a prezzi sostenibili, non
meno importante sar la capacit di mettere
a valore lenorme mole di dati generati dai
grandi database sanitari, dai registri medici
elettronici, dalla digitalizzazione delle pub-
blicazioni scientiche e dalla proliferazione
di dispositivi medici personali.
I big data in farmacologia sono grandi
aggregazioni di informazioni legate alle po-
polazioni che assumono i farmaci, come ad
esempio i dati biometrici, i dati relativi alle
abitudini e agli stili di vita, allinterazione
e agli effetti dei trattamenti farmacologici,
allandamento naturale delle patologie, alla
durata della risposta farmacologica nel tempo.

Il diluvio di dati sanitari non di per s un


valore e pu costituire persino uninsidia per la salute e
per la privacy, specie se gli interessi economici e lutilizzo
improprio dovessero prevalere sugli aspetti etici.

Intanto bene chiarire che il diluvio di


dati sanitari non di per s un valore e pu
costituire persino uninsidia per la salute e
per la privacy, specie se gli interessi economi-
ci e lutilizzo improprio dovessero prevalere
sugli aspetti etici e sulla gestione razionale
e responsabile delle informazioni sensibili.
Una prima questione riguarda quindi le tazionali in grado di simulare effetti su po-
fonti e la qualit dei database, perch soltan- polazioni pi ampie. Occorrer passare dai big
to i dati acquisiti e gestiti correttamente sono Dalla pratica clinica provengono inoltre data agli smart data, cio essere
in grado di produrre quelle evidenze valida- informazioni preziose su come i farmaci in grado di generare e selezionare
te che servono al processo decisionale. In al- agiscono nella vita reale su un numero mi-
tre parole, occorrer passare dai big data agli gliaia o milioni di volte superiore a quello i dati giusti.
smart data, cio essere in grado di generare e delle popolazioni studiate nei trial, e sugli
selezionare i dati giusti, riducendo al mi- effetti a lungo termine per la rivalutazione ne, follow-up), rappresentando una risorsa
nimo il rischio di errore, per svolgere analisi dellefcacia e del prolo benecio-rischio. informativa preziosa per il nostro Servizio
corrette e assumere decisioni informate e au- Per i regolatori, acquisire e analizzare in sanitario nazionale.
torevoli. Sar quindi fondamentale riuscire modo sistematico questa enorme mole di In conclusione, lingresso dei big data
a integrare conoscenze di domini differenti dati post-marketing signica poter contare nel mondo della farmacologia porta con
e tradizionalmente non comunicanti, in un su un patrimonio di conoscenze in continua s un potenziale grande vantaggio per la
concorso di intelligenze e di competenze evoluzione in grado di colmare i gap di evi- salute delluomo. Il benecio che ne conse-
tecniche e scientiche mai sperimentato, per denze al momento dellautorizzazione, spe- gue per legato alla capacit di incrociare
valorizzare al meglio le straordinarie poten- cie per quei farmaci che vengono immessi in enormi masse di dati e analizzare cos una
zialit dellinformation technology applicata commercio con procedure accelerate; signi- quantit ineguagliata di informazioni, rife-
alle scienze della vita e, nel nostro specico, ca anche poter gestire gli schemi di rimborso rite a milioni di pazienti e pertanto in grado
ai processi regolatori lungo lintero ciclo di condizionato, informare le attivit di health di consentire analisi di ampia portata mai
vita del farmaco. technology assessment e il processo di rine- tentate sinora. Tutto ci richiede integrazio-
Lo sviluppo clinico di molecole sempre goziazione, migliorare lidenticazione delle ne delle competenze e aggiornamento, con-
pi orientate a target mirati e popolazioni di popolazioni target e vericare lappropria- divisione delle conoscenze, collaborazione
studio denite in base a specici biomarca- tezza prescrittiva. tra stakeholder (pazienti e medici in primis)
tori richiede la capacit di condividere e in- ci che lAifa sta facendo da alcuni anni e cooperazione tra attori pubblici e privati,
tegrare i risultati prodotti nei trial in modo con i suoi database: la banca dati OsMed, ma anche un quadro giuridico in grado di
da ottenere dati scienticamente signicati- la Rete nazionale di Farmacovigilanza e, so- contemperare trasparenza, accesso alla co-
vi che possono indirizzare la ricerca futura, prattutto, i registri di monitoraggio, che con- noscenza, tutela dei dati personali e diritto
incidere sui processi regolatori e contribuire sentono una gestione telematica di tutte le alla riservatezza su informazioni sensibili
alla denizione di modelli teorici e compu- fasi di trattamento (eleggibilit, dispensazio- come quelle che riguardano la salute. F

1116-FWD-04_xweb.indd 20 17/11/2016 16:32:19


www.forward.recentiprogressi.it forward | 21

Come cambia
la sorveglianza post-marketing
Grandi quantit di dati sanitari offrono nuove opportunit ma richiedono anche nuovi sforzi

N ellultimo decennio il termine big


data stato applicato in differen-
ti settori e con diversi signicati. In
generale, il concetto di big data pu
I dati, in forma anonima, derivano da diffe-
renti banche dati di assicurazioni sanitarie
che sono state convertite localmente a un for-
mato dati standardizzato e condiviso (com-
nimizzato, per ulteriori elaborazioni a livel-
lo centrale. Larmonizzazione dellestrazione
iniziale dei dati stata particolarmente com-
plessa in quanto le banche dati differivano
essere spiegato attraverso il paradigma del- mon data model) cos da permettere di lancia- tra loro per sistema di codica di patologia
le 4 V (volume, velocity, variety, veracity), vale re un unico script generato centralmente per e farmaci, sistema sanitario sottostante, tipo-
a dire, enormi quantit di dati, rapidamente la loro analisi senza alcun trasferimento di logia di dati raccolti e linguaggio utilizzato9.
accessibili, estremamente etrogenei, e che ri- dati sensibili. Tali iniziative hanno dimostrato che se tali
chiedono approcci analitici innovativi, quali Il progetto Eu-Adr, per lindividuazione multi-database network fossero stati disponi-
algoritmi di machine learning, per fornire ri- di reazioni avverse da farmaci, stato nan- bili in passato avrebbero potuto contribuire
sultati utili e accurati ai decision maker negli
ambiti in cui si applica1. Di recente, il tema
dei big data diventato un argomento molto I big data trasformeranno la medicina. Afnch possano
attenzionato anche in ambito sanitario, dove
esiste una enorme e crescente quantit di in-
essere utili bisogna analizzarli e interpretarli correttamente.
formazioni in formato elettronico disponibili Ziad Obermeyer, Ezekiel J. Emanuel
sotto forma di cartelle cliniche informatizzate,
archivi di medicina generale, ussi ammini- ziato dalla Commissione europea nel 2008 ad accelerare il processo di valutazione di se-
strativi, registri di patologia e di monitorag- Gianluca Trifir, con lobiettivo di identicare precocemen- gnali dallarme di farmacovigilanza, favoren-
gio dei farmaci, ecc. (vedi gura). Laddove tali Valentina Ientile te e supportare dal punto di visto biologico do una pi rapida sospensione dal mercato di
dati fossero opportunamente elaborati e resi Dipartimento di possibili segnali di farmacovigilanza tramite farmaci dimostratisi pericolosi come nel caso
interoperabili tra le diverse gure coinvolte Scienze biomediche, data mining applicato a un network di otto Vioxx. Altra importante evidenza generata
nella generazione degli stessi rappresentereb- odontoiatriche banche dati amministrative e di medicina ge- da tali progetti che il sistema tradizionale
bero una grande opportunit per trasformare e delle immagini nerale da quattro paesi europei Danimarca, di farmacovigilanza basato su segnalazione
in evidenze scientiche vaste moli di informa- morfologiche e Italia, Olanda e Regno Unito con una po- di sospetta reazione avversa da farmaco non
zioni routinariamente raccolte nella pratica funzionali - Universit polazione di riferimento complessiva di qua- potr mai essere sostituito per lidentica-
clinica per ni non scientici2,3. di Messina si 30 milioni di persone, e altre banche dati zione di segnali di sicurezza, bens soltanto
A partire dagli anni Novanta, in un nume- biomediche. I dati delle singole banche dati supportato da tali network, soprattutto rela-
ro sempre pi grande di paesi, soprattutto in venivano prima elaborati localmente tramite tivamente a eventi avversi multifattoriali che
Europa, Usa e Asia, cresciuto limpiego di un software chiamato Jerboa e poi condivisi, non sono comunemente segnalati (ad esem-
banche dati sanitarie per la valutazione post- in un formato omogeneo, aggregato e ano- pio, infarto del miocardio). a p.22
marketing di pattern prescrittivo, sicurezza ed
effectiveness (comparative effectiness research)
dei farmaci utilizzati nella reale pratica cli-
nica4-6. Anche lItalia ricca di dati sanitari Farmaceutica
convenzionata,
in formato elettronico: ogni azienda sanita- distribuzione Risultati
ria locale e Regione produce ussi ammini- diretta e esami
DPC laboratorio
strativi a ni di rimborsabilit delle presta-
zioni sanitarie erogate; a ci vanno aggiunti Diagnostica Registro
gli archivi elettronici di medici di medicina specialistica mortalit
ambulatoriale Schede
generale e pediatri di libera scelta, frequente- dimissione e patologie
mente organizzati in reti di ricerca, i registri ospedaliera
Valutazione
di patologia e quelli di monitoraggio dei far- geriatrica
maci di nuova commercializzazione richiesti
dallAgenzia italiana del farmaco, sebbene
Biobanca
sottoutilizzati dal punto di vista scientico. Cartelle
cliniche
Il record linkage di differenti banche dati ospedaliere
sanitarie, nel rispetto delle normative della
privacy che prevedono procedure di anoni- Archiviazione
dati
mizzazione dei dati dei pazienti, rendono Record
Prospective
possibile integrare notevoli quantit di dati. data linkage
Numerose iniziative sono state recente- collection
mente concluse o sono tuttora in corso in di-
verse parti del mondo in cui sono stati creati
multi-database network che danno accesso a Banche dati
fonti dati di dimensioni mai prima raggiun- amministrative
Big data Analisi
dati
te per la sorveglianza postmarketing dei far- Archivi
maci. In particolare, vi sono due esperienze MMG e PLS
internazionali che meritano un approfondi-
mento: il sistema statunitense di sorveglianza
postmarketing Sentinel7 e il progetto euro- Visite
Pronto
peo Eu-Adr8. Soccorso Visualizzazione
dati
Generato nel 2008 su mandato della Food Esenzioni &
and drug administration per il monitorag- reporting
gio prospettico della sicurezza dei farmaci in
commercio, il sistema di sorveglianza Senti-
nel si basa sullimpiego di record elettronici
di circa 100 milioni di cittadini statunitensi. MMG: medico di medicina generale PLS: pediatra di libera scelta DPC: distribuzione per conto

1116-FWD-04_xweb.indd 21 17/11/2016 16:32:20


22 | forward BIG DATA 4 / 2016

Interrogare i ussi amministrativi


A supporto delle procedure per la rimborsabilit dei nuovi farmaci

I big data rappresentano un tema di


grande interesse e al centro dellat-
tenzione scientica, regolatoria e in-
dustriale, ma presentano numerose
a oltre il 34% dellintera popolazione italia-
na, dati che vengono resi in formato anonimo
sulla base di speciche convenzioni con le Re-
gioni e con le Asl che ne rimangono titolari
immunologici per pazienti con patologia tu-
morale ed espressione della mutazione pd-1
e pdl-1. Ma non mancano gli esempi anche
in altre malattie, come lasma e i nuovi trat-
problematicit relative al loro signicato, alle secondo la normativa della privacy. La dimen- tamenti con i farmaci biologici anticorpi mo-
metodologie di analisi e di elaborazione dei sione di BigData Ar-Co fa riferimento a oltre noclonali (mAb) nelle sottopopolazioni con
dati e soprattutto rispetto al loro ruolo, 150 milioni di prescrizioni farmaceutiche per asma grave, refrattaria ed eosinola, i nuovi
con riferimento alla tutela della privacy, alle- anno e a tutte le schede di dimissione ospeda- trattamenti biotecnologici per la sclerosi mul-
ventuale supporto alla digital epidemiology, liera e prestazioni specialistiche, derivate dai tipla primariamente progressiva o limpiego
Nello Martini alla appropriatezza prescrittiva, alle speri- ussi amministrativi degli assistiti a livello re- degli inibitori del pcsk9 nei pazienti ad alto
Drugs & Health srl mentazioni cliniche, alla farmacovigilanza, gionale e di 53 Asl, dalle quali si raccolgono rischio cardiovascolare che non rispondono
alle decisioni regolatorie e alla verica degli informazioni dei singoli pazienti relativi alla alla terapia con statine.
outcome nella pratica clinica reale. Questi farmaceutica e ai ricoveri ospedalieri. In tale contesto uno degli elementi pi
temi sono ampiamente presenti e discussi in Per cogliere lutilit e i limiti di tale osserva- critici ai ni della rimborsabilit per lAifa
questo numero di Forward. Da parte mia, vor- torio, a supporto delle procedure di rimbor- stabilire in maniera afdabile e nel mondo
rei esaminare il possibile ruolo e leventuale sabilit di nuovi farmaci e quindi a suppor- reale la prevalenza delle sottopopolazioni
utilit dei big data a supporto delle procedure to delle attivit della Commissione consul- target che solitamente viene desunta da studi
di rimborsabilit dei nuovi farmaci. tiva tecnico-scientica e del Comitato prezzi puramente teorici di epidemiologia inferen-
In Italia abbiamo differenti esempi di pro- e rimborsi dellAgenzia italiana del farmaco ziale. Ma senza una metodologia afdabile
getti basati sullutilizzo dei big data in ambito (Aifa) necessario cogliere alcuni elementi di calcolo, la denizione del prezzo e della
farmaceutico e assistenziale che si contraddi- essenziali, attuali e anche futuri delle proce- rimborsabilit rimane priva del suo denomi-
stinguono tra di loro nella struttura dei data dure di autorizzazione e di rimborsabilit. natore essenziale.
base, negli ambiti di applicazione, negli in- Lelemento chiave del nuovo modello adot-
dicatori assunti e nelle nalit stesse. Infatti, tato dalle aziende farmaceutiche per il mar- Definizione della popolazione target
come si evidenzia nella tabella 1, nessuno di ket access dei nuovi farmaci (biotecnologici e Per vericare lutilit dei big data nel de-
essi mutualmente inclusivo o mutualmente prodotti a basso peso molecolare small mo- nire lepidemiologia delle sottopopolazioni
esclusivo di tutti gli indicatori e di tutte le atti- lecule) basato nella stragrande maggioranza target, viene portato come esempio uno stu-
vit. Questi progetti risultano complementari dei casi nel trattamento di sottopopolazioni dio di prevalenza dei pazienti candidabili al
e integrativi per il governo delle performance, (small population) per le quali viene richiesta trattamento con la nuova molecola pcsk9 che
della appropriatezza, della aderenza al tratta- lautorizzazione allimmissione in commer- stato condotto a partire dai ussi ammini-
mento, delle popolazioni target, dellimpatto cio (procedura centralizzata Ema Agenzia strativi di BigData Ar-Co.
di nuovi farmaci, delle reti cliniche integrate europea dei medicinali) e la rimborsabilit I pazienti candidabili al trattamento con
nel riassetto delle cure primarie e dei costi as- (procedura Aifa di prezzo e rimborso). pcsk9 sulla base di quattro criteri di estrazio-
sistenziali (burden of disease) delle patologie. Lestensione del mercato (fatturato delle ne sono:
aziende e spesa a carico del sistema sanitario pazienti con evento cardiovascolare nellan-
Un grande osservatorio per le procedure nazionale) avviene attraverso la procedura di no precedente sulla base delle schede di di-
del regolatorio estensione delle indicazioni (a sostanziale missione ospedaliera (ricovero per infarto,
Il BigData Ar-Co nasce dallintegrazione varianza di prezzo) per cui si arriva al tratta- ictus, sindrome coronarica acuta, trombosi
dellOsservatorio Arno con Core (Collabora- mento di popolazioni molto ampie (adaptive venosa profonda),
tive outcome research), partner di Cineca pathway). Lesempio pi tipico dato in on- pazienti con evento pregresso cardiovasco-
Centro di calcolo del consorzio interuniversi- cologia, dalle sottopopolazioni a bersaglio lare e in trattamento con statine nellanno
tario. La struttura di BigData Ar-Co costituita molecolare (target therapy) con differenti bio- successivo (solo il 63,3% dei pazienti risul-
dai dati di circa 20,5 milioni di assistiti, pari marker e, pi recentemente, dai trattamenti ta in trattamento con statine),

da p. 21

Altri network internazionali sono stati cre- osservazionali, indipendentemente da quanti- I big data trasformeranno la medicina. I dati
ati negli ultimi anni per favorire studi post- t e qualit dei dati. in quanto tali per sono inutili. Afnch pos-
marketing su farmaci e vaccini tra cui Aritmo, Per concludere, citando un editoriale re- sano essere utili, bisogna analizzarli e inter-
Safeguards, Advance, Sos, Protect ed EURO- cente del New England Journal Medicine a r- pretarli correttamente e devono portare a del-
mediCat in Europa, Cnodes in Canada, Aspen ma di Ezekiel J. Emanuel e Ziad Obermeyer: le azioni12. F
in Asia e Australia, a dimostrazione di quanto
frequente sia la tendenza a livello globale a
creare infrastrutture di big data per il monito- 1. Martin-Sanchez F, Verspoor K. Big data in medicine is driving 8. Coloma PM, Schuemie MJ, Trifir G, et al. Combining
raggio post-marketing dei farmaci10. big changes. Yearb Med Inform 2014;9:14-20. electronic healthcare databases in Europe to allow for
Un ultimo cenno va fatto sullimpiego dei so- 2. Ross MK, Wei W, Ohno-Machado L. Big data and the large-scale drug safety monitoring: the EU-ADR Project.
cial media come possibile fonte dati per farma- Electronic Health Record. Yearb Med Inform 2014;9:97-104. Pharmacoepidemiol Drug Saf 2011;20:1-11.
co- e vaccino-vigilanza11. Sulla base di numerosi 3. Index for Excerpts from the American Recovery and 9. Avillach P, Coloma PM, Gini R, et al.; EU-ADR consortium.
studi pubblicati negli ultimi anni, analizzare Reinvestment Act of 2009. Health Information Technology Harmonization process for the identification of medical events
enormi quantit di dati sia di carattere generale (HITECH) Act 2009, pp. 112-64. in eight European healthcare databases: the experience from
sia di ambito sanitario estrapolabili dai social 4. Hripcsak G, Albers DJ. Next-generation phenotyping of the EU-ADR project. J Am Med Inform Assoc 2013; 20:184-92.
media sembra essere un approccio promettente electronic health records. J Am Med Inform Assoc 2013; 10.Trifir G, Coloma PM, Rijnbeek PR, et al. Combining multiple
per la valutazione post-marketing di farmaco- 20:117-21. healthcare databases for postmarketing drug and vaccine
vigilanza, sebbene accessibilit e accuratezza di 5. Wagholikar KB, Sundararajan V, Deshpande AW. Modeling safety surveillance: why and how? J Intern Med 2014;275:551-
tali dati richiedano ulteriori veriche. paradigms for medical diagnostic decision support: a survey 61.
In generale, la disponibilit di enormi and future directions. J Med Syst 2012;36:3029-49. 11.Sarker A, Ginn R, Nikfarjam A, et al. Utilizing social media
quantit di dati sanitari da fonti differenti 6. Sullivan P, Goldmann D. The promise of comparative data for pharmacovigilance: A review. J Biomed Inform
rappresenta unimportante opportunit nel effectiveness research. Jama 2011;305:400-1. 2015;54:202-12.
campo della farmacovigilanza, ma bisogna 7. Platt R, Wilson M, Chan KA, et al. The new Sentinel network: 12.Obermeyer Z, Emanuel EJ. Predicting the Future Big data,
valutare rigorosamente la qualit dei dati da improving the evidence of medical-product safety. N Engl J Machine Learning, and Clinical Medicine. N Engl J Med
analizzare, cos come i limiti inerenti agli studi Med 2009; 361:645-7. 2016;375:1216-9.

1116-FWD-04_xweb.indd 22 17/11/2016 16:32:20


www.forward.recentiprogressi.it forward | 23

Tabella 1. Esempi di big data in Italia con relati ambiti di applicazione e indicatori di attivit.

Ambiti
di Indicatori
Progetti di
applicazione
attivit

Progetti Ambito Regioni Appropriatezza Aderenza Peformance Costi assistenziali Impatto dei Popolazioni Budget alle Integrazione
- ASL prescrittiva al trattamento Regioni Regioni nuovi farmaci target cure primarie reti cliniche
OsMed Aifa Nazionale
Matrice Agenas Multiregionale
Mes SantAnna di Pisa Multiregionale 14 Regioni
Core Cineca Multiregionale 9 Regioni
49 Asl

Acg Regione Veneto Veneto 21 Ulss
CReG Regione Lombardia Lombardia 10 Asl/Pot
19 Centri

Chronic care model
Toscana e Asl Arezzo
Area Vasta

pazienti in trattamento con statine ad alto evidenzia che il costo prevalente costituito sment (Hta). Nei paesi in cui le procedure di
dosaggio (solo il 42% dei pazienti risulta in dai ricoveri ospedalieri, seguiti dalla spesa Hta sono da tempo consolidate e vengono
trattamento con statine ad alto dosaggio), farmaceutica e dalla spesa per la specialistica assunte come base per decidere la eventua-
pazienti con pregresso evento cardiova- (gura 1). Senza i dati del burden of disea- le rimborsabilit, le valutazioni economiche
scolare, in trattamento con statine ad alto se e dei costi assistenziali integrati si nisce (incremental cost-effectiveness ratio e costo
dosaggio e non a target colesterolo Lld per valutare limpatto dei nuovi farmaci su nale per anni di vita pesati per la qualit)
> a 100 mg/dl 30% (far from goal): tale una singola variabile (spesa farmaceutica) e vengono effettuate da strutture terze rispet-
coorte rappresenta solo il 40% dellintera non sullintero processo assistenziale. Solo to allagenzia regolatoria. Ad esempio, nel
popolazione con un rischio di malattia car- in questo modo possibile valutare e docu- Regno Unito tali valutazioni non sono di
diovascolare molto alto. mentare nel tempo i cosiddetti costi evitabili competenza della Medicine and healthcare
Secondo questa metodologia possibile attraverso il monitoraggio che verichi negli regulatory agency ma piuttosto del National
individuare dallarchivio di BigData Ar-Co, il anni gli effetti compensativi reali derivanti institute for health and care excellence o di
numero di pazienti in Italia che presentano dai nuovi farmaci, per evitare di mettere a istituzioni accreditate e altamente qualicate
le condizioni di candidabilit al trattamen- bilancio risparmi presunti e virtuali. del National health service.
to con pcsk9: si tratta di una popolazione di In Italia tutte le funzioni (prezzo, rimbor-
47.424 pazienti con prevalenza epidemiolo- Conclusioni sabilit, Hta e farmacovigilanza) sono invece
gica pari a 0,047 x 1000 abitanti. La conclusione di questo articolo riporta concentrate in unico organismo, lAifa, per
ad una valutazione di carattere strutturale e cui si viene a creare un potenziale conitto
Costi assistenziali integrati di sistema che riguarda lesigenza di terzie- di interesse. auspicabile che questo aspetto
delle patologie t nella elaborazione e nellimpiego dei dati rilevante e strutturale venga risolto nellambi-
Unaltra criticit nellambito del processo di big data e pi in generale delle procedure to del riordino dellAifa pi volte annunciato
di rimborsabilit costituita dalla valutazio- di valutazione dellHealth technology asses- ma non ancora implementato. F
ne del burden of disease e dei costi assisten-
ziali integrati delle patologie, in modo da Figura 1. Costi assistenziali integrati (ricoveri, farmaceutica e specialistica).
stimare limpatto dei nuovi farmaci (budget
impact) nellambito delle patologie per le Spesa pro capite
quali sono indicati. Oggi il budget impact si ()
calcola sulla base di modelli teorici di popo-
lazione (Markov) e inferenziali la cui matri- 12.000
ce viene denita prevalentemente dalle in- Specialistica
dustrie farmaceutiche nellambito del global 10.000
Ricoveri
value dossier e dei paesi di riferimento, in
Farmaceutica
particolare negli Stati Uniti. In questo modo 8000
si producono stime che, anche se aggiusta-
te su parametri italiani (per esempio, i dia-
gnosis-related group), non sono facilmente 6000
trasferibili alla pratica clinica reale. Mentre
il budget impact dei nuovi farmaci, stimato 4000
sui dati reali dellintero processo assistenzia-
le e non solo della farmaceutica, pu e deve 2000
costituire un reale budget impact 2.0 nel real
world.
Lanalisi dei costi assistenziali integrati di
0
nove patologie (due acute e sette croniche), Scompenso SCA BPCO/asma Artrite Diabete Osteoporosi Ipertensione Dislipidemia
esaminate nellambito del BigData Ar-Co, cardiaco reumatoide

1116-FWD-04_xweb.indd 23 17/11/2016 16:32:20


24 | forward BIG DATA 4 / 2016

Verso una nuova cooperazione


pubblico-privato
Per interrogare i dati e generare evidenze con metodo e rigore

gni giorno creiamo 2,5 quintilioni di presentano, in altre parole, il database del pi organizzative basate su evidenze nate dalla

O byte di dati e il 90% dei dati mondiali


ad oggi prodotto stato creato negli
ultimi due anni. Quello dei big data
un argomento vasto, sfaccettato ed estrema-
grande studio osservazionale mai condotto:
la normale pratica clinica.
evidente che, in un momento in cui la
sanit pubblica ha necessit di capire, orga-
pratica clinica per ottimizzare e migliorare
la stessa;
solo con unanalisi attenta dei contesti in
cui si opera, del peso reale di una malat-
mente attuale. Citando il losofo e docente di nizzare, pianicare e ottimizzare, e lindustria, tia e dellimpatto che le opzioni terapeu-
logica ed epistemologia allUniversit di Ox- dal canto suo, ha necessit di produrre, mo- tiche disponibili possono avere, o di fatto
ford, Luciano Floridi, una cultura sviluppata strare, sottolineare e sostenere la bont dei hanno sulla stessa, si pu mirare a un mi-
non si preoccupa soltanto di accumulare dati, suoi prodotti, la disponibilit immediata di glioramento della gestione e programma-
ma ne ha anche cura: li analizza, li inserisce questa mole di dati non pu passare in secon- zione della salute pubblica. Infatti, i dati
in un contesto, li interpreta. Oggi, invece, la do piano. possono consentire di prevedere meglio
velocit dellinformazione cancella e riscri- I big data possono rappresentare un punto la diffusione delle malattie, permettono
ve in un ciclo continuo. La storia rischia di di incontro per convogliare e condividere in- alle societ scientiche di stilare linee gui-
essere ridotta a un perenne hic et nunc e noi tenti, interessi, approfondimenti per tutti gli da e produrre raccomandazioni basate su
potremmo nire imprigionati in un perenne attori, pubblici e privati, coinvolti nel mondo maggiori evidenze di trattamento-effetto,
adesso1. della salute (agenzie regolatorie, pagatori, pa- supportano lottimizzazione dei percorsi
Linvito ad aver cura dei dati, in particolar zienti, industria, clinici, accademia). diagnostico terapeutici assistenziali, ridu-
modo, si applica bene a tutte le informazioni Infatti, possono portare valore e innova- cendo le aree di inefcienza e sostenendo
(dati) che quotidianamente vengono raccolte zione poich: lintroduzione delle tecnologie pi inno-
e archiviate sulla nostra vita da paziente. offrono la possibilit di generare una mag- vative.
evidente, infatti, che quando si parla di big giore conoscenza in ricerca e sviluppo al Non un caso che il Patto per la sanit digi-
data in ambito medico-sanitario la necessit ne di creare una base di osservazione per tale, pubblicato nel luglio del 2016, metta tra
di approfondire, inserire in un contesto e aree grigie che altrimenti non avrebbero ri- le sue priorit la creazione di nuovi modelli
interpretare sia ancora pi urgente rispetto sposta; organizzativi e di una cartella clinica condivi-
a una pratica di mera consultazione ammi- possono aiutare lindustria a creare dei sa, oltre che di sistemi informativi ospedalieri
nistrativa. Diventa importante analizzare e modelli predittivi ottimizzando le speri- integrati e soluzioni di business intelligence
comprendere i tanti dati raccolti e trasformarli mentazioni cliniche e migliorando la tra- per il monitoraggio dellappropriatezza del-
in evidenze. sferibilit delle conclusioni derivate da stu- le prescrizioni farmaceutiche. Linnovazio-
di clinici randomizzati, che sono effettuati ne digitale pu svolgere un ruolo chiave sia Maurizio Belfiglio*,
Big data, valore e innovazione su un numero di partecipanti limitato e nellevoluzione contemporanea dei modelli Cristina Mencarelli,
I dati che un cittadino/paziente genera nel non rappresentativo di tutte le tipologie di assistenziali sia in quelli organizzativi, come Lara Pippo^
momento in cui incrocia il sistema sanitario pazienti che vengono invece trattati nella fattore abilitante e in taluni casi determinante
*Head Value Proposition,
nazionale sono molteplici (prescrizioni, vi- pratica clinica; per la loro realizzazione2. Abbvie;
site, ricoveri, ecc.) e rappresentano una fon- possono supportare il decisore (pagatore
Regional Affairs
te inestimabile di informazioni. Se oppor- e clinico) con dati pi realistici su cui
I big data possono Manager, Pfizer;
tunamente consultati e incrociati (linkati), basare le proprie decisioni. Attraverso la-
^
consentono di raccontare la storia clinico- nalisi dei big data si potrebbero produrre rappresentare un punto Head of Market Access
assistenziale di popolazioni di assistiti. Rap- raccomandazioni mediche, terapeutiche e CSL Behring
di incontro per convogliare Biotherapies for Life.
e condividere intenti, interessi,
Il valore dei big data per lindustria del farmaco approfondimenti per tutti
gli attori, pubblici e privati,
Ricerca Screening in silico coinvolti nel mondo
Diagnostica genomica
Previsione della tossicit
della salute.

Sviluppo Simulazione del trial clinico Competitive insight La scienza, dunque, deve imparare un nuo-
Reclutamento dei pazienti Individuazione di bisogni insoddisfatti vo modo per stare al passo con se stessa e le
Disegno del trial Sviluppo dossier per la rimborsabilit aziende farmaceutiche non possono esimersi
Denizione delle priorit dal contribuire a creare un processo virtuoso.
Una delle pi grandi sde, infatti, proprio la
Market Negoziazione protocolli / formulari
capacit di gestire e integrare i dati in tutta la
access Pricing sulla base del valore
catena del valore del farmaco, dalla scoperta
Collaborazione con il payor
(ad esempio, selezione dei pazienti, aderenza) di nuove molecole al loro uso nel mondo rea-
le, dalla possibilit di comprendere meglio il 1. Milluzzi A. Big data,
Commerciale Informazioni sul consumatore (consumer data, social media) paziente al ritagliare le terapie sulla base delle Luciano Floridi: Ecco
Ottimizzazione multichannel sue esigenze e caratteristiche. perch laffare del
Strategie di eccellenza nel lancio terzo millennio.
Posizionamento del marchio Un momento di confronto e crescita Economy up 2016,
per pubblico e privato 28 aprile.
Medica Monitoraggio della sicurezza I big data e i real world data sono fonda- 2. Patto per la sanit
Educazione mirata al paziente mentali per passare dalla fase previsionale digitale. Documento
e al medico programmatico.
a quella di verica nella pratica clinica e per
implementare un processo di valutazione dei 3. Patarnello F, Recchia G,
Attivit Analisi delle qualit Ricciardi W, Favaretti
farmaci cos detto Hta 2.0. Vi unevidente
Programmazione/previsioni catena di approvvigionamento end-to-end C. Hta traslazionale
Esternalizzazione potenzialit nel realizzare un continuum del- cercasi. Il Sole 24 Ore
Strategie dei canali di distribuzione le evidenze necessarie per la registrazione, il Sanit 2011;
rimborso e la ricerca post-autorizzativa. In Anno XIV(13).

1116-FWD-04_xweb.indd 24 17/11/2016 16:32:20


www.forward.recentiprogressi.it forward | 25

La ricerca in un mare di dati


Generare nuovi ipotesi da verificare con gli strumenti dellebm

I
big data hanno assunto un ruolo sem-
pre pi centrale nella raccolta, ela-
borazione e interpretazione di dati. Eugenio Santoro
questultimo ambito, il cambiamento potrebbe consistere nellin- Partiamo da alcuni numeri: l80% dei Laboratorio di
tegrare differenti soggetti con un approccio pi ampio, nel quale dati generati quotidianamente non strut- Informatica medica
tutte le risorse (competenze, dati, nanziamenti) concorrono nel turato, cio non proviene da archivi e da- Irccs - Istituto
completare il prolo di evidenze delle nuove tecnologie e ridurne i tabase predeniti e codicati ma piuttosto di ricerche
rischi3. Il paradigma delle produzioni di informazioni sui farmaci dal web, dai blog, dai social network e dai farmacologiche
molto cambiato negli ultimi 10 anni: se prima lintero pacchetto forum. C addirittura chi sostiene che nel Mario Negri
informativo veniva prodotto dallazienda e valutato dal decisore, 2020 tale tipologia di dati rappresenter il
oggi ogni stakeholder promotore e produttore di dati ed evidenze. 100%. A ci occorre aggiungere il fatto che naturale e di proporre risposte basate sulle
I decisori e pagatori italiani trattano questi temi a livello interna- la diffusione di smartphone, wearable e, in evidenze scientiche), al ne di individuare
zionale anche se nella realt la loro applicazione ai ni decisionali generale, dellinternet of things sta producen- nuovi approcci sulle cause, sui trattamenti
(prezzo e rimborso, gestione del ciclo di vita del prodotto) com- do una quantit enorme di dati, anche in e sulla prevenzione delle malattie cardio-
plessa e poco regolamentata. Tuttavia la produzione di big data ambito sanitario. Si stima che ogni giorno, vascolari. E c gi chi, come il Memorial
potenzialmente positiva sotto molteplici aspetti e per diversi attori: sommando a questi dati quelli provenienti Sloan Kettering cancer center di New York,
stimola lappropriatezza duso dei farmaci e il governo della spe- dalle conversazioni su internet, si sori la ha integrato queste soluzioni allinterno del
sa; tutela tutti i portatori di interesse (agenzie regolatorie, pagatori, cifra di 2,5 miliardi di miliardi di byte. La percorso assistenziale dove Ibm Watson col-
pazienti, industria, clinici, accademia); alimenta la collaborazione crescita stata impetuosa soprattutto nel labora con i gli oncologi di questa struttura
tra istituzioni, industria, accademia, esperti e decisori; incoraggia la corso degli ultimi due anni, durante i quali per diagnosticare un tumore e identicare la
cooperazione pubblico-privato sulla generazione di evidenze e la stato generato il 90% dei dati disponibi- cura migliore.
diffusione di quanto gi stato raccolto; sostiene un processo dina- li oggi nel mondo. Addirittura si stima che Dal punto di vista della ricerca clinica,
mico di valutazione che include diversi portatori di conoscenze. Le ogni persona, attraverso le proprie appendi- limpiego dei big data potrebbe aggiunge-
aziende, dal canto loro, prevedono gi investimenti per i big data, ci elettroniche e le operazioni che compie re molto agli strumenti oggi impiegati. Per
nanziando studi pre- e post-registrativi, sostenendo il fondo per nella quotidianit, contribuisca a produrre esempio, potrebbero essere utilizzati per
la ricerca indipendente e i registri di monitoraggio Aifa, erogando al minuto 1,7 megabyte di dati. analizzare in modo integrato i dati genomi-
contributi per creazione e sostegno di grandi registri di patologia e Non c dubbio che siano necessarie tec- ci, medico-sanitari, nutrizionali ed econo-
alimentando in modo diretto e indiretto attivit di ricerca su data- niche di analisi in grado di interpretare que- mico-sociale, con lobiettivo di individuare
base amministrativi. sta grossa mole di dati, cos da poter attivare possibili cure per diverse patologie (questo

Si devono sostenere una produzione Disporre di pi dati non signica necessariamente


e una metodologia di interrogazione disporre di pi conoscenza.
dei dati di qualit. ... Ma manca
un sistema a doppio senso premiante tutta una serie diniziative che in ambito sa- proprio uno degli obiettivi di Human
sia per il pubblico sia per il privato. nitario potrebbe portare a un miglioramen- technopole elaborato dallIstituto italiano
to dellassistenza sanitaria, alla riduzione di tecnologia). Oppure, semplicemente mo-
dei costi per lerogazione dei servizi, alla nitorando le conversazioni sui social media,
Servono gure preparate, esperte in epidemiologia, sociologia, fruizione di servizi che aiutino a supportare possono essere usati per raccogliere ed ela-
statistica. Si devono sostenere una produzione e una metodologia le decisioni cliniche, alla realizzazione di si- borare dati legati alla frequenza dei sintomi
di interrogazione dei dati di qualit. Il passaggio dal dato allevi- stemi di sorveglianza delle malattie e di far- di una malattia, agli effetti collaterali regi-
denza non pu prescindere dalla fase di validazione e di discussio- macovigilanza e, in generale, alla gestione strati dal paziente in seguito alla assunzio-
ne critica. Le aziende farmaceutiche sono sempre pi consapevoli della salute pubblica. ne di un dato farmaco, o alla diffusione di
che il potenziale di questo strumento si realizza solo attraverso la In questa direzione vanno numerose speciche malattie infettive. O ancora, ela-
trasparenza e la collaborazione, ma manca un sistema a doppio iniziative intraprese nel corso degli ulti- borando i campi note di una cartella clinica
senso premiante sia per il pubblico sia per il privato. mi anni, soprattutto da parte dei colossi elettronica, potrebbero aiutare a catturare in
Le problematiche che si incontrano sono note e, purtroppo, la dellinformatica, spesso in collaborazione profondit dettagli che racchiudono infor-
loro risoluzione non sembra immediata: ostacoli in Italia per gli con le multinazionali del farmaco. Alcune mazioni di valore sulla salute del paziente.
investimenti, costi e burocrazia, e scarsa chiarezza su regole di recenti iniziative vedono coinvolti diverse Tutto ci rappresenta unalternativa agli
accesso ai data base, in primis, fanno emergere la difcolt di gesti- alleanze: Sano e Google Life Science (la di- strumenti oggi in uso per fare ricerca clini-
re gli intenti comuni e i (legittimi) conitti di interesse che si pos- visione di Google che si occupa di sviluppa- ca? Non detto che ci sia vero. Concetti
sono superare solo con la trasparenza e la chiarezza degli obiettivi. re nuove tecnologie in ambito medico) per come la rappresentativit, la riproducibili-
Si percepisce, sempre pi, la necessit di adottare un linguaggio sviluppare nuovi strumenti che integrino i t dei risultati, levidence based medicine
comune, di avere accesso ai dati gi disponibili, di adottare una vari approcci terapeutici e di controllo nei sono piuttosto distanti dalle tecniche di big
metodologia rigorosa e condivisa per avere evidenze riproducibili, pazienti con diabete di tipo 1 e di tipo 2; data che, sebbene lavorino su grandi mole
di stabilire una partnership trasparente con i decisori per la deni- Medtronic e Samsung per il monitoraggio e di dati, possono contenere al loro interno
zione di come e perch produrre big data, di avere una legislazione lanalisi di dati ottenuti da nuovi strumenti delle distorsioni. Il loro impiego potrebbe
dedicata e aggiornata. Privacy, etica, raccolta, propriet, capacit di di monitoraggio; Novo Nordisk e Ibm per invece risultare prezioso nel generare ipote-
interrogare correttamente i dati e di trasformarli in evidenze sono migliorare la gestione dei pazienti diabetici. si che devono poi essere studiate e vericate
alcuni dei temi ricorrenti che vengono sollevati da pi parti e che Anche le societ scientiche negli Stati attraverso gli strumenti (come le sperimen-
difcilmente trovano ora una risposta valida per tutti. Uniti stanno entrando in questo settore, tazioni cliniche controllate, gli studi osser-
Il futuro, o forse sarebbe pi corretto dire il presente, richiede come dimostrano gli accordi tra lAmerican vazionali e quelli epidemiologici) della me-
quindi una collaborazione pubblico-privato sulluso dei big data e heart association e Google Life Science, e dicina basata sulle prove.
la creazione di un network di eccellenza per la generazione di evi- quelli tra la stessa associazione scientica e Daltra parte, disporre di pi dati non
denze, in cui tutti gli stakeholder (Aifa, Istituto superiore di sanit, lIbm Watson Health (la divisione di Ibm signica necessariamente disporre di pi
il mondo accademico, le societ scientiche, lindustria farmaceu- che gestisce il super calcolatore Watson in conoscenza. La disponibilit di dati pi
tica e dei device, le associazioni dei pazienti, le Regioni, il garante grado, attraverso tecniche di intelligenza complessi non dovrebbe farci dimenticare
della privacy) trovino un consenso sulle migliori soluzioni a queste articiale e di cognitive computing, di analiz- limportanza che ha il programma di ricer-
problematiche. Riconoscerne la priorit deve essere il passo succes- zare elevati volumi di dati, di comprendere ca e linterpretazione appropriata dei risul-
sivo perch il fattore tempo vitale e impietoso. F domande complesse poste in linguaggio tati. F

1116-FWD-04_xweb.indd 25 17/11/2016 16:32:20


26 | forward BIG DATA 4 / 2016

Quando i big data possono


diventare scomodi
Dalla produzione e gestione dei dati alle scelte politiche

I
l termine big data diventato e temporale delluso di questi dati determi- gressivo decremento delle stime nel sud, per
di gran moda. Sulla base na una grande, ma non sempre attentamente giungere a straordinari valori inferiori al 4%
dellesperienza di chi ha visto considerata, eterogeneit della riproducibilit in Sicilia. Ricordo, oggi con un sorriso, le fan-
gi molto tempo fa nei dati e della validit dei dati che riguardano i ri- tasiose interpretazioni di questi risultati da
amministrativi la potenzialit di trarre coveri ospedalieri, non solo in Italia peraltro. parte di alcuni, anche illustri, non solo clinici
da questi nuova conoscenza, la nuova Quando il Programma nazionale esiti (Pne) ma anche epidemiologi: la dimostrazione del
attenzione al tema frutto di qualche ha iniziato la propria attivit, lestrema va- potente ruolo protettivo della dieta mediter-
novit particolare o siamo di fronte alla riabilit della qualit dei dati delle sdo ha ranea (ipotesi etiologica: fattore protettivo
riproposizione di qualcosa che ben si proposto una sda metodologica e operativa per letalit dopo ima). Oppure la clamoro-
conosce? molto impegnativa. Intervista a sa sconfessione dellopinione molto diffusa
Dati amministrativi? Non so cosa siano i Carlo Alberto della bassa qualit dellassistenza ospedaliera
dati amministrativi. Sistemi informativi con Alcuni esempi? Perucci nel meridione. I dati empirici mostravano
vari contenuti possono essere utilizzati per Negli anni Novanta in Italia non solo non chiaramente il ruolo protettivo della dieta
scopi diversi, anche di carattere amministra- era possibile ma non era nemmeno proget- gi direttore mediterranea e/o lottima efcacia del tratta-
del Programma
tivo, ma queste sono caratteristiche dellu- tata la interconnesione sistematica a livello mento degli episodi di ima negli ospedali del
nazionale esiti
tilizzazione, non dei dati per s. Tuttavia le nazionale tra le sdo e le schede di morte; sud. Ma il controllo dei dati sdo consent di
nalit per le quali viene disegnato e gestito solo alcune regioni avevano anticipato i tem- tener conto di unaltra ipotesi valutativa: per
un sistema informativo, e il contesto socia- pi con propri sistemi informativi ospedalie- fattori culturali e sociali in molte aree del me-
le, culturale e istituzionale determinano in ri e con i cosiddetti registri nominativi delle ridione le famiglie ritenevano, e in molti casi
modo rilevante la riproducibilit e la validit cause di morte, interconnetendoli. Quindi a oggi ancora ritengono, disonorevole la morte
dei dati. Ancor di pi: la variabilit tempo- livello nazionale era possibile stimare esclu- di un congiunto in ospedale. Quindi, anche
rale e geograca degli utilizzi di un sistema sivamente la mortalit intraospedaliera. Alli- per cinici fenomeni speculativi altres connes-
informativo si associano sempre a variabilit nizio del nuovo secolo le stime di mortalit si a organizzazioni maose, le persone dece-
della riproducibilit e della validit dei dati. intraospedaliera dopo un episodio di infarto dute in ospedale venivano dimesse come vive
Le cosiddette schede di dimissione ospeda- miocardico acuto (ima) davano valori relati- e contro il parere dei sanitari, e trasportate a
liera (sdo), oggi molto utilizzate per la re- vamente omogenei nel nord e centro Italia, casa dove veniva certicato il decesso. Linter-
munerazione prospettica delle prestazioni di attorno a circa il 10%, con un rapido pro- connessione tra sdo e registri di morte permi-
assistenza ospedaliera, erano certamente gi
presenti in Italia negli anni Settanta, prima
in modalit campionaria e poi sistematica,
ben prima che negli anni Novanta iniziasse
il loro uso a ni amministrativi. Ma la re-
munerazione dei soggetti erogatori di assi-
stenza ospedaliera stata introdotta in modo
eterogeneo nel tempo, tra diverse regioni, per
diverse tipologie di aziende, pubbliche e pri-
vate; ancor oggi molti ospedali, soprattutto
pubblici e nel meridione, non sono nanziati
sulla base del valore della loro produzione
che viene calcolato attenendosi alle sdo. Que-
sta forte eterogeneit geograca, istituzionale

1116-FWD-04_xweb.indd 26 17/11/2016 16:32:20


www.forward.recentiprogressi.it forward | 27

se quindi di svelare il fenomeno e migliorare un contesto di misurazione per intensit as- stime di esito aggiustate che tenessero con-
la validit delle stime della mortalit intrao- sistenziale, vengono registrate e codicate su to dei fattori confondenti di ciascun indica-
spedaliera dopo infarto che nel sud risultava sdo solo nei casi di minore gravit. tore. Sulle prime parve straordinario come i
in media simile a quella del centro e del nord. consulenti avessero (nalmente) colto lidea
Ma questo problema di validit dei dati, non Nulla di nuovo, dunque del confondimento nei confronti concetto
uno dei soliti difetti italiani: credo che anco- Certamente oggi si presentano maggiori spesso assai ostico da capire negli ambienti
ra oggi lOrganizzazione per la cooperazione opportunit per disponibilit di tecnologie professionali sanitari, per non dire in quel-
e lo sviluppo economico (Ocse) stimi la mor- informatiche, sia hard sia soft, che consen- li politici. Ma fu difcile spiegare come non
talit intraospedaliera post-infarto per tutti i tono in tempi brevi il trattamento di grandi fosse possibile produrre procedure di risk
paesi europei, poich in alcuni non sarebbe volumi di dati e lo sviluppo di metodi stati- adjustment standard, ma fosse necessario
possibile linterconnessione sistematica tra stici avanzati che ne possono permettere ana- sviluppare modelli di risk adjustment speci-
sistemi informativi ospedalieri e i registri di lisi molto potenti. Tuttavia, questa grande ci di ciascun confronto, di ciascun periodo
morte. Gli stili di cura inpatient e outpatient disponibilit di dati e tecniche di analisi au- temporale, valutandone la validit e le poten-
sono eterogenei nel tempo e da un paese a un menta i problemi di riproducibilit e di vali- ziali distorsioni legate, soprattutto, alla etero-
altro, e il confronto della mortalit intraospe- dit non solo dei dati ma, soprattutto, delle geneit temporale e geograca della validit
daliera affetto da forti distorsioni; tuttavia stime e delle loro interpretazioni. dei dati (big) utilizzati, e agli effetti sulla pre-
molti esperti e molti politici usano talora in Probabilmente torna il grande dilemma cisione delle stime aggiustate.
modo acritico le stime dellOcse senza tener metodologico tra approcci induttivi e meto- A proposito di dati aggiustati, mi si per-
conto di questi rilevanti limiti di validit. di ipotetico-deduttivi. Personalmente ritengo metta un episodio. A una Commissione del
Ancor oggi unanalisi esplorativa, cos importante formulare ipotesi, etiologiche e Senato, tra pochi senatori, alcuni annoiati,
cara a certi maneggioni di big data, consenti- valutative, basate sulle conoscenze disponi- altri interessati, vi una rapida presentazio-
rebbe di osservare alcuni singolari fenomeni. bili, da sottoporre a processi di falsicazione ne di Pne; con diapositive sintetiche che ri-
Ad esempio, negli ospedali italiani, iperten- utilizzando metodologie rigorose e traspa- portano stime comparative tra ospedali, si
sione, diabete, broncopneumopatia cronica renti. Attenzione, basarsi sulle conoscenze sottolinea che i risultati sono aggiustati. Una
ostruttiva e altre patologie croniche sembra- disponibili non signica assolutamente con- senatrice, furibonda, chiede la parola: Come
no essere fattori protettivi nella mortalit a 30 siderare solo ipotesi plausibili, semmai avere vi permettete di presentare al Senato delle
giorni dopo ima, ancor pi protettivo sembre- il coraggio di sottoporre a valutazione anche Repubblica dati aggiustati!. Molti altri aned-
rebbe il fumo di tabacco. Artefatti In realt o soprattutto ipotesi altamente improbabi- doti potrebbero essere raccontati sulla grande
questi risultati dipendono esclusivamente da li, contrarie al senso comune dominante e difcolt, da parte dei politici e soprattutto
un noto fenomeno di codica competitiva, sgradite alla politica e cultura del momento. dei giornalisti, a interpretare correttamente
quando patologie croniche, meno rilevanti in Tanto pi sar big la quantit dei dati dispo- gli errori casuali, le magiche p e gli effetti
del caso.
Emergono atteggiamenti culturali e politi-
ci talora contrastanti: sottovalutazione degli
Laumento delle conoscenze disponibili, anche attraverso aspetti di metodo; riuto di considerare errori
casuali e sistematici o, viceversa, enfatizzazio-
i big data, non destinato a ridurre lincertezza, semmai a renderci ne opportunistica di errori; sopravalutazione
maggiormente consapevoli di tutto quello che non conosciamo. degli aspetti informatici e gestionali dei dati.
In generale si riproduce il noto paradosso nei
sistemi sanitari: quando mancano informa-
nibili, tanto maggiori saranno i problemi zioni per decidere, i decisori sostengono di
metodologici nella loro produzione, analisi e essere costretti a decidere in assenza di infor-
utilizzazione, e tanto maggiori dovranno es- mazioni utili; quando invece le informazioni
sere il rigore nella formulazione a priori delle sono disponibili, e talora abbastanza forti,
ipotesi e la trasparenza nella discussione e i decisori preferiscono non considerarle nem-
interpretazione delle informazioni derivate, meno, per potere decidere come vogliono.
dei loro limiti, dei potenziali errori casuali e Quindi istituzioni, politici e decisori sono
sistematici. pronti, a parole, a creare e nanziare grandi
Nessun disegno di studio, su nessuna sistemi informativi, basi di dati sempre pi
ipotesi etiologica o valutativa, privo di er- grandi, infrastrutture informatiche costosissi-
rori sistematici e casuali. I risultati di gran- me e faraoniche, salvo poi non sapere o vole-
di trial clinici randomizzati (rct) sono affet- re utilizzare le evidenze prodotte dalla loro
ti da distorsioni (soprattutto, ma non solo, utilizzazione e analisi, soprattutto quando
per selezione e modicazione delle misure limitano i gradi di libert delle decisioni. Di
di effetto), come lo sono quelli dei grandi questo processo sono spesso complici esper-
studi osservazionali (soprattutto per confon- ti, anche epidemiologi, pronti a produrre
dimento). Forse, tuttavia, qualcuno pensa, risultati, analisi, informazioni funzionali, a
per esempio nel campo della valutazione di giusticare decisioni (politiche) gi prese. E
efcacia dei trattamenti sanitari, di superare guai a quelli che formulano ipotesi e produ-
il rigore (apparente) metodologico dei trial, cono conoscenze considerate contrarie, non
per affermare una pratica corrente di studi compatibili, comunque fastidiose, critiche
osservazionali usando soprattutto big data, con gli orientamenti decisionali dei potenti
molto quick and dirty, perch ritenuti pi di turno.
manipolabili e adattabili a speciche nalit Laumento delle conoscenze disponibi-
commerciali. La risposta tuttavia non la di- li, anche attraverso luso di big data, non
fesa a oltranza degli studi sperimentali e del destinato a ridurre lincertezza, semmai a
loro (apparente) rigore ma laffermazione, renderci maggiormente consapevoli di tutto
negli studi osservazionali che usano big data, quello che non conosciamo. In altre parole
di metodi scientici rigorosi, altrettanto o pi la produzione di enormi volumi di dati e di
complessi e costosi di quelli degli rct. informazioni non semplica gli scenari deci-
Anni fa, nella fase sperimentale di Pne, gli sionali, anzi costringe i decisori ad aver a che
esperti di una grande societ di consulenza, fare con livelli pi complessi di incertezza e a
che fornisce al Ministero della salute servizi essere esposti a maggiori e pi documentate
di sistemi informativi, chiesero di produrre e critiche.
fornire per ciascun indicatore di esito model- Mi permetto di dire che il problema non
li di risk adjustment e di controllo del con- quanto big siano i dati, ma quanto sono gran-
fondimento da inserire nella base di dati del di, forti e oneste lautonomia, lindipendenza
Nuovo sistema informativo sanitario (Nsis), e lintegrit di coloro che li progettano, gesti-
in modo da produrre automaticamente scono, analizzano e interpretano. a p.28

1116-FWD-04_xweb.indd 27 17/11/2016 16:32:22


28 | forward BIG DATA 4 / 2016

da p.27
Con i big data si fa spesso riferimento tivi interconnessi del Servizio sanitario nazionale poter continuare a decidere arbitrariamente
(anche) a flussi di dati non strutturati di cui al presente comma in modalit anonima. senza spiegare le ragioni delle decisioni e sen-
generati dai social. I limiti legati alla Pi chiaro di cos il legislatore non po- za dover rispondere dei loro effetti?
qualit del dato, alla definizione teva essere. Ma lattuazione di questa legge, Ovvero, anche nel Ssn la burocrazia il
di protocolli affidabili rispetto a avanzatissima per quei tempi e certamente male oscuro di questo paese, oppure una
quesiti clinici precisi, alla difficolt nel senso della creazione di big data per la certa politica che usa la burocrazia per non
di gestire la privacy sono simili a valutazione e il governo del Ssn, avrebbe poi dover rispondere delle proprie scelte?
quanto gi presente negli attuali flussi comportato: la acquisizione dei pareri della
amministrativi? cabina di regia del Nisis, della Conferenza La velocit di produzione e messa a
Personalmente riuto la denizione di permanente per i rapporti tra lo Stato, le re- disposizione dei nuovi big data sembra
ussi amministrativi: non ho nessun pre- gioni e le province autonome, e dellAutorit un vantaggio rispetto ai dati generati
giudizio nelluso di questi dati, a condizione garante della privacy, del Consiglio di stato; dalle rilevazioni fatte fino ad oggi con
che siano utilizzati, analizzati e interpretati te- poi il nulla osta della Presidenza del Consi- i sistemi correnti. Si tratta di un vero
nendo conto, con metodi rigorosi, delle loro glio dei ministri, il visto del Ministro guarda- avanzamento? E riguardo alla variet e
caratteristiche di riproducibilit e validit. sigilli, la registrazione della Corte dei conti, al volume?
In quanto alla questione della cosiddetta inne la pubblicazione sulla Gazzetta ufciale Credo di aver risposto a questa domanda.
privacy, mi si consenta una premessa. Non e lattuazione da parte delle regioni, prevista Grandi ed efcienti basi di dati di buona qua-
solo in Italia certo, ma soprattutto nella de- allora per linizio del 2015. Il 2015 passato, lit sarebbero molto utili alla ricerca etiolo-
gradata e arretrata condizione delle nostre il 2016 sta nendo e i decreti sulla intercon- gica e valutativa e consentirebbero di fornire
burocrazie, nella sua attuale modalit di fun- nessione e quello sulle sdo non sono ancora importanti e tempestive informazioni per le
zionamento, la cosiddetta Autorit garante pubblicati sulla Gazzetta ufciale decisioni di gestione e di governo dei siste-
della privacy potrebbe essere da alcuni con- Anni e anni per realizzare una riorganiz- mi sanitari. Ben vengano quindi big, anche
siderata, alla stregua del fumo di tabacco, zazione dei sistemi informativi che, in altri very, extremely big data, a condizione tuttavia
dellinquinamento ambientale e di alcune paesi e in altre culture, avrebbe richiesto solo che siano utilizzati con trasparenza e rigore
epidemie di malattie trasmissibili, uno dei pochi atti amministrativi. In questo ritardo metodologico, con la consapevolezza che la
principali fattori di rischio per la salute del- spaventoso ha giocato un inammissibile ruo- moltiplicazione delle fonti, della quantit e
la popolazione con un potente fenomeno di lo ostativo, dilatorio lAutorit garante della tipologia dei dati e dei loro trattamenti mol-
modicazione/moltiplicazione di effetto con privacy con continui rinvii e obiezioni, sem- tiplica le fonti di errore. Ancora una volta,
le altre burocrazie. Ce ne sarebbero molti di pre alla scadenza dei termini, in un tiramolla guardando una fotograa bene ricordare
buoni motivi. Un esempio: attorno al 2010, paralizzante e defatigante. che le caratteristiche della macchina fotogra-
anche sulla base delle proposte di Agenas, ca sono altrettanto importanti della (teori-
allora diretta da un innovatore intelligente Quali potrebbero essere le ragioni ca) realt che il fotografo intende riprendere.
come Fulvio Moirano, il Ministero della salu- di questo ritardo? Ogni misura un esercizio di errore, ma nulla
te, un po controvoglia in alcune sue burocra- A taluni venuto il sospetto che in que- possiamo conoscere di quello che non misu-
zie, diede nuova spinta a un processo di revi- sto incredibile ritardo abbiano giocato fatto- riamo.
sione dei contenuti informativi delle sdo e a ri non dichiarati, come i contrasti tra gestori In quanto alla velocit mi pongo una do-
un progetto di integrazione delle basi di dati commerciali dei sistemi informativi in diversi manda: come possibile pensare a velocissi-
del Sistema sanitario nazionale (Ssn), peral- ministeri o lostilit di qualche settore profes- mi big data quando per ottenere una sempli-
tro gi avviato allinizio degli anni Duemila sionale. Ad esempio la nuova sdo dovrebbe ce modica dei contenuti informativi della
con il cosiddetto progetto Mattoni, con una contenere lidenticazione dei chirurghi per sdo ci sono voluti cinque anni? Avremmo gi
esplicita interconnessione tra i diversi cosid- ciascuna procedura chirurgica, informazione disponibili grandi e relativamente veloci si-
detti ussi informativi correnti. Era un obiet- che consentirebbe di stimare il volume di at- stemi informativi che, se interconnessi, costi-
tivo ambizioso linterconnessione a livello tivit dei professionisti e di valutarne gli effet- tuirebbero una base di dati grande e potente,
nazionale delle informazioni individuali tra ti sugli esiti, ma anche di controllare possibili ma le burocrazie che paralizzano il paese ne
sdo, farmaceutica, specialistica, emergenza, distorsioni nello svolgimento delle attivit impediscono la realizzazione e luso.
pronto soccorso, riabilitazione e tutti gli al- professionali. Magari, ad esempio, si potreb- Siamo veramente convinti che la politica,
tri sistemi informativi su base individuale del be anche scoprire che alcuni illustri cattedra- nelle sue diverse articolazioni, voglia vera-
Ssn con lanagrafe tributaria, allora, e ancor tici o alcune scuole di specializzazione non mente i big data che, se utilizzati con meto-
oggi, unica anagrafe di popolazione attiva a hanno sufcienti volumi di attivit. di scientici rigorosi e in modo trasparente,
livello nazionale. Questa importante azione Di fatto le burocrazie hanno no ad oggi potrebbero produrre informazioni capaci di
di riorganizzazione del sistema informativo bloccato questi importanti cambiamenti nel- condizionare e criticare le scelte politiche, li-
del Ssn viene esplicitamente sancita per ini- le informazioni disponibili per il Ssn, impe- mitandone comunque i gradi di libert, lar-
ziativa di Renato Balduzzi, divenuto Ministro dendo tante possibili analisi etiologiche e bitrio e, soprattutto, costringendo tutti a ren-
della salute e grande sostenitore dei sistemi valutative importanti per la tutela della salute dere esplicita lincertezza e a rendere ragione
di valutazione, e con il contributo decisivo della popolazione. Quanti studi su fattori di delle proprie scelte?
di alcuni senatori, tra i quali mi piace ricor- rischio ambientale e occupazionale sarebbe-
dare Lionello Cosentino, dalla Legge nume- ro stati possibili se i dati interconnessi del Ssn
ro 135, del 7 agosto 2012. Stiamo parlando fossero stati tempestivamente resi disponibi-
delle cosidetta spending review del governo li alla agenzie competenti e alle strutture di
Ogni misura un esercizio di errore,
Monti che allarticolo 15 comma 25 bis, cos ricerca qualicate? Quanti farmaci avrebbe- ma nulla possiamo conoscere di quello
recita: Ai ni della attivazione dei programmi ro avuto una pi rapida e valida valutazione che non misuriamo.
nazionali di valutazione sullapplicazione del- comparativa di efcacia (o di inefcacia)?
le norme di cui al presente articolo, il Ministero Quanta inappropriatezza in strutture e servizi
della salute provvede alla modica e integrazione sanitari avrebbe potuto essere meglio identi-
di tutti i sistemi informativi del Servizio sanitario cata? Quante tecnologie sanitarie avrebbero
nazionale, anche quando gestiti da diverse am- potuto essere meglio valutate? Quanta della
ministrazioni dello Stato, e alla interconnessione tanto osannata eccellenza avrebbe potuto
a livello nazionale di tutti i ussi informativi su essere validamente certicata, consentendo
base individuale. Il complesso delle informazioni ai cittadini scelte pi informate nei luoghi di
e dei dati individuali cos ottenuti reso disponi- cura?
bile per le attivit di valutazione esclusivamente Viene spontanea una domanda: sono corpi
in forma anonima ai sensi dellarticolo 35 del e settori burocratici arretrati e conservatori a
decreto legislativo 23 giugno 2011, n.118. Il Mi- ostacolare lo sviluppo di una pi valida base
nistero della salute si avvale dellAgenas per lo informativa sulla quale fondare valide ana-
svolgimento delle funzioni di valutazione degli lisi etiologiche o valutative nel Ssn? Oppure
esiti delle prestazioni assistenziali e delle proce- esiste una diffusa, nemmeno tanto nascosta,
dure medico-chirurgiche nellambito del Servizio volont politica che non vuole informazioni
sanitario nazionale. A tal ne, Agenas accede, in valide e tempestive sulla salute della popo-
tutte le fasi della loro gestione, ai sistemi informa- lazione e sullefcacia dei servizi sanitari per

1116-FWD-04_xweb.indd 28 17/11/2016 16:32:22


www.forward.recentiprogressi.it forward | 29

Il labile conne tra riservatezza


ed esposizione
La vulnerabilit dei big data senza regole sulla privacy.
La necessit di un cambio di paradigma in una prospettiva di ricerca sociale

innegabile che luso dei big data offra tavano Topol e colleghi, quasi un utente su dei big data in sanit e, ancora meno, il 9%

potenzialmente opportunit enor-


mi anche per il settore sanitario e che
stiano rivoluzionando il nostro modo
quattro apre questo tipo di email, offrendo di
fatto il anco ai malintenzionati.
Il risultato che il processo di implementa-
si dotato di policy per vigilare sulluso dei
dati sanitari da parte di privati. Inoltre, solo
il 26% dei paesi rispondenti al sondaggio af-
di essere cittadini e pazienti. Flussi sempre zione di una e-health autenticamente basata ferma di avere attivi sistemi di vigilanza sui
maggiori di dati permettono di denire trend sulluso dei big data ancora un miraggio e sistemi mobile per garantire la sicurezza e la
e tendenze, intercettare i bisogni dei cittadi- la barriera principale appunto la sicurezza, qualit nel trattamento dei dati e un paese su
ni, anticipare eventuali problemi nellambito la corazza troppo fragile su cui i sistemi sani- due non ha una legislazione precipua per per-
della sanit pubblica, per esempio di carattere tari possono fare afdamento per garantire la mettere agli individui laccesso ai propri dati
epidemiologico, per non parlare dei conse- privacy dei cittadini. Di fatto i problemi aper- nel fascicolo sanitario elettronico o una legi-
guenti vantaggi in termini di costi. Laggettivo ti dallutilizzo dei big data sono ben lungi slazione che consenta al paziente di decidere
big si applica, infatti, al concetto di infor- dallessere risolti, cos come siamo lontani dal con chi condividere ogni singola partizione
mazione in tre direzioni: dal punto di vista poter parlare di unimplementazione sicura di dati del proprio fascicolo.
del volume di dati che si possono raccogliere dei sistemi di e-health. Non un caso, infatti, Seguendo la classicazione dellEnisa
(quantit), dellalta variabilit di queste infor- che lultimo rapporto sullargomento pubbli- (Agenzia europea per la sicurezza delle reti
mazioni (cio dalla provenienza contempora- cato dallUfcio europeo dellOrganizzazione e dellinformazione), i principali problemi
nea da pi fonti) e, inne, dalla velocit con mondiale della sanit (Oms) nel 2015 si in- per la privacy sono:
cui i dati possono essere raccolti, condivisi e titoli From innovation to implementation. 1. la perdita di controllo e trasparenza da par-
interpretati. E-health in the Who European Region: lin- te del sistema,
Tuttavia, big anche il divario fra le emer- novazione c, per limplementazione vi an- 2. la questione della riusabilit del dato,
genti opportunit che questo paradigma por- cora parecchio lavoro da fare, e la principale 3. i rischi che emergono per la privacy dalla
ta con s e la nostra capacit di far fronte ai barriera per la messa in pratica di sistemi di possibilit di incrociare i dati ottenendo
problemi che esso ci pone, per primi quelli e-health proprio la minaccia dal punto di nuove informazioni (a chi appartiene a
riguardanti la sicurezza e la privacy del titola- vista della privacy dei dati. I risultati messi in questo punto questa nuova classe di infor-
re dei dati, che rimane sempre lindividuo. luce dallOms sono netti: sebbene l80% dei mazioni?),
importante precisare che privacy e sicurezza paesi europei possegga una legislazione per 4. i rischi legati alle attivit di proling e de-
non sono sinonimi: la sicurezza essenziale la protezione della nostra riservatezza, solo il cision making sulla base dellanalisi dei big
per garantire la privacy. Stiamo vivendo in un 13% possiede una strategia per regolare luso data. a p.30
mondo a due velocit, dove la gara fra le
tecnologie pensate per garantire la sicurezza
dei sistemi informatici in termini di privacy Attacchi alla sicurezza nelle rete
e lattivit di hacker e truffatori assomiglia a Come gli hacker attaccano i dati sensibili della ricerca traslazionale.
quella fra Achille e la tartaruga. Per non par-
lare dei problemi strutturali intrinsechi allu-
tilizzo di sistemi informatici per lo stoccaggio
Cloud provider dello studio Sei mesi dopo
e il trattamento dei nostri dati, per esempio
quelli che scegliamo pi o meno consapevol-
mente di condividere attraverso app e device.

Intrusioni pericolose
Gli interessi che ruotano intorno alle in-
formazioni medico-sanitarie sono enormi.
Lo studio Privacy and security in the era of 7. Il partecipante
Reclama che sono state rilasciate
digital health: what should translational re- delle informazioni sensibili in modo
searchers know and do about it? pubblica- non aderente al consenso informato.
to nel marzo del 2016 a rma fra gli altri
di Eric Topol (autore nel 2012 del best seller
The creative destruction of Medicine) esa- 3. Lallegato infetto aperto
mina molto bene i due principali problemi
2. Il ricercatore Fa s che il maleware infetti
lapplicazione e il sistema che
Apre lemail e lallegato
dellattacker e risponde gestiscono i dati dello studio.
posti dallutilizzo dei big data in sanit dal al mittente.
punto di vista della privacy: lhacking da un
lato e le frodi dallaltro. Nel 2015 lhacking
stata la prima causa di violazioni negli Stati
Uniti e nel 2014 lhealthcare stato il settore 1. Lattacker 5. Cloud provider dello studio
che ha visto il maggior aumento di attacchi, Cerca su Google il sito
Tiene traccia delle operazioni
per il reclutamento dei pazienti
e solo dal 2013 al 2014 lambito sanitario ha dello studio. Manda via email eseguite sui dati del sistema
al team di ricercatori di gestione dei dati dello studio.
visto un incremento del 21,7% dei furti di delle domande sul consenso
identit. Le conseguenze economiche di tut- informato con un allegato
infetto.
to questo non sono affatto secondarie, dal 4. Lattacker
momento che nel 2015 il danno economico Con un accesso
segreto installato
stato maggiore del 125% rispetto a cinque dal malware (backdoor)
ruba informazioni
anni prima. Sempre pi frequenti anche le sensibili allinsaputa
frodi, come i furti di identit per ottenere del team di ricerca.

prescrizioni di farmaci e i tentativi riusciti 6. Lattacker


Correla i dati rubati dal server
di phishing tramite email, per ingannare gli con altre sorgenti di informazioni
e pubblica informazioni riservate
utenti convincendoli a fornire dati personali, dei partecipanti allo studio.
password e via dicendo, ngendosi unorga-
nizzazione afdabile. Secondo quanto ripor-
Fonte. Filkins BL, et al. Am J Transl Res 2016; 8:1560-80.

1116-FWD-04_xweb.indd 29 17/11/2016 16:32:22


30 | forward BIG DATA 4 / 2016

da p.29
Flussi di dati fuori controllo sono conservati sicamente i miei dati? Chi prodotto; e, inne, denire luso corretto e
necessario, tuttavia, fare delle distinzioni pu accedervi? E in caso di controversia, quello scorretto dellinformazione dal punto
fra quelli che sono i problemi di privacy dei dovuta per esempio a un furto, sotto quale di vista della riservatezza.
sistemi di e-health realizzati dalle strutture giurisdizione ci troviamo? Viviamo inoltre in Il mondo del mercato privato, senza rego-
sanitarie, come il gi citato fascicolo sanita- un profondo paradosso, quello secondo cui lamentazioni ferree in merito alla privacy, ci
rio elettronico, la cartella clinica elettronica, punibile il produttore di una app che di- espone dunque potenzialmente a molte pi
la ricetta elettronica, la tessera sanitaria e via chiara di utilizzare i dati sanitari dei cittadini vulnerabilit rispetto a quello dei sistemi sa-
dicendo, e i ussi di dati personali che co- in un certo modo e poi non lo fa, ma non nitari, ma i due ambiti sono destinati a in-
stantemente i privati cittadini regalano alle colui che non dichiara anticipatamente nulla tersecarsi. Cosa accade per esempio quando
diverse compagnie (per la maggior parte pri- a proposito del possibile utilizzo dei dati che sono i medici stessi a utilizzare una app qual-
vate) tramite le app presenti su smartphone e raccoglie. siasi per gestire i nostri dati sanitari?
tablet, o durante lutilizzo di software online
e social media. Questo ultimo canale oggi Un cambio di paradigma
estremamente vulnerabile, eterogeneo, privo Le politiche sulla privacy dei venditori In questo scenario cos estremamente ca-
di regole e quindi di unadeguata vigilanza. non possono essere considerate accessibili otico, necessario quindi chiosa lEnisa
In soldoni, sebbene i servizi come il fasci- e trasparenti se le persone non sono in grado un cambiamento di paradigma, non pi
colo sanitario elettronico non possano dirsi di valutarle e interpretarle correttamente. basato sulla dicotomia big data versus pri-
immuni da pericoli, come hackeraggi e frodi, vacy, bens sul binomio big data with pri-
essi sono comunque imbrigliati allinterno di Health insurance portability vacy. Slogan a parte, il concetto quello di
una tta rete di regole a maglie pi o meno and accountability act integrare le politiche per garantire la sicurez-
strette a seconda del paese che codicano in za del trattamento dei dati sanitari a qual-
maniera chiara diritti e doveri dei titolari del La logica attuale la seguente: deve essere siasi livello nelle modalit in cui pensiamo
trattamento dei nostri dati sanitari. Vengono cura del cittadino, del paziente, dellutente alluso dei big data, per uscire nalmente da
ssate, per esempio, delle misure minime per informarsi: una volta che accetta di utilizzare questo scenario in cui a fare la differenza
la protezione del titolare dei dati, dei criteri una app se ne assume tutta la responsabili- per un cittadino informato sui destinatari
di cifratura, la tracciabilit delle operazioni t. Alla ne a fare la differenza il grado di dei dati sanitari che sta per condividere sia
effettuate e dei criteri per garantire che chi interesse del singolo a informarsi, e non si solamente il suo grado di interesse su queste
sottoscrive un contratto per la condivisione tratta di uneccezione ma, a quanto pare, del- questioni e la voglia di leggere le informati-
dei propri dati online lo possa fare in manie- la regola. Unottima sintesi su questo stata ve punto per punto chiedendo spiegazioni
ra libera, specica e informata. recentemente pubblicata dal Department of dove qualcosa non chiaro.
Tutto questo non deve essere per legge in health and human services americano dal Il punto che non facile decidere come
alcun modo garantito invece dai produttori titolo Examining oversight of the privacy & legiferare. Su questo aspetto si espresso nel
privati di app e software, con il risultato che security of health data collected by entities maggio 2014 anche lUfcio del Presidente
molto spesso lutente non sa esattamente not regulated by Hipaa. Secondo gli esperti degli Stati Uniti per la scienza e la tecnolo-
che cosa sta scaricando sul suo smartpho- oggi la maggior parte delle entit che colle- gia, proponendo in un documento dal ti-
ne, e dove e in che modo sono trattati i suoi zionano dati negli Stati Uniti (qui non si fa tolo Big data and privacy: a technological
dati sanitari. Claire Porter sulle pagine de riferimento solamente alle app) non rego- perspective alcune raccomandazioni per
The Guardian, in un articolo intitolato Little lata dallHipaa (Health insurance potability la creazione di nuovi regolamenti. Lidea
privacy in the age of big data, pone la que- and accountability act), che dal 1996 rego- quella di non concepire la lotta per la tutela
stione in questi termini: Is volunteering our lamenta la privacy dei dati e le disposizioni della privacy come se quella fra Achille e la
personal data simply the price we pay for free di sicurezza per la tutela delle informazioni tartaruga fosse una mera sda tecnologica:
services? (questa condivisione volontaria dei sanitarie. E non solo: i cittadini americani sa- la cartina di tornasole rimangono le effettive
nostri dati personali forse semplicemente il rebbero oggi troppo poco e male informati applicazioni pratiche di queste tecnologie, il
prezzo che paghiamo per avere servizi gratu- sulle sorti dei propri dati sensibili che raccol- loro uso. Privacy chiosano gli esperti non
iti?). La questione estremamente delicata gono tramite le entit che utilizzano, come le signica solo anonimizzare, n mantenere
perch ci coinvolge molto pi da vicino di app, e non sempre essi hanno facile accesso un segreto. La via indicata dalla Casa Bian-
quanto pensiamo. La maggior parte delle app ai propri stessi dati. ca quindi quella di concentrare la ricerca
che noi tutti scarichiamo quotidianamente Sono cinque in particolare le differenze e i relativi nanziamenti su tecnologie che
non ha dovuto soddisfare alcun criterio di che intercorrono fra unentit coperta da Hi- diano segnali tangibili di aiutare a protegge-
valutazione n sostenere alcun esame che ne paa e una che non lo (in termini tecnici, re la privacy allinterno dei meccanismi so-
provasse leffettiva validit e, soprattutto, non non covered entity): garantire laccesso ai pro- ciali che inuenzano i comportamenti e la
soggetta ad alcuna regola che la obblighi a pri dati come un diritto; regolamentare il riu- vita privata delle persone. Per questo serve
garantire la nostra privacy o a fornire infor- so dei dati da parte di terze parti; garantire puntare su unadeguata formazione dei citta-
mazioni precise sul prodotto che stiamo ac- misure standard di sicurezza; utilizzare una dini e assumere la prospettiva di una ricerca
quistando. terminologia chiara sulle questioni di priva- sociale. I big data sono anzitutto una scienza
Vi poi il problema geograco, non se- cy allinterno delle informative che gli uten- sociale.
condario in termini legislativi: dove e come ti devono sottoscrivere prima di scaricare il [Pagine a cura di Cristina Da Rold]

Le cinque raccomandazioni della Casa Bianca

1. 2. 3. 4. 5.
Lattenzione Le politiche e le Con il coordinamento e il sostegno LOspt della Casa Gli Stati Uniti
della politica regolamentazioni dellOce of science and technology Bianca insieme dovrebbero fare
dovrebbe ad ogni livello policy (Ospt) della Casa Bianca, alle istituzioni da guida sia in
essere focalizzata governativo non le agenzie del Networking and information dellistruzione e societ campo internazionale
pi sulluso dei big dovrebbero includere technology research and development professionali idonee dovrebbe sia nazionale adottando
data e meno sulla particolari soluzioni program dovrebbero raorzare la ricerca incoraggiare le possibilit politiche che incentivino
loro raccolta tecnologiche, ma statunitense nellambito delle tecnologie di formazione e training in luso di tecnologie
e analisi. dovrebbero essere collegate alla privacy e in quelle importanti ambito di protezione della pratiche per la
formulate in termini di aree delle scienze sociali che formano/ privacy, inclusi i percorsi di protezione delle privacy
risultati da raggiungere. caratterizzano il successo dellapplicazione carriera professionale. gi oggi esistenti.
stessa di queste tecnologie.

Fonte. Executive Oce of the President, Presidents Council of Advisors on Science and Technology. Oce of the president presidents council of advisors
on science and technology Report to the President Big data and privacy: a technological perspective executive. Washington, maggio 2014.

1116-FWD-04_xweb.indd 30 17/11/2016 16:32:22


www.forward.recentiprogressi.it forward | 31

Come si addice a Silicon Valley, i big data sono per lo pi


una grande campagna pubblicitaria, ma c una possibilit:
che un giorno possano portare protti a milioni di persone
che attualmente non hanno accesso ad essi.
Evgeny Morozov

Internet non un mondo a parte


Le smart technology non sono solo destabilizzanti: e mobilit, ci dicono che possiamo andare
dove vogliamo quando vogliamo, ma in real-
possono anche conservare lo status quo. t si tratta di una libert fasulla, come quella
Rivoluzionarie in teoria, sono spesso reazionarie nella prassi1. di chi deve portare il braccialetto elettronico.
Queste societ, infatti, offrono ai cittadini
Per la decima edizione del festival della rivista conseguenze che que- un sistema solo apparentemente convenien-
settimanale Internazionale, il primo weekend sto ha avuto su politi- te perch in cambio di servizi sempre pi a
di ottobre si sono riuniti a Ferrara giornalisti, ca, economia e societ. Ed proprio questo basso costo, o addirittura gratuiti, ricevono
intellettuali e scrittori da tutto il mondo per lerrore secondo Morozov: il cyberspazio non la titolarit dei dati collettivi. Ormai stato
parlare di attualit e informazione, economia pu essere considerato un mondo separato costruito un mercato di dati su cui le azien-
e letteratura, ma anche di fumetti e fotograa. perch internet al centro del contempora- de hanno fondato il loro business, ma le no-
Tra loro Evgeny Morozov, sociologo e giorna- neo economico e sociale in cui ci troviamo. stre numerose informazioni personali non
lista bielorusso, oggi uno degli intellettuali di La Silicon Valley non cos diversa da Wall dovrebbero esistere come un qualcosa che
riferimento in merito al dibattito sugli effetti Street e le grandi piattaforme digitali come pu essere venduto. E i cittadini continuano
politici e sociali dello sviluppo della tecnolo- Amazon, Google e Facebook, spinte dagli a essere indeboliti dai trattati commerciali
gia. Morozov noto per le sue posizioni cri- stessi istinti predatori della nanza, si stan- transnazionali che stanno limitando i loro
tiche e in controtendenza rispetto al comune no appropriando dello spazio pubblico mo- diritti e aumentando quelli delle aziende. Ci
ottimismo sulle potenzialit democratizzanti nopolizzando i dati personali. Come scrive troviamo cos nel bel mezzo di un paradosso:
di internet. Morozov nella sua raccolta di saggi Silicon il diritto alla privacy sta diventando il servizio
Secondo Morozov uno dei temi centrali Valley: i signori del silicio2, le aziende della al diritto alla privacy, se lo si desidera lo si
del nostro tempo la regolamentazione del- Silicon Valley stanno piazzando un lo spi- deve comprare.
lo spazio cibernetico. Per poter comprendere nato invisibile intorno alle nostre vite. Sul- Secondo Morozov, come se la Silicon
meglio la questione bisogna tornare indietro la carta ci promettono pi libert, apertura Valley avesse due mani: la sinistra a p.32
agli anni Ottanta, stagione in cui emersa li-
dea che vedeva il cyberspazio come un luogo
distinto dal mondo reale e quindi regolato
dal cosiddetto diritto cibernetico. Oggi molte Airbnb un portale online che mette in rela-
aziende della Silicon Valley hanno pensato di zione chi cerca un alloggio (un appartamento o
sfruttare a loro vantaggio la diversa legislazio- una camera) per brevi periodi e chi dispone di
ne. Esempio calzante quello di Airbnb che, uno spazio da affittare. Generalmente, si tratta
non appena si tentato di regolamentarne la da una parte di persone che viaggiano per
attivit online con le leggi nazionali, ricor- turismo e dallaltra di privati che, avendone la
sa in giudizio sostenendo di essere vittima di possibilit, mettono a frutto uno spazio di cui di-
censura. Unica soluzione, a parere di Moro- spongono. I ricavi sono denunciati nella dichia-
zov, smettere di attenersi alla visione inge- razione dei redditi e sottoposti a tassazione for-
nua di internet come mondo diverso. fettaria. Il sito fu aperto nellottobre del 2007 da
Nei grandi dibattiti sulla rete e linnovazio- Brian Chesky, Joe Gebbia e Nathan Blecharczyk.
ne ci si sempre limitati a parlare del digita- presente in quasi 200 nazioni e in 34mila citt.
le per il digitale, senza considerare invece le

1116-FWD-04_xweb.indd 31 17/11/2016 16:32:22


32 | forward BIG DATA 4 / 2016

da p.31 buona che ci offre i servizi gratu- che nellaffrontarne le conseguenze non fa torit che sia alternativa a Google, ma realiz-
itamente e la destra cattiva che cattura e ri- nulla per rimuoverne le cause. come distri- zare invece una piattaforma pubblica che si
vende i nostri dati. I cosiddetti big data sono buire tappi per le orecchie contro i fastidiosi articoli in infrastrutture pi o meno piccole
infatti cos importanti che lindustria tecno- rumori stradali, invece di fare qualcosa per a disposizione della comunit. Inoltre, per
logica riesce a controllare persino la nostra ridurli. Morozov questo lunico modo afnch
immaginazione e il nostro futuro attraverso Per fare in modo che il costo di un sistema lEuropa non rimanga sottomessa alla regola
la costruzione di storie, facendo diventare alternativo alla Silicon Valley non ricada sul americana.
la Silicon Valley la pi grande storyteller del cittadino consumatore, che si troverebbe a Lintervento pubblico, conclude Morozov,
mondo occidentale. dovere pagare di pi un servizio offerto da tanto pi urgente poich le societ digitali
E i mercati ormai possono raggiungerci aziende tradizionali, Morozov sostiene la ne- si stanno muovendo molto pi di quanto
nelle nostre case facendoci offerte che non cessit di unalternativa di tipo governativo pensiamo, per avere sempre pi potere. Or-
possiamo riutare. La rapida ascesa della a Uber e Airbnb, i giganti della sharing eco- mai Google, operando spesso a Bruxelles,
sharing economy sostiene Morozov pu nomy. Si deve quindi guardare alle istituzio- inuenza la politica e si sta facendo strada
essere letta anche in questa chiave: il capitali- ni pubbliche per raccogliere e gestire i dati perno nel settore dellenergetica. Dunque,
smo dispone ora di nuove tecnologie capaci che ora sono nelle mani delle aziende della bisogna trovare unalternativa. O vogliamo
di convertire ogni merce che sia stata com- Silicon Valley: importante che i big data davvero che in futuro sia tutto gestito da Ai-
prata, e quindi rimossa dal mercato diven- rimangano nelle mani dei cittadini. Ma an- rbnb, Facebook e Google?
tando un capitale inerte poco utile, in oggetti che lEuropa non dovrebbe pensare a unau- [Pagine a cura di Rebecca De Fiore]
afttabili che non abbandonano mai il mer-
cato. Che la sharing economy stia rendendo
le conseguenze dellattuale crisi economica 1. Morozov E. Imprisoned by innovation. The New York Times 2013; 23 marzo.
pi sopportabili innegabile, ma il fatto 2. Morozov E. Silicon Valley: i signori del silicio. Torino: Codice Edizioni, 2016.

Il rendering del
nuovo campus
di Apple ancora
in costruzione
(verr inaugurato
nei primi mesi
dellanno
prossimo).

Conseguenze politiche e morali del consumismo informativo


Deve esserci ben chiaro che stiamo andando incontro a unapocalisse dati personali fa stare peggio qualcun altro, privandolo di alcune
informativa, in un mondo in cui i dati personali sono oggetto di scambio opportunit, allora ho un fattore etico extra da prendere in considerazione:
come se fossero caff o una qualsiasi altra merce. Si prenda largomento leconomia da sola non basta. Tutto questo per dire che il consumismo
tanto in voga dei vantaggi derivanti dalla cessione dei propri dati in informativo ha profonde conseguenze politiche e morali, comparabili
cambio di benefici commerciali tangibili. Mettiamo che decidiate di al consumismo energetico per estensione e importanza. Intellettuali e
installare un sensore sulla vostra automobile per provare allassicurazione partiti politici dovrebbero impegnarsi per mostrare la reale portata di
che guidate in modo molto pi sicuro dellautomobilista medio secondo queste conseguenze. Dovremmo fare del nostro meglio per contrastare
il suo modello dei prezzi per le polizze. Benissimo: se siete sopra la lapparente normalit economica della condivisione di informazioni.
media, pagherete meno. Il problema con i valori medi, tuttavia, che Un atteggiamento del tipo solo business! non basta pi.
met della popolazione sempre al di sotto del valore di riferimento; e La condivisione di informazioni dar anche vita a un mercato vivace,
inevitabilmente al di l del fatto che ci vogliano monitorare o no ma manca di una cornice etica a supporto. Pi di trentanni fa, Michel
quella met sar costretta a pagare di pi: se chi ha pi successo accetta Foucault riuscito a prevedere che il neoliberismo ci avrebbe trasformati in
lauto-tracciamento, allora la maggior parte delle istituzioni sociali finir imprenditori di noi stessi, ma non dimentichiamo che limprenditoria non
per concludere (in modo del tutto logico) che chi invece lo rifiuta abbia priva di lati negativi: come la maggior parte delle attivit economiche,
qualcosa da nascondere. pu generare esternalit negative, dallinquinamento al rumore.
Secondo questo modello, le implicazioni della cessione dei miei dati Limprenditoria basata sulla condivisione di informazioni non fa eccezione.
personali non riguardano pi soltanto il mercato e leconomia, ma si Evgeny Morozov
estendono anche allambito etico. Se la mia scelta di vendere i miei Da: I signori del silicio. Codice Edizioni.

1116-FWD-04_xweb.indd 32 17/11/2016 16:32:22


www.forward.recentiprogressi.it forward | 33

Big data e psicopolitica: ancora e sempre


fatti versus interpretazione?
Una riflessione filosofica sul presente e futuro dei big data

A
nche in losoa si riette sulla rilevan- preferenze. Ognuno, dice Han, diviene cos il dal narcisismo esibizionistico che anima la
za attuale e prossima dei big data. Non benthamiano panottico di se stesso. Daltra nostra epoca, le nostre stesse persone si posi-
soltanto in chiave etica, interrogando- parte, sostiene non a caso Tim Cook, CEO tivizzerebbero in merci quanticabili, misu-
si sulla questione della privacy, ma sui risvolti della Apple, oggi nessuno esce di casa sen- rabili e controllabili: i big data annunciano
della loro pervasivit sulle forme di vita. za lo smartphone, domani probabilmente la ne della persona e della volont libera.
Protect me from what I want. il truismo saremo connessi allo smartphone3. In altri Con quali conseguenze politiche? Secon-
di Jenny Holzer scelto dal coreano Byung- termini, se oggi disponiamo di protesi mne- do Han, la crisi della libert nella societ
Chul Han per lesergo di un pamphlet che, di motecniche, domani esse saranno parte in- contemporanea consiste nel doversi confron-
suo, ha molto della verit ovvia1. Invece che tegrante di noi, no al punto di anticipare tare con una tecnica di potere che non nega
allItalica bold, font della gigantesca scritta i nostri desideri, alla Minority Report. Lo Luciano De Fiore o reprime la libert, ma la sfrutta. La libera
originale dellartista americana, o alle note aveva in qualche modo previsto anche Freud: Sapienza scelta viene annullata in favore di una libera
indie dei Placebo autori della canzone dallo Luomo per cos dire divenuto una specie Universit di Roma selezione tra le offerte. Tutte le informazioni
stesso titolo ispirata dalla Holzer, stavolta il di dio-protesi, veramente magnico quando divengono merci preziose: la popolazione va
messaggio afdato a una riessione veloce, equipaggiato di tutti i suoi organi accessori; amministrata scrupolosamente, concentran-
ma aflata, sulle nuove tecniche di potere del questi, per, non formano un tuttuno con dosi su procreazione, tassi di natalit e morta-
neoliberismo. Che dei big data farebbero il lui e ogni tanto gli danno ancora del lo da lit, stati di salute, durata e qualit della vita,
proprio big deal, un grandissimo affare: sta- torcere. Si consoli tuttavia: questa evoluzione scelte economiche e di stili di vita. Il che era
to di sorveglianza e mercato venendo cos a non nir nellanno del Signore 1930, quan- gi proprio della politica intesa come biopo-
coincidere. do pubblic il suo Disagio nella civilt, da litica, alla Foucault.
Da cosa ci si dovrebbe proteggere? Dalla cui il passo tratto4. Proprio cos. Ma con un salto evidente: usando le stati-
nostra stessa libert di desiderare. Libert di Ecco che allora i big data divengono, stiche demograche, la biopolitica non acce-
singoli, considerati per come nientaltro che agli occhi di critici estremi come Mayer- deva allo psichico. Ecco quindi il necessario
leccesso del capitale stesso, il quale sfrutte- Schnberger, Cukier5 o appunto Han, uno passaggio neoliberista alla psicopolitica: per
rebbe la libert dellindividuo per ripro- strumento psicopolitico estremamente efca- questo la statistica si differenzia dai big data:
dursi. Essere davvero liberi dovrebbe signi- ce, che permette di estrarre un sapere scon- da essi si pu ricavare non solo lo psicopro-
care piuttosto realizzarsi insieme (secondo il nato sulle dinamiche della comunicazione gramma individuale, ma anche quello collet-
Marx dei Manoscritti), mentre lisolamento sociale. Questo sapere un sapere del dominio, tivo e in caso lo psicoprogramma dellinconscio.
a cui il regime neoliberale induce secondo che consente di avere accesso alla psiche e di Non il petrolio il motore del capitalismo,
Han, e nonostante i social media, anzi non inuenzarla su un piano pre-riessivo. In ma la libido: lenergia libidinale devessere
produrrebbe affatto quella libert, rendendo altre parole, attraverso le informazioni che canalizzata sugli oggetti di consumo cos da
piuttosto ognuno servo del proprio lavoro, o liberamente afdiamo alla rete, anche spinti assorbire le eccedenze della pro- a p.34
per meglio dire, delle proprie azioni. Scelte,
beninteso, liberamente, giacch soltanto lo
sfruttamento della libert individuale offre il Attraverso le informazioni che liberamente afdiamo alla rete,
massimo rendimento. Secondo questo punto
di vista, anche la moltitudine invocata da anche spinti dal narcisismo esibizionistico che anima la nostra epoca,
Negri e Hardt non sarebbe che un insieme ir- le nostre stesse persone si positivizzerebbero in merci quanticabili,
relato di solitudini, inatto a formare un Noi misurabili e controllabili.
politico capace di un agire comune. Tutti, di
nuovo e sempre, soggetti. Sottomessi, cio, ad
un ordine che si erge a nuova trascendenza, Jenny Holzer, The Survival series, Protect Me From What I want, 1985-1986.
con lacquiescenza di tutti.
Questa versione neo-apocalittica della
postmodernit si servirebbe dei social media
per operare un controllo capillare ed estrema-
mente produttivo di coloro che contribuisco-
no volontariamente al proprio sfruttamento.
Come? Grazie allautoesposizione, allauto-
denudamento volontari consentiti, anzi pro-
mossi, dai social che rendono ogni nostro
dato immesso sulla rete uninformazione, e
cos un quantum sfruttabile economicamen-
te. Autoesposizione favorita, aggiungerem-
mo, dal narcinismo imperante2. I dispositivi
tecnici fungerebbero cos da oggetti devozio-
nali: se inteso come strumento di soggettiva-
zione (nel senso proprio, di assoggettamento
individuale), uno smartphone funzionerebbe
al dunque come una volta il rosario per un
cristiano, mutuando la funzione di controllo
e sorveglianza su se stessi: il like lamen di-
gitale. Mentre clicchiamo like, ci sottoponia-
mo al rapporto di dominio.
Una tecnica di potere assai efcace che
rende possibile che gli uomini si sottometta-
no da s alla dipendenza, senza coercizioni:
il neoliberalismo come capitalismo del like,
seducente piuttosto che inibente, invitante di
continuo a comunicare, condividere, parteci-
pare, esprimere le nostre opinioni, desideri e

1116-FWD-04_xweb.indd 33 17/11/2016 16:32:23


34 | forward BIG DATA 4 / 2016

da p.33 duzione industriale. Si trattereb-


be allora di captare la libido, vale a dire di La crisi della libert nella societ contemporanea consiste
confezionare i desideri secondo le necessit nel doversi confrontare con una tecnica di potere che non nega
degli investimenti. E su questo ho dei dubbi:
in particolare, sulla capacit di confezionare
o reprime la libert, ma la sfrutta. La libera scelta viene annullata
(faonner, dice Stiegler6) i desideri attraverso in favore di una libera selezione tra le offerte.
le protesi mnemotecniche. Si tratta forse di Byung-Chul Han
una sfumatura, ma ho limpressione piutto-
sto che le mnemotecnologie (una volta era
in testa la televisione, oggi i social) condi-
zionino n dalla radice le forme di consumo,
semmai schermando la coscienza dai propri
desideri, separandola dai propri desideri o
offuscandoli.
Ora, si chiede Han, i big data riusciranno
effettivamente non solo a sorvegliare il com-
portamento umano, ma anche a sottoporlo
a un controllo psicopolitico?. S, sostiene:
libera da qualsivoglia restrizione prospettica,
caratteristica dellottica analogica, la sorve-
glianza digitale ha eliminato gli angoli ciechi,
rendendo possibile anche lo scrutare la psi-
che. Come per Voltaire la statistica signicava
tout court lIlluminismo, poich questultimo
dava accesso ad un sapere oggettivo fondato
su cifre e condotto su basi numeriche, cos la
trasparenza diviene la parola-chiave del se-
condo, perverso Illuminismo: il Dataismo.
Ma come Hegel aveva svelato lanima ide-
ologica dellIlluminismo nel concetto di utile,
cos Han convinto che anche il Dataismo,
con la sua pretesa di affrancarsi da qualsivo-
glia ideologia, sia esso stesso unideologia:
quella del totalitarismo digitale in base al
quale, quando siano disponibili dati a suf-
cienza, alla Chris Anderson, ogni teoria su-
perua7. Rinunciando totalmente al senso ed
alla narrazione, secondo il losofo coreano,
Jenny Holzer, You Are My Own, 1999.
il dataismo non sarebbe altro che lennesima
versione del nichilismo postmoderno.
Nel ragionamento di Han balena unin-
congruenza. Per un verso, la psicopolitica delle pagine pi frequentate dai suoi utenti zioni delle innite mutazioni genetiche di un
sarebbe in grado di collettare una quantit o su quelle alle quali abbiamo messo un like, tumore. Prima ancora che di carattere etico,
gigantesca di dati e informazioni, senza per ammesso non si siano direttamente dichia- politico e di privacy. Ma non detto affatto
riuscire a conferire senso al loro insieme. Ri- rate le proprie idee nella pagina del proprio che lera dei big data si annunci come une-
manendo cos al di qua del signicato e di un prolo8. Ogni informazione, interpretata, poca senza ragione. F
sapere in termini propri. Per un altro, Han si pu valere molto. Gli inserzionisti, tra cui
riferisce esplicitamente alle conoscenze frutto molti partiti politici, pagano cifre molto con-
dei big data come ad un sapere del dominio, sistenti per mostrare i loro annunci a specici 1. Byung-Chul Han. Psicopolitica, edizione
potente al punto da riuscire a inuenzare ad- gruppi demograci. Le etichette che Facebo- italiana a cura di Federica Bongiorno. Roma:
Nottetempo, 2016.
dirittura linconscio individuale dei soggetti. ok assegna ai propri utenti aiutano infatti le
Delle due luna. campagne a mirare con la massima precisio- 2. Colette Soler, psicanalista lacaniana, ha coniato
ormai una decina danni fa questa espressione
E inoltre, e soprattutto: perch contrappor- ne un pubblico particolare. Ovvio che conta- fortunata, coniugando narcisismo e cinismo,
re, ancora una volta, i dati al loro signicato, re non raccontare, e sappiamo bene che il per definire la cifra fondamentale del nostro
anzi, al processo esperenziale della ricerca dei S ammesso esista deriva da un racconto. tempo.
loro signicati? La polemica estrema contro i Nel quale per le singole informazioni, per 3. Cook T. Uno smartphone per ogni abitante
big data assomiglia troppo alle vecchie requi- quanto parcellizzate, hanno un proprio signi- della Terra, saremo connessi non violando la
sitorie degli ermeneuti contro i realisti, vetero cato, se collegate e interconnesse secondo privacy. La Repubblica 2016, 18 agosto, p. 20.
o neo che siano. Conta di pi il fatto o la sua scelte politiche sensate. 4. Freud S. Il disagio della civilt, in: Freud S,
interpretazione? Valgono entrambi, piutto- Se pu creare allora qualche problema, Opere 1924-1929. Torino: Paolo Boringhieri,
sto. Ridurre lindividuo a quantied self ad specie di privacy, il fatto che i candidati ad 1978 (p. 582).
un corpo dotato di sensori che automatica- unelezione politica ricorrano al micro-tar- 5. Mayer-Schnberger V, Cukier K. Big Data. Die
mente registrano ogni suo dato: temperatura, geting per rivolgersi agli elettori in modo Revolution, die unser Leben verndern wird.
tasso glicemico, consumo di calorie, tragitti, estremamente selezionato, non ci scandaliz- Monaco: Redline Verlag, 2013.
massa grassa e magra, alterazioni del battito zeremmo altrettanto se il data mining con- 6. Vedi ad esempio Stiegler B. Economie de
cardiaco, per restare solo alle informazioni di sentisse di evitare sprechi in sanit9, oppure lhypermatriel et psychopouvoir. Paris: Mille
et une nuits, 2008.
carattere igienico-sanitario non ha ovvia- di programmare campagne di prevenzione
mente senso, se a ci non si accompagna poi ultramirate, prolate secondo le caratteristi- 7. Anderson C. The End of Theory: the Data
Deluge makes the Scientific Method obsolete.
la capacit di raccontare e collegare quei dati che dei diversi cluster anche di una stessa po-
Wired 2008, 23 agosto.
e dar loro un senso complessivo. bene co- polazione, sfruttando anche la nuova tecno-
8. Hermann J, Inside Facebooks (Totally Insane,
munque tener presente che Facebook solo logia di anonimizzazione dei dati frutto della
Unintentionally Gigantic, Hyperpartisan)
per fare un esempio di un social che vanta, ad cosiddetta privacy differenziale10. Political-Media Machine. New York Times 2016,
oggi, 1 miliardo e 700 milioni di utenti attivi La questione vera, evidente a tutti, che 24 agosto.
nel mondo da tempo raccoglie informazio- quando si ha a che fare con i big data ci si 9. Secondo un rapporto della McKinsey (2013),
ni sui propri utenti, e di recente ha rinnovato confronta davvero con il big: con grandezze lanalisi dei big data consentirebbe alla sanit
la pagina delle preferenze, facilitandone la vi- enormi, la cui decifrazione e interpretazione americana risparmi per 300 miliardi di dollari
sualizzazione. Facebook deduce le preferenze pongono innanzitutto rilevanti problemi di lanno.
politiche (oltre che economico-commerciali calcolo, come sanno bene gli operatori sani- 10.www.cis.upenn.edu/~aaroth/Papers/
e quelle attinenti lo stile di vita) sulla base tari alle prese per esempio con le decifra- privacybook.pdf

1116-FWD-04_xweb.indd 34 17/11/2016 16:32:23


www.forward.recentiprogressi.it forward | 35

Big data: unindagine sui professionisti sanitari


In linea con gli obiettivi del progetto Forward, stata realizzata una survey sul concetto di big data.

1. DESCRIZIONE DEL CAMPIONE


Una delle caratteristiche pi originali e realmente nuove del progetto Forward al congresso nazionale della Associazione italiana di epidemiologia (Torino,
lattenzione al punto di vista del personale sanitario sulle grandi questioni che 19-21 ottobre 2016) e a 278 oncologi partecipanti al meeting annuale
attraversano la medicina di oggi. Dopo le indagini sulla medicina di precisione, dellAssociazione italiana di oncologia medica (Roma, 28-30 ottobre 2016).
il valore e i valori e il coinvolgimento dei pazienti, stata avviata una survey Simile let media dei partecipanti alla survey (epidemiologi: 42,7 anni -
per sondare il punto di vista e la percezione del concetto di big data su un oncologi: 41,84 anni) e il genere (65 donne su 100 oncologi e 57 donne su
campione di professionisti che lavorano in ambito sanitario: le prime due cento epidemiologi), ma diversa la provenienza geograca, inuenzata dalla
discipline coinvolte sono state quelle degli oncologi clinici e degli epidemiologi. sede di svolgimento dellevento: prevalenza di epidemiologi del nord e di
I dati preliminari che presentiamo si riferiscono a 70 epidemiologi intervistati oncologi del centro Italia.

2 . A N A L I S I D E I R I S U LTAT I
interessante mettere a confronto le risposte alla prima domanda della diverso anche lorientamento espresso a proposito di un altro quesito:
survey. A dierenza dei loro colleghi clinici, per gli epidemiologi ci sono cosa sono i big data? Colpisce la dierente considerazione dei dati che
pochi dubbi che siano le tre V a caratterizzare i big data. scaturiscono dalla ricerca sperimentale, dati tipicamente strutturati e non
necessariamente big: tra le quattro tipologie suggerite lepidemiologo
Con il termine big data si fa generalmente riferimento non ha dubbi, identificando quasi esclusivamente negli electronic
a dati caratterizzati da
health record la fonte di numeri ad alto volume, variabilit e velocit
EPIDEMIOLOGI di produzione; mentre per 4 oncologi su 10 anche i risultati degli studi
1% 3% controllati randomizzati possono essere considerati big data.
Elevata Sensibilit, Elevato margine In ambito sanitario, a proposito di quali fonti possiamo parlare
Specificit di Errore, di big data?
e Semplicit elevata Efficienza
duso e Efficacia EPIDEMIOLOGI
(tre S) (tre E)
93% 3% 9% 4%
Alto Volume, Alta Precisione, Singoli Risultati
alta Variabilit, Produttivit, registri di studi
alta Velocit Peculiarit di farmaci osservazionali
di produzione (tre P) 1%
(tre V) 86%
Cartelle cliniche Risultati
ONCOLOGI elettroniche di studi
dei cittadini controllati
26% 3% (electronic health randomizzati
Elevata Sensibilit, record)
Elevato margine
Specificit di Errore,
e Semplicit elevata Efficienza
duso e Efficacia ONCOLOGI
(tre S) (tre E)
53% 18% 39% 40%
Alto Volume, Alta Precisione, Cartelle cliniche Risultati
alta Variabilit, Produttivit, elettroniche di studi
alta Velocit Peculiarit dei cittadini controllati
di produzione (tre P) (electronic health randomizzati
(tre V) record)
8% 12%
Singoli Risultati
registri di studi
di farmaci osservazionali

Su cosa punterebbe lepidemiologo? Sul potenziamento dei sistemi di Mentre da parte delloncologo c pi interesse per le applicazioni dei big
raccolta e gestione dei dati del paziente e, in seconda battuta, sui cosiddetti data al governo dellinformazione utile per lattivit clinica e assistenziale.
organizational data, comunque legati ai primi.

Con il termine big data si fa generalmente riferimento a dati caratterizzati da

EPIDEMIOLOGI ONCOLOGI

40% 23% 11% 26% 34% 37% 15% 14%


Clinical data Clinical reference Genomic Organizational Clinical data Clinical reference Genomic Organizational
(cartelle cliniche (database informativi data data (cartelle cliniche (database informativi data data
elettroniche, per il personale (sistemi di gestione elettroniche, per il personale (sistemi di gestione
sistemi di sanitario, archivio amministrativa sistemi di sanitario, archivio amministrativa
archiviazione di di linee guida, a partire dalle archiviazione di di linee guida, a partire dalle
imaging, ecc.) percorsi diagnostico- cartelle cliniche imaging, ecc.) percorsi diagnostico- cartelle cliniche
terapeutici, sistemi elettroniche) terapeutici, sistemi elettroniche)
esperti di drug esperti di drug
information, information,
ecc.) ecc.)

1116-FWD-04_xweb.indd 35 17/11/2016 16:32:23


Medicina personalizzata e centrata sul malato, assistenza al paziente basata
sul valore, impegno per una sanit che faccia uso intenso dei dati: non il
riepilogo del primo anno del progetto Forward ma una sintesi dei temi portanti del
a fascicolo speciale del Jama curato dallInstitute of medicine (Iom) degli Stati Uniti.
Hanno contribuito alcune tra le personalit pi in vista della sanit americana e pu prescindere da un equilibrato recupero di quanto di importante ci consegna il
colpisce la frequenza con cui ricorrono le keyword che hanno caratterizzato gli passato: in primo luogo la tutela e se possibile il rilancio di qualsiasi impegno utile
approfondimenti del primo anno di Forward. Grande risalto alla necessit di una a promuovere la salute attraverso politiche di prevenzione. Da solo, nota Koch,
maggiore health literacy, per esempio, o allimportanza delle ricadute organizzative il tabagismo responsabile di circa mezzo milione di morti prevenibili nei soli
delle innovazioni introdotte nellassistenza; discussione della necessit di un Stati Uniti. Risultati simili potrebbero essere ottenuti con un pi stretto controllo
monitoraggio costante dellevolversi della sanit e confronto sulla difficolt di dellobesit e con il miglioramento delle abitudini alimentari dei 22 milioni di
definire indicatori attendibili per la valutazione di qualit, di efficacia e di processo. bambini che vivono in famiglie a basso reddito. La raccolta di documenti proposta
How best to monitor progress in health remains a simple, yet profound question. dallo Iom ci mette ancora una volta di fronte allevidenza che il punto chiave la
Certamente, leditoriale di Howard K. Koch guarda in prospettiva, nella direzione determinazione delle priorit: promuovere il benessere e la prevenzione oltre alle
recita il titolo di un completo benessere dei cittadini. Ma guardare avanti non terapie; considerare la salute di comunit oltre a quella degli individui.

I dati Ragionare In un futuro


amministrativi sui big data non troppo
hanno il vantaggio biomedici pu anche distante, gli algoritmi
di coprire popolazioni di signicare guardare ci diranno del paziente Big data,
grandi dimensioni difcili oltre il sistema cose che non sappiamo.
da raggiungere con uno sanitario. Ziad Obermeyer
big questions
studio tradizionale. Griffin M. Weber Tra i diversi temi affrontati fino ad oggi dal
Francesca Dominici

10 11 12 gruppo di lavoro Forward, quello dei big


data ha richiesto un maggiore sforzo per
mettere insieme tutti i punti necessari a un
utile approfondimento. Siamo partiti dalla
Nel processo Occorrer Limpiego definizione, passando per grandi entusiasmi
di condivisione passare dai big dei big data ma anche attraverso profonde diffidenze,
ogni persona deve data agli smart data. potrebbe risultare per studiare ci che gi oggi si pu e quello
che potremmo mettere in pratica con questa
essere messa in grado Luca Pani prezioso nel generare enorme mole di dati che circonda, osserva ma
di vedere il dato, ipotesi da studiare forse anche condiziona il mondo della salute.
comprenderlo ed e vericare. Nonostante molti siano concentrati
eventualmente usarlo. Eugenio Santoro sullaggettivo semplice e immediato, chiaro
Harlan M. Krumholz

14 20 25 che non si tratta solo di una questione di


volumi. La possibilit di connettere sistemi
diversi, combinare dati attraverso linguaggi
condivisi, trasformare il rumore di fondo
Tanto pi sar La condivisione Stiamo in nuove e utili informazioni, aumentare i
big la quantit volontaria andando incontro punti di osservazione sui fenomeni, rendere
pi efficienti in termini di tempo e spazio le
dei dati disponibili, dei dati personali a unapocalisse rilevazioni, sono tutti potenziali vantaggi che
tanto maggiori i semplicemente informativa. sembrano ora possibili. Allo stesso tempo,
problemi metodologici il prezzo che paghiamo Evgeny Morozov bisogna tener conto dellaffidabilit dei risultati
nella loro produzione, per avere servizi prodotti, della loro riproducibilit e di molti altri
analisi, utilizzazione. gratuiti? potenziali bias che rischiano di trasformare i big
data in fonti di big error. Tra le altre cose vale
Carlo Perucci

26 Claire Porter

30 32 la pena aggiungere anche il non trascurabile


rischio di intrusione nella vita privata di ognuno
di noi legato alla fame di informazioni che
Supplemento a Recenti Progressi in Medicina Vol. 107, numero 09, novembre 2016
alimenta i big data.
Ancora una volta non troverete in queste
Advisory Board Laura Amato Tiziano Carradori Ranieri Guerra Carlo Perucci pagine delle conclusioni o delle soluzioni ai
Giovannella Baggio Marina Cerbo Giovanni Leonardi Walter Ricciardi tanti problemi che sono legati al tema.
Giovanni Bissoni Marina Davoli Nello Martini Carlo Saitto
Il limite delle pagine disponibili non esaurisce
Renato Botti Flori Degrassi Fulvio Moirano Angelo Tanese
di certo un argomento su cui potrebbe essere
I componenti dellAdvisory Board, il Direttore responsabile e lAssociate Editor non percepiscono compensi per le attivit svolte nellambito del progetto
Forward. Le opinioni espresse dagli autori e dalle persone intervistate sono personali e non impegnano gli enti e le aziende di appartenenza. importante ritornare. Tuttavia, contiamo di
aver messo insieme esempi, esperienze e punti
Direttore responsabile Luca De Fiore Il Pensiero Scientifico Editore T. +39 06 862 82 335 di vista utili ad approfondire e a discutere
Via San Giovanni Valdarno 8 F. +39 06 862 82 250
Associate Editor Antonio Addis criticamente se i big data possono diventare
00138 Roma info@recentiprogressi.it
Redazione Marialidia Rossi una nuova frontiera della conoscenza in
Laura Tonon Stampa Ti Printing
Via delle Case Rosse 23 - 00131 Roma medicina.
Relazioni esterne Luciano De Fiore
Maria Nardoianni Novembre 2016 Antonio Addis
Graca Antonella Mion 2016 Il Pensiero Scientico Editore Dipartimento di Epidemiologia,
Servizio sanitario regionale del Lazio

La policy di Forward
descritta in dettaglio sul sito del progetto.

Il progetto Forward realizzato anche grazie al contributo non condizionato di

1116-FWD-04_xweb.indd 36 17/11/2016 16:32:23