Sei sulla pagina 1di 73

Corso di Sistemi Telematici

Prof. Dino Giuli


A.S. 2015-2016

Seminario Big Data & Cognitive


Computing
Approfondimento sulle tematiche e su alcuni
strumenti IBM
02.11.2015
Chi siamo
Ing. Giulia Adembri
Project manager Fondazione ICON

Ing. Gabriele Guidi Reserch fellow , PhD Student DINFO-UNIFI,


Collaborator Fondazione ICON

Fondazione ICON (International Center Of computational


Neurophotonics) - Organizzazione di ricerca no-profit, costituita
nel luglio del 2011
Fondazione ICON
Sviluppo di algoritmi di intelligenza artificiale
CytoCAD Cytology Computer Aided Diagnosis
SImple heaRT (SIRT) sistema telematico per il monitoraggio
di pazienti affetti da scompenso cardiaco
Applicazione e personalizzazione di strumenti IBM

Dic. 2013 Accordo quadro Fondazione ICON DINFO- IBM

Sistemi Telematici STAGE IBM WATSON LAB


Premi per stage su tematiche di Analytics e
Prof. D. Giuli
Cognitive Computing, basato sullimpiego di
Assegnazione e tutoraggio di
strumenti IBM Watson:
tesine che comprendano lutilizzo
IBM Watson Analytics
di strumenti IBM Watson
IBM Watson Developer Cloud
Iniziative Big Data, Analytics & Cognitive
Computing della Fondazione ICON
2014
Per IBM Italia Studio di fattibilit per la gestione dei Big Data
neuroscientifici sviluppati per lo Human Brain Project Flagship 2013-
2022
Per CsaVRI Unifi Studio di fattibilit per lapplicazione di strumenti di
smart analytics, nellambito del progetto IMPATTO
2015
Stage Watson Lab, borsa di studio per studenti DINFO che sviluppino
casi d'uso per gli strumenti IBM Watson Developer Cloud e IBM
Watson Analytics
Sviluppo concepts per applicazione
Progetto MIUR SiiMobility sviluppo di algoritmi di data analytics
bioinspired per servizi ai cittadini (in attesa di avvio)
Cosa si intende per BIG DATA?
Big Data definitions
datasets whose size is beyond the ability of typical database software tools to capture, store,
manage, and analyze, (McKinsey Global Institute, Big data: The next frontier for innovation,
competition, and productivity, 2011 )
data of a very large size, typically to the extent that its manipulation and management present
significant logistical challenges. (Oxford English Dictionary, 2013)
The ability of society to harness information in novel ways to produce useful insights or goods
and services of significant value and things one can do at a large scale that cannot be done at
a smaller one, to extract new insights or create new forms of value. (V. Mayer-Schnberger and K.
Cukier, Big Data: A Revolution that Will Transform How We Live, Work, and Think, 2013)
The set of technical capabilities, processes, strategies and skills for continuously converting vast,
fast, varied data into Right Data to obtain actionable insights and foresights (GROUP 2 -
UNIVERSITY/PUBLIC-DRIVEN APPLICATIONS, World Summit on Big Data and Organization Design,
Universit Panthon - Sorbonne Paris, 2013)
an all-encompassing term for any collection of data sets so large and complex that it becomes
difficult to process using on-hand data management tools or traditional data processing
applications.(Wikipedia, 2014)
Big data is a broad term for data sets so large or complex that traditional data processing
applications are inadequate. Challenges include analysis, capture, data curation, search, sharing,
storage, transfer, visualization, and information privacy. The term often refers simply to the use of
predictive analytics or other certain advanced methods to extract value from data, and seldom to
a particular size of data set. Accuracy in big data may lead to more confident decision making. And
better decisions can mean greater operational efficiency, cost reduction and reduced risk.
(Wikipedia, 2015)
The four Vs of BIG DATA
BIG DATA SOURCES
3 main contexts:
The large data collections of big science projects
in traditional data warehouse or database formats
The enterprise data of large, non-Web-based companies (IBM, TATA, etc.)
Generally in multiple format
The data holdings of a Google, Facebook, Twitter, Apple, Alibaba or other large
Web company
Include large unstructured holdings
Include graph data

4th context: Broad Data


The huge amount of freely available, but widely varied, Open Data on the
World Wide Web (Structured and Semi-structured)
Example: The extended Facebook OGP graph (the part outside Facebooks
datasets)
Example: The growing linked open data cloud of freely available RDF linked
data
Example: Hundreds of thousands of datasets that are available on the Web
free from governments around the world
Big Data Analytics
Hadoop
Framework per applicazione distribuite
sistema di calcolo MapReduce distribuito per processi di tipo batch, maneggia
terabyte o petabyte di dati distribuiti su diversi servers (cluster).
MapReduce: i dati iniziali sono una serie di record che vengono trattati singolarmente
da processi chiamati Mapper e successivamente aggregati da processi chiamati
Reducer.
Hadoop stato sviluppato sulla base del Google File System (GFS): Hadoop
Distributed File System (HDFS).
Nell'HDFS di Apache Hadoop ogni file diviso in bocchi di dimensione fissa di 64
MB e questi blocchi sono replicati in maniera ridondante (2 o 3 volte) nei server del
cluster.
NameNode un server che gestisce la logica di allocazione dei dati nel cluster
tramite metadata dei files. E' un server critico perch unico. File systems classici
dividono in 512 B, mentre i DB in blocchi che vanno da 4 KB a 32 KB.
Hadoop Common, un set di librerie che supportano le varie versioni di Hadoop.
Hadoop MapReduce APIs sono principalmente chiamate da Java
Alcuni progetti collegati ad Hadoop
Apache Avro for data serialization
Cassandra and Hbase: databases
Chukwa: a monitoring system specifically designed with large
distributed system in mind
Hive: provides ad hoc SQL-like queries for data aggregatio and
summarization
Mathout: a machine learning library
Pig: a high-level Hadoop programming language that provides a
data-flow language and execution framework for parallel
computation
Jaql: Query Language for JavaScript Object Notation (JSON)
Strumenti IBM
Watson: Semantic Web Technology, enhanced by a massive use of open
linked data, plays a crucial role in the overall Deep QA architecture
find and locate ontologies and semantic data online
explore the content of these semantic documents - NLP (Natural Language
Processing)
InfoSphere BigInsights Platform (Hadoop): business and smart analytics
instrument to Search and explore, Analyze and visualize, Aggregate and extract
o Big Data Analytics
o Data Warehousing
o Data Security & Privacy
o Information Integration
o Lifecycle Management
o Master Data Management
Big Data Enterprise Engine:
o InfoSphere Streams (streaming Analytics)
o Infosphere BigInsights (Internet Scale Analytics)
Cosa fa Watson
Con Watson si possono costruire applicazioni Web semantiche, tramite le APIs
Watson, sviluppate secondo i requisiti del nuovo WEB Semantico, che forniscono
laccesso a varie funzionalit con servizi on-line (Web Services).
Laccesso alle funzionalit, al contrario di altri motori di ricerca del Web Semantico,
illimitato.
Librerie Java- servizi SOAP per:
Ricerca di ontologie e documenti semantici legate a particolari ambiti o concetti
Ricerca allinterno delle ontologie e documenti semantici
Recuperare metadati concernenti unontologia
Recuperare metriche da ontologie ed entit
Sfruttare il contenuto di ontologie
Fare queries SPARQL (SPARQL Protocol and RDF Query Language) tramite Web
Interfaces

Risorse
RDF (Resource Description Framework), Linked Data
URI: Google, Swoogle4, PingTheSemanticWeb5, URLs manuali

Language Identification Disambiguation Concept Extraction


NPL Lexical Analysis Entity Extraction Relationship Extraction
Classification Fact Extraction Inferencing
Architettura di Watson

First discovered through a crawling and tracking component, using Heritrix, the Internet Archives
Crawler
Validation and Analysis component is then used to create a sophisticated system of indexes for the
discovered documents, using the Apache Lucene indexing system3
Based on these indexes, a core API is deployed that provides all the functionalities to search,
explore and exploit the collected semantic documents. This API also links to the Revyu.com
Semantic Web based reviewing system to allow users to rate and publish reviews on ontologies
Applicazioni di Watson
Healthcare:
INPUTs: electronic medical record, dati diagnostici, dati clinici, stato dellarte
sui trattamenti
OUTPUTs: diagnosi, trattamento ottimizzato in base alla storia clinica del
paziente (radiazioni, chemio, intervento chirurgico)
Phases:
pre-processing
NLP in Healthcare: analysis of text (ex. medical report):
Content Analysis
Post-processing

14.nov. 2013 - IBM mette a disposizione la tecnologia Watson per


creare una nuova generazione di app Watson <cloud service
Infosphere BigInsights
Cos: piattaforma basata sul software framework Apache Hadoop, per Big Data.
Cosa fa:
offre funzionalit di data mining e analytics su dati at rest complessi (strutturati e
non) su larga scala, con funzionalit di sicurezza, performance e affidabilit adatti a
workflow aziendali. 20 applicazioni predefinite e 2 acceleratori. Console di
visualizzazione. Supporta il Lightweight Directory Access Protocol (LDAP) per aut.
Console. Connettori per le principali piattaforme di data warehouse IBM (DB2,
Netezza) e non, che consentono di pescare I dati da DB no-SQL
I cluster di BigInsight, basati su GPFS (General Parallel File System Shared Nothing
Cluster) anzich su HDFS (Hadoop Distributed File System) di Hadoop, permettono
scritture random su file gi esistenti nel cluster, oltre a quelle append
Campi applicazione principali:
Aziende pubbliche e private per il supporto alle decisioni
Infosphere Streams
Cos: piattaforma basata sul software framwork Apache Hadoop, per Big Data.

Cosa fa: abilita lelaborazione massiva di flussi di dati per avere analisi in tempo reale

Campi applicazione principali:


Aziende produttrici/distributrici/dettaglianti per integrare informazioni di acquisto
della clientela con sentiment analysis sui social media
Opinion mining
A sub-discipline of computational linguistics that focuses on extracting
peoples opinion from the web.
The recent expansion of the web encourages users to contribute and express
themselves via blogs, videos, social networking sites, etc. All these platforms
provide a huge amount of valuable information that we are interested to
analyse. Given a piece of text, opinion-mining systems analyse:
Which part is opinion expressing;
Who wrote the opinion;
What is being commented.

Rif. D. Osimo, F. Mureddu Research Challenge on Opinion Mining and


Sentiment Analysis
Sentiment analysis
Sentiment analysis, on the other hand, is about determining the
subjectivity, polarity (positive or negative) and polarity strength (weakly
positive, mildly positive, strongly positive, etc.) of a piece of text in other
words:
What is the opinion of the writer

Rif. D. Osimo, F. Mureddu Research Challenge on Opinion Mining and Sentiment


Analysis
Big Data nel mondo del business
Obiettivo: Trasformare enormi volumi di dati di
vario tipo in informazioni e conoscenza utili per
prendere decisioni aziendali mirate
Strumenti: piattaforme IT che raccolgono e
analizzano i big data ed estraggono info
personalizzabili tramite content analysis, data
mining e smart analytics
Sorgenti big data: archivi informatici aziendali
(database e filesystems), blog & social media, dati
internet delle grandi web company
Potenzialit dei Big Data
Integrare il Business con la Tecnologia ->smart
analytics
Utilizzare dati storici e di sintesi, strutturati e
non
Trarre il massimo profitto dall'analisi delle
informazioni estratte da tutte le fonti
disponibili->drill down&drill through big data
BigData issues
Con i BigData problemi che nei dati comuni
sono trascurabili, diventano criticit
Esempio: le Operazioni di I/O
Infatti con il calcolo distribuito e Grid HPC la
computazione non pi un problema, gran
parte del tempo del processo viene impiegato
in operazioni su Disco!!!
BigData issues
Quindi sono state sviluppate tecnologie che
permettono di Analizzare stream di dati SENZA
doverli salvare.
Ovvero vengono analizzati e linformazione viene
estratta AL MOMENTO della scrittura, non prima
salvati e poi analizzati.
Come risultato ho che a fine processo avr le
informazioni su quei dati senza averli fisicamente
salvati in nessun datacenter ma analizzati come
flusso
BigData issues
Si pensi ad esempio ad un flusso di dati
proveniente da twitter
La sorgente dei dati senza fine, ovvero nel
tempo impiegato per salvare un certo tot di
dati, la sorgente ne ha gi riprodotti
altrettanti.
Analizzo quindi il flusso, non dati salvati.
BigData issues
Nel mondo IBM il pacchetto InfoSphere offre il
software Stream che affronta il problema
dei BigData esattamente come descritto
Lambiente permette di costruire un flusso di
analisi e scrivere codice (c, c++, altri linguaggi)
in blocchi funzionali
Il framework poi parallelizza lanalisi
trasformandola da analisi tradizionale ad
analisi del flusso
Alcuni esempi di ambiti
applicativi applicativi
Ambito applicativo
Brand Monitoring
La smart analytics su blog, piattaforme di customer
care e canali social media in questo ambito
consente:
analisi del comportamento di acquisto del cliente
valutazione della percezione del proprio brand o
di uno specifico prodotto
valutazione del servizio alla propria clientela
Profilazione e design nuovi prodotti
Adeguamento tempestivo dei prodotti alle
tendenze di mercato (marketing/trends)
Ambito applicativo
Banking/Insurance
La smart analytics su blog, piattaforme di
customer care e canali social media in questo
ambito consente:
emersione comportamenti anomali,
fraudolenti o non aderenti alle politiche
aziendali
monitoraggio
valutazione del servizio alla propria clientela
Trends monitoring
Marketing & tendenze
Strumenti per monitorare
e visualizzare graficamente
le tendenze on-line in real-
time
Correlazione
trend/sviluppo prodotti
Smart Analytics, Analisi
semantica e Machine
learning per analizzare Big
Data originati su social
media, blogs e forums
I tacchi si abbassano in
tempi di crisi?
Nascita di una tendenza: Cycle Chic
Pedalare con stile
Il look dei ciclisti chic si
propaga sui fashion blog e
sulle principali citt del
mondo creando un nuovo
settore di business
Propagazione fenomeno Cycle chic
2007

Diffusione: blog Copenhagen ->blog Berlino


Business: Cycle chic si diffonde prima nelle
citt con forti comunit artistiche
Propagazione fenomeno Cycle chic
2008

Diffusione: Stoccolma, Portland, Los Angeles


Business: nuove aziende di biciclette e
abbigliamento casual per bici (UK, USA, D) Chatters on-line +228% (2007)
Propagazione fenomeno Cycle chic
2009

Diffusione: USA, Nord EU, Singapore


Business: emerge lo stile tweed, aumentano
eventi e brands per ciclisti urbani Chatters on-line +210% (2008)
Propagazione fenomeno Cycle chic
2010

Diffusione: Buenos Aires, Johannesburg,


Shangai, Mexico City, Tokio, Australia
Business: nasce il Bristol Cycle Festival Chatters on-line +274% (2009)
Propagazione fenomeno Cycle chic
2011

Diffusione: Mosca, Ottawa, Bogota, Parigi


Business: nuove aziende di sneakers per
bici, grandi firme si dedicano al settore Chatters on-line +159% (2010)
Propagazione fenomeno Cycle chic
2012

Diffusione: 100 blogs associati a Cycle Chic


Business: le bici entrano nelle settimane Chatters on-line +170% -
della moda di NY e Londra partial year (2011)
Alibaba phenomenon

biggest online commerce company, 80% of


China's online shopping market is dominated
by Alibaba
Some IBM cases stories
Home Connexion S.r.l. Esigenza aziendale:
Figino Serenza (Como), difficolt nel prendere decisioni
Italy critiche su vendite e volumi di
Desing prodotto, produzione e magazzino
marketing, vendite
allestimento vetrine per Soluzione:
la casa madre Pacific
International Group analisi sofisticate e
pianificazione scenari per far
fronte alla domanda fluttuante
Analisi e
pianificazione dello
Vantaggi:
scenario per prevedere puntualit delle consegne
la domanda futura,
mantenendo livelli di (+98%), migliori relazioni con i
approvvigionamento e fornitori (tracking efficiency) e
magazzino sotto visione pi accurata della
controllo
pipeline di vendita
RCI Banque Espaa Esigenza aziendale:
Spain Fronteggiare il rischio che i
clienti scelgano altri
Finanziaria di Renault, competitors alla scadenza dei
Dacia, Nissan in Spagna contratti
e Portogallo
Soluzione:
Analizzare le preferenze dei
clienti ed il ciclo di vita dei
Integrare il CRM
(Customer Relationship
prodotti tramite la piattaforma
Management) Oracle, Oracle cloud (SaaS)
per costruire campagne Vantaggi:
di marketing Segmentazione del customer
personalizzate e
care in base a profitto, importo
aumentare la redditivit
e fedelt
Kaffee Partner Esigenza aziendale:
vendita al dettaglio Ottimizzare i costi delle campagne
Germania/Austria di vendita e marketing, soddisfare i
Sistemi di produzione clienti esistenti ed attrarne di
caff per casa/ufficio nuovi
con particolare cura Soluzione:
del design
Analizzare le abitudini di acquisto
dei clienti e generare report di
Aumentare vendita automaticamente
lefficacia delle
Vantaggi:
campagne di
marketing, per campagne marketing appropriate
consolidare ed con aumento del portafoglio
aumentare la clientela clienti, risparmio risorse uomo per
analisi di performance
GKN Driveline Esigenza aziendale:
vendita al dettaglio Ottimizzare i costi delle campagne
Germania/Austria di vendita e marketing, soddisfare i
Sistemi di produzione clienti esistenti ed attrarne di
caff per casa/ufficio nuovi
con particolare cura Soluzione:
del design
Analizzare le abitudini di acquisto
dei clienti e generare report di
Aumentare vendita automaticamente
lefficacia delle
Vantaggi:
campagne di
marketing, per campagne marketing appropriate
consolidare ed con aumento del portafoglio
aumentare la clientela clienti, risparmio risorse uomo per
analisi di performance
Infosphere Platform Examples
Solution description End user/customer Type of analytics
technology to study complex environment interactions between Beacon Institute predictive analysis
communities and ecosystem
deliver instantaneous people search from IBM BluePages (600'000 IBM Information flexible queries and result as fast
people) Management as possible

improving service means listening to customers and gathering thousands Hertz Content analytics
of comments via web, email and text message
identify traffic pattern KTH - Royal Institute of traffic management
technology
providing a platform (SmartBay) for technology development, delivering Marine Institute Ireland Ocean information management
information and services for many users (harbormaster, fishermen, in near real-time
researchers, tourism officials, etc.)
helping on-line retailer deliver the web experience their customers wants Technovated business intelligence
improve customer care with data
analytics in real-time
streaming data technology supports covert intelligence and surveillance TerraEchos protection and monitoring of
sensor systems. IBM solutions help the ADELOS system (which detect, critical infrastructure
classify, locate and track potential threats) to analyze the data streaming
and to match the sound patterns
Leveraging key data to provide proactive patient care starting 12 to 24 University of Ontario Smarter healthcare
hours before any overt sign of trouble, almost undetectable changes Institute of Technology
begin to appear in the vital signs of infants who have contracted this
infection
Holds the potential to give clinicians an unprecedented ability to
interpret
vast amounts of heterogeneous data in real time, enabling them to spot
subtle trends
Strumenti di content analytics

Watson analytics
Watson Analytics
Watson Analytics: piattaforma web che permette di:
impostare unanalisi di dominio: es. analisi vendite
caricare database in forma di testi strutturati esportati
o files Excel per quell dominio
impostare una parola chiave o una domanda sul target
dellanalisi (es. vendite)
estrarre la conoscenza, rispetto al target, in forma di
relazioni/regole. Es.:
regola a. % vendite alte per abbigliamento infante+
acquirente femmina+ forte sconto,
regola b. % vendite bassissime per abbigliamento maschile
+ acquirente femminile + forte sconto ,
regola c. %vendite basse per accessori + femmina + forte
sconto etc.
Watson Analytics
rappresentare le regole estratte in forma di
infografica (v. Figure 1, Figure 2, Figure 3)
fare infografica multitarget: es. vendite+profitto->
rispetto al profitto: volume vendite con forte
sconto risulta in perdita (profitto negative),
mentre vendite basse ma con poco o nessuno
sconto crea molto profitto (v. Figure 3)
Watson Analytics

Es. di infografica per visualizzare le regole individuate da Watson, rispetto alle categorie
di prodotto.: GENDER: Female/Male riferito allacquirente. DISCOUNT:
Large/Moderate/Small or None riferito allacquisto. Nella barra superiore vi sono le
miniature di altri tipi di estrazioni/grafici suggeriti.
Watson Analytics

Figure 2 Vendite per categorie di prodotto.


Watson Analytics

Figure 3: Vendite per categorie di prodotto correlate al profitto-> abbigliamento bambino


+ venduto ma in perdita. Accessori hanno minor volume di vendite, ma alto profitto.
IBM Watson powered
applications
IBM Watson
cognitive computing
2013: Watson aiuta un importante centro oncologico ad
accelerare il trasferimento della conoscenza dalla ricerca alla
pratica
Gen 2014: IBM annuncia nuovi Watson Services, erogati in
modalit cloud, tramite la piattaforma Bluemix, per
trasformare la Ricerca e lo Sviluppo industriale, visualizzare
insight sui Big Data e alimentare l'esplorazione analitica
2015: Bluemix si propone come una piattaforma Cloud per lo
sviluppo di applicazioni che utilizzano servizi basati su Watson
WATSON COME SERVICE

Watson necessita come tutti i sistemi di intelligenza artificiale di


una fase di train.
Sono disponibili alcuni domini su cui Watson gi addestrato
(Bluemix) altrimenti necessario un processo di addestramento
special purpose per il dominio di interesse.
Il punto di forza di Watson lavorare sul linguaggio naturale,
analizzando non soltanto le singole parole o singole frasi ma tutto il
contesto in cui esse vengono pronunciate/scritte.
Da inizio 2014 Watson offerto come Service Web integrabile in
vari applicativi.
Si passa da Cognitive products a Cognitive Systems.
In qualsiasi applicazione che sia connessa ad internet quindi
possibile inserire un pulsante personalizzato "Ask to IBM Watson"
per poter accedere in tempo reale al servizio.
CASO D'USO 1 - WATSON CHEF
CASO D'USO 1 - WATSON CHEF
Watson stato addestrato con conoscenze di cucina.
NON soltanto un sistema che dati alcuni ingredienti
disponibili calcola la ricetta fattibile con essi.
Infatti addestrato con dati relativi a ricette tipiche
regionali, ma anche nozioni relative ai vari sapori, a quale
sapore sta bene con un altro, con nozioni di psicofisica
edonica, nozioni di chimica.
Questo porta il sistema Watson Chef a saper CREARE nuove
ricette gradevoli al palato umano
In particolare, pu creare la ricetta (inedita) pi adeguata
per ogni singolo individuo prendendo alcuni dati di
profilazione utente (nazionalit, mi piace di pi salato o
dolce, piccante, sono vegetariano, etc...)
CASO D'USO 2 - WATSON ASSISTENTE AGLI
ACQUISTI

Watson funge in questo caso da addetto alle


vendite (esempio di scarpe), scegliendo il
modello pi appropriato per un certo utente.
Anche in questo caso l'analisi del linguaggio
naturale fondamentale per incorporare le
varie informazioni che altri utenti condividono
e le domande che solitamente gli utenti fanno
ai commessi umani.
CASO D'USO 3 - WATSON ASSISTENTE DI
VIAGGIO
CASO D'USO 3 - WATSON ASSISTENTE DI VIAGGIO
Servizio al passeggero: Watson aiuta a scegliere e
pianificare le proprie vacanze. L'utente chiede a
Watson in linguaggio naturale qualcosa del tipo:
"Voglio andare in vacanza con mia moglie e i miei
due figli in un posto caldo, per una settimana ad
aprile". Watson elabora il tutto e propone
Localit, hotel disponibili, aereo, taxi per arrivare
all'aeroporto etc...". Grazie ad una attenta
profilazione utente Watson in grado in tutto il
percorso di offrire sempre cose gradite al cliente,
esempio: se l'aereo in ritardo offre un buono
pasto gratis Italiano
Use cases sviluppati al DINFO con
la Fondazione ICON
Fondazione ICON: Bluemix e Watson, scenari di utilizzo
8 ottobre 2015
Incubatore Universitario Fiorentino
Overview degli scenari di utilizzo
Bluemix e Watson: Tesine
Studente Argomento Tecnologia IBM Ricadute/interconnessioni

Bando EU SOUL-FI Accelerator call


Giovanni
Journey in Florence app Bluemix + Personality Round B: TRIP - journey tutor
Grieco+
turistica con profilazione based on TouRIst Personality with
Antonio Insight
personalit high degree of privacy Dyrecta
Passaro
Lab srl + Fondazione ICON

Pubblicazione in Future Internet


Journal special Issue
Matteo ECG come predittore dello
Watson Analytics Ecosystemic Evolution Feeded by
Mazzola scompenso cardiaco
Smart Systems Prof. Giuli Guest
Editor
Overview degli scenari di utilizzo
Bluemix e Watson: Stage
Studente # Argomento Tecnologia IBM Ricadute/interconnessioni

Predizione outcomes
1 Watson Analytics Progetto DINFO-AOU Careggi
Roberta Terapia Intensiva
Rossi Bluemix + Personality
2 Dataset di personalit Proposta FI-WARE SOUL-FI
Insight
Integrabile in portali su
Bluemix + Natural
1 H2020 call finder progettazione EU o per uffici di
Language Classifier
supporto alla progettazione
Andrea
Parametrizzazione parametri
Accogli
Estrazione parametri Bluemix + Relationship terapie (Progetto DINFO-AOU
2
diario clinico Extraction Careggi)
Ricerca DINFO su farmaci LASA
Bluemix + Natural
1 AntiSPAM SMS Back-end app mobile
Iacopo Language Classifier
Girolami Call center virtuale con
2 Virtual chat for emergency Bluemix + Dialog
integrazione servizi text<->speech
Journey in Florence
Applicazione mobile per unofferta turistica profilata sulla personalit
utente tramite il servizio IBM WATSON Personality Insights
Prototipo APP Android. Le funzionalit dellapplicazione sono:

Determinazione del profilo dell utente tramite il servizio IBM


WATSON Personality Insight, con il metodo Big Five,
analizzando un testo scritto dallutente.
Suggerimento automatico dei luoghi in base alla personalit
dellutente.
Pianificazione di un itinerario da parte dellutente e navigazione
verso i luoghi selezionati.
Valutazione dei luoghi visitati.
Caratterizzazione del territorio (profilo di personalit del
territorio) basata sul giudizio espresso dallutente.
Journey in Florence
Risultati: Analisi Short-Term
Coppia predittiva LF/HF
e pNN20 con potere
predittivo del 92%
H2020 Call Finder

Lambito di classificazione dei progetti scelto quello del


programma Horizon2020.

La gerarchia che costituisce la struttura in cui vengono


catalogati dei progetti in un programma la seguente:

Programme H2020 FP7


Societal Excellence Industrial
Main Pillar
Challelnges Sciences Leadership
Environme Transport
Challenge Energy Food Health
nt
Call Waste Water SC5
Lapplicazione: schema di
funzionamento

5
Predizione outcomes per Terapia Intensiva

Ricerca di predittori connessi a parametri utili alla gestione del reparto di terapia
intensiva utilizzando il servizio IBM Watson Analytics
USE CASE 1: Antispam SMS (a regime)

Connessione al
SMS text servizio
ricevuto

Spam or Human
SMS

72/10
Realizzazione Servizio Antispam

Codice cUrl per dataset Training

Dataset
API Rest SMS

73/10