Sei sulla pagina 1di 10

La Regola S.M.A.R.

T per Vincere con i


Big Data
Bernard Marr e Smart Data
‘Big Data: Using SMART Big
Buona parte di questo articolo prende ispirazione dal libro
Data, Analytics and Metrics To Make Better Decisions and Improve
Performance’
Il libro è stato scritto da uno dei massimi esperti di Big data e Business intelligence al
mondo: Bernard Marr.

Spesso definito Big data Guru Bernard ha scritto questo fantastico libro giocando sulla parola
Smart Data.

Spesso le aziende non hanno bisogno di enormi quantità di dati o risorse.

Bastano semplici datasets e persone sufficientemente esperte di business per creare valore aggiunto.

L’approccio di Marr ai Big data si basa sull’acronimo di SMART data:

• Start with Strategy


• Measure Metrics and Data
• Apply Analytics
• Report Results
• Transform Business

In questo articolo spiegherò ogni punto della parola smart, ovvero come creare valore per il tuo
business sfruttando dati digitali.

Inizia con una Strategia (S)


Iniziare con strategia significa capire in quale posizione si trova la tua azienda. E’ il primo passo per
la Big Data Analysis.

Come avevo accennato prima, il 99% delle aziende italiane non ha ne soldi ne risorse per potersi
permettere un team di Data Scientists
Non siamo tutti Google o Uber che hanno la possibilità di sfruttare enormi quantità di dati digitali.

O spendere buona parte del budget in Data Exploration cercando tattiche innovative per
sconvolgere il mercato

Inizia con dati che già possiedi e cerca qualche modello predittivo che davvero ti possa
aiutare nel breve-medio periodo.

E’ inutile parlare di intelligenza artificiale, machine learning e deep leraning quando nel 90% dei
casi, nella vita reale, non avrebbero alcuna utilità.

Molto spesso basta il Data Analytics, statistica e conoscenza del settore.

Farsi le giuste domande


A volte si trovano i dati, si crede di aver scoperto un trend vincente e il poco senso critico porta
nella direzione opposta.

Rischiando di rovinare il proprio Business.

Fin dall’inizio bisogna avere a mente l’obbiettivo che si vuole raggiungere. E’ inutile cercare
disperatamente i dati prima di capire come dovremmo usarli.

Solamente dopo aver ben chiara la direzione si può passare al prossimo step: farsi le giuste
domande.
Se il tuo obbiettivo è aumentare i tuoi clienti, le domande a cui dovrai rispondere potrebbero essere:

• Chi sono attualmente i tuoi clienti ?


• Quali sono le loro caratteristiche demografiche ?
• Quanto spendono mediamente nella tua attività
Una volta che hai individuato le SMART question è molto più efficace iniziare a lavorare con i
dati.

Anche a livello pratico la dimensione dei datasets si riduce notevolmente. Passare da ‘archivio
tutto quello che trovo‘ a ‘cerco di individuare X e Y per raggiungere questo obiettivo‘ fa la
differenza.

Si evita frustrazione e lavoro inutile nonché il rischio di fare seri danni

In una parola tutto questo si traduce in focus, che non a caso è l’elemento fondamentale per il
successo personale e aziendale.

Metriche e Analisi dei dati (M)


Prima di parlare di metriche e analisi vediamo come distinguere in diverse categorie i Big Data.

• Dati ordinati: sono il tipo di dati più efficaci da utilizzare per generare
conoscenza. Sono dati archiviati in specifici file come csv o in database.
Pronti per essere analizzati. Con una riga di codice possono essere
importati e visualizzati con le librerie di Python, come pandas
• Dati non ordinati e parzialmente ordinati: sono i veri Big Data.
Miliardi di dati non ordinati e spesso difficili da analizzare. I dati non
ordinati comprendono anche immagini, registrazioni, documenti di testo,
video, mail. Per poterli utilizzare è necessario un ulteriore sforzo per
convertirli in ordinati. Spesso questo processo è costoso in termini di
tempo e difficilmente automatizzabile.
Chiaramente tutti parlano di Big Data. Di informazioni infinite in giro per il web che possono
cambiarti la vita.

In parte è vero ma la domanda è sempre la stessa.

Hai abbastanza risorse per trarne vantaggio ? O ancora più semplicemente, ne ha davvero bisogno il
tuo business ? Possono rispondere ad una tua reale esigenza ?

Da dove prendere i dati da analizzare


Cerchiamo di capire più nel dettaglio dove possiamo prendere i dati per le nostre analisi.

Una volta comprese le tecniche di acquisizione sarà ancora più facile capire perché i
dati non ordinati non sono sempre la soluzione migliore.

• Chiedere direttamente informazioni: spesso sottovalutato ma di grande


efficacia. I semplici sondaggi o le recensioni dei clienti sono un’ottima
fonte di dati. Sono facilmente ordinabili e pronti all’uso. Dalle stelle su
google a volontari che compilano questionari lasciando la propria
opinione.
• Dati di transazione: vengono generati ogni volta che un cliente effettua
un acquisto. Ci danno importanti informazioni come cosa viene comprato,
a che ora, in quale zona geografica. Se combinati con altre informazioni
possono dare risultati inaspettati e vincenti.
• Comprare dati: il business di molte aziende è proprio quello di tenere i
dati più o meno personali in immensi database. Spesso sono utili fonti di
informazioni e possono dare grandi vantaggi. Come mail preferenze e e
cronologia acquisti di clienti nel tuo target.
• Dati ‘Catturati‘: catturati nel senso presi inconsapevolmente dalle
persone. Dalle ricerche google alle posizioni GPS. Con l’esplosione
dell’IoT la quantità di questo tipo di dati aumenterà in modo
esponenziale. Rivelando anche dati personali della quotidianità,
facilmente intuibili dalle persone che utilizzano questi dispositivi.
• Dati generati consapevolmente : post su Facebook, video e tweets.
Possono sembrare innocui ma conosciamo tutti l’esito delle elezioni
americane del 2018. La psicometria applicata ai mi piace, alle preferenze
può dare risultati straordinari. Sia in positivo che in negativo.

Come procedere con l’analisi


Ora che abbiamo analizzato le fonti più importanti di dati vediamo quale può essere il prossimo
step.

A seconda delle nostre domande abbiamo collezionato i dati che potrebbero aiutarci.

Abbiamo visto che ci sono diversi fonti per raccogliere dati e dobbiamo scegliere quale usare.

Prima di tutto dobbiamo assolutamente tenere conto di quanto dispendioso possa essere un metodo
piuttosto che un altro per prendere i dati.

Sia in termini di tempo che di denaro.

Come indicazione generale possiamo seguire una semplice scaletta che può per lo meno metterci
sulla giusta strada .

A quali dati e quali fonti dobbiamo dare la precedenza ?

• Senza dubbio iniziare con i dati già ordinati e interni all’azienda. Con
interni intendo dati già presenti nei propri database e facilmente
accessibili. Nulla che richiede ulteriore intervento per catturare dati di
persone/servizi esterni. Questo perché sono velocemente analizzabili e
poco dispendiosi. In alcuni casi l’analisi si conclude con questo primo
step. Per questo conviene dare priorità a questo tipo di informazioni.
• Si prosegue con i dati interni e non ordinati
• Infine con i dati esterni e non ordinati
Ci si focalizza troppo su l’ultima parte. E’ vero che il futuro del Data Science è probabilmente sui
dati esterni e non ordinati ma ricordiamoci il nostro obiettivo.

Se possiamo rispondere alle nostre domande risparmiando tempo e fatica perché complicarci la vita
?
Big Data Analytics (A)
Avere un obbiettivo e i giusti datasets è importante ma non basta.

Dobbiamo entrare nella parte analitica del processo per poter trasformare i dati
in conoscenze che abbiano valore per il nostro business.

Ci sono diversi tipi di dati e molto spesso non hanno grande valore se considerati a se stanti.

L’analisi diventa interessante quando si inizia a combinare diversi datasets o addirittura diversi tipi
di dati insieme. Vediamo quali sono i principali tipi di analisi che possiamo fare:

• Text Analytics: come suggerisce il nome questo tipi di analisi consiste


nel estrarre informazioni e conoscenza da testi. In moltissimi business
sono presenti grandi quantità di materiale analizzabile: come mail, report,
pdf, blog posts, report interni etc.. A sua volte il text analytics si divide in
molte sottocategorie, come sentiment analysys, document
clustering, concept extraction .
• Speech Analytics: video, podcast, registrazioni, note audio e altro ancora
sono ora analizzabili. Non solo è possibile individuare il contesto e le
parole chiavi ma perfino il ‘sentimento’ della discussione. In parole
povere cogliere frustrazione o soddisfazione riguardo un prodotto e quali
caratteristiche provocano queste emozioni
• Video e Immagini: l’analisi di video e immagini nasce con le telecamere
di sorveglianza per individuare i i borseggiatori. Oggi sono molto più
avanzati e utilizzati in diversi ambiti. Dalle telecamere delle auto con
guide autonoma che in tempo reale individuano i pericoli al face
recongition del tuo smartphone.

Vedi anche come stanno usando i big data per combattere i crimini

Come i like possono descrivere chi sei realmente


Voglio aprire una piccola parentesi facendo un esempio che mi ha colpito molto.

Giusto per farti capire quanto questa tecnologia può essere sorprendente.
La vicenda che racconto è un evento realmente accaduto ad una azienda che produce articoli per
neonati.

Il padre di una ragazza di 15 anni si presenta all’ufficio del manager lamentandosi degli annunci di
articoli per bambini che arrivano alla figlia.

“Sta cercando di incoraggiare mia figlia a rimanere in cinta ? Per quale motivo continui a mandarle
annunci di questo tipo ? “

Il manager capendo la situazione si scusa per l’inconveniente dando la colpa ad un’errore di


sistema.

Pochi giorni dopo, ancora dispiaciuto per l’errore, decide di chiamare il padre per telefono.

Questa volta la risposta è completamente sconvolgente. ” Ho parlato con mia, non ero al corrente di
alcune attività che avvenivano in casa mia. In agosto nascerà il mio primo nipote.”

In questo caso il Big Data Analysis è stato più accurato del padre della diretta interessata.

Il Data Scientist della compagnia, Andrew Pole, ha poi spiegato che l’algoritmo era giunto
alla conclusione sulla situazione della ragazza basandosi sull’analisi di 25 prodotti da lei
visualizzati.

A questo punto si potrebbe aprire un dibattito su privacy e uso improprio di dati personali.

Senza dubbio la regolazione è importante, sopratutto quando si parla di grossi colossi tech con in
mano le ‘vulnerabilità’ di milioni di persone

Comunicare i risultati (R)


Abbiamo visto l’importanza di porsi un obiettivo, di farsi le giuste domande e in base queste ultime
analizzare e raccogliere dati.

Siamo arrivati ad una parte cruciale nel processo di Big Data analysis: visualizzare i dati e saper
comunicare le nostre analisi.

Non importa quanto innovativa possa essere la tua analisi.

Se non sei capace di comunicare le tue scoperte alle persone che hanno il potere di metterle in
pratica, hai lavorato per nulla.

Se non sai comunicare con manager e direttori della tua azienda, sapendoli convincere del valore
aggiunto che puoi portare al loro business, è inutile parlare di big data analysis.

Il miglior modo per presentare dei dati è sicuramente attraverso grafici e tabelle. Ricordati che
spesso devi parlare con persone che non hanno grandi conoscenze tecniche.
Non c’è frase che meglio spiega questa situazione di: “A picture is worth a thousand words” .
Un immagine (nel nostro caso un grafico), può spiegare meglio di 1000 formule matematiche o
righe di codice.

Vediamo insieme quali sono le componenti fondamentali del Data Visualization: librerie di Python,
tool e grafici statistici.

Data Visualization
A seconda dei dati che abbiamo difronte ci sono tre tipi di grafico che ci tornano molto spesso utili:

• Grafici a una variabile: istogrammi, poligoni di frequenza, grafici a


torta, box plot
• Grafici a due variabili: proiettano l’andamento di due variabili sue due
dirsi assi per individuarne la correlazione: scatter plot, grafici cronologici
• Grafici a tre variabili: superfici 3D, heatmap, bubble plot

Se ti interessa approfondire ho scritto un guida introduttiva alla statistica per Data


Scientist e una guida su Plotly per il DataVisualization !

Ognuno di questi grafici è utile a presentare diversi tipi di dati e diversi punti di vista dello
stesso dataset.

Ad esempio un istogramma è utile per darci un’idea della frequenza assoluta de nostri dati ma non
ci dice un granché sulla frequenza relativa.

Allo stesso modo un grafico a torta ci permette di visualizzare in un’istante la frequenza relativa ma
non quella assoluta.

Saper padroneggiare i concetti di statistica descrittiva è d’obbligo per fare un buon lavoro, così
come è importante sapersi muovere con il codice

Trasforma i dati in business (T)


Metriche, analisi e algoritmi stanno già cambiando il mondo del business. Ogni impresa, di
qualsiasi dimensione e settore può sfruttare i big data.

Ci sono grandi opportunità per la tua azienda, vediamo le principali:

• Capire meglio il tuo target, le sue caratteristiche e le sue abitudini.


Ricordi l’esempio della ragazza incinta ? Le scienze sociali applicate alle
analisi dei dati personali portano risultati sempre più sorprendenti.
Tenendo d’occhio l’eticità e la possibile violazione della privacy che
alcuni modelli predittivi comportano
• Ottimizzare processi e gestione interna: individuare aree o prodotti
meno efficienti e come sostituirli. Le grandi catene di distribuzioni e i
grandi magazzini devono ottimizzare i propri spazi. Non è semplice
capire quale prodotto sia più redditizio. I dati e i dispositivi IoT sono di
grande aiuto. Tenendo monitorato ogni singolo prodotto e capendo quale
prodotto possa essere più appetibile per il pubblico
• Aumentare la sicurezza ed evitare le frodi. Videocamere intelligenti,
sensori o addirittura le carte di credito e le assicurazioni. Quando vengono
avvertite attività sospette immediatamente si procede ad un controllo. Sia
che si parli di una videocamera con il face recognition, che analizzando
contratti che presentano anomalie. Senza dimenticare come i big data
vengono usati per gli attacchi informatici, evitando perdite di dati
sensibili e intrusioni non autorizzate
Ovunque ci sia un’attività umana ci saranno anche dati analizzabili.

L’era digitale in cui sempre più ci addentriamo ha aperto la strada ad un mare di opportunità. I
dati sono stati definiti come il nuovo petrolio.
Non è un caso se le aziende più ricche del mondo sono le stesse che fanno uso massiccio dei dati.

Google, Facebook, Amazon hanno tutte un denominatore comune

Conclusione
Smart data is better than big data. I dati sono ovunque, tutte le aziende li generano ma
poche sono in grado di ricavarne informazioni utili.

Poniti un obiettivo e fatti le giuste domande. Solamente dopo si può iniziare a pensare dove e come
analizzare i dati. Concludendo con visione di business e capacità di comunicazione

Spero di aver toccato con chiarezza i punti fondamentali di una tecnologia in grande espansione e di
come possa essere utilizzata dalle aziende di ogni settore

Potrebbero piacerti anche