Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Spesso definito Big data Guru Bernard ha scritto questo fantastico libro giocando sulla parola
Smart Data.
Bastano semplici datasets e persone sufficientemente esperte di business per creare valore aggiunto.
In questo articolo spiegherò ogni punto della parola smart, ovvero come creare valore per il tuo
business sfruttando dati digitali.
Come avevo accennato prima, il 99% delle aziende italiane non ha ne soldi ne risorse per potersi
permettere un team di Data Scientists
Non siamo tutti Google o Uber che hanno la possibilità di sfruttare enormi quantità di dati digitali.
O spendere buona parte del budget in Data Exploration cercando tattiche innovative per
sconvolgere il mercato
Inizia con dati che già possiedi e cerca qualche modello predittivo che davvero ti possa
aiutare nel breve-medio periodo.
E’ inutile parlare di intelligenza artificiale, machine learning e deep leraning quando nel 90% dei
casi, nella vita reale, non avrebbero alcuna utilità.
Fin dall’inizio bisogna avere a mente l’obbiettivo che si vuole raggiungere. E’ inutile cercare
disperatamente i dati prima di capire come dovremmo usarli.
Solamente dopo aver ben chiara la direzione si può passare al prossimo step: farsi le giuste
domande.
Se il tuo obbiettivo è aumentare i tuoi clienti, le domande a cui dovrai rispondere potrebbero essere:
Anche a livello pratico la dimensione dei datasets si riduce notevolmente. Passare da ‘archivio
tutto quello che trovo‘ a ‘cerco di individuare X e Y per raggiungere questo obiettivo‘ fa la
differenza.
In una parola tutto questo si traduce in focus, che non a caso è l’elemento fondamentale per il
successo personale e aziendale.
• Dati ordinati: sono il tipo di dati più efficaci da utilizzare per generare
conoscenza. Sono dati archiviati in specifici file come csv o in database.
Pronti per essere analizzati. Con una riga di codice possono essere
importati e visualizzati con le librerie di Python, come pandas
• Dati non ordinati e parzialmente ordinati: sono i veri Big Data.
Miliardi di dati non ordinati e spesso difficili da analizzare. I dati non
ordinati comprendono anche immagini, registrazioni, documenti di testo,
video, mail. Per poterli utilizzare è necessario un ulteriore sforzo per
convertirli in ordinati. Spesso questo processo è costoso in termini di
tempo e difficilmente automatizzabile.
Chiaramente tutti parlano di Big Data. Di informazioni infinite in giro per il web che possono
cambiarti la vita.
Hai abbastanza risorse per trarne vantaggio ? O ancora più semplicemente, ne ha davvero bisogno il
tuo business ? Possono rispondere ad una tua reale esigenza ?
Una volta comprese le tecniche di acquisizione sarà ancora più facile capire perché i
dati non ordinati non sono sempre la soluzione migliore.
A seconda delle nostre domande abbiamo collezionato i dati che potrebbero aiutarci.
Abbiamo visto che ci sono diversi fonti per raccogliere dati e dobbiamo scegliere quale usare.
Prima di tutto dobbiamo assolutamente tenere conto di quanto dispendioso possa essere un metodo
piuttosto che un altro per prendere i dati.
Come indicazione generale possiamo seguire una semplice scaletta che può per lo meno metterci
sulla giusta strada .
• Senza dubbio iniziare con i dati già ordinati e interni all’azienda. Con
interni intendo dati già presenti nei propri database e facilmente
accessibili. Nulla che richiede ulteriore intervento per catturare dati di
persone/servizi esterni. Questo perché sono velocemente analizzabili e
poco dispendiosi. In alcuni casi l’analisi si conclude con questo primo
step. Per questo conviene dare priorità a questo tipo di informazioni.
• Si prosegue con i dati interni e non ordinati
• Infine con i dati esterni e non ordinati
Ci si focalizza troppo su l’ultima parte. E’ vero che il futuro del Data Science è probabilmente sui
dati esterni e non ordinati ma ricordiamoci il nostro obiettivo.
Se possiamo rispondere alle nostre domande risparmiando tempo e fatica perché complicarci la vita
?
Big Data Analytics (A)
Avere un obbiettivo e i giusti datasets è importante ma non basta.
Dobbiamo entrare nella parte analitica del processo per poter trasformare i dati
in conoscenze che abbiano valore per il nostro business.
Ci sono diversi tipi di dati e molto spesso non hanno grande valore se considerati a se stanti.
L’analisi diventa interessante quando si inizia a combinare diversi datasets o addirittura diversi tipi
di dati insieme. Vediamo quali sono i principali tipi di analisi che possiamo fare:
Vedi anche come stanno usando i big data per combattere i crimini
Giusto per farti capire quanto questa tecnologia può essere sorprendente.
La vicenda che racconto è un evento realmente accaduto ad una azienda che produce articoli per
neonati.
Il padre di una ragazza di 15 anni si presenta all’ufficio del manager lamentandosi degli annunci di
articoli per bambini che arrivano alla figlia.
“Sta cercando di incoraggiare mia figlia a rimanere in cinta ? Per quale motivo continui a mandarle
annunci di questo tipo ? “
Pochi giorni dopo, ancora dispiaciuto per l’errore, decide di chiamare il padre per telefono.
Questa volta la risposta è completamente sconvolgente. ” Ho parlato con mia, non ero al corrente di
alcune attività che avvenivano in casa mia. In agosto nascerà il mio primo nipote.”
In questo caso il Big Data Analysis è stato più accurato del padre della diretta interessata.
Il Data Scientist della compagnia, Andrew Pole, ha poi spiegato che l’algoritmo era giunto
alla conclusione sulla situazione della ragazza basandosi sull’analisi di 25 prodotti da lei
visualizzati.
A questo punto si potrebbe aprire un dibattito su privacy e uso improprio di dati personali.
Senza dubbio la regolazione è importante, sopratutto quando si parla di grossi colossi tech con in
mano le ‘vulnerabilità’ di milioni di persone
Siamo arrivati ad una parte cruciale nel processo di Big Data analysis: visualizzare i dati e saper
comunicare le nostre analisi.
Se non sei capace di comunicare le tue scoperte alle persone che hanno il potere di metterle in
pratica, hai lavorato per nulla.
Se non sai comunicare con manager e direttori della tua azienda, sapendoli convincere del valore
aggiunto che puoi portare al loro business, è inutile parlare di big data analysis.
Il miglior modo per presentare dei dati è sicuramente attraverso grafici e tabelle. Ricordati che
spesso devi parlare con persone che non hanno grandi conoscenze tecniche.
Non c’è frase che meglio spiega questa situazione di: “A picture is worth a thousand words” .
Un immagine (nel nostro caso un grafico), può spiegare meglio di 1000 formule matematiche o
righe di codice.
Vediamo insieme quali sono le componenti fondamentali del Data Visualization: librerie di Python,
tool e grafici statistici.
Data Visualization
A seconda dei dati che abbiamo difronte ci sono tre tipi di grafico che ci tornano molto spesso utili:
Ognuno di questi grafici è utile a presentare diversi tipi di dati e diversi punti di vista dello
stesso dataset.
Ad esempio un istogramma è utile per darci un’idea della frequenza assoluta de nostri dati ma non
ci dice un granché sulla frequenza relativa.
Allo stesso modo un grafico a torta ci permette di visualizzare in un’istante la frequenza relativa ma
non quella assoluta.
Saper padroneggiare i concetti di statistica descrittiva è d’obbligo per fare un buon lavoro, così
come è importante sapersi muovere con il codice
L’era digitale in cui sempre più ci addentriamo ha aperto la strada ad un mare di opportunità. I
dati sono stati definiti come il nuovo petrolio.
Non è un caso se le aziende più ricche del mondo sono le stesse che fanno uso massiccio dei dati.
Conclusione
Smart data is better than big data. I dati sono ovunque, tutte le aziende li generano ma
poche sono in grado di ricavarne informazioni utili.
Poniti un obiettivo e fatti le giuste domande. Solamente dopo si può iniziare a pensare dove e come
analizzare i dati. Concludendo con visione di business e capacità di comunicazione
Spero di aver toccato con chiarezza i punti fondamentali di una tecnologia in grande espansione e di
come possa essere utilizzata dalle aziende di ogni settore