Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Sandro Stancampiano1
Parole chiave: Big Data, Text Mining, Cultural Heritage, Municipalities, Tourism.
Gruppo tematico: 27 Turismo e qualità della vita. 20 Big data e misura e monitoraggio della qualità
della vita.
1. Introduzione2
2 Le opinioni espresse in questo contributo sono sotto la responsabilità dell’autore e non riflettono
necessariamente le politiche dell’ISTAT (Istituto Nazionale di Statistica).
2 Stancampiano S.
2. Framework teorico
1 TripAdvisor è una delle maggiori piattaforme utilizzate dagli utenti nel mondo per scambiare e condividere
informazioni turistiche.
2 Diogene è un software che consente di effettuare data wrangling, ovvero di scaricare dati dal web utilizzando
tecniche di scraping, di organizzarli in una base di dati e di creare corpus ad hoc per studi di Text Mining.
3 IRaMuTeQ è un software realizzato per effettuare analisi multidimensionali di testi che fornisce una interfaccia
grafica a R, altro software di elaborazione dati particolarmente efficiente per l’analisi di grandi dataset.
Matera 2019 Text Mining dei Social Network
libertà calcolato sulla tabella di contingenza che incrocia presenza/assenza della parola in
una UCE con l’appartenenza o meno di questa UCE alla classe considerata [12].
Dall’interpretazione dei segmenti di testo evidenziati nel dendrogramma è possibile
ottenere la rappresentazione delle tematiche trattate nel corpus. Coerentemente con
l’obiettivo di questo studio si perde il riferimento alle specifiche recensioni per accedere a
una visione più generale e statisticamente rilevante di quanto osservato dai visitatori.
3. Corpus
Sono state raccolte 2237 recensioni pubblicate su TripAdvisor tra gennaio 2018 e maggio 2019
relative alla visita dei Sassi di Matera.
Abbiamo scelto TripAdvisor perché si tratta dello strumento di condivisione di esperienze e di
scambio di informazioni più utilizzato: ad oggi contiene 760 milioni di recensioni e opinioni che
riguardano oltre 8 milioni di sistemazioni, linee aeree, esperienze e ristoranti e può vantare una media
di visitatori unici mensile di 490 milioni. Si tratta di un punto di riferimento per turisti e viaggiatori di
molti paesi considerando che è disponibile in 28 lingue 1 .
Le recensioni sono state suddivise in 2442 segmenti di testo, il numero delle forme è 4726 (types)
e 83155 sono le occorrenze (tokens). Il numero degli hapax è 2237 pari al 2,69% delle occorrenze e al
47,33% delle forme. Le forme attive sono 4211 di cui 1522 con una frequenza >= 3, la media delle
forme per segmento è 34,05. La ricchezza lessicale, calcolata come proporzione di parole diverse (il
vocabolario) sul totale delle occorrenze è 5,7% (V/N*100), di conseguenza il corpus raccolto è
statisticamente rilevante e può essere analizzato [13].
Il software ha proposto una divisione del corpus in 3 classi in cui sono stati classificati 1898
segmenti (77,72%). Si tratta di una percentuale di segmenti classificati accettabile per proseguire con
l’analisi del corpus e procedere con l’interpretazione dei risultati ottenuti [14].
4. Risultati
Le classi, come mostrato in Figura 1, suggeriscono una bipartizione del corpus in due subcorpus: il
primo è rappresentato dalla classe verde costituita dal 39,2% dei segmenti classificati (744/1898), il
secondo è a sua suddiviso in due sottoinsiemi; la classe rossa e la classe blu composte
rispettivamente dal 35,1% (667/1898) e dal 25,7% (487/1898) dei segmenti classificati
dall’algoritmo.
Mozzafiato ogni volta che ci ritorno sembra la prima. Matera è stupenda sia
il giorno che la sera dove sembra un presepe, bisogna camminare molto ma
ne vale davvero la pena per il panorama mozzafiato che offre.
Indimenticabile esperienza unica e suggestiva quella di passeggiare tra i
sassi di Matera sia di giorno che di sera regalano emozioni mozzafiato. Una
esperienza indimenticabile è stata anche quella del presepe vivente
organizzato dalle varie associazioni del posto.
Vacanze natalizie a Matera, posto fantastico questi sassi di Matera abbiamo
alloggiato ai sassi caveosi a pochi metri dal duomo la vista è spettacolare sia
di giorno che di notte con scorci assolutamente affascinanti che
rappresentano un vero piacere. Scoprire passeggiando lentamente per le
strade una gita indimenticabile
Matera giorno e notte da visitare assolutamente sia di giorno che nella
fantastica atmosfera di sera sembra che camminando nei sassi ci perdiamo
ma in quattro e quattro otto siamo dalla parte opposta.
Incanto la citta di Matera è un meraviglioso labirinto di scale e vicoli ciechi
con case quasi a ridosso della gola che da sul torrente gravina. Bellissima di
giorno incantevole la notte vi consiglio vivamente di arrivare al belvedere di
murgia timone per avere una vista totale.
Tabella 1 - Cluster 1: UCE tipiche in ordine per somma 𝛘2 delle forme contrassegnate
Tabella 2 − Cluster 2: UCE tipiche in ordine per somma 𝛘2 delle forme contrassegnate.
Tabella 3 − Cluster 3: UCE tipiche in ordine per somma 𝛘2 delle forme contrassegnate.
5. Conclusioni
Riferimenti bibliografici
(1) Rezzani, A., (2013). Big Data. Architettura, tecnologie e metodi per l’utilizzo di
grandi basi di dati. Milano: Apogeo.
(2) Soro, A., (2016). Liberi e connessi. Milano: Codice Edizioni.
(3) Mayer-Schönberger, V., Yuckier K. N., (2013). Big Data. Una rivoluzione che
trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Milano: Garzanti.
(4) Ceron, A., Curini, L., Iacus, S. M., (2014). Social Media e Sentiment Analysis.
L’evoluzione dei fenomeni sociali attraverso la Rete. Springer Italia.
(5) Daas, P., Roos, M., De Blois, C., Hoekstra, R., Ten Bosch, O., Ma, Y., (2010). New
Data Sources for Statistics: Experiences at Statistics Netherlands, Discussion Paper
no. 201109, Statistics Netherlands, The Hague, The Netherlands.
(6) Giovannini, E., (2014). Scegliere il futuro. Bologna: Il Mulino.
(7) Stancampiano, S., (2019). Gestire i beni culturali con i Big Data. In: Di Bella E.,
Maggino F., Trapani M. (a cura di), Libro degli abstract. AIQUAV 2018. Atti del V
Convegno dell’Associazione Italiana per gli studi sulla Qualità della Vita 13-15
Dicembre 2018. Fiesole (FI): Genova: University Press, pp. 114 - 116.
(8) Fondazione Matera Basilicata 2018, (2019). Presentato il programma culturale di
Matera 2019 - comunicato stampa del 20 Settembre 2018.
(9) Greco, F., (2014). Integrare la disabilità. Una metodologia interdisciplinare per leggere
il cambiamento culturale. Milano: FrancoAngeli.
(10) Bolasco, S., (2014). Analisi Multidimensionale dei dati. Metodi, strategie e criteri
d’interpretazione. Roma, Carocci
(11) De Souza, M.A.R., Wall, M.L., Thuler, A.C.M.C., Lowen, I.M.V., Peres, A.M. (2018).
The use of IRAMUTEQ software for data analysis in qualitative research. Rev Esc
E n f e r U S P. 2 0 1 8 ; 5 2 ; e 0 3 3 5 3 . D O I : h t t p : / / d x . d o i . o r g / 1 0 . 1 5 9 0 /
S1980-220X2017015003353
(12) Reinert, M., (1995). I mondi lessicali di un corpus di 304 racconti di incubi attraverso
il metodo “Alceste”. In: Cipriani R. e Bolasco S. (a cura di), Ricerca Qualitativa e
Computer. Teorie, metodi e applicazioni. Milano: FrancoAngeli, 203-223.
(13) Bolasco, S., (2013). L’analisi automatica dei testi. Roma: Carocci Editore.
(14) Camargo, B.V., Justo, A.M., (2018). Tutorial para o uso do software de análise textual
IRAMUTEQ. Universidade Federal de Santa Catarina.
(15) Stancampiano, S.,(2018). Misurare, monitorare e governare le città con i Big Data. In:
Iezzi D. F., Celardo L., Misuraca M. (a cura di), JADT’ 18. Proceedings of the 14th
International Conference on the Statistical Analysis of Textual Data. Roma:
UniversItalia, 748-754.