Nel 1969, con il nome di ARPAnet, nasce una rete di calcolatori che permetteva solo di inviare file da un
calcolatore all’altro, ed eventualmente il controllo da remoto.
L’agenzia ARPA (Advanced Research Project Agency) era stata creata qualche anno prima per permettere al
governo americano di costruire un sistema di comunicazione che, nell’eventualità di una guerra nucleare,
potesse resistere ad eventuali interruzioni. Pensiamo a come è stato risolto il problema dell’interruzione
della comunicazione «ideando» la commutazione di pacchetto in alternativa alla commutazione di circuito. Se
una comunicazione viene interrotta, posso garantire la connessione reinviando il pacchetto perso (che
contiene al suo interno l’indirizzo di partenza e l’indirizzo di destinazione). L’instradamento del pacchetto
viene gestito, nodo per nodo, in funzione delle condizioni della rete (disponibilità della connessione, traffico
ecc…)
La rete fortunatamente non dovette servire per i fini bellici temuti, e fu sviluppata per supportare la ricerca
scientifica.
Nel 1984 prende il nome di INTERNT (INTERconnected NETworks). Il progetto ha abbandonato gli scopi
militari per concentrarsi sulle possibilità offerte al modo scientifico.
L’utilizzo non è più limitato alla ricerca scientifica che aveva anche creato le basi per la Posta Elettronica che
in poco tempo si diffuse con grande velocità.
1989/1990: un ricercatore del CERN di Ginevra, Tim Berners-Lee invento il World Wide Web
I documenti, nel formato HTML (Hypertest Markup Language) sono contenuti in siti a struttura reticolare
Altri servizi sono Email, FTP (File Transfer Protocol), Chat, NewsGroup ecc.
L’ideatore del WWW, Tim Berners-Lee, ha sviluppato il progetto curando tre parti:
Un editor per la scrittura dei testi
Un insieme di regole, protocollo, per lo scambio di informazioni tra l’elaboratore che effettua la richiesta di
documenti attraverso il browser, ed il server sul quale risiede il documento richiesto (e/o le informazioni
richieste)
Internet è un’infrastruttura (rete di reti), costituita dalla interconnessione di più reti autonome (Internetworking)
• Si basa su un insieme di protocolli di comunicazione, denominati Internet Protocol Suite, definiti da un organismo
internazionale (IETF – Internet Engineering Task Force)
L’indirizzo numerico (a 32 o 128 bit) non è di utilizzo facile per gli utenti finali
Si ricorre allora all’uso di indirizzi alfanumerici più facili da ricordare (mnemonici)
Ma gli indirizzi mnemonici devono essere convertiti in indirizzi numerici utilizzati dai router
La conversione è affidata ad un meccanismo distribuito denominato DNS (Domain Name System)
Nell’indirizzo mnemonico compare in ultima posizione il dominio di primo livello
Per esempio, in www.lumsa.it, il dominio di primo livello è it
I domini di primo livello possono essere geografici (it, fr, es, uk, ...) o non geografici (com, net, org, ...)
Il paradigma client-server
La comunicazione con il server avviene secondo una serie di regole standard (protocollo)
Protocolli di comunicazione
Come nel caso della codifica dei dati occorre utilizzare degli standard internazionali per mantenere compatibilità nel
tempo ed interoperabilità tra dispositivi diversi
– la semantica, che riguarda, per esempio, il significato di alcuni valori utilizzati per il controllo della
trasmissione e la gestione degli errori;
Esempi:
Il Modello ISO-OSI
Nel passaggio ai livelli inferiori il messaggio viene elaborato e preparato per la trasmissione (tipicamente
aggiungendo informazioni), fino a giungere al livello fisico, che si occupa dell’effettiva trasmissione verso la
stazione di destinazione.
A destinazione il messaggio compie il percorso nella direzione inversa: dal livello più basso a quello più alto.
Ad ogni passaggio di livello il messaggio viene elaborato eliminando, ad esempio, le informazioni non
necessarie per i livelli superiori
Architettura TCP/IP
– Trasporto: trasforma i dati in modo da essere inviabili secondo le regole del protocollo TCP (più affidabile) o UDP
(più indicato per comunicazioni in tempo reale/streaming)
– Rete: protocollo IP di invio ed instradamento dei singoli pacchetti di dati sulla rete:
User Agent:
Mail Server:
Mailbox contenente messaggi (non ancora letti) per l’utente (nella casella di posta)
Coda di messaggi in uscita (non ancora spediti)
Protocollo SMTP tra i mail server per il recapito dei messaggi:
1. Oltre a messaggi testo può inviare immagini, video, file audio, etc.
2. Utilizza una versione proprietaria di un protocollo open: Extensible Messaging and Presence Protocol
(XMPP).
Messaggistica real-time
Le origini della Teoria dei Grafi: I ponti di Koenigsberg. Nel corso dei secoli è stata più volte proposta la questione se
sia possibile con una passeggiata seguire un percorso che attraversi ogni ponte una e una volta soltanto e tornare al
punto
di partenza.
Un grafo è una struttura “relazionale” che si presta perfettamente all’analisi del funzionamento delle reti sociali
attraverso una specifica modellazione (Social Network Analysis)
Può rappresentare:
- Un programma di calcolo
Cammino
Esempi
- Facebook - i nodi sono le persone e gli archi sono le amicizie (schema semplificato)
Grafo orientato:
- il Grafo del Web (Webgraph) - i nodi sono le pagine Web e gli archi sono i link (diretti) tra le pagine
- Twitter: una persona A può seguire B ma B può non seguire A
Considerando il grafo non orientato di Facebook, se gli archi rappresentano le interazioni, possiamo intuire perché il
concetto di grafo sociale sia stato esteso considerando nodi anche i video, le immagini ed altri oggetti
gli archi sono le interazioni del tipo «alla persona A piace la foto pubblicata dalla persona B»
i nodi non sono più solo le persone e gli archi non sono più solo le amicizie
Esempi:
Collegamenti aerei
Autostrade
Metro Roma
Se n sono le persone
Ogni persona rappresenta un nodo di un grafo non orientato
stringe la mano a tutti gli altri (n-1) una sola volta (arco)
ci saranno n(n-1) strette di mano ma ... ogni stretta di mano verrebbe contata due volte se non si dividesse
per 2, quindi in totale ci saranno
n(n-1)/2 effettive strette di mano
RETI SOCIALI
Le reti sociali
Una rete sociale è un qualsiasi gruppo di attori sociali (individui o organizzazioni) connessi tra loro da diversi
legami sociali.
È uno spazio nel quale costruire e ricercare relazioni con le altre persone per la circolazione delle informazioni
I grafi sono da sempre, ancor prima di Internet, lo strumento usato per la modellazione di reti sociali (o social
networks).
Le reti sociali:
Ne studiamo:
La Natura
L’Intensità
Come stimare la distanza tipica tra due nodi casuali di una rete sociale?
«La teoria del mondo piccolo o dei piccoli mondi, o effetto del mondo piccolo è una teoria matematica e sociologica
che sostiene che tutte le reti complesse presenti in natura sono tali che due qualunque nodi possono essere collegati
da un percorso costituito da un numero relativamente piccolo di collegamenti.» Fonte: Wikipedia
Esperimento di Milgram
Nel 1967, Milgram fece il seguente esperimento (voleva scoprire qual’era la probabilità che due persone scelte a caso
si conoscessero):
Diede delle lettere a persone di Omaha (Nebraska) e Wichita (Kansas), destinate a residenti di Boston
(Massachussets).
Numero di Erdős: i nodi della rete sono autori di articoli di matematica, e c’è un arco tra due autori se hanno
lavorato insieme in un articolo
Numero di Bacon (Kevin): i nodi della rete sono attori cinematografici, e c’è un arco tra due attori se hanno
lavorato insieme in un film
La nostra società è profondamente interconnessa
Non c’è una formula matematica che provi quanto emerso da questo «scherzare con i numeri» ma non ci
sono smentite derivate da esperimenti in contraddittorio.
Se la distanza, quando esiste una connessione, tra tutti è piccola, il numero di persone a distanza “molto” piccola è
numeroso!
Per renderci conto del diametro “piccolo”, possiamo provare a visualizzare la mappa dei nostri social
network!
Tante reti sociali hanno reso disponibili dei tool per poterle visualizzare
Tra queste: Facebook, Twitter, LinkedIn...
(LinkedIn Maps)
Twitter (MentionMap)
Funzioni principali:
Web Scraping
Processo di utilizzo dei Robot (bot) per estrarre contenuti e dati da un sito web.
Anche detto «web data extraction», è una tecnica informatica di estrazione di dati e informazioni dalla rete mediante
strumenti automatizzati come ad esempio:
- Marketing elaborazioni di «analisi del testo» e utilizzo di tecniche di «sentiment analysis» (raccolta in
tempo reale di opinioni espresse in vari contesti)
Un motore di ricerca (Google, Bing, etc.) si può dividere in tre parti concettualmente distinte:
Crawler: la parte che si occupa di “scaricare” in locale le pagine, che poi saranno processate dal motore
Indexer, che crea un indice dei documenti, che viene usato dal motore
Query processor, che riceve la query utente e restituisce i risultati ordinati
Metodi di ricerca e indicizzazione
I robot (programmi che operano senza supervisione Umana) si occupano di creare gli indici
Per far questo partono dall’esplorazione della pagina web iniziale (Universal Resource Locator) ricercando
tutti i link presenti in essa
Ogni link trovato sarà processato allo stesso modo in una mappatura a ricognizione continua
Non tutti i contenuti sono però accessibili tramite l’homepage del sito ma possono essere ricercate tramite il motore
di ricerca interno al sito stesso.
Ad esempio:
PageRank
PageRank
L’idea alla base di PageRank è la seguente: “Un sito web autorevole è quello che è puntato da siti web autorevoli”.
- PageRank, per calcolare i valori delle pagine, guarda solo la struttura di grafo delle pagine Web (WebGraph):
ogni pagina è un nodo, ogni link tra le pagine è un arco diretto.
SOCIAL MEDIA:
Insieme di applicazioni web tramite le quali gli utenti possono creare e scambiarsi contenuti
è contemporaneamente uno spazio, nel quale prendono vita le informazioni, fortemente integrato con gli
strumenti di creazione e scambio delle informazioni stesse
“un gruppo di applicazioni web basate sui paradigmi (tecnologici ed ideologici) del web 2.0 che permettono lo
scambio e la creazione di contenuti generati dagli utenti”. (Andreas Kaplan e Michael Haenlein)
Possiede tutte le caratteristiche di una piattaforma digitale
Community online
Gruppo di persone che si incontrano, discutono e si scambiano informazioni attraverso la rete (gli strumenti utilizzati
più frequentemente dagli utenti per interagire sono forum, chat e programmi di messaggistica istantanea) (Def.
Treccani)
• I social media sono la piattaforma che permette alle community online di formarsi ed evolversi
Community online:
Le tecniche di analisi sono tante, ma tutte sono volte ad individuare le relazioni esistenti tra i componenti la
community. Le tecniche si possono basare su:
Per contenuto generato dagli utenti (dall'inglese user- generated content; sigla UGC) si intende qualsiasi tipo di
contenuto - come ad esempio: post nei blog, contributi a wiki, discussioni nei forum, post nei reti sociali e tweet,
podcast e altri tipi di file audio, immagini e video digitali - creato dagli utenti e pubblicato in Internet, spesso reso
fruibile tramite le piattaforme di social networking (fonte: wikipedia)
- Requisiti di pubblicazione
- Sforzo creativo
- Creazione al di fuori delle pratiche e delle routine professionali
Social Network:
Analisi delle strutture sociali finalizzati alla conoscenza del comportamento collettivo
Oggetto dello studio sono le dinamiche relazionali che intercorrono tra gli individui
La teoria permette di indagare sulla reciproca influenza tra comportamenti sociali e sul sistema
d’interdipendenze
Il dato descrive in maniera elementare, un fatto, un oggetto, un evento o altro, attraverso simboli o
combinazione di simboli. Non è interpretato ma esprime in forma originaria l’oggetto rappresentato dal dato
stesso.
Il dato diventa informazione quando ci permette di scegliere.
L’informazione diventa conoscenza quando ci permette di capire
La conoscenza diventa competenza quando ci permette di agire.
Il Data Mining
Selezione, osservazione e modellazione di grandi moli di dati al fine di riconoscere principi di funzionamento non noti
a priori
«Di recente è stata sollevata la questione dati, che metteva a rischio la privacy degli utenti che effettuavano l’accesso
automatico attraverso una piattaforma molto diffusa. Il problema non è più presente a seguito di un aggiornamento:
è sufficiente quindi avere l’ultima versione dell’applicazione per proteggere totalmente i propri dati.»
SPUNTI DI RIFLESSIONE:
Vi sono situazioni nelle quali la sequenza di informazioni relative ad un soggetto, ad esempio acquisti
specifici, può ricondurre all’identità della persona
Ogni trattamento di dati personali deve avvenire nel rispetto dei principi fissati all’articolo 5 del Regolamento
(UE) 2016/679, che qui si ricordano brevemente:
liceità, correttezza e trasparenza del trattamento, nei confronti dell’interessato;
limitazione della finalità del trattamento, compreso l’obbligo di assicurare che eventuali trattamenti
successivi non siano incompatibili con le finalità della raccolta dei dati;
minimizzazione dei dati: ossia, i dati devono essere adeguati pertinenti e limitati a quanto necessario rispetto
alle finalità del trattamento;
esattezza e aggiornamento dei dati, compresa la tempestiva cancellazione dei dati che risultino inesatti
rispetto alle finalità del trattamento;
limitazione della conservazione: ossia, è necessario provvedere alla conservazione dei dati per un tempo non
superiore a quello necessario rispetto agli scopi per i quali è stato effettuato il trattamento;
integrità e riservatezza: occorre garantire la sicurezza adeguata dei dati personali oggetto del trattamento.
Il Regolamento (articolo 5, paragrafo 2) richiede al titolare di rispettare tutti questi principi e di essere “in
grado di comprovarlo”. Questo è il principio detto di “responsabilizzazione” (o accountability) che viene poi
esplicitato ulteriormente dall’articolo 24, paragrafo 1, del Regolamento, dove si afferma che “il titolare mette
in atto misure tecniche e organizzative adeguate per garantire, ed essere in grado di dimostrare, che il
trattamento è effettuato conformemente al presente Regolamento.”
Garantire la privacy:
Preoccuparsi della «privacy impact», identificando preventivamente quali conseguenze possono derivare dalla
gestione e analisi dei dati
Il GDPR: il Regolamento generale (Ue) sulla protezione dei dati personali 2016/679
Responsabilizza titolari e responsabili del trattamento in misura molto superiore al passato, imponendo di
pensare in anticipo le finalità e le modalità dei trattamenti e di costruirne correttamente e in modo
documentabile l’impalcatura giuridica e organizzativa.
GDPR
Verifica dei rischi legati alla protezione dei dati a livello aziendale
Mappatura dei dati
Monitoraggio
Sicurezza
Comunicazioni delle violazioni
Google Analytics
Google Analytics
Per utilizzare la piattaforma è necessario creare un account principale, all’interno del quale possono essere definiti
fino a 100 account secondari per i singoli componenti il team di lavoro.
Poi devono essere definite le proprietà, che indicano cosa si vuole tracciare. Per ogni proprietà si ottiene un
tag che dovrà essere inserito nel sito. La guida informa che per utilizzare la proprietà si dovrà effettuare il
«Copia e incolla il tag globale del sito subito dopo il tag di apertura {head} su ogni pagina web da misurare»
all’interno di ogni proprietà si possono creare fino a 25 viste, cioè l’insieme dei rapporti che creeremo sulla
piattaforma; la vista di default è “Tutti i dati del sito web”
Account
Proprietà
In questa sezione possono essere indicate le connessioni ad altri servizi come ad esempio Google Ad (a
pagamento)
Ad (o AdSense) è una piattaforma di Google per la gestione in tempo reale di annunci pubblicitari
Vista
Impostare i filtri.
Destinazione
Durata
Pagine per sessione
eventi
Ci basiamo sui cookie per memorizzare le tue impostazioni e altre preferenze. Usiamo i cookie anche per:
Affinché i visitatori dei siti web possano impedire l'utilizzo dei propri dati da parte di Google Analytics,
abbiamo sviluppato il Componente aggiuntivo del browser per la disattivazione di Google Analytics per i siti
web che utilizzano la versione supportata del codice JavaScript di Google Analytics (analytics.js, gtag.js).
Per eseguire la disattivazione, scarica e installa il componente aggiuntivo per il browser web in uso. Il
Componente aggiuntivo per la disattivazione di Google Analytics è compatibile con Chrome, Safari, Firefox e
Microsoft Edge. Per funzionare, il componente aggiuntivo per la disattivazione deve poter essere
correttamente caricato ed eseguito nel browser. Scopri di più sulla disattivazione e su come installare
correttamente il componente aggiuntivo per il browser facendo clic qui.