Sei sulla pagina 1di 48

Università di Roma “La Sapienza” Facoltà di Scienze

Statistiche
23 gennaio 2008

Web 2.0: La Statistica ai tempi di YouTube e


Wikipedia

Introduzione agli strumenti del nuovo Web

Daniele Frongia
Il presente materiale è distribuito con la licenza Creative
Commons “Attribuzione - Non commerciale - Condividi allo
stesso modo - 2.5 Italia”, reperibile presso il seguente sito
Internet: http://creativecommons.org/licenses/by-nc-
sa/2.5/it/.
Programma

Introduzione al Web 2.0


Wiki in ambiente statistico
Wikipedia e la Statistica
Condivisione di video scientifici
Pubblicazioni scientifiche 2.0
Blog e motori di ricerca 2.0
Algoritmi di indicizzazione e ricerca
Probabilità e Web 2.0
Analisi delle reti sociali
Web 2.0

Web 2.0: definizione di Wikipedia


http://it.wikipedia.org/wiki/Web_2.0

Web 2.0, non si sa cos'è ma si misura lo stesso


http://punto-informatico.it/p.aspx?id=1948763

Web 2.0: una definizione


http://blog.nicolamattina.it/?p=238
Elementi innovativi del Web 2.0

L’elemento innovativo consiste nella combinazione di


vecchie tecnologie e standard (come HTML, CSS, XML,
JavaScript, DOM) per realizzarne di nuove (come AJAX)

RIA: Rich Internet Application

Mashup...
Mashup

http://www.deeario.it/2006/08/21/mashup-mappa-dei-blog-
italiani/

http://pipes.yahoo.com/pipes/

http://softwarecommunity.intel.com/articles/eng/1505.htm

http://code.google.com/apis/gdata/basics.html
Strumenti 2.0: una prima lista
Tipologia strumento Web 2.0 Esempi

Social bookmarking Blue Dot, del.icio.us, StumbleUpon,


Technorati

Calendaring Google Calendar, bCal, Yahoo!


Calendar

Images / Video Sharing YouTube, Flickr, FOTOLOG

Collaborative authoring Wikipedia, PBwiki, Basecamp, Social


Text, Writely

Social Networking MySpace, Orkut, Facebook, Hi5,


Friendster, LinkedIn, Neurona, Ning

Blogs Blogger, Skyblog, dBlog, Splinder,


WordPress

Communications tools Windows Live Messenger, ICQ,


Google Talk, Yahoo! Messenger

Social games Second Life, Half Life, World of


Warcraft, Lineage, RuneScape, Final
Fantasy XI, Online Chess

Netvibes, Google Reader,


Feed reader / News aggregator
FeedReader, Liferea, Straw

Gnutella, eMule, BitTorrent,


File sharing
Napster, Kazaa
Caratteristiche Web 2.0

Le caratteristiche più importanti del Web 2.0 sono:

* I siti Web 2.0 sono piattaforme che consentono una forte


interazione tra utenti

* Gli utenti usufruiscono di servizi innovativi mediante


potenti interfacce grafiche

* Gli utenti forniscono il valore aggiunto con la produzione di


contenuti e la condivisione della conoscenza

* I servizi offerti vengono aggiornati di continuo ( “perpetual


beta”)
“Il Web è il palcoscenico e la star sei tu”
Centralità e protagonismo dell'utente
Statistiche sull’uso del Web 2.0

YouTube e Second Life i primi della classe?

Quali sono i siti realmente più visitati e utilizzati?

Alcune indagini hanno provato a far luce sul alcuni aspetti del
fenomeno.

http://tallblog.conted.ox.ac.uk/index.php/2007/03/16/some-
real-data-on-web-20-use/
Strumenti 2.0: i Blog

http://it.wikipedia.org/wiki/Blog

http://www.youtube.com/watch?v=IKcqge8SvzQ
Blog
Nati nel 1997, esplosi nel 2002, quanti sono?
Strumenti 2.0: i Wiki

Wiki: ambiente web di condivisione e gestione di documenti e


file dove gli utilizzatori possono visualizzare e aggiungere
contenuti, ma anche di modificare i contenuti esistenti inseriti da
altri utilizzatori.

http://www.youtube.com/watch?v=-dnL00TdmLY

Sulla tecnologia Wiki si basa il funzionamento dell’enciclopedia


online Wikipedia.
La regina 2.0: Wikipedia

“Uno sforzo per creare e distribuire una enciclopedia libera della


più alta qualità possibile ad ogni singola persona sul pianeta
nella propria lingua” - Jimmy Wales

Wikipedia, con oltre 9 milioni di voci e 10 milioni di utenti


registrati, rappresenta la più grande collezione di sapere umano.
Wikipedia esiste in oltre 250 lingue differenti e riceve oltre 60
milioni di accessi al giorno.
Sull’attendibilità di Wikipedia

Nel 2006 la rivista Nature ha confrontato Wikipedia e la


prestigiosa Enciclopedia Britannica, giungendo a un
giudizio di sostanziale parità quanto ad autorevolezza (3.86
errori per voce per Wikipedia, 2.92 l’Enciclopedia
Britannica).
Wikipedia: le motivazioni

Fonte: ACM http://delivery.acm.org


Il futuro di Wikipedia

Proposte finalizzate a migliorare i contenuti (XVI


International World Wide Web Conference):

●Definizione della reputazione degli utenti sulla base delle


modifiche effettuate. Se il contributo resiste alle modifiche si
guadagna reputazione, mentre se il contributo viene
sostituito dalla versione precedente la reputazione scende.

●Segnalazione degli interventi faziosi prendendo in


considerazione l’identità dell’utente.
Strumenti 2.0 per la condivisione dei documenti

Alcuni strumenti 2.0 si propongono di realizzare una scrittura


collaborativa via web
Servizi online che consentono la condivisione di documenti (file,
e non pagine web come per i wiki):

Google Docs e Zoho Writer, strumenti per creare, modificare e


condividere documenti

Scribd, una sorta di YouTube per documenti in formato Word,


PDF, Excel o PowerPoint

SlideShare e Zoho Show


Ragionare 2.0

Tagging

Nel Web 2.0, per tag si intendono delle etichette che vengono
apposte ai contenuti

L’idea alla base dei tag è fare in modo che i contenuti siano
ricercabili, correlabili e utilizzabili in base a parametri semantici
(qualitativi e non quantitativi) definiti dagli utenti
Dalla tassonomia alla folksonomia

Analisi cognitiva del tagging di Rashmi


http://www.rashmisinha.com/archives/05_09/tagging-
cognitive.html

Il tagging può essere visto come una evoluzione della


tassonomia classica: “from taxonomy to folksonomy”

Folksonomia: categorizzazione collaborativa di


informazioni mediante l'utilizzo di parole chiave scelte
liberamente

Scenari futuri: Ontolologie vs folksonomie, Web


Semantico e Web 3.0
Second Life

Second Life, un ambiente virtuale dove farsi una vita


parallela con grafica 3D

Ogni utente può scegliersi o personalizzarti un personaggio


e viaggiare e vivere in un mondo virtuale, spendendo o
guadagnato linden dollars

Ridimensionato sia il numero di utenti attivi che la rilevanza


del business

Compravendita di “immobili” alle scommesse, dallo spaccio


di droga alla prostituzione…ma qualcosa di buono?
Second Life

L'avatar D73 all'ingresso del University of Portsmouth SL Research Centre


Per non perdersi

RSS
Vantaggi rispetto alle tradizionali newsletter:
la possibilità di avere un unico aggregatore per diverse
fonti, evitare lo spam, ricevere in tempo reale
un'informazione selezionata e personalizzata.
Netvibes

Netvibes (così come Google Reader) consente di


riorganizzare fonti informative in griglie personalizzate

http://www.netvibes.com
Wiki in ambito statistico

Wiki in Istat: per gestire progetti, produrre pubblicazioni in


modo collaborativo, avviare programmi educativi, condividere e
commentare del materiale in ambito statistico, etc.
PBwiki è uno dei tanti servizi per la creazione e la gestione di
wiki
http://www.apogeonline.com/webzine/2007/11/13/23/20071113
2301
Wiki in ambito statistico

http://statistics.pbwiki.com/State%20Standards
Wikipedia e la Statistica

http://it.wikipedia.org/wiki/Regressione_non_lineare

http://it.wikipedia.org/wiki/Moto_browniano

http://it.wikipedia.org/wiki/Ricerca_operativa

http://it.wikipedia.org/wiki/Censimento

http://it.wikipedia.org/wiki/Istat
Condivisione di video scientifici

Non solo YouTube e Google Video


Video Lectures http://videolectures.net
Scivee, una piattaforma di scambio tra scienziati per
video, abstract, paper, rating, commenti
http://www.scivee.tv
WikiVideo http://www.wikivideo.it/corso.php?id=155
Funzionamento di Scivee

http://www.oneweb20.it/21/01/2008/scivee-la-cultura-e-leducazione-viaggiano-online/
Editoria 2.0: http://www.lulu.com/it/
Blog statistici

Stat Project http://www.stat-project.com/


Data Steps http://datasteps.blogspot.com

Dataninja http://dataninja.wordpress.com/

WENSUI'S BLOG IN STATISTICAL COMPUTING


http://statcompute.spaces.live.com

Statistical Modeling, Causal Inference, and Social


Science http://www.stat.columbia.edu/~gelman/blog
Motori di ricerca 2.0
Google Custom Search Engine (CSE)
Motore di ricerca personalizzato per statistici
http://www.google.com/coop/cse?cx=0116918816353835
85749%3Aug5syhxupjq

Motori di ricerca semantici


http://www.lexxe.com

Ricerca visuale
http://www.grokker.com
Web 2.0: approfondimenti teorici

o Algoritmi di indicizzazione e ricerca

o Probabilità e Web 2.0

o Analisi delle reti sociali


Algoritmi di indicizzazione e ricerca

• http://it.wikipedia.org/wiki/Google

• http://it.wikipedia.org/wiki/Pagerank
Algoritmi di indicizzazione e ricerca

Il successo di Google sta nell'algoritmo di ricerca ("Teorema di


Randfish”?)
http://www.magnificaweb.it/algoritmo-di-google-teorema-di-
randfish/

Un nuovo concorrente per Google: Wikia Search


http://search.wikia.com/wiki/Search_Wikia

…ed è possibile contribuire all’algoritmo

Motore Web 2.0 “italiano”


http://www.ggoal.com/site/piz_search.php
Il comportamento probabilistico (?) di
Wikipedia
“Il punto non è che ogni voce di Wikipedia sia probabilistica,
ma che l'intera enciclopedia si comporta in modo
probabilistico ... Per dirlo in altro modo, nella Britannica la
qualità varia da, diciamo, 5 a 9 con una media di 7. In
Wikipedia varia da 0 a 10, con una media, diciamo, di 5. Ma
visto che Wikipedia ha dieci volte le voci della Britannica,
avete maggiori probabilità di trovare su Wikipedia una voce
sensata su un qualunque argomento”

C. Anderson, La coda lunga

Possiamo formalizzare questa affermazione con


l’introduzione di una v.a. e di una distribuzione di
probabilità?
Reti sociali: Da Sarnoff a Tilly

La legge di Metcalfe era


un'evoluzione della legge di
Sarnoff (pioniere della
radiofonia) che sosteneva la
relazione lineare tra gli utenti di
una rete e il suo valore.

David Reed sostiene che il


valore delle reti cresce in modo
esponenziale.

Andrew Odlyzko e Benjamin


Tilly: Metcalfe è eccessivamente
ottimista, più prudente ipotizzare
una crescita logaritmica

Immagine da www.kaltura.com
Reti sociali: teoria dei grafi

Eulero e la teoria dei grafi

Erdős e Rény e i grafi a connessione casuale

“And what is your Erdős number?”


Erdős Number (EN)

Smarty, EN = 3

Distribuzione della v.a. EN tra i matematici censiti dal progetto

Mediana = 5
Media = 4.65
Deviazione standard = 1.21

http://www.oakland.edu/enp/trivia.html
Reti sociali: un approccio
multidisciplinare…

Sei gradi di separazione di Stanley Milgram:


la distanza con l’aborigeno australiano…

Legami deboli di Granovetter:


dal Don Giovanni a LinkedIn
Reti sociali: un approccio
multidisciplinare…

Collective dynamics of small world networks di Duncan


Watts e Steve Strogatz:
> Alto livello di aggregazione e basso grado di separazione
> Grafi casuali di Erdős

Reti a invarianza di scala di Albert-László Barabási:


> L’evoluzione delle opinioni nelle reti sociali
> Il sempre presente EN
> IT e probabilità: attacchi mirati agli hub di una rete
Legami deboli in un mondo piccolo (LinkedIn)
La rete sociale di Gesù (Fonte: N.T.)
…epistemologia della complessità

Altri temi delle reti sociali da approfondire da un punto di vista


metodologico:

• Escalation dei fenomeni


• Imprevedibilità
• Ridondanza
• Evoluzione a salti
Perchè parlare di Web 2.0 agli statistici

Studenti
Nuovi metodi e strumenti
Approfondimenti teorici su fenomeni web “appassionanti”
Nuove opportunità lavorative
Uniroma è già Web 2.0: http://www.uniroma.tv/

Ricercatori e professionisti
Strumenti di condivisione del sapere
Strumenti didattici
Innovazione di processo nel privato e nella PA
Nuove opportunità di business
Bibliografia
Tim Berners Lee, L'architettura del nuovo Web, Feltrinelli, Milano, 2001

A.L. Barabasi, Link. La scienza delle reti, Einaudi, Torino, 2004

Henry Jenkins, Cultura convergente, Apogeo, Milano, 2007

Dal web 2.0 ai media sociali: Tracce e percorsi della partecipazione in rete A
cura di CSP s.ca.rl. - Lara Marcellin, Fabiana Vernero, Ferdinando Ricchiuti,
Enrico Sola, Andrea Toso, Giovanni Calia, CSP s.c.a.r.l., http://www.csp.it

Chris Anderson, La coda lunga, Codice edizioni, Torino, 2007

Sergio Maistrello, La parte abitata della rete, Tecniche Nuove, Milano, 2007

Howard Rheingold, Smart Mobs, Raffaello Cortina, Milano 2003

Pierre Lévy, L'intelligenza collettiva (per un'antropolgia del cyberspazio),


Feltrinelli, Milano 1996

Daniele Frongia, Carlo Vaccari, Introduzione al Web 2.0 per la Statistica,


Roma, 2008 (a febbraio su http://www.istat.it/dati/pubbsci/contributi)
Quanto sei Web 2.0?

http://web20.designinterviews.com/quiz.php
Contatti...Web 2.0

Email
danielefrongia@gmail.com

Blog
http://segnalazionit.blogspot.com/

Skype
danielefrongia

LinkedIn
http://www.linkedin.com/in/frongia