Sei sulla pagina 1di 41

Fundamentos de la Bsqueda

en la Web
Para Periodistas y Comunicadores
Llus Codina
Grupo DigiDoc Departamento de
Comunicacin
Universitat Pompeu Fabra

Contenido de esta presentacin


2

La Informacin como recurso


Entornos intensivos en informacin
La saturacin informativa
Bsquedas avanzadas
Booleanas
Parametrizadas
Combinadas
El monocultivo informacional

Propuesta de ejercicios

L. Codina - UPF

Enero 2015

La informacin como recurso


3

Un recurso
Facilita alcanzar objetivos
En general, la informacin permite
Predecir el futuro
Gestionar el entorno
Reducir las consecuencias de futuros hechos adversos
Incrementar las ventajas de futuros hechos favorables

Optimizar todos los dems recursos


A ms informacin menos recursos (tiempo, dinero, etc.)
Conseguir mejores objetivos con menos recursos

L. Codina - UPF

Enero 2015

La Bsqueda de Informacin en el Periodismos


4

En el Periodismo en particular, y en la

Comunicacin en general, la bsqueda y el uso de


sistemas de informacin aade:

Calidad
Credibilidad
Exclusividad

L. Codina - UPF

Enero 2015

Entornos
5

Intensivos en informacin
Acadmicos e Investigadores

Estudiantes universitarios
Doctorando y estudiantes de tercer ciclo
Profesores de universidad
Sectores I+D+i
etc.

Profesionales

Comunicadores
Periodistas
Economistas
Politlogos
etc.

Sistemas de informacin relevantes


Motores de bsqueda especializados
Bases de datos para acadmicos
Bases de datos para profesionales

L. Codina - UPF

Enero 2015

Sistemas relevantes para comunicadores y comuniclogos


6

Buscadores
Generalistas

Google
Bing
DuckDuckGo

Especializados:

Sistemas de respuestas: Wolfram Alpha


Buscadores acadmicos: Google Scholar

Bases de datos
Prensa

MyNews
Factiva

Multimedia

AGE Fotostock
Getty Images
Corbis

L. Codina - UPF

Enero 2015

El Problema
7

Nuestro ecosistema informativo


Cada vez es ms rico
Ms informacin
Ms fuentes
Ms formatos
Ms tecnologas y canales

Pero el da sigue teniendo 24 horas


No podemos consumir toda la informacin que nos afecta
profesionalmente
Cada vez se requieren mejores competencias

informacionales

Somos la informacin a la que nos exponemos

L. Codina - UPF

Enero 2015

Consecuencias
8

Es letal
Mucha informacin (ruido)
Perder informacin (silencio)

Necesitamos
Solamente informacin relevante (precisin), pero
Toda la informacin relevante (exhaustividad)
El balance necesario
La precisin reduce la exhaustividad
Hemos de elegir entre:
Aumentar precisin (y perder exhaustividad)
Aumentar la exhaustividad (y perder precisin)

L. Codina - UPF

Enero 2015

Soluciones 1: Abandonar el Monocultivo


9

No se trata de cambiar de buscador


Si el usamos funciona bien, porqu cambiarlo?
No se trata de usar una vez un buscador y otra vez,

otro

No solucionamos nada si una vez usamos el buscador A, y


otras el buscador B

Se trata de aadir un n-simo buscador a nuestra

cartera de herramientas profesionales

El buscador A en bsquedas puntuales


El buscador A + B en bsquedas informacionales
Y, posiblemente, los buscadores A + B + C en determinados
proyectos

L. Codina - UPF

Enero 2015

Soluciones 2 - Conocer las fuentes


10

Necesitamos
Conocer las fuentes

Fuentes crticas de cada sector de actividad o rama del


conocimiento. En nuestro caso: fuentes para la comunicacin
social

Saber buscar
Conocer los principios unificadores
Utilizar las bsquedas avanzadas

L. Codina - UPF

Enero 2015

Tipos de bsqueda
11

Simple

Trmino nico
Trmino compuesto
Frase en lenguaje natural

Avanzada

Parametrizada
Booleana
Combinada

Formas de expresin

Pseudo cdigo: independiente del sistema


Sintaxis directa: dependiente del sistema
Formulario: interfaz del sistema

L. Codina - UPF

Enero 2015

Bsqueda simple - 1
12

Trmino nico
Ejemplos: televison
Problema: excesivo ruido
Opcin: no usar nunca trminos nicos
Trmino compuesto: conceptos que necesitan dos o

ms trminos para ser expresados

Ejemplos: John Ford, ciencia ficcin, economa


poltica
Problema: ruido, en versin falsas coordinaciones. Ejemplo:
el sitios web de coches de la marca Ford de un tal John
Smith.
Opcin: usar comillas, p.e. john ford, ciencia ficcin, etc.

L. Codina - UPF

Enero 2015

Bsqueda simple - 2
13

Frase en lenguaje natural


Ejemplo: principales tendencias del periodismo
en 2015
til para encontrar documentos MUY especficos y
seguramente MUY relevantes (si es que existen)
Cada vez ms til en Google:

Capacidad de interpretar las intenciones del usuario y la


semntica de la frase completa

Problema general: silencio, falsas coordinaciones. Prdida


de informacin. Falta de precisin de los resultados.
Opcin: convertir la frase natural en una ecuacin booleana.

L. Codina - UPF

Enero 2015

Recomendaciones generales
14

Uso de comillas en trminos compuestos


juegos olimpicos mejor que Juegos Olmpicos
Uso de alfabeto pobre:
juegos olimpicos mejor que Juegos Olmpicos
ciencia ficcion mejor que: ciencia ficcin
La lengua de la pregunta (pre)determina la lengua

del documento

L. Codina - UPF

Enero 2015

Bsquedas avanzadas
15

Tipologa de bsquedas avanzadas


Parametrizadas
Booleanas
Combinadas

L. Codina - UPF

Enero 2015

Parametrizadas
16

Restriccin de la bsqueda por campos o parmetros


Los campos o parmetros ms habituales (en la web)

Ttulo
Cuerpo de la pgina
Fecha de publicacin

Otros parmetros (en bases de datos)

Autor
Lengua
Fuente
Categora, etc.

Ejemplo

Ttulo: festival cannes


Entre: 2012 - 2014

L. Codina - UPF

Enero 2015

Ejercicio - 1
17

Haga dos prcticas de bsqueda parametrizada en

Google mediante el formulario de bsqueda


avanzada, combinando un tema a su eleccin y, en
cada caso: (a) un formato de documento, (b) una
zona del documento (p.e. ttulo).
Documente la prctica con capturas de pantalla
comentadas del formulario de bsqueda y de la
pgina de resultados correspondiente.

L. Codina - UPF

Enero 2015

Booleanas
18

Basada en lgebra de Boole


Operadores principales
AND
OR
NOT
Forma simple
t1 OP t2
Dnde:

Ejemplos en pseudo cdigo:

t1 es una palabra clave (p.e. barcelona, festivales, cine, televisin, etc.)


OP es uno de los operadores principales AND, OR, NOT
barcelona AND festivales
Cine OR television

Ejemplo (siguiendo el formulario de bsqueda avanzada de Google)

AND > Todas las palabras: barcelona festivales


OR > Cualquiera de las palabras: cine television

L. Codina - UPF

Enero 2015

Booleanas compuestas
19
Forma compuesta. Variaciones:
Primer caso: t1 OP (t2 OP t3)
Segundo caso: (t1 OP t2) OP (t3 OP t4)
Ejemplos
Primer caso: necesitamos encontrar informacin sobre ciencia ficcin y cine o televisin. Posible
solucin en pseudo cdigo:
ciencia ficcin AND (cine OR televisin)

Tiene solucin en el formulario de Google. Cul sera? Haga pruebas.

Segundo caso: necesitamos encontrar informacin sobre la web 2.0, las redes sociales, el
periodismo, la comunicacin corporativa, etc. , todo a la vez. Posible solucin en pseudo cdigo:

(web 2.0 OR redes sociales) AND (periodismo OR comunicacin


corporativa)
Tiene
Si

solucin en el formulario de Google?

es que NO, en este caso necesitamos sintaxis directa

L. Codina - UPF

Enero 2015

Ejercicio 2
20

Pruebe a realizar las bsquedas siguientes

expresadas con pseudo cdigo:


Barcelona AND (cine OR television)
barcelona AND festivales AND (cine OR television OR
audiovisual)

con el formulario de bsqueda avanzada de Google


Documente la prctica con capturas de pantalla del
formulario de bsqueda y de la primera pgina de
resultados de cada bsqueda.
L. Codina - UPF

Enero 2015

Repaso Booleanas - 3
21

Uso
AND > reduce resultados y aumenta precisin
OR > aumenta resultados y reduce precisin
NOT > reduce resultados y aumenta precisin
Balance:
AND > aumenta precisin pero elimina informacin
OR > aumenta resultados pero incrementa el ruido
NOT > reduce el ruido pero elimina informacin

L. Codina - UPF

Enero 2015

Problemas - 1
22

AND >
Falsamente intuitivo
No corresponde necesariamente con el uso del y gramatical
Ejemplo: necesito informacin sobre la obras de teatro y
novelas que han sido adaptadas para cine y televisin
Traduccin booleana incorrecta:
(teatro AND novela) AND (cine AND televisin)
Problema: el usuario perder informacin muy relevante

Traduccin booleana correcta:


(teatro OR novela) AND (cine OR televisin)
Ventaja: el usuario consigue una gran precisin sin prdida de
informacin

L. Codina - UPF

Enero 2015

Problemas - 2
23

OR
Anti intuitivo
trmino 1 o bien trmino 2, o ambos
cuantos ms trminos, ms ruido, no menos

En la lengua natural, la partcula O puede tener dos


significados:
Incluyente
Excluyente

Cmo operador booleano siempre es incluyente

L. Codina - UPF

Enero 2015

Problemas 3
24

NOT

Anti intuitivo
Puede destruir informacin: elimina por igual informacin relevante y
no relevante

Ejemplo: necesito informacin sobre publicidad de

refrescos, pero siempre que sean bebidas para adultos


Con la ecuacin: (refrescos AND publicidad)
NOT jvenes
Perdemos este documento: Resultados de una
investigacin sobre publicidad de marcas
de refrescos para jvenes y adultos
L. Codina - UPF

Enero 2015

Ejercicio - 3
25

Dada la siguiente necesidad de informacin: becas

y ayudas para producciones de cine y vdeo, cul


de las siguientes ecuaciones es mejor?:
a)
b)

(becas AND ayudas) AND (cine AND vdeo)


(becas OR ayudas) AND (cine OR vdeo)

Copie el enunciado de esta pregunta y la


respuesta elegida en su informe.

L. Codina - UPF

Enero 2015

Cuadro resumen
26

Operador

Resultados

Precisin

Ruido

AND

+
-

+
+

+
-

OR
NOT

L. Codina - UPF

Enero 2015

Bsquedas Combinadas: la mejor amiga de los


Periodistas
27

Son las ms habituales en sistemas profesionales y

acadmicos
Combinan ecuaciones de los dos tipos

Parametrizadas
Booleanas

Ejemplo
(Ttulo artculo= web mvil AND publicidad) AND (Aos=
2010 -2015)
Interpretacin: buscamos artculos sobre la web mvil y la
publicidad, pero siempre que esas palabras clave aparezcan
en el ttulo y solamente si han publicado en los ltimos aos.
L. Codina - UPF

Enero 2015

Bsquedas avanzadas: balance


28

El medio ms potente para expresar nuestras necesidades de


informacin sin ambigedad, en especial las bsquedas
combinadas (booleanas + parametrizadas)
Especialmente til en bases de datos profesionales: Factiva,
Getty Images, Corbis, etc. y acadmicas: Google Scholar.
Sin embargo, utilidad limitada en Google normal:
Implementacin incompleta en el formulario de bsqueda
avanzada
Resultados pueden ser inconsistentes en la sintaxis directa

En el caso de Google normal: cada vez ms eficaz (para


compensar) en bsquedas con lenguaje natural.

L. Codina - UPF

Enero 2015

Ejemplo
29

Formulario de bsqueda combinada en CSIC

L. Codina - UPF

Enero 2015

Ejercicio - 4
30

Prepare una bsqueda combinada de un tema de su

inters que sea:

Parametrizada, por ejemplo, mediante un tema limitado al


ttulo
Booleana, en base a utilizar dos conceptos combinados
mediante OR, AND, NOT (no hace falta todos los operadores,
uno o dos de ellos).

Valore los resultados. Haga capturas de pantalla.

L. Codina - UPF

Enero 2015

Evitar el monocultivo
31

Usar otro buscador (adems de Google)


Buscadores generalistas:
Bing
DuckDuckGo
Ask
Buscadores especializados
Scholar > Informacin acadmica
Mendeley > Informacin acadmica + Red Social
Wolfram Alpha > Sistema de respuestas

L. Codina - UPF

Enero 2015

Ejercicio
32

Ir a: http://tools.seochat.com/
Hacer una breve revisin en diagonal de las herramientas
disponibles. Hacer una captura de pantalla comentada

Ir a: http://tools.seochat.com/tools/google-vs-yahoo-

search-results/

Hacer una comparacin Google v Bing para un tema de su


inters (puede ser un tema de actualidad o un tema
acadmico vinculado con el Grado en Periodismo)
Hacer una captura de pantalla comentada

L. Codina - UPF

Enero 2015

Ejercicio
33

Realizar la misma bsqueda (a eleccin del

estudiante) en estos tres buscadores:

Google
Bing
DuckDuckGo

Hacer una breve comparativa en formato libre (p.e.

mediante una tabla y/o con capturas de pantalla) de


la relevancia de los cinco primeros resultados de
cada buscador.
Redactar unas breves conclusiones.
L. Codina - UPF

Enero 2015

Google Scholar
34

La versin Google para entornos acadmicos


nicamente resultados publicados en servidores

muy fiables (universidades, fundaciones cientficas,


centros de investigacin, etc.)
Cada vez ms utilidades:

Anlisis de citaciones
Biblioteca personalizada
Exportacin de referencias

L. Codina - UPF

Enero 2015

Ejercicio 5
35

Repita alguna de las bsquedas anteriores (o piense

en una tema de bsqueda nuevo, si lo prefiere) pero


use en esta ocasin la versin acadmica de Google
> Google Scholar.
Compare las pginas de resultados. Observe las
opciones de navegacin laterales y las opciones
situadas debajo de cada resultado. Intente
comprender su funcin. Indquelas en el pie de la
captura.

L. Codina - UPF

Enero 2015

Sistema de respuestas
36

No proporcionan listas de enlaces, sino respuestas

directes
tiles para resolver necesidades de informacin
concretas
No resuelven bsquedas informacionales ni
transaccionales

L. Codina - UPF

Enero 2015

Wolfram Alpha
37

Ir a: Wolfram Alpha > http://www.wolframalpha.com/


Vaya primero a los ejemplos de uso:

http://www.wolframalpha.com/examples/

Haga pruebas libremente, ponga a prueba, p.e., algunos de


los ejemplos de bsqueda sugeridos para entender major este
buscador
Haga dos capturas de pantalla comentadas de dos elementos
significativos de Wolfram Alpha

L. Codina - UPF

Enero 2015

Para evitar el monocultivo 1: Tipologa de


necesidades de informacin
38

Necesidades de Informacin Concretas - NIC:


Navegacionales, transaccionales, informacionales simples

Una sola respuesta o un datos concreto soluciona la necesidad


Ejemplos:
Cuntos presidentes han tenido en los Estado Unidos de Amrica?
Cules son las cinco ciudades ms pobladas del mundo?
Unesco (en el sentido, quiero ir al sito de la Unesco)

Necesidades de Informacin Orientadas a un Problema NIOP


Informacionales complejas, acadmicas

No hay una respuesta unvoca, necesitamos razonamiento (discurso) y reflexin;


ms informacin suele generar an ms necesidades de informacin. No hay una
solucin predeterminada.
Ejemplos:
Realidad aumentada y periodismo
Modelos de negocio en cibermedios
Principales tendencias de comunicacin en los prximos aos

L. Codina - UPF

Enero 2015

Para evitar el monocultivo 2: Buscadores


candidatos
39

Sea:
A: el buscador habitual, probablemente, Google
B: un segundo buscador alternativo, probablemente, Bing
C: un tercer buscador alternativo, posiblemente, DuckDuckGo
o Ask o Yahoo
D: una pareja de buscadores acadmicos, probablemente,
Google Scholar + Mendeley o Wordlcat

L. Codina - UPF

Enero 2015

Para evitar el monocultivo 3: Estrategia


40

Ejemplo de aplicacin de la regla de aadir (no

sustituir) buscadores al buscador habitual

Supongamos esta distribucin de necesidades de


informacin:
7 de cada 10 sern tipo NIC
2 de cada 10 sern tipo NIOP-Profesional
1 de cada 10 ser tipo NIOP-Acadmica

La posible estrategia multicultivo puede ser:


70 % de las bsquedas, tipo NIC: buscador A
20 % de las bsquedas, tipo NIOP-profesionales: buscador A + B |
C
10 % de las bsquedas, tipo NIOP-acadmicas: D

L. Codina - UPF

Enero 2015

Ms informacin y sitio del autor


41

http://www.lluiscodina.com/category/diagramas/
http://www.lluiscodina.com/

L. Codina - UPF

Enero 2015

Potrebbero piacerti anche