Es raro el da en el que no utilizamos Google para hacer algn tipo de
bsqueda. Google es el buscador ms utilizado en Internet. Fue diseado por Sergei Brin y Lawrence Page en 1998 cuando eran estudiantes de Doctorado de Informtica en la Universidad de Standford (Page et al. 1998). Pues bien, el xito de Google se debe a un algoritmo llamado Page Rank que tiene mucho que ver con el lgebra Lineal. Este algoritmo asigna una puntuacin de importancia a cada una de las pginas web, de modo que cuando se hace una bsqueda mediante palabras clave, el buscador nos proporciona una serie de pginas que contienen esas palabras clave pero que adems estn ordenadas de modo que las ms relevantes, las ms importantes, sern mostradas en las primeras posiciones. El algoritmo PageRank de Google asigna un valor numrico a cada pgina Web de acuerdo a su importancia. Este valor se calcula de forma automtica, sin intervencin humana. La importancia de una pgina Web se cuantifica teniendo en cuenta los hiperenlaces o hipervnculos que contienen todas las pginas Web que componen Internet. Entonces, en un primer intento, se podra tomar como valor de la importancia ix de la pgina i como el nmero de enlaces que se hacen desde el resto de pginas hacia i. En este sentido, podramos construir una matriz A definida de la siguiente forma:
Supongamos que tenemos una coleccin de 4 pginas Web como la
mostrada en la figura 2:
si la importancia Xi se mide como el nmero de enlaces que recibe la pgina i.
De manera que la pgina 3 sera la ms importante, seguida de un empate entre las pginas 1 y 4, y, por ltimo, la menos importante sera la pgina 2. La estrategia seguida parece que no es todo lo democrtica que debera, porque existirn pginas con muchos enlaces y pginas con pocos. Si una pgina Pj enlaza con Nj pginas, parece lgico pensar que el voto de Pj deber repartirse entre las Nj pginas, de modo que cada enlace que sale de ella tendr un peso igual a 1/Nj. Esto nos lleva a considerar ms razonable el usar la matriz normalizada siguiente:
Para el clculo de la importancia de cada pgina que compone la red de la
figura 2. Tambin parece razonable pensar que el enlace desde una pgina importante debe tener ms peso que el enlace desde una pgina poco importante. Entonces la importancia de cada pgina viene determinada analizando los enlaces que se hacen hacia ella y la importancia de cada uno de estos enlaces. Si una pgina Pj (que contiene Nj enlaces) enlaza a una pgina i, esto debe hacer que aumente la importancia Xi de Pi con la
cantidad Volviendo al ejemplo de la figura 2, el vector de importancias debe satisfacer:
Buscamos un vector X que verifique el sistema anterior. Este sistema es
compatible indeterminado y su solucin es:
donde k puede tomar cualquier valor. Averiguamos el valor de k de modo que
todas las componentes del vector solucin sumen 1 y obtenemos:
Observar que el ranking de pginas de la figura 2 ha cambiado. Parece
sorprendente que la pgina 3 que es enlazada desde las otras tres pginas ha dejado de ser la ms importante. Para comprender esto, hay que observar que la pgina 3 enlaza solamente con la pgina 1 y, por lo tanto, dedica todo su voto a esta pgina. Esto unido al voto de la pgina 2 da como resultado que la pgina 1 sea la ms importante en el ranking. Como hemos visto, el problema del clculo del vector de importancias queda reducido a la resolucin de un sistema:
Los Administradores de Páginas Web y Proveedores de Contenido Comenzaron A Optimizar Sitios Web en Los Motores de Búsqueda A Mediados de La Década de 1990