jueves, 11 de abril de 2013

Pagerank



El PageRank es la forma a través de la cual Google determina la importancia de una página web. Y es importante, porque es uno de los factores que determinan el ranking en los resultados de una búsqueda en Google.

Se trata de un valor numérico del 0 al 10, que representa la importancia de una página en la web. Google entiende que cuando un sitio A enlaza a otro sitio B, es como si “votara” a B. Cuantos más votos (enlaces) son emitidos para un sitio, el buscador entiende que debe ser más importante. Pero Google también analiza la página que emite el voto, ya que los vos votos emitidos por  páginas consideradas "importantes", es decir, con un PageRank elevado, valen más, y ayudan a otras páginas a hacerse "importantes". Por ello, el PageRank de una página refleja la importancia de la misma en Internet, además de definir  y depender del número y PageRank de todas las páginas que la enlazan.
 PageRank es una marca registrada y patentada por Google desde el 9 de enero de 1999, que está formada por una familia de algoritmos utilizados para asignar de forma numérica la relevancia de las páginas web indexadas por un motor de búsqueda. Este modelo fue desarrollado por los fundadores de Google Larry Page (apellido, del cual, recibe el nombre el algoritmo) y Sergey Brin, en la Universidad de Stanford.

El algoritmo del PageRank se encuentra en el documento original donde sus creadores presentaron el prototipo de Google: The Anatomy of a Large-Scale Hypertextual Web Search Engine. Y es el siguiente:


Donde:
·         PR (A) es el PageRank de la página A.
·         d es un factor de amortiguación que tiene un valor entre 0 y 1 (algunos expertos creen que ronda los 0,85). Representa la probabilidad de que un usuario continúe pulsando links al navegar en vez de escribir una url.
·         PRI (i) son los valores de PageRank que tienen cada una de las páginas i que enlazan a A.
·         C(i) es el número total de enlaces salientes de la página i (sean o no hacia A).



A causa de la importancia comercial que tiene aparecer entre los primeros resultados del buscador, se han creado métodos para manipular artificialmente el PageRank de una página, entre los que destaca el spam, que consiste en añadir enlaces a una cierta página web en lugares como blogs, libros de visitas, foros de Internet, etc. con la intención de aumentar el número de enlaces que redireccionen a la página.




Cabe mencionar, que PageRank tomó su modelo del Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto para la Información Científica (ISI) en los Estados Unidos durante la década del 50.

Por último me gustaría mencionar algunas políticas y principios de Google en relación con el tema tratado, centrándome principalmente en dos de los principios de privacidad de Google que seguidamente cito:

1.     Utilizar la información para ofrecer a nuestros usuarios productos y servicios valiosos
Pues Google vela por ofrecer al navegante la mejor experiencia posible, ya que el hecho de que los usuarios compartan información con en buscador permite crear productos y servicios valiosos para ellos, estimulado la innovación.
Un ejemplo es que el buscador aprende de los errores ortográficos de los usuarios al realizar una búsqueda para poder ofreces resultados más precisos. Así, cuando se escriba “oso bardo”, el buscados deducirá que probablemente se haya querido escribir “oso pardo”
3.     Recopilar información personal de forma transparente
Google se esfuerza por mostrar a los usuarios la información utilizada para personalizar sus servicios. Intentando ser transparente en la forma en que utiliza la información de los usuarios para facilitar la tarea al navegante en lo que se pueda.

Existen además otros 3 principios de privacidad, por lo que os dejo un enlace a un video en el que se explican los 5 principios de privacidad de Google de forma detallada:


Como último dato, comentar que las actualizaciones del PageRank tienen lugar algunas veces al año, y tardan varios días en completarse. La última registrada fue la 1ª semana de noviembre de 2012.

ESTEFANÍA GARCÍA DE LA TORRE FERNÁNDEZ. (Economía y Periodismo)

8 comentarios:

  1. En realidad existen dos tipos de PageRank, el “publico” y el “real” que sólo Google conoce. El primero es el que podemos ver mediante herramientas como la Google Toolbar y el segundo es el sistema que realmente emplea Google, que no es público y del que se desconocen la mayoría de los detalles. Si utilizas Internet Explorer puedes instalar fácilmente la Google Toolbar para poder el ver PageRank público de las páginas que visitas dirigiéndonte a su página y siguiendo las instrucciones. Para Firefox y Chrome existen extensiones específicamente diseñadas para este fin.

    Interpretación posible del PageRank público:
    PR0: se destina a las páginas que todavía no han sido evaluadas o que han sido penalizadas.
    PR1: indica que la página ha sido indexada y que es correcta.
    PR2: la página es interesante y tiene potencial para subir más con dedicación y esfuerzo.
    PR3: la página es un buen recurso en su nicho. Muchas páginas informativas y de negocios de calidad están en este nivel (Donpostre.com, Cajadecarton.es, Laboresymanualidades…)
    PR4: Google considera que las páginas situadas en este nivel destacan del resto de su segmento. A partir de aquí ya estamos hablando de páginas consolidadas y con notable autoridad (Serpadres.com, Webtaller.com, Gratisjuegos.org…)
    PR5: a las páginas en este nivel les resulta mucho más fácil salir en el primer puesto de las búsquedas (Games.es, Bodas.net, Deusto…)
    PR6, PR7 y PR8: estas páginas son una autoridad indiscutible en su campo (El Corte Inglés, Barcelona.com, Museo del Prado…)
    PR9 y PR10: únicamente los grandes entre los grandes están en este nivel (Google, Adobe, Youtube…)

    Las actualizaciones del PageRank público tienen lugar 3 ó 4 veces al año: lo que ves en la Google Toolbar es una instantánea del PageRank real, tomada en el momento en que se hizo público.

    ¿Existe una alternativa al Google PageRank?

    Existe, y se llama Autoridad de Dominio (Domain Authority) y Autoridad de Página (Page Authority), conceptos desarrollados por SEOmoz y que son independientes del PageRank.
    La escala de ambos conceptos va desde 1 a 100, y miden la probabilidad de que una página salga más arriba que otras en las búsquedas de una determinada Frase Clave. Puedes descargar la SEOmoz Toolbar aquí y ver una aplicación del concepto de PA y DA en uso en el artículo Análisis de Frases Clave.

    CARMEN DEL ÁLAMO RUIZ, ECONOMÍA-PERIODISMO

    ResponderEliminar
  2. Como comentario a la entrada, me parece interesante hacer una pequeña inclusión al término spam, para que conozcamos un poco más qué es y cómo se lleva acabo.
    Se llama spam, correo basura o mensaje basura a los mensajes no solicitados, habitualmente de tipo publicitario, generalmente enviados en grandes cantidades que perjudican de alguna o varias maneras al receptor. La acción de enviar dichos mensajes se denomina spamming.
    Los spammers utilizan diversas técnicas para conseguir las largas listas de direcciones de correo que necesitan para su actividad, generalmente a través de robots o programas automáticos que recorren internet en busca de direcciones. Algunas de las principales fuentes de direcciones para luego enviar el correo basura son: los propios sitios web, listas de correo, cadenas, páginas en las que se solicita tu dirección de correo, entrada ilegal en servidores…
    Una vez que tienen una gran cantidad de direcciones de correo válidas, los spammers utilizan programas que recorren la lista enviando el mismo mensaje a todas las direcciones. Esto supone un costo mínimo para ellos, pero perjudica al receptor (pérdidas económicas y de tiempo) y en general a Internet, por consumirse gran parte del ancho de banda en mensajes basura.
    Además, es frecuente que el remitente de correo basura controle qué direcciones funcionan y cuáles no por medio de web buz o pequeñas imágenes. De esta forma, cada vez que alguien lee el mensaje, su ordenador solicita la imagen al servidor de susodicho remitente, que registra automáticamente el hecho. Otro sistema es el de prometer en los mensajes que enviando un mensaje a una dirección se dejará de recibirlos: cuando alguien contesta, significa no sólo que lo ha abierto, sino que lo ha leído.

    MARÍA TRAPIELLO GONZÁLEZ (ECONOMÍA -PERIODISMO)

    ResponderEliminar
  3. Como el funcionamiento del pagerank ya ha quedado bien definido,me gustaría comentar uno de los aspectos que comentamos en clase el pasado martes.

    Este sistema se convierte en un arma de doble filo puesto que,si bien es una manera de estructurar los contenidos de una manera que garantiza bastante fiabilidad, también puede verse corrompido por ciertos intereses, especialmente en términos económicos.
    Por un lado es bastante probable que la información encontrada en las primeras páginas mostradas en Google cuenten con una información bastante precisa. Eso se debe a la diversidad de usuarios de la red. Si la información fuera falsa y estuviera llena de errores lo más improbable es que los usuarios siguieran mencionándola y visitándola. No obstante también es cierto que muchas páginas de las encontradas entre los primeros puestos muestran una información de ínfima calidad. Los motivos, por ejemplo, pueden deberse al diseño o atractivo de ciertas páginas que las llevan a situarse en los primeros puestos de la lista.

    Por todo ello, y en mi opinión, Google puede considerarse un buscador fiable pero, lo más importante es la contrastación y el no creerse todo lo que leemos. Debemos comparar informaciones entre varias páginas y, de esa manera, nuestro buscador será más fiable todavía.

    En cuanto al otro aspecto que debatimos en clase acerca de la conveniencia de crear un comité de expertos que regulen la calidad de las informaciones de Google me parece del todo inviable y perjudicial para la libertad de expresión. Una de las características principales de Internet es la posibilidad de expresión y libertad que permite al individuo. De esta manera, un conjunto de expertos limitaría esta opción. Pero, además, ¿quiénes serían las personas más cualificadas para la tarea? ¿Sabrían acerca de la diversidad de temas tratados en la red? Por no mencionar los intereses económicos, ideológicos, políticos o sociales que se verían envueltos.

    Sin duda, Google es uno de los mejores cerebros.

    BELÉN SANTA CRUZ DÍEZ (ECONOMÍA-PERIODISMO)

    ResponderEliminar
  4. En alusión al debate que entablamos el pasado martes en clase, referente a si convenía más o menos que la jerarquía de las páginas web fuese establecida por el público en general o por los expertos en particular, considero que todo depende del ámbito en que nos encontremos. Así, en el terreno académico, convendría que nos fiásemos y nos dejásemos guiar por los segundos. En contraposición, en el terreno popular y coloquial, habríamos de optar por el primero, a fin de encontrar una información más sencilla, clara y directa.
    En todo caso, el debate puede ser concluido, pues ya existe la posibilidad de decantarnos por un paradigma u otro. Tan solo hemos de configurar o no, en la página de inicio de Google, la opción de Google científico o académico.
    Por otra parte, desearía centrarme en el plano jurisdiccional; en virtud del art. 18.1 CE "se garantiza el derecho al honor, a la intimidad personal y familiar y a la propia imagen". Asimismo, en el art. 18.3 CE se consigna que "la ley limitará el uso de la informática para garantizar el honor y la intimidad personal y familiar de los ciudadanos y el pleno ejercicio de sus derechos".
    A pesar de la legislación, un estudio realizado por Privacy International revela que la empresa Google no permite que los internautas pidan la eliminación de sus datos personales, amén de que"hace mucho más con nuestros datos de lo que nunca podríamos imaginar". Incluso, la Agencia Española de Protección de Datos (AEPD) ha iniciado, recientemente, la investigación de la compañía.

    Fuentes Calvo, Daniel (Derecho+ Periodismo).



    ResponderEliminar
  5. Tras la lectura de la entrada de mi compañera queda bien clara la función y el uso del Page Rank puesto a disposición por google, lo que no ha comentado y en verdad es una duda propia es si las empresas que aparecen como principales resultados, como webs oficiales, pagan por encontrarse en ese ránking privilegiado a primera vista del lector. Si alguno de mis compañeros tuviese la respuesta le agradecería su colaboración. Ya que actualmente internet es uno de los mayores puntos de venta y publicidad no sería de extrañar que las empresas hiciesen una aportación económica a Google para aparecer las primeras.

    ResponderEliminar
  6. En mi opinión, y de acuerdo con el resto de mis compañeros, yo creo que el Page Rank hace una función muy útil para todos nosotros, ya que esta aplicación lo que hace es poner a nuestra disposición cuales son las páginas que debemos visitar o, en función de la información que estamos buscando, cuales son las páginas que más nos interesan y a cuales deberíamos acceder.
    Creo que Google hace una función muy buena, pero que nosotros debemos contrastar varias informaciones de distintos sitios web ya que muchas veces,y aunque google trata de confirmar si la información es verdadera o falsa, puede haber fallos y debemos evitarlos.
    Es muy útil la función de los spam, ya que gracias a ellos, a través de un link, podemos acceder a otras páginas que nos pueden ayudar mucho a la hora de localizar cierta información o de querer contrastar la que ya tenemos.
    Mónica Fernández Meizoso/ Economía y periodismo

    ResponderEliminar
  7. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  8. Retomando el debate que hicimos en clase, yo tengo una posición diferente a la de Daniel. Si bien los expertos pueden saber mucho sobre el tema, nadie te puede asegurar que te den la mejor información, aquella que de verdad te pueda interesar. A la hora de confiar en un individuo o un grupo concreto, sólido, hemos de tener en cuenta la pregunta sobre "qué intenciones tienen a la hora de informarnos". Puede resultar evidente la relación entre la persona que busca información y la otra que informa objetivamente y sin dejarse llevar por sus ideas, pensamientos o intereses. Error, cuando un individuo experto tiene la posibilidad de hacer llegar información a un grupo amplio de personas, lo que hará es subjetivizar todo aquello que dice y simplemente dar a conocer lo que le interesa. Estoy generalizando, como es evidente, pero no creo que sea incorrecto hacerlo en este caso. Si bien la voz de los expertos puede ser interesante y grata a la hora de hacer trabajos académicos de alto grado, en los que pueden pedirse cierta presencia en el tema (importancia) del informador, o de semejante índole: cuando una persona busca información sin más intención que la de informarse, responder a una pregunta que se plantea, es más fiable confiar en la voz popular. Es cierto que siempre habrá gente ignorante que diga cosas sin valor y puedan interferir en el buen conocimiento que buscamos; sin embargo, es evidente que al tener un público tan amplio, al tener a tantos millones y millones de personas conectadas bajo esta red, también habrán voces que sepan de lo que hablan y puedan informarnos con certeza y precisión, y sobre todo sin intentar persuadirnos, pues lo hacen sin fin persuasor alguno.

    David Catalán Sebastiá - Derecho y Periodismo

    ResponderEliminar