page rank

26
Beatriz Hernando Robledo Curso 3º Teoría de la información documental UCM 1

Upload: beatriz-hernando

Post on 17-Jun-2015

847 views

Category:

Education


0 download

DESCRIPTION

Trabajo 3º Diplomatura Biblioteconomía y Documentación en la UCM (curso 2008-2009) sobre el algoritmo del Page Rank.

TRANSCRIPT

Page 1: Page Rank

Beatriz Hernando RobledoCurso 3º

Teoría de la información documentalUCM

1

Page 2: Page Rank

INDICE

 Definición  Nacimiento  Funcionamiento

Características

2

Page 3: Page Rank

El algoritmo Páginas con mayor Page Rank Páginas con menor Page Rank Cómo averiguar el Page Rank de tú pág web 

3

Page 4: Page Rank

DEFINICIÓN: El Page Rank es el número, o valor que recibe una página en función de su importancia dentro de la red por Google.  

4

Page 5: Page Rank

NACIMIENTO • El nacimiento del Page Rank supone la aparición de Google. •Creadores: Sergei Brin y Larry Page• 1os pasos: • estudio de los links que enlazaban a otras páginas.

5

Page 6: Page Rank

6

NACIMIENTO

•Noción de importancia: número de veces que citan/enlazan" un documento •  'BackRub' : determinará el número de enlaces hacia las páginas web 

 

Page 7: Page Rank

NACIMIENTO

•Descubrir la manera de clasificar y de determinar la importancia de cada una de las páginas según el número de citas.•Sergei Brin-Larry Pein: Page Rank•Agilización de las búsquedas•Creación de Google y aparición en 1996

7

Page 8: Page Rank

FUNCIONAMIENTO 1.Los links son considerados para Google como votos, por ello cuánto más votos tenga una página mayor importancia tendrá esta para Google y por lo tanto mejor posicionada estará la página en una búsqueda. 2.También tendrá en cuenta la importancia de cada página que emite el voto.

 8

Page 9: Page Rank

9

3. Normas de Google para considerar link como apto. 1. nunca tendrá en cuenta aquellas

cuyo contenido sea la colección de links.

2.sólo se aplica a páginas individuales y no al sitio Web.

4. Dos tipos de enlaces: 1.enlaces salientes2.enlaces entrantes.

Page 10: Page Rank

La teoría es que al enlazar, se pierde algo de Page Rank y al ser enlazado se gana.

Esto depende de muchos matices, tipo de enlaces, número, a qué páginas, etc. y tiene más que ver con la relevancia de la página que con el Page Rank propiamente dicho. 

10

Page 11: Page Rank

Cada página solo puede traspasar una determinada cantidad de Page Rank.

La cantidad de Page Rank, dependerá del volumen, calidad, contenido nuevo en Internet, etc. y cada página solo puede traspasar determinada cantidad a otra(s) páginas.

11

Page 12: Page Rank

12

El Page Rank se reparte en función del número y tipo de enlaces que conecten las páginas.

El Page Rank que se traspasa es la mitad del valor para cada enlace.

Si enlazamos a páginas que nunca nos enlazarán a nosotros perderemos Page Rank.

Page 13: Page Rank

EL ALGORITMO

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

PR(A) Es el Page Rank de la página A, PR(Ti) Es el Page Rank de las páginas Ti que

enlazan a A, C(Ti) Es el número de links salientes de la página

Ti d es un factor variable que puede estar entre 0 y

11-d Es la probabilidad de que el usuario presione

sobre el enlace.

13

Page 14: Page Rank

1.El Page Rank sólo se aplica individualmente a cada página que forma parte de una Web, y no a esta.

2.Para definir el Page Rank de una página recurrimos a las páginas que enlazan a dicha página.

3.El Page Rank de las páginas Ti que enlazan a la página A no afecta al PageRank de la página A uniformemente. Dentro del algoritmo del PageRank, el PageRank de una página T se calcula por el número de links salientes C (T) en la página T. Esto significa que cuantos más enlaces salientes tenga la página T, menos beneficiará el enlace de la página A al enlazar a la página T.

14

EL ALGORITMO

Page 15: Page Rank

4.El valor del Page Rank de las páginas entrantes, es decir de Ti en la fórmula, se suma. Esta es una forma de aumentar el Page Rank de la página A

5.Finalmente, la suma del PageRank transmitido de las páginas Ti se multiplica por un factor aleatorio d que puede estar entre 0 y 1. De este modo, la transmisión del PageRank que beneficia a una página que es enlazada por otra se reduce.

15

EL ALGORITMO

Page 16: Page Rank

CARACTERISTICASCarácter aleatorio: está determinado por la

acción del usuario que tiene la opción de hacer cliq en un enlace o no.

Carácter iterativo: consiste en dar un valor inicial de PR.

Page 17: Page Rank

2ª Versión del algoritmo

Entre todas las versiones conocidas que se han publicado, este es un segundo modelo.

PR(A) = (1-d) / N + d (PR (T1)/C (T1) +… + PR (Tn)/C (Tn))

N es el número total de páginas del sitio 17

EL ALGORITMO

Page 18: Page Rank

18

La diferencia con la primera versión se encuentra en que este la probabilidad la determinaba el usuario. En cambio, en esta segunda ya está determinada cuando entra tan a menudo como páginas posee el sitio.

EL ALGORITMO

Page 19: Page Rank

PÁGINAS CON MAYOR PAGE RANK

URL PAGE RANK

http://www.whitehouse.gov 10http://google.com 10http://www.adobe.com 10http://www.apple.com 9http://www.ibm.com 9http://www.microsoft.com 9http://youtube.com 9http://www.cnn.com 9 19

Page 20: Page Rank

PÁGINAS CON MENOR PAGE RANK

URL PAGE RANKhttp://www.nauticalowcost.com

0

http://www.ciberhost.com.ar 0http://www.mejoresrazas.info 0http://mejoresrazas.info 0http://inmopatagonia.com 0http://mundopaginasninosinfantilesgratis.site40.net

1

http://www.clinicaveterinariallanera.com

1

http://creativo.net46.net 1

20

Page 21: Page Rank

CÓMO AVERIGUAR EL PAGE RANK

http://www.elpagerank.com/ http://www.gamarod.com.ar/pagerank/  http://www.pagerank-tracking.com/

Basta con introducir en cualquiera de estas páginas la URL de la que queramos saber el Page Rank y pulsar para que calcule.

21

Page 22: Page Rank

CÓMO AVERIGUAR EL PAGE RANKBarra de Google:

http://www.google.com/tools/firefox/toolbar/FT3/intl/es/index.html http://google-toolbar-para-firefox.softonic.com/ http://www.programatium.com/google/tools/toolbar.htmhttp://google-toolbar.malavida.com/d368-descargar-windows http://google-toolbar.softonic.com/ 

22

Page 23: Page Rank

CÓMO AVERIGUAR EL PAGE RANK

23

Page 24: Page Rank

GAMROD: http://www.gamarod.com.ar/pagerank/pagerank.asp [consultada 23 octubre 20008] GOOGLEMANIA:http://www.googlemania.com/comobuscar.php?pagina=3&exclusion_de_palabras#exclusion_de_palabras [consultada 23 octubre 20008] SOFTWARE: http://software.adslzone.net/glosario/p-q-y-r/ [consultada 23 octubre 20008] EL PAGE RANK: http://www.elpagerank.com/quees.php?l=es [consultada 23 octubre 20008] EL PAGE RANK: www.elpagerank.com[consultada 23 octubre 20008] 24

Page 25: Page Rank

DESARROLLO WEB: http://www.desarrolloweb.com/articulos/1149.php [consultada 23 octubre 20008] GOOGLE: http://www.google.com/intl/es/corporate/tech.html [consultada 23 octubre 20008]http://www.hacetelaweb.com.ar/funcionamiento_del_pagerank.htm [consultada 23 octubre 20008] ADSEOK: http://www.adseok.com/seo/pagerank-funcionamiento/ [consultada 23 octubre 20008]

ADSEOK: http://www.adseok.com/seo/como-mantener-el-pagerank/ mantener posición [consultada 23 octubre 20008] VISITAS-WEB. http://www.visitas-web.com/2007/12/pagerank.html [consultada 23 octubre 20008]

 25

Page 26: Page Rank

ADSEOK: http://www.adseok.com/seo/como-mantener-el-pagerank/ mantener posición [consultada 23 octubre 20008] VISITAS-WEB. http://www.visitas-web.com/2007/12/pagerank.html [consultada 23 octubre 20008] REFUGIO ANTERIAEREO: http://refugioantiaereo.com/2006/09/formula-pagerank-explicada [consultada 23 octubre 20008] CODIGOGEEK: http://www.codigogeek.com/2008/02/10/preguntas-frecuentes-sobre-google-pagerank/ [consultada 23 octubre 20008] PAGE RANK-TRACKING: http://www.pagerank-tracking.com/ [consultada 23 octubre 20008] 26