El algoritmo de PageRank de Google: Todo lo que necesitas saber

El algoritmo de PageRank de Google: Todo lo que necesitas saber

PageRank fue desarrollado en la Universidad de Stanford por los fundadores de Google, Sergey Brin y Larry Page. Se basa en la idea de que la calidad de una página web puede ser determinada por las otras páginas web que la enlazan.

Google usó PageRank para determinar la clasificación de las páginas en sus resultados de búsqueda. A medida que Google se convirtió en el motor de búsqueda dominante, generó una demanda masiva de backlinks.

Si ha trabajado en SEO, es casi seguro que haya oído hablar de PageRank. También puede estar confundido acerca de qué significa exactamente PageRank y cómo se calcula. Para responder a estas preguntas, definimos el PageRank a continuación, junto con cómo se calcula y cómo ha cambiado con el tiempo.

¿Qué es PageRank?

PageRank es el primer algoritmo que utilizó Google para clasificar las páginas web en las páginas de resultados de sus motores de búsqueda (SERP). Según Google, el algoritmo lleva el nombre del cofundador de Google, Larry Page.

En el artículo original sobre PageRank, el concepto se definió como “un método para calcular una clasificación para cada página web basada en el gráfico de la web. PageRank es un intento de ver qué tan buena es una aproximación a la importancia que se puede obtener solo desde el enlace estructura.”

PageRank fue definido con más detalle por Sergey Brin y Larry Page en el documento que presentó el motor de búsqueda de Google. El documento describió a PageRank como “una medida objetiva de la importancia de las citas que se corresponde bien con la idea subjetiva de importancia de las personas. Debido a esta correspondencia, PageRank es una excelente manera de priorizar los resultados de las búsquedas de keywords en la web”. En otras palabras, “el análisis de la estructura de enlaces a través de PageRank permite a Google evaluar la calidad de las páginas web”.

¿Cómo calcula Google el PageRank?

El artículo fundamental de Google resume el cálculo de PageRank:

Suponemos que la página A tiene páginas T1 … Tn que apuntan a ella (es decir, son citas). El parámetro d es un factor de amortiguación que se puede establecer entre 0 y 1. Por lo general, establecemos d en 0.85. Hay más detalles sobre d en la siguiente sección. También C (A) se define como el número de enlaces que salen de la página A. El PageRank de una página A se da de la siguiente manera:

PR (A) = (1-d) + d (PR (T1) / C (T1) + … + PR (Tn) / C (Tn))

Tenga en cuenta que los PageRanks forman una distribución de probabilidad en las páginas web, por lo que la suma de los PageRanks de todas las páginas web será uno.

PageRank o PR (A) se puede calcular usando un algoritmo iterativo simple, y corresponde al vector propio principal de la matriz de enlaces normalizada de la web. Además, un PageRank para 26 millones de páginas web se puede calcular en unas pocas horas en una estación de trabajo de tamaño mediano. Hay muchos otros detalles que están más allá del alcance de este documento.

Esta fórmula calcula el PageRank de una página sumando un porcentaje del valor de PageRank de todas las páginas que la enlazan. Por lo tanto, los backlinks de páginas con mayor PageRank tienen más valor. Además, las páginas con más enlaces salientes pasan una fracción más pequeña de su PageRank a cada página web vinculada.

Según esta fórmula, tres factores principales que afectan el PageRank de una página son:

  • La cantidad de páginas que tienen un vínculo de retroceso
  • El PageRank de las páginas que lo enlazan
  • El número de enlaces salientes en cada una de las páginas que lo enlazan

Un ejemplo simple: calcular el PageRank para tres páginas

La fórmula anterior puede parecer intimidante, pero es relativamente sencilla. Para demostrarlo, calculemos el PageRank para una Internet con tres páginas web.

Gráfico de PageRank con tres sitios

En el ejemplo anterior, la página web A tiene un vínculo de retroceso que apunta a la página web B y la página web C. La página web B tiene un vínculo de retroceso que apunta a la página web C, y la página web C no tiene vínculos salientes. Con base en esto, ya sabemos que A tendrá el PageRank más bajo y C tendrá el PageRank más alto.

Es importante recordar que la fórmula de PageRank es iterativa. Esto se debe a que el PageRank de cada página depende del PageRank de las páginas que apuntan a ella. Cada vez que se ejecuta el cálculo, se acerca a la respuesta final.

Aquí están las fórmulas y los resultados de PageRank para la primera iteración asumiendo d = 0.85:

  • Página A: (1 – 0,85) = 0,15
  • Página B: (1 – 0,85) + (0,85) * (0,15 / 2) = 0,213745
  • Página C: (1 – 0,85) + (0,85) * (0,15 / 2) + (0,85) * (0,21375 / 1) = 0,3954375

Esta es solo la primera iteración del cálculo. Para obtener el PageRank final de cada página, el cálculo debe repetirse hasta que el PageRank promedio de todas las páginas sea 1.0.

La historia de PageRank

Google no fue la primera empresa en utilizar el análisis de enlaces para determinar la clasificación de los sitios web en los resultados de búsqueda. Robin Li, quien más tarde fundó Baidu, desarrolló el algoritmo Rankdex en 1996. La patente estadounidense de Li se presentó un año antes que la patente análoga de Google.

Larry Page y Sergey Brin comenzaron a desarrollar PageRank en 1996 en la Universidad de Stanford. Otros desarrolladores involucrados en el proyecto fueron Scott Hassan, Rajeev Motwani, Alan Steremberg y Terry Winograd. La patente de PageRank se presentó el 10 de enero de 1997. Stanford compartió los derechos de licencia exclusivos sobre esta patente con Google por 1,8 millones de acciones, que vendió en 2005. Al 24 de septiembre de 2019, PageRank y todas las patentes asociadas expiraron.

En sus inicios, Google mostraba públicamente las puntuaciones de PageRank en sus productos. En 2000, Google lanzó la barra Google. Este plugin viene con varias funciones, incluida la capacidad de buscar en la web, marcar páginas y acceder a cuentas de Google.

Barra de herramientas de Google

La primera barra de herramientas también permitió que cualquiera pudiera ver la puntuación de PageRank de cualquier página web que visitaran. Como se muestra a continuación, el plugin devolvió una puntuación en una escala logarítmica de 0 a 10 para cada página. Los datos de PageRank estuvieron disponibles en la barra de herramientas hasta 2016.

Barra Google con PageRank

En 2000, Google también comenzó a compartir públicamente datos de PageRank en Google Directory. Google Directory era una lista de los principales sitios web organizados por categoría y ordenados por PageRank. Google finalmente cerró este producto en 2011.

Barra Google con PageRank

A pesar de eliminar el acceso público a las puntuaciones de PageRank, Google siguió utilizando PageRank para las clasificaciones de búsqueda. Con el tiempo, la empresa actualizó el algoritmo de PageRank. Google también realizó actualizaciones de algoritmos de búsqueda relacionados con PageRank, por ejemplo, para contrarrestar la práctica de esculpir PageRank en 2008.

En 2017, Gary Illyes confirmó que todavía estaba usando PageRank como señal. Sin embargo, esta información ha sido cuestionada. El ex ingeniero de Google, Jonathan Tang, aclaró que Google reemplazó la versión de PageRank desarrollada en Stanford “en 2006 con un algoritmo que da resultados aproximadamente similares pero es significativamente más rápido de calcular”.

Dado que Google dejó de compartir información públicamente sobre PageRank, es casi imposible saber exactamente cómo se usa el algoritmo en la actualidad y cómo se ha modificado con el tiempo. Sin embargo, la idea central de PageRank, que el gráfico de enlaces de Internet se puede utilizar para determinar la calidad de las páginas web individuales, sigue siendo muy influyente. Los backlinks y los enlaces internos siguen siendo fundamentales para el rendimiento de SEO.