El algoritmo de PageRank de Google: Todo lo que necesitas saber

El algoritmo de PageRank de Google: Todo lo que necesitas saber

PageRank fue desarrollado en la Universidad de Stanford por los fundadores de Google, Sergey Brin y Larry Page. Se basa en la idea de que la calidad de una p√°gina web puede ser determinada por las otras p√°ginas web que la enlazan.

Google us√≥ PageRank para determinar la clasificaci√≥n de las p√°ginas en sus resultados de b√ļsqueda. A medida que Google se convirti√≥ en el motor de b√ļsqueda dominante, gener√≥ una demanda masiva de backlinks.

Si ha trabajado en SEO, es casi seguro que haya oído hablar de PageRank. También puede estar confundido acerca de qué significa exactamente PageRank y cómo se calcula. Para responder a estas preguntas, definimos el PageRank a continuación, junto con cómo se calcula y cómo ha cambiado con el tiempo.

¬ŅQu√© es PageRank?

PageRank es el primer algoritmo que utiliz√≥ Google para clasificar las p√°ginas web en las p√°ginas de resultados de sus motores de b√ļsqueda (SERP). Seg√ļn Google, el algoritmo lleva el nombre del cofundador de Google, Larry Page.

En el art√≠culo original sobre PageRank, el concepto se defini√≥ como “un m√©todo para calcular una clasificaci√≥n para cada p√°gina web basada en el gr√°fico de la web. PageRank es un intento de ver qu√© tan buena es una aproximaci√≥n a la importancia que se puede obtener solo desde el enlace estructura.”

PageRank fue definido con m√°s detalle por Sergey Brin y Larry Page en el documento que present√≥ el motor de b√ļsqueda de Google. El documento describi√≥ a PageRank como “una medida objetiva de la importancia de las citas que se corresponde bien con la idea subjetiva de importancia de las personas. Debido a esta correspondencia, PageRank es una excelente manera de priorizar los resultados de las b√ļsquedas de keywords en la web”. En otras palabras, “el an√°lisis de la estructura de enlaces a trav√©s de PageRank permite a Google evaluar la calidad de las p√°ginas web”.

¬ŅC√≥mo calcula Google el PageRank?

El artículo fundamental de Google resume el cálculo de PageRank:

Suponemos que la p√°gina A tiene p√°ginas T1 … Tn que apuntan a ella (es decir, son citas). El par√°metro d es un factor de amortiguaci√≥n que se puede establecer entre 0 y 1. Por lo general, establecemos d en 0.85. Hay m√°s detalles sobre d en la siguiente secci√≥n. Tambi√©n C (A) se define como el n√ļmero de enlaces que salen de la p√°gina A. El PageRank de una p√°gina A se da de la siguiente manera:

PR (A) = (1-d) + d (PR (T1) / C (T1) + … + PR (Tn) / C (Tn))

Tenga en cuenta que los PageRanks forman una distribución de probabilidad en las páginas web, por lo que la suma de los PageRanks de todas las páginas web será uno.

PageRank o PR (A) se puede calcular usando un algoritmo iterativo simple, y corresponde al vector propio principal de la matriz de enlaces normalizada de la web. Adem√°s, un PageRank para 26 millones de p√°ginas web se puede calcular en unas pocas horas en una estaci√≥n de trabajo de tama√Īo mediano. Hay muchos otros detalles que est√°n m√°s all√° del alcance de este documento.

Esta f√≥rmula calcula el PageRank de una p√°gina sumando un porcentaje del valor de PageRank de todas las p√°ginas que la enlazan. Por lo tanto, los backlinks de p√°ginas con mayor PageRank tienen m√°s valor. Adem√°s, las p√°ginas con m√°s enlaces salientes pasan una fracci√≥n m√°s peque√Īa de su PageRank a cada p√°gina web vinculada.

Seg√ļn esta f√≥rmula, tres factores principales que afectan el PageRank de una p√°gina son:

  • La cantidad de p√°ginas que tienen un v√≠nculo de retroceso
  • El PageRank de las p√°ginas que lo enlazan
  • El n√ļmero de enlaces salientes en cada una de las p√°ginas que lo enlazan

Un ejemplo simple: calcular el PageRank para tres p√°ginas

La fórmula anterior puede parecer intimidante, pero es relativamente sencilla. Para demostrarlo, calculemos el PageRank para una Internet con tres páginas web.

Gr√°fico de PageRank con tres sitios

En el ejemplo anterior, la página web A tiene un vínculo de retroceso que apunta a la página web B y la página web C. La página web B tiene un vínculo de retroceso que apunta a la página web C, y la página web C no tiene vínculos salientes. Con base en esto, ya sabemos que A tendrá el PageRank más bajo y C tendrá el PageRank más alto.

Es importante recordar que la fórmula de PageRank es iterativa. Esto se debe a que el PageRank de cada página depende del PageRank de las páginas que apuntan a ella. Cada vez que se ejecuta el cálculo, se acerca a la respuesta final.

Aquí están las fórmulas y los resultados de PageRank para la primera iteración asumiendo d = 0.85:

  • P√°gina A: (1 – 0,85) = 0,15
  • P√°gina B: (1 – 0,85) + (0,85) * (0,15 / 2) = 0,213745
  • P√°gina C: (1 – 0,85) + (0,85) * (0,15 / 2) + (0,85) * (0,21375 / 1) = 0,3954375

Esta es solo la primera iteración del cálculo. Para obtener el PageRank final de cada página, el cálculo debe repetirse hasta que el PageRank promedio de todas las páginas sea 1.0.

La historia de PageRank

Google no fue la primera empresa en utilizar el an√°lisis de enlaces para determinar la clasificaci√≥n de los sitios web en los resultados de b√ļsqueda. Robin Li, quien m√°s tarde fund√≥ Baidu, desarroll√≥ el algoritmo Rankdex en 1996. La patente estadounidense de Li se present√≥ un a√Īo antes que la patente an√°loga de Google.

Larry Page y Sergey Brin comenzaron a desarrollar PageRank en 1996 en la Universidad de Stanford. Otros desarrolladores involucrados en el proyecto fueron Scott Hassan, Rajeev Motwani, Alan Steremberg y Terry Winograd. La patente de PageRank se presentó el 10 de enero de 1997. Stanford compartió los derechos de licencia exclusivos sobre esta patente con Google por 1,8 millones de acciones, que vendió en 2005. Al 24 de septiembre de 2019, PageRank y todas las patentes asociadas expiraron.

En sus inicios, Google mostraba p√ļblicamente las puntuaciones de PageRank en sus productos. En 2000, Google lanz√≥ la barra Google. Este plugin viene con varias funciones, incluida la capacidad de buscar en la web, marcar p√°ginas y acceder a cuentas de Google.

Barra de herramientas de Google

La primera barra de herramientas también permitió que cualquiera pudiera ver la puntuación de PageRank de cualquier página web que visitaran. Como se muestra a continuación, el plugin devolvió una puntuación en una escala logarítmica de 0 a 10 para cada página. Los datos de PageRank estuvieron disponibles en la barra de herramientas hasta 2016.

Barra Google con PageRank

En 2000, Google tambi√©n comenz√≥ a compartir p√ļblicamente datos de PageRank en Google Directory. Google Directory era una lista de los principales sitios web organizados por categor√≠a y ordenados por PageRank. Google finalmente cerr√≥ este producto en 2011.

Barra Google con PageRank

A pesar de eliminar el acceso p√ļblico a las puntuaciones de PageRank, Google sigui√≥ utilizando PageRank para las clasificaciones de b√ļsqueda. Con el tiempo, la empresa actualiz√≥ el algoritmo de PageRank. Google tambi√©n realiz√≥ actualizaciones de algoritmos de b√ļsqueda relacionados con PageRank, por ejemplo, para contrarrestar la pr√°ctica de esculpir PageRank en 2008.

En 2017, Gary Illyes confirm√≥ que todav√≠a estaba usando PageRank como se√Īal. Sin embargo, esta informaci√≥n ha sido cuestionada. El ex ingeniero de Google, Jonathan Tang, aclar√≥ que Google reemplaz√≥ la versi√≥n de PageRank desarrollada en Stanford “en 2006 con un algoritmo que da resultados aproximadamente similares pero es significativamente m√°s r√°pido de calcular”.

Dado que Google dej√≥ de compartir informaci√≥n p√ļblicamente sobre PageRank, es casi imposible saber exactamente c√≥mo se usa el algoritmo en la actualidad y c√≥mo se ha modificado con el tiempo. Sin embargo, la idea central de PageRank, que el gr√°fico de enlaces de Internet se puede utilizar para determinar la calidad de las p√°ginas web individuales, sigue siendo muy influyente. Los backlinks y los enlaces internos siguen siendo fundamentales para el rendimiento de SEO.