Un tesoro de documentos que parecen describir cómo Google clasifica resultados de búsqueda ha aparecido en línea, probablemente como resultado de una publicación accidental por un bot interno.
La documentación filtrada describe una versión antigua de la API del Content Warehouse de Google y proporciona una visión interna del funcionamiento de Google Search.
Origen de la Filtración
El material parece haber sido inadvertidamente subido a un repositorio de GitHub de acceso público propiedad de Google alrededor del 13 de marzo por herramientas automatizadas del gigante de la web.
Esa automatización aplicó una licencia de código abierto Apache 2.0 al commit, como es estándar para la documentación pública de Google. Un commit de seguimiento el 7 de mayo intentó deshacer la filtración.
Sin embargo, el material fue detectado por Erfan Azimi, CEO de EA Digital Eagle, e informado el domingo por los operativos de SEO Rand Fishkin, CEO de SparkToro, y Michael King, CEO de iPullRank.
Contenido de los Documentos
Estos documentos no contienen código u otros elementos similares; en lugar de eso, describen cómo usar la API del Content Warehouse de Google, que probablemente esté destinada solo para uso interno.
La documentación filtrada incluye numerosas referencias a sistemas y proyectos internos. Aunque existe una API de Google Cloud con un nombre similar que ya es pública, lo que terminó en GitHub parece ir mucho más allá.
Relevancia para la Comunidad SEO
Los archivos son dignos de mención por lo que revelan sobre los factores importantes para Google al clasificar páginas web por relevancia, un asunto de interés duradero para cualquier persona involucrada en el negocio de SEO o cualquier persona que opere un sitio web y espere que Google lo ayude a ganar tráfico.
Entre las más de 2,500 páginas de documentación, hay detalles sobre más de 14,000 atributos accesibles o asociados con la API, aunque hay poca información sobre si se utilizan todas estas señales y su importancia.
Por lo tanto, es difícil discernir el peso que Google aplica a los atributos en su algoritmo de clasificación de resultados de búsqueda. Pero los consultores de SEO creen que los documentos contienen detalles notables porque difieren de las declaraciones públicas de Google.
Revelaciones Impactantes Sobre el Algoritmo de Google
Recientemente, se ha filtrado una serie de documentos que han generado controversia respecto a cómo el gigante de la tecnología Google maneja su algoritmo de búsqueda. Según un informe de SparkToro, muchas de las afirmaciones hechas por Reza Azimi en un correo electrónico contradicen directamente las declaraciones públicas realizadas por los representantes de Google a lo largo de los años.
Contradicciones en las Declaraciones de Google
Entre las contradicciones destacadas por el informe de SparkToro, se encuentran:
- Negación de que las señales centradas en clics afecten a los rankings.
- Negación de que los subdominios se consideren separadamente en los rankings.
- Negación de la existencia de una «sandbox» para sitios web nuevos.
- Negación de que se recopile o considere la antigüedad de un dominio.
Además, iPullRank’s King también menciona en su post que John Mueller, un defensor de la búsqueda de Google, ha declarado en un video que «no tenemos nada como una puntuación de autoridad de sitios web».
Sin embargo, los documentos revelan que Google puede calcular una puntuación de «siteAuthority» como parte de las Señales de Calidad Comprimidas que almacenan para los documentos.
Importancia de los Clics y Otros Factores
Uno de los aspectos más destacados es la importancia de los clics – y los diferentes tipos de clics (buenos, malos, largos, etc.) – en determinar cómo se clasifican las páginas web. Durante el juicio antimonopolio de US v. Google, Google reconoció que considera las métricas de clics como un factor de clasificación en la búsqueda web.
Otro de los hallazgos es que Google utiliza los sitios web vistos en Chrome como una señal de calidad, visto en la API como el parámetro ChromeInTotal. Según King, «uno de los módulos relacionados con las puntuaciones de calidad de página presenta una medida a nivel de sitio de las vistas desde Chrome».
Factores Adicionales Considerados por Google
Los documentos también indican que Google considera otros factores como:
- Frescura del contenido.
- Autoría del contenido.
- Si una página está relacionada con el enfoque central del sitio.
- Alineación entre el título de la página y el contenido.
- «El tamaño promedio ponderado de la fuente de un término en el cuerpo del documento.»
Hasta el momento, Google no ha respondido a una solicitud de comentarios sobre estas revelaciones.