Lorimavexus

Contenido SEO que genera resultados reales

El error con etiquetas canonical que duplicó todo nuestro contenido en Google

El error con etiquetas canonical que duplicó todo nuestro contenido en Google

Enero de 2024. Notamos algo extraño en los resultados de búsqueda. Nuestras páginas aparecían dos o tres veces para la misma consulta, pero con URLs diferentes. Pensamos que era algo temporal hasta que revisamos Search Console y vimos 18,000 páginas indexadas cuando nuestro sitio solo tenía 4,200.

El problema estaba en las etiquetas canonical. Durante una actualización del CMS, alguien modificó la plantilla base y las canonicals empezaron a apuntar a parámetros de sesión en lugar de las URLs limpias. Cada visitante generaba una versión única de cada página con un ID de sesión diferente.

Paso 1: Verificar el código fuente

Revisamos el HTML de 50 páginas aleatorias. Todas tenían canonical apuntando a URLs con parámetros como ?sessionid=xyz789. Google rastreaba estas URLs, no encontraba canonical válido y las indexaba todas como páginas únicas. Un desastre de contenido duplicado masivo.

Paso 2: Auditar parámetros de URL

Usamos Google Analytics para identificar todos los parámetros activos. Encontramos ocho diferentes: sessionid, userid, ref, source, utm_campaign, y tres más que ni siquiera sabíamos que existían. Algunos provenían de integraciones antiguas que nadie documentó.

Paso 3: Configurar parámetros en Search Console

Marcamos cada parámetro como "no cambia contenido" en la configuración de rastreo. Esto le indica a Google que ignore esas variaciones. Pero esto no elimina páginas ya indexadas, solo previene futuras.

Paso 4: Corregir las etiquetas canonical

Modificamos la plantilla del CMS para generar canonicals dinámicas que siempre apunten a la URL base sin parámetros. Implementamos una función que limpia cualquier query string antes de generar la etiqueta. Probamos con 500 páginas antes de desplegar a producción.

Paso 5: Desindexar duplicados

Creamos un sitemap solo con URLs limpias y lo enviamos a Search Console. Luego solicitamos eliminación masiva de todas las URLs con parámetros usando la herramienta de eliminación. Google tardó tres semanas en procesar 14,000 solicitudes.

La limpieza completa tomó dos meses. Nuestro ranking mejoró gradualmente a medida que Google consolidaba las señales en una sola versión de cada página. Perdimos tiempo valioso y posiciones porque nadie verificó las canonicals después de actualizar el sistema. Ahora tenemos alertas automáticas que verifican la estructura de canonicals cada semana.

Privacidad y cookies

Usamos cookies para mejorar tu experiencia. Elige qué tipos aceptas.