¿Has oído hablar del tag “canonical”? ¿Te suena a chino o sabes por dónde van los tiros? ¿Qué diferencia hay entre contenido canónico y contenido duplicado?
Hoy vamos a hablar sobre cómo canonicalizar contenido para que Google sepa qué tiene relevancia dentro de nuestra web.

Usabilidad y buena indexación: el buen camino.

Nosotros siempre queremos que nuestra web sea la mejor. Que tenga todo lo necesario para que el usuario que la visita encuentre lo que busca: buenas imágenes, descripciones originales y bien estructuradas, buenas transiciones, una arquitectura web bien organizada y comprensible…
Son muchos factores los que hacen que una web sea “usable”, desde los colores a las fuentes de texto elegidas. El usuario manda, el usuario debe entender e interactuar con nuestra web para que él quede satisfecho tras su visita (porque encuentre lo que busca, porque pueda contactar, porque pueda comprar un artículo…).
Pero, ¿le estamos dando a Google la información completa sobre cómo queremos que entienda él nuestra página web?
Normalmente van de la mano, una buena usabilidad y una buena organización interna de la web, para que los robots que pasan a visitarla e indexarla la comprendan correctamente, pero a veces hay que indicarle de forma clara cómo queremos que entienda el contenido que tenemos, para que no “pierda el tiempo” e indexe lo más importante primero.
La detección y corrección del contenido duplicado y la canonicalización de contenidos es clave en cualquier estrategia de SEO Onsite.

Contenido Canónico 01

Casos en los que el contenido puede duplicarse

Cuando hablamos de contenido canónico nos referimos a que, dentro de una página web puede haber varias urls que contengan el mismo contenido, lo que plantea problemas de duplicidad y de disolución de los rankings de las páginas a nivel de indexación.
Esto puede ocasionarle “dolores de cabeza” a los robots que exploran tu sitio web, ya que no entienden la estructura correcta de los contenidos, como ocurre en los siguientes casos.
Debemos señalarle como canónico cuál es el contenido que queremos indexar o que queremos señalar como el más relevante.

1. Urls Dinámicas

Podemos tener una landing page que hable sobre zapatos y que cambie su url original cuando marcamos un filtro o un parámetro como color, talla o cualquier variante.

Url principal: ejemplo.com/zapatos-tacon/
Variante de url: ejemplo.com/zapatos-tacon?color=negro&talla=39

Esta url dinámica que se ha generado, es diferente a la original, pero el contenido de la página es el mismo, lo que puede crear problemas de cara al SEO.

2. Diferentes urls, mismo contenido

Esto ocurre cuando nuestro sistema añade carpetas en la url al insertar el contenido en diferentes categorías.
Url principal: ejemplo.com/blog/propuestas-zapatos-primavera
Variante de url: ejemplo.com/blog/tendencias/propuestas-zapatos-primavera

Si dejamos que esto ocurra, sin indicarle al buscador que es la principal la que tiene que indexar, tendremos contenido duplicado en nuestro sitio web y Google puede penalizarnos por ello. Debemos indicarle cuál es el contenido canónico para evitar que esto ocurra.

3. Protocolos http y subdominios

Cuando configuramos nuestro servidor, si no lo hacemos correctamente, estamos mostrando el mismo contenido para las siguientes variantes de nuestra web:

http://ejemplo.com/zapatos-tacon
https://ejemplo.com/zapatos-tacon
http://www.ejemplo.com/zapatos-tacon

Contenido Canónico 02

Cómo marcar el contenido canónico en nuestra web para que Google lo entienda

  • No se deben indicar páginas canónicas a través del archivo robots.txt
  • No utilices la herramienta de eliminación de URLs para indicar páginas canónicas, puesto que elimina todas las versiones de una URL de la búsqueda.
  • No indiques URL canónicas diferentes que lleven a una misma página, ni con la misma técnica ni con otras diferentes (por ejemplo, no especifiques una URL de una página en un sitemap y luego indiques otra URL de la misma página mediante rel=»canonical»).
  • No utilices la directiva noindex para evitar que se seleccione una página canónica, puesto que se ha diseñado para excluir páginas del índice, no para seleccionar páginas canónicas.
  • Indica páginas canónicas cuando utilices etiquetas hreflang. Especifica una página canónica en el mismo idioma o, en el caso de que una página no esté disponible en ese idioma, selecciona el que consideres más adecuado.

Estructura correcta del contenido canónico: cómo etiquetarlo

Para etiquetar páginas concretas como “canónical content” puedes indicar que una página es un duplicado añadiendo una etiqueta a su encabezado.

Si quieres que https://ejemplo.com/zapatos/zapatos-tacon sea la URL canónica de una página aunque haya varias URL que lleven al mismo contenido debes etiquetarlas así:

Marca todas las páginas duplicadas con un elemento de enlace rel=»canonical». Añade una etiqueta con el atributo rel=»canonical» a la secciónde las páginas duplicadas. Este elemento debe dirigir a la página canónica, tal como puede verse en este ejemplo:

Contenido Canónico 03

Revisa la salud de tu contenido para evitar duplicidad y “ponérselo fácil” a Google a la hora de interpretar su estructura.
Puedes hacer un análisis del estado de canonicalización de tu web con herramientas como Screaming Frog, que te darán resultados de cuantas etiquetas canonical te faltan o si están correctamente colocadas.