• del.icio.us
  • Twitter
  • Facebook
  • Meneame
  • Digg
  • LinkedIn
  • MySpace
  • Technorati
  • email
  • Print
  • PDF

Indexación de contenidos paginados: Google cambia las reglas

14 Noviembre 2011 - Fernando Maciá

Google ha anunciado recientemente cambios y nuevas funcionalidades para mejorar la forma en que indexa una serie de contenidos distribuidos a lo largo de una serie de páginas en un sitio Web.

La presentación de contenidos en una serie de distintas páginas se produce con frecuencia en los sitios Web ante la imposibilidad de presentar toda la información en una única página: por ejemplo en largos artículos que se subdividen en varias páginas o, más frencuentemente, en listados de productos.

Hasta ahora, esta situación planteaba numerosos retos ante la dificultad de incluir titles y metas description únicos para cada una de las páginas de la serie, además de la distribución de la popularidad en cada una de las páginas. Muy habitualmente, Google sólo indexaba la primera o primeras páginas de la serie, lo que impedía que pudiera acceder, por ejemplo, a fichas de producto desde los enlaces de las últimas páginas de la serie.

Soluciones aplicadas hasta ahora

Una de las formas en que desde las consultoras de posicionamiento en buscadores habíamos atacado esta situación consistía en incluir una meta ROBOTS con la instrucción “NOINDEX, FOLLOW” en la sección <head> a partir de la segunda página de la serie. Con la meta ROBOTS configurada de esta manera, lo que tratábamos de conseguir era:

  1. Que Google indexara la primera página de la serie y que fuera esta la que mostrara en sus resultados para las búsquedas pertinentes.
  2. Que Google no viera las siguientes páginas de la serie –habitualmente con el mismo title y meta description que la primera– como contenido duplicado de la primera. Al incluir “NOINDEX”, estas páginas no deberían indexarse.
  3. Que Google siguiera los enlaces en cada una de las páginas de la serie hacia las páginas detalle de fichas de producto. Al incluir “FOLLOW”, estos enlaces deberían ser seguidos por Google para indexar dichas páginas.

Una segunda forma consistía en incluir un rel=”canonical” apuntando a la primera página en cada una de las páginas de la serie para que Google indexara exclusivamente la primera como resultado para toda la serie.

Soluciones a aplicar a partir de ahora

Ninguna de estas dos soluciones, por razones obvias, era óptima. Por lo que Google ha propuesto dos nuevas alternativas para solventar esta situación:

  1. Crear una página única con todo el contenido de la serie, enlazada con un enlace del tipo “Ver todo” en la primera página de la serie. En opinión del buscador, esta página es la que puede resultar en la mejor experiencia del usuario, salvo cuando el tiempo de carga o algún otro problema impida que se pueda presentar todo el contenido en una única página o haga esta presentación muy poco usable. En caso de poder implementar esta solución, entonces Google recomienda añadir rel=canonical en todas y cada una de las páginas de la serie apuntando a la URL con la versión de “Ver todo”. (Hacer click sobre la imagen para verla a tamaño completo)
  2. Google pagination con rel=canonical

    Human Level Communications recomienda implementar esta solución en los casos de contenidos tales como artículos periodísticos, reportajes o pequeños listados repartidos en unas pocas páginas.

  3. Especificar la relación entre las distintas páginas de una serie añadiendo rel=”next” y rel=”prev” en la sección <head> de las páginas correspondientes.

Es decir, si tenemos una serie de páginas cuyas URL son del tipo:

http://www.sudominio.com/productos?tipo=abc&page=1

http://www.sudominio.com/productos?tipo=abc&page=2

http://www.sudominio.com/productos?tipo=abc&page=3

http://www.sudominio.com/productos?tipo=abc&page=4

En la primera página, http://www.sudominio.com/productos?tipo=abc&page=1, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”next” href=”http://www.sudominio.com/productos?tipo=abc&page=2″ />

En este caso, no incluimos ninguna referencia anterior con rel=”prev” porque se trata de la primera página de la serie.

En la segunda página, http://www.sudominio.com/productos?tipo=abc&page=2, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”prev” href=”http://www.sudominio.com/productos?tipo=abc&page=1″ />

<link rel=”next” href=”http://www.sudominio.com/productos?tipo=abc&page=3″ />

Es decir, la referencia tanto a la página anterior a la 2, como la página siguiente.

En la tercera página, http://www.sudominio.com/productos?tipo=abc&page=3, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”prev” href=”http://www.sudominio.com/productos?tipo=abc&page=2″ />

<link rel=”next” href=”http://www.sudominio.com/productos?tipo=abc&page=4″ />

Es decir, la referencia tanto a la página anterior a la 3 –página 2– como la página siguiente –página 4.

En la página 4, que es la última, http://www.sudominio.com/productos?tipo=abc&page=4, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”prev” href=”http://www.sudominio.com/productos?tipo=abc&page=3″ />

En este caso, no incluimos ninguna referencia anterior con rel=”next” porque se trata de la última página de la serie (hacer click sobre la imagen para verla a tamaño completo).

Google: paginación con rel="next" y rel="prev"

Human Level Communications recomienda implementar esta solución en los casos de largos listados de productos, listados de hoteles, restaurantes, etc. que ocupan muchas páginas.

Recapitulando:

  • La primera página de la serie sólo incluye rel=”next” y no rel=”prev”.
  • La última página de la serie sólo incluye rel=”prev” y no rel=”next”.
  • Las páginas segunda a penúltima de la serie incluyen tanto rel=”prev” como rel=”next”.
  • Las URL especificadas para rel=”prev” y rel=”next” pueden ser tanto absolutas como relativas. Nosotros recomendamos, para el caso en que el contenido pueda ser plagiado, que los enlaces se especifiquen de forma absoluta. Así seguirán apuntando a nuestras páginas salvo que el plagiador los edite específicamente. Si existe un enlace <base> en la página, las URL relativas se resuelven de acuerdo con la URL base especificada por esta etiqueta.
  • rel=”next” y rel=”prev” sólo se declaran en la sección <head> y NO en los enlaces de la sección <body> de la página.
  • rel=”next” y rel=”prev” son independientes de rel=”canonical” y, en algunos casos, pueden funcionar juntos sin problemas, por ejemplo, para eliminar la indexación de URL con parámetros de sesión.
  • De momento, rel=”next” y rel=prev” son pistas para Google, y no directivas absolutas.
  • Si no se especifican, Google seguirá rastreando la serie de páginas como hasta ahora, intentando identificar la relación entre ellas y escogiendo en cada caso la más relevante como resultado.
  • ATENCIÓN: si la primera página de la serie es accesible a través de dos URL distintas, por ejemplo, como primera página de listado sin parámetro de paginación –http://www.sudominio.com/productos?tipo=abc– y como primera página de listado desde el resto de páginas incluyendo parámetro de paginación –http://www.sudominio.com/productos?tipo=abc&page=1–, debemos incluir un rel=”canonical” especificando la URL que queremos indexar para evitar contenido duplicado: <link rel=”canonical” href=”http://www.sudominio.com/productos?tipo=abc” />

Este artículo puede ser reproducido siempre que se respete su integridad y se acompañe de la siguiente línea de crédito en la misma página en que aparezca el mismo y conservando los respectivos enlaces:

Fernando Maciá, Director de Human Level Communications, consultora de posicionamiento en buscadores, gestión de campañas de enlaces patrocinados y desarrollo web amigable para buscadores. Autor del libro Posicionamiento en Buscadores, publicado por Anaya Multimedia.

13 Comentarios para “Indexación de contenidos paginados: Google cambia las reglas”

  • FontySoft dice:

    Muy bien detallado Fernando, gracias.

    Pero me surge una cuestión relacionada con el tema y es referente al orden. Si en el listado paginado que comentas en tu artículo diesemos la posibilidad de ordenarlo por distintos criterios (referencia, precio, peso, color, etc), ¿las páginas del listado ordenado por precio serían contenido duplicado de las páginas ordenadas por referencia?

    En caso afirmativo, ¿como se prodría solucionar?

  • DUQUE dice:

    Recomendais utilizar el rel=”prev” y rel=”next”para páginaciones donde la primera página es indexable y las siguientes llevan un “noindex, follow”

    Un saludo.

  • santos dice:

    Me uno a la pregunta de Duque.

    Un saludo

  • fernando dice:

    @FontySoft: los cambios de orden en un listado no es contenido nuevo. Efectivamente, si generamos una URL distinta para cada ordenación de contenido estaríamos creando contenido duplicado, ya que el contenido es el mismo. En estos casos, podemos reordenar los listados pasando un parámetro por POST de forma que no cree una URL distinta o, en caso de hacerlo a través de un enlace pasando parámetros por GET, añadir un rel=canonical con la URL que deseemos especificar como única para esa página. Adicionalmente, recomendaría incluir un rel=nofollow en los enlaces hacia URL de reordenación de resultados.

  • fernando dice:

    @DUQUE y @santos: lo que recomendamos es eliminar directamente el noindex,follow del resto de las páginas y sustituir este método por la especificación de rel=prev y rel=next para comunicar correctamente a Google la relación que existe entre las páginas. Esto permitirá indexar todo el contenido tanto de las páginas de listado (sin que se vea como duplicado) como los enlaces hacia las páginas detalle.

  • Claudio dice:

    Excelente explicación. Trataré de implementarlo aunque es difícil con el tipo de código que utilizo.

  • miguel valero seo dice:

    hasta ahora consideraba la dos técnicas anteriores, pero ciertamente está que presenta de la mano de Google me parece la más sensata, supongo que es la mejor solución para la tiendas online. Podrías colgar el link original donde Google comenta esto. Me parece una observacion importante e interesante la que has realizado. Saludos.

  • Contenidos duplicados en tu web. Detección y corrección del problema dice:

    [...] como duplicado. No he encontrado todavía la página oficial donde se anuncia esto, pero la fuente Fernando Maciáme parece de lo más solvente, se trata de incluir el siguiente metadato en la primera página de la [...]

  • Google cambia las reglas Indexación de contenidos paginados | Web 2.0 Negocios Ideas Oportunidades Marketing 2.0 dice:

    [...] de contenidos paginados  Google cambia las reglas – http://www.humanlevel.com/articulos/indexacion-de-contenidos-paginados-google-cambia-las-reglas.html obligada lectura si eres [...]

  • jose dice:

    Siempre me ha costado entender completamente esta tematica y con este articulo me parece que voy encontrando la luz ;) …. pongo un ejemplo. Tengo la siguiente lista de direcciones ( accesibles desde su paginador)

    http://www.midominio.com/descargas/
    http://www.midominio.com/descargas/page-2-0-0-0-2/
    http://www.midominio.com/descargas/page-3-0-0-0-2/
    http://www.midominio.com/descargas/page-4-0-0-0-2/
    http://www.midominio.com/descargas/page-5-0-0-0-2/

    Aqui seria correcto aplicar rel=”next” y rel=”prev”? Los contenidos de cada pagina no son los mismos ( aunque claro, para los motores de busqueda podrian ser “similares”, entonces en este caso no decido utilizar canonical y si rel=”next” y rel=”prev?

    Espero sus comentarios ;)
    Gracias!

  • 42 consejos de Matt Cutts tras Google Panda | | Blog Seo Adictos 24H - Posicionamiento Web - Analista SEO Valencia dice:

    [...] me parece muy interesante la observación de Fernando Maciá que me parece de lo más solvente, se trata de una interesante solución para resolver el problema [...]

  • fernando dice:

    Disculpa Miguel, se me había pasado incluir el enlace a la referencia de Google: http://googlewebmastercentral.blogspot.com/2011/09/pagination-with-relnext-and-relprev.html así como una referencia adicional también muy recomendable: http://www.seroundtable.com/google-pagination-solution-14037.html

  • SeoSeo7 dice:

    Buenísimo el post Fernando!!!

    Una duda de novato, en el caso de paginas de resultados de productos, donde pueden haber 10, 20 o “N” paginas y todas con productos distintos y por ejemplo 15 productos por pagina, yo podría añadir a la url y a las metas de forma dinámica la frase “productos del 16 al 30″ y así sucesivamente hasta el final, se supone que no estoy limitando la indexación ni duplicando contenido, verdad???

Comente este contenido

HLC con los líderes

SEMPO General Member logo
Web Analytics Association logo

HLC en los medios

Canal Nou 24

HLC en eventos