Qué es la meta robots

La etiqueta meta robots se usa como directiva para dar instrucciones a los buscadores, o sólo a Google en el caso de Googlebot, respecto al rastreo e indexación de la página web donde está implementada, dando directrices para que indexen o no una página o contenidos de la misma, o para que sigan o no los enlaces que van desde ésta hacia otras páginas, impidiendo su indexación.

Su uso lógico es para indicar directivas negativas, pues el rastreador las entiende como positivas en caso de no indicar lo contrario. Por defecto ya son interpretadas en positivo.

Es obvio, pero no deben existir estas etiquetas en el caso de que queramos que los buscadores indexen la página, por eso, hay que estar muy atentos a no incluirlas o quitarlas en aquellos portales que las usan en pruebas y que van a lanzar la versión definitiva que quieren indexar, para que la indexación se lleve a cabo sin problemas.
Las metaetiquetas robots nos van a permitir controlar la forma en que se debe indexar una página y la forma de mostrarla a los usuarios en la página de resultados de búsqueda.

Dónde y cómo se implementa la etiqueta meta robots

La ubicación de la metaetiqueta robots debe hacerse en la sección <head> de la página en cuestión. Además, necesita contener dos atributos, name y content para poder funcionar correctamente.

<!DOCTYPE html>
<html>
<head>
...
<title>...</title>
<meta name="robots"  content="noindex" />
...
</head>
<body>
...
</body>
</html>

Atributo content: Directivas 

Los valores que pueden acompañar a la etiqueta robots para poder dar diferentes indicaciones cara a la indexación o forma de publicación de la página, pueden ser varios y se indican dentro del atributo “content”.

Podemos dar tantas directrices como estimemos oportunas, siempre que al incluirlas, estén separadas por comas. Las principales directivas que encontraremos son:

  • index / noindex, con la que indicaremos a los robots si deseamos indexar o no la página web en sus motores de búsqueda para que aparezca o no en los resultados de búsqueda de los mismos. Si no queremos indexarla con noindex le diremos que no muestre esta página ni un enlace “en caché” en los resultados de búsqueda.
  • follow / nofollow, indica a la araña si debe rastrear y seguir, o no, los enlaces que contiene la página en cuestión.
  • archive / noarchive, señala si queremos que se archive o no el contenido de la página web en la caché interna del buscador.
  • snippet /nosnippet, para que no solo muestre el título y no la descripción en los resultados de búsqueda y sólo.
  • odp / noodp, cuando no queremos que se muestren metadatos del opd, Open Proyect Directory, en los títulos o descripciones de la página.
  • ydir / noydir, similar a la anterior, pero para el directorio de Yahoo.
  • traslate / notraslate, para ofrecer o no la traducción de la página en los resultados de búsqueda.
  • noimageindex, para no indexar las imágenes de la página.
  • unavailable_after [RFC-850 date/time], cuando no queremos que se muestre la página en los resultados de búsqueda a partir de la fecha y hora señaladas.

Ejemplos de uso de metaetiqueta robots e interpretación de las directivas

Citamos algunos ejemplos de meta robots y el significado de lo que queremos indicarle a los rastreadores de los buscadores con ello:

<meta name="robots"  content="index,follow"  />

Es la etiqueta por defecto de cualquier página web y no es necesario incluirla. Indica al rastreador que rastree, indexe y siga los enlaces contenidos en la página web.

<meta name="robots"  content="index, nofollow"  />

Queremos que se indexe la página pero que no se sigan los enlaces que contiene la misma.

<meta name="robots"  content="nofollow, noodp"  />

Cuando deseamos que no se rastreen los enlaces que contiene y no queremos mostrar los metadatos opd en los títulos o descripciones de la página.

 

¿Te ha gustado el artículo? ¡Compártelo!