Indexación Semántica Latente: otra vuelta de tuerca

Fani Sánchez

Escrito por Fani Sánchez

La Indexación Semántica Latente es una forma de análisis de la información usada por los buscadores en la que se parte del principio de que las palabras que se encuentran a determinada distancia, en una misma porción de texto o área, tienen significados similares o existe una relación estrecha entre ellas.

La Indexación Semántica Latente no es un tema nuevo para los que trabajamos en el mundo del Search Marketing. De un tiempo a esta parte, los buscadores intentan comprender no sólo la lógica léxica o gramatical de nuestras búsquedas, sino ahondar en las relaciones y significados semánticos de las mismas. Este artículo pretende ser una introducción al mundo de la Indexación Semántica Latente (ISL) y sus efectos colaterales, del cual extraer unas recomendaciones para adaptar la optimización de contenido en tu estrategia de posicionamiento en buscadores.

Un poco de historia

La Indexación Semántica Latente no es otra de las invenciones de Google. Al menos no estrictamente. La ISL es sólo una determinada aplicación del Análisis Semántico Latente (ASL), que se gestó a finales de los años 80 en las cabezas de los doctores Thomas K.Landauer (Pearson Knowledge Technologies) y Susan Dumais (Microsoft) entre otros. Podéis consultar la patente echándole un poco de ánimo.

El ASL consiste en la descomposición de los contenidos (matriz) en valores singulares (SVD) que, a través de determinados cálculos, consigue relacionar las similitudes entre grupos de palabras, palabras y pasajes y otras áreas del documento.
Se trata de determinar la relevancia de un término o valor en relación a la totalidad del documento u otras partes o términos y valores del mismo, en base su ocurrencia o distancia entre ellos.

Fórmulas que servían para el análisis semántico latente
Una de las fórmulas usadas en el Análisis Semántico Latente

Cuando años después se contaba con ordenadores lo suficientemente potentes, se pudieron ampliar estos cálculos a volúmenes de datos mayores, en relación directamente proporcional a la capacidad de las computadoras. Desde entonces su uso se ha extendido a múltiples disciplinas.

Aunque como casi todo lo que rodea a Google, no tenemos una «declaración oficial» al respecto y alguno de los programadores que conozco versados en el tema del procesamiento del lenguaje natural afirmarían que son puras suposiciones, creemos que  Google ha integrado el ASL en su sistema de indexación y ha sabido cómo usar el ASL en su beneficio o, como ellos afirmarían, en beneficio del usuario.

¿En qué consiste la Indexación Semántica Latente?

La Indexación Semántica Latente es usada por los buscadores para el procesamiento y análisis de la información en vastas proporciones. A grandes rasgos, la ISL asume que las palabras que se encuentran a determinada distancia, en una misma porción de texto o área, tienen significados similares o existe una relación estrecha entre ellas. Intenta aproximarse a muchos aspectos del lenguaje y la comprensión humana, y aprende de nosotros cada vez que analiza textos y documentos o cada vez que refinamos una búsqueda.  Por ello, bien haríamos en tenerla en cuenta a la hora de abordar la estrategia de creación y optimización contenidos de nuestra web.

 La ISL relaciona e identifica conceptos a través de la ocurrencia y la proximidad entre palabras.

Creemos que la ISL conecta tópicos y palabras estableciendo relaciones entre campos semánticos, entre sinónimos, formas verbales, plurales y singulares o términos relacionados aunque con significados distintos.
Estas conexiones han sido creadas tras el repetido análisis de sitios y sitios. Se estudian las relaciones entre los términos dentro de sus distintos párrafos, la totalidad del documento o el sitio y los enlaces internos o externos del sitio. Los buscadores comienzan a tomar estas referencias y a definir una temática según lo estudiado. Se integran en su sistema como un intento más de empatizar con el usuario y clasificar y puntuar las páginas para las distintas búsquedas de los usuarios.

Relaciones entre términos o campos semánticos

Algunas de las relaciones que creemos que puede establecer la ISL son dentro campos semánticos (furgoneta-coche-motocicleta) o entre sinónimos (empleo-trabajo, pelota-balón), abreviaturas (bicicleta-bici), conjugaciones verbales o simplemente palabras relacionadas con un denominador común (biberón-chupete-cuna, nubes-nublado, natación-nadar).

Para obtener alguna pista sobre los términos que presumiblemente relaciona Google, se ha recomendado más de una vez el uso del comando ~ (seguido de la palabra clave en cuestión) para obtener pistas de qué términos considera Google que están relacionados con tu palabra clave. Pero esto no siempre funciona. Muchas veces podréis comprobar con este método que sus equivalencias o compatibilidades no son tan frecuentes y algunas incluso, son algo disparatadas:

Errores en términos relacionados
Al usar el comando ~ para buscar palabras relacionadas con ‘carne’, resalta ‘carné’ en la SERP

Resultados de búsqueda tras la ISL

Que los buscadores intentan aproximarse al análisis semántico es un hecho. El grado de éxito ya es muy relativo dependiendo del idioma al que nos refiramos o a según que temáticas. Desde luego, las arañas no dejan de ser máquinas que personalmente creo que están muy lejos de entender ciertos matices del lenguaje, pero sus intentos por acercarse a la comprensión de ciertas búsquedas y mejorar la clasificación de determinados sitios o páginas en las categorías pertinentes más allá de unas keyword objetivo van mejorando paulatinamente.

Pongamos un ejemplo: si las arañas rastreasen una página que ofrece paquetes vacacionales, no sería difícil que entre el contenido encuentren términos como ‘turismo’, ‘vacaciones’, ‘viajes’ o ‘viajar’. Si encuentran  un portal que habla de playas en España, sería común que encontrasen nombres de costas españolas y términos como ‘mar’, ‘arena’ o ‘soleado’.
Poco a poco, iría archivando las relaciones entre estas palabras y en un futuro ideal podrá ir ofreciendo al usuario la web más relevante ante una búsqueda ambigua, apreciando la sutil diferencia que existe entre alguien que busca contratar un paquete vacacional en la Costa Blanca y alguien que busca cuáles son los mejores destinos de la Costa Blanca para hacer un tour autogestionado.

Actualmente ya vemos algunas relaciones establecidas (mucho más sencillas) como las que surgen al hacer una búsqueda de ‘ofertas empleo’: además de destacar las palabras incluidas en la búsqueda, resalta las que considera que están relacionadas y pueden ser de interés para el usuario.

Relaciones que la Indexación Semántica Latente establece entre algunos términos
Relaciones que la Indexación Semántica Latente establece entre los términos empleo y trabajo, ambos marcados en negrita aunque en mi fórmula de búsqueda sólo introduje «empleo».

Ventajas de la Indexación Semántica Latente

La Indexación Semántica Latente, lejos de ser una realidad palpable y real, sí es una tendencia que sugiere nuevas vías hacia donde ampliar nuestra estrategia de optimización on-page en buscadores. Presenta algunas ventajas que deberíamos aprovechar, como por ejemplo:

  • Refuerzo del posicionamiento: si asumimos el principio de la ISL, debemos asumir también que las palabras clave semánticamente próximas ayudan a reforzar el posicionamiento de la página, confirmando a Google que tu página trata de X tópico, y ofreciéndote la posibilidad de aparecer en las SERPS con otro término relacionado.
  • Textos más naturales: la Indexación Semántica Latente debe permitirte redactar textos y contenidos más naturales y menos «forzados». Aunque es recomendable seguir cumpliendo con la densidad estimada de tu keyword, podrás reforzar el texto escribiendo sinónimos y variantes y no introduciendo la palabra clave con calzador entre linea y linea.
  • Textos más extensos: posiblemente, usando otras palabras del mismo campo semántico produzcas más texto ya que te vendrán a la mente ideas relacionadas que de otra forma no se te hubiera ocurrido mencionar. Con ello, también aportarás un contenido de valor al usuario y estarás matando dos pájaros de un tiro.

Recomendaciones

  • Riqueza léxica: escribe tus textos con esmero y explota el vocabulario relacionado con tu palabra clave objetivo.
  • Usa la cabeza: aunque hablemos de matrices, fórmulas matemáticas, y múltiples herramientas, lo cierto es que lo que Google busca es aproximarse al lenguaje del usuario, que no es ni más ni menos que una persona como tú y como yo. Usa la cabeza. Piensa en cómo hablas cuando tratas o escribes a un amigo, a tu jefe o un artículo por el puro placer de escribir y no posicionar (¿os acordáis de eso?). Nuestro vocabulario es más rico de lo que pensamos, sólo tenemos que hacer de la práctica un hábito.

Si te ha interesado el tema y quieres saber más, puedes visitar la explicación del Análisis Semántico Latente que hacen en Schoolarpedia.

Curso online de keyword research: consultoría de palabras clave

Fani Sánchez
Autor: Fani Sánchez

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *