¿Cómo indexa el contenido Google?

27/10/2017
  • Vamos a explicarte de manera sencilla cómo indexa el contenido Google. Entender este punto te será de gran ayuda para entender el SEO de tu página.

  • Al enfrentarnos a un proyecto desde el punto de vista del SEO, es muy habitual que nos hablen en lo que parece chino. Una de las palabras que más se repiten es el término indexación. Pero... ¿qué es y cómo indexa el contenido Google? Si no lo tienes claro, este post es para ti.
  • Hablemos primero de rastreo

  • Antes de explicar cómo indexa el contenido Google, necesitamos tener claro otro concepto: el concepto de rastreo. Más que nada porque sin rastreo no hay indexación. El rastreo es una parte crítica de la optimización si queremos que nuestro eCommerce aparezca en los resultados de búsqueda de Google.

    Para no extendernos demasiado, diremos que Google tiene una serie de robots que se dedican las 24 horas del día a recorrer las páginas web. Lo que hacen es buscar tanto nuevos dominios como actualizaciones de los que ya conoce. Para ello, replica la navegación tal y como lo haría un usuario, es decir, pasando de enlace a enlace.

    Es importante recalcar que, por el mero hecho de crear un sitio nuevo o aumentar las categorías o fichas de producto de nuestra tienda online, no tenemos por qué aparecer directamente en las búsquedas. No hay una relación directa causa-efecto.

    El bot o crawler se mueve gracias a un algoritmo, que es el que pondera qué sitios, cada cuánto tiempo y cuántas páginas visitará. Por decirlo de otra forma: Google nos asigna lo que se llama crawl budget, una “cantidad de rastreo” máxima.
  • Ahora sí: ¿cómo indexa el contenido Google?

  • Una vez rastreado el sitio... ¿qué es lo que hace Google Bot con la información? Pues guardarla en un índice.

    Imagina Google como una enorme biblioteca en la que se guardan millones de libros. Esa biblioteca sería el índice, con lo que el proceso de indexación consiste en guardar “los libros” (en nuestro caso páginas web) en las estanterías de esta biblioteca.

    Evidentemente, no basta con almacenar por almacenar. Google necesita un orden lógico y una referencia para que el resultado sea accesible.
  • Volviendo al ejemplo de la biblioteca podemos entenderlo muy bien. En las librerías, los libros se encuentran organizados alfabéticamente y por temáticas (misterio, ensayo, guías de viaje, novela histórica…). Pues Google necesita hacer un poco lo mismo.

  • Esto implica que Google necesita saber de qué trata nuestra web. Para ello, lo que hace durante el proceso de rastreo es crear un pequeño resumen, una ficha de consulta que construye utilizando elementos como el título, la descripción, los encabezados y el contenido (tanto texto como fotos, que interpreta a través del alt text o texto alternativo y el nombre del archivo).

    Gracias a estas fichas, lo que hace Google es relacionar cada página con una serie de palabras clave.
  • Supón que vendes calzado deportivo. Pues, si has hecho las cosas bien, la página de tu tienda online en la que vendes zapatillas de deporte Adidas Samba negras contendrá estas keywords en las llamadas metaetiquetas (title, description…) en el texto descriptivo del producto y en las fotos.

  • Cuando un usuario haga una consulta para ese modelo de zapatillas utilizando el buscador, Google comprobará en su índice si tiene alguna referencia.

    ¿Qué ocurre si Google encuentra más de una página en la que aparezcan esos términos?

    Evidentemente, esto pasa con mucha frecuencia. Así que tendrá que recorrer todas las páginas que encuentre, entre las que puede estar una ficha en Wikipedia, el vídeo de un unboxing realizado en YouTube, un hilo en un foro o, por supuesto, fichas de producto de diferentes eCommerce.
  • Cómo facilitar la indexación

  • Hay algunos condicionantes técnicos que debes tener claros a la hora de hacer una página indexable.

    Lo primero a tener en cuenta es que no toda la tecnología que se utiliza para desarrollar una web es interpretada igual de bien por Google.
  • El mejor ejemplo es Flash, que tan fuerte pegó hace algo más de una década y que ha caído en desgracia por una razón de peso: a Google le cuesta bastante hacerse con él y, aunque se indexa, no lo interpreta correctamente. Algo parecido pasa con Silverlight, Ajax, JS o el uso de Iframes.

  • Siempre es recomendable que especifiques qué no quieres indexar. Como te decía, hay un crawl budget y nos interesa que se indexen las páginas que nos pueden aportar tráfico y negocio. Gracias a este archivo, podrás restringir al acceso a determinadas secciones del eCommerce.

    Si quieres hacerlo a nivel de URL concretas, puedes utilizar otro recurso: las meta-etiquetas, los meta-robots o los canonicals. Más útiles si vas a contenidos concretos. Aún así decirte que Google suele respetar cualquiera de estas fórmulas, pero en realidad no está obligado a hacerlo.

    Si quieres indexar de manera más rápida, puedes utilizar Google Search Console, que te permite hacer que una página concreta sea rastreada de manera “forzada“.

    Google Search Console es también el mejor modo de saber si nuestras páginas están siendo indexadas. Da de alta tu site y consúltalo con regularidad para saber en qué estado están las cosas.
  • Hasta aquí la explicación de cómo indexa el contenido Google ¿tienes alguna duda? ¡Pregunta que para eso estamos!

  • Imágenes | Unsplash.

Jordi Ordóñez


Jordi Ordóñez es consultor eCommerce y SEO con más 16 años de experiencia en proyectos online. Ha asesorado a clientes como Castañer, Textura, Acumbamail, Kartox o Casa Ametller. Escribe en el blog oficial de Prestashop, BrainSINS, Marketing4ecommerce, Fotografía eCommerce, Socialancer, eCommerce-news.es y SEMRush entre otros. Es redactor en el blog de Oleoshop.

¿Quieres ser el primero en dejar tu opinión?

Regístrate con nosotros y así podrás crear tus comentarios, contar tus experiencias y participar en nuestro blog.

Buscar entradas

Últimas entradas

Este sitio web almacena datos como cookies para habilitar la funcionalidad necesaria del sitio, incluidos análisis y personalización. Puede cambiar su configuración en cualquier momento o aceptar la configuración predeterminada.

política de cookies

Esenciales

Las cookies necesarias ayudan a hacer una página web utilizable activando funciones básicas como la navegación en la página y el acceso a áreas seguras de la página web. La página web no puede funcionar adecuadamente sin estas cookies.


Personalización

Las cookies de personalización permiten a la página web recordar información que cambia la forma en que la página se comporta o el aspecto que tiene, como su idioma preferido o la región en la que usted se encuentra.


Análisis

Las cookies estadísticas ayudan a los propietarios de páginas web a comprender cómo interactúan los visitantes con las páginas web reuniendo y proporcionando información de forma anónima.


Marketing

Las cookies de marketing se utilizan para rastrear a los visitantes en las páginas web. La intención es mostrar anuncios relevantes y atractivos para el usuario individual, y por lo tanto, más valiosos para los editores y terceros anunciantes.