Todos, alguna vez, hemos formulado una pregunta a un buscador, ya sea Google, Bing, Yahoo!, etc. Algunas “serias” (¿Qué poeta español del siglo XIX escribió Rimas y Leyendas?), otras “necesarias” (¿Cuál es la estación de metro más próxima a Legazpi?), algunas “graciosas” (¿Quién es la persona más fea del mundo?), otras “imprudentes” (¿qué me tomo si no puedo respirar?). Podríamos engrosar la lista de adjetivos bastante más, pero de muestra yo creo que vale. Por cierto, normalmente las preguntas las formulamos de forma más reducida -como en el lenguaje indio (estación metro próxima a Legazpi)-, y eso que con el micrófono de Google echamos unas parrafadas memorables (me gustaría saber cuál es la estación de metro más próxima a Legazpi y cuántas salidas tiene).
Después de lo visto, vamos a ver los pasos que realiza un motor de búsqueda:
1º Rastreo. Proceso mediante el que el robot del buscador descubre páginas nuevas y actualizadas y las añade a su índice. Los robots utilizan un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.
Esta parte se realiza en servidores off line. Los robots trabajan continuamente como arañas rastreando y almacenado en los servidores del buscador.
2º Indexación. El robot del buscador procesa todas las páginas que ha rastreado para compilar un índice masivo de todas las palabras que ve junto con su ubicación en cada página. Además, también procesa la información incluida en las etiquetas y los atributos de contenido clave, como las etiquetas "title" y los atributos "alt".
La indexación también se realiza en off, no en tiempo real (cuando el usuario realiza la búsqueda).
3º Publicación de Resultados. El sistema busca en el índice las páginas que coincidan con la búsqueda que un usuario realiza, y muestra los resultados que considera más relevantes para el usuario. La relevancia se determina a partir de más de 200 factores, unos on-page y otros off-page.
Normalmente, Google nos ofrece una amplísima lista de resultados en milésimas de segundos.
Para que un sitio web consiga una buena posición en las páginas de resultados, es importante asegurarse de que los robots de los buscadores puedan rastrearlo e indexarlo correctamente.
Pero hay ocasiones en las que no queremos que los buscadores incluyan en sus índices ciertas páginas. Para evitarlo podemos:
- Usar un archivo centralizado para controlar la entrada, el archivo robots.txt
- Introducir una etiqueta especial en cada página, la meta Robots
Esto es una millonésima parte del mundo SEO; es decir del enjambre de técnicas que envuelven el posicionamiento orgánico (que no es de pago) en los buscadores. El SEO es un temario incluido en todos los másteres porque es fundamental para los negocios digitales. ¿Necesitas que te asesoremos sobre tus estudios? Solo dinos a qué hora quieres que te llamemos