Existen tres formas de buscar información en la web, dos de ellas son las más empleadas: la primera es hacer uso de los motores de búsqueda, que permiten localizar información a través de la formulación de una pregunta. La segunda es a través de los directorios -sistemas que clasifican documentos web seleccionados por materia y que permiten que naveguemos por sus secciones o busquemos en sus índices-. Y la menos habitual, es buscar en la web a través de los enlaces de las páginas web (estructura hipertextual).
Lo más normal es que un usuario no distinga entre un motor de búsqueda, como Google, o un directorio, como Yahoo!, ya que sus interfaces de consultas son muy similares. La principal diferencia, que como usuarios no percibimos, es que los directorios son aplicaciones controladas por humanos, encargados, entre otras cosas, en clasificar por temáticas la información que reciben.
Para entender el funcionamiento de un motor de búsqueda, tenemos que contemplarlo desde dos perspectivas: por un lado, la recopilación de la información y, por el otro, la recuperación de la información.
Para recopilar la información, el motor compila automáticamente las direcciones de las páginas que formarán parte de su índice, las indexa y las registra en su base de datos. Para realizar este proceso, el motor se vale de robots (conocidos como spider, arañas), que recopilan varios millones de páginas por día y actualizan la información de la que ya disponían.
El proceso de recuperación de información comienza cuando un usuario hace una consulta al sistema. Cada sistema dispone de diferentes prestaciones: los hay con la clásica caja dentro de un formulario web en la que el usuario tiene que escribir su petición. En algunos casos, nos permiten realizar restricciones, como por ejemplo buscar resultados en un idioma concreto o realizar una búsqueda para una frase literal. Otros sistemas permiten realizar búsquedas mucho más refinadas, como, por ejemplo, aquellos en los que se pueden realizar búsquedas sobre el título contenido en un documento.
Cada motor de búsqueda usa sus propios algoritmos con criterios diferentes y, por lo tanto, cada uno de ellos presenta un listado de resultados diferente. Así, cada motor, recuperará información si realiza la búsqueda por término simple, por término múltiple, basada en el contexto, basada en el lenguaje natural o buscando la correspondencia de patrones.
El orden en el que el motor presenta los resultados a la búsqueda del usuario (alineado de los documentos, o ranking) es lo que decide a un usuario decidirse por un buscador y no por otro.
Como usuario, espero que el motor me muestre los documentos más acordes y relevantes con la búsqueda que estoy realizando.
Como empresa, deseo aparecer en esos primero puestos de los listados de los motores, ya que es una gran ventaja sobre el resto de competidores.