Nota sobre la evaluación: de forma intercalada en el texto de este artículo encontrará el enunciado de diversas actividades. Para superar esta unidad didáctica deberá realizar estas actividades redactando un informe en el que se incluyan comentarios y, en caso que sea pertinente, una captura de pantalla de cada actividad para ilustrar su realización. Para entregar este informe deberá crear un solo documento para todos las actividades de esta unidad didáctica en formato OpenOffice o Word y de un máximo de 500 Kb. A continuación podrá usar el espacio de entrega y notificación perteneciente a este grupo de unidades didácticas. La realización de forma satisfactoria de este ejercicio implicará la obtención de 0,75 créditos.
1. Introducción
Como es sabido, los motores presentan sus opciones de búsqueda en dos planos o formas de acceso: la búsqueda simple, utilizada por la inmensa mayoría de los usuarios y la búsqueda avanzada, cuya utilización es muy minoritaria. Sin embargo, la búsqueda avanzada ofrece prestaciones cuyo conocimiento detallado merece la pena. A cambio de pagar el peaje que representa una cierta curva de apredinzaje podemos obtener recursos mucho mejores de la Web. Además, lo cierto es que el dominio (y el hábtito) de la búsqueda avanzada marcan, una vez más, la diferencia entre el profesional y el aficionado.
2. Simple vs. Avanzada
Las prisas de la vida cotidiana y el sentido de la urgencia (real o imaginario) que casi todos experimentamos en nuestro trabajo diario hace que la búsqueda simple sea, con mucha diferencia la más utilizada en los diferentes motores. Es tanta la diferencia de la búsqueda simple sobre la avanzada que en algunos casos (Yahoo, Ask) es un tanto difícil acceder a ella, síntoma claro de que la mayor parte de los usuarios la evitan, pues como es sabido las interfaces de consulta de los motores de búsqueda están diseñasdas a partir de el estudio de los hábitos de sus usuarios como no podría ser de otro modo.
Ahora bien, el hecho de que la búsqueda avanzada sea mucho menos utilizada no nos dice nada en realidad sobre su utilidad, simplemente nos habla de la preferencia de los usuarios por la simplicidad. Para ejecutar una búsqueda simple únicamente hemos de entrar la palabra clave y hacer un clic en el botón de búsqueda. Con la inmensa cantidad de información publicada en la Web es muy probable que obtengamos alguna información, no necesariamente la mejor información, pero algo obtenemos y posiblemente de cierta relevancia.
En contraste, para la búsqueda avanzada no solamente hemos de hacer un clic adicional, cosa que no sería en principio ningún problema especial sino que debemos tomar decisiones , cosa que va contra el principio fundamental de la usabilidad enunciado como “no me hagas pensar”. No es estraña la preferencia de los usuarios por la búsqueda simple.
Ahora bien, utiilizar la búsqueda avanzada aporta ventajas y, aunque resulte de una gran obviedad recordarlo refuerza el hábito de utilizarla . A su vez, usar la búsqueda avanzada, en más de una ocasión puede marcar la diferencia entre una búsqueda fallida y una búsqueda con éxito. Mientras que esto puede parecer trivial en un contexto de ocio o de simple curiosidad (buscamos información sobre nuestra actriz preferida o sentimos curiosidad por las imágenes de la última carrera de Fórmula 1) en un contexto profesional, la diferencia entre éxito y fracaso de una operación de búsqueda es difícil de exagerar.
3. Componentes principales de la búsqueda avanzada
Aunque cada motor presenta un sistema propio, existen ciertas regularidades entre ellos que permiten un análisis común. En este sentido, los componentes más habituales se pueden agrupar en tres secciones, pero en honor a Google, la ampliaremos a cuatro secciones (la última solamente podemos obtenerla en Google de momento). Cabe advertir que no todos los motores las tienen todas. Se trata de las siguientes:
Búsqueda booleana asistida
Búsqueda por campos:
Título
Contenido de la página
URL
Filtros:
Idioma
Formato (pdf, word, etc.)
Fecha
Dominio
Mineria de datos
Páginas similares
Actividad 1: Vaya su motor de búsqueda preferido, acceda a la búsqueda avanzada del mismo e intente identificar los cuatro grupos de opciones que hemos señalado más arriba. ¿Están todos presentes? ¿Falta alguno?
3.1. Búsqueda booleana
Esta clase de búsqueda (ver la Unidad Lenguajes de interrogación para buscadores ) permite la combinación de varios términos con los operadores lógicos AND, OR y NOT. Actualmente, en la mayor parte de los casos solamente es posible usar búsquedas booleanas en modo asistido, es decir, entrando los términos en una formulario donde cada fila corresponde al uso de un operador.
Incluso AltaVista y AlltheWeb, dos de los motores que mayores facilidades proporcionaban para el uso libre de ecuaciones boolenas, han retirado esta opción de su búsqueda avanzada. Paradójicamente, en casi todos los motores se puede entrar ecuaciones complejas (varias palabras, varios operadores, paréntesis) en la búsqueda simple, aunque no está documentado y los resultados no siempre son fiable, particularmente en el caso de Google que interpreta con mucha liberalidad el significado de los operadores (a pesar de que están definidos de forma matemáticamente precisa).
El objetivo general de las búsquedas booleana es, por un lado, establecer con la mayor precisión el sentido de la necesidad de información del usuario y, por otro, lanzar en una sola operación una búsqueda que de otro modo requeriría varias operaciones.
3.2. Búsqueda por campos
El mayor beneficio de la búsqueda por campos consiste en el incremento de precisión que es capaz de aportar, notablemente con el uso de un campo como título. Por ejemplo, una búsqueda simple por el término “microformatos” arroja más de 500 mil resultados. Restringir la búsqueda a documentos que tengan la palabra “micrformatos” en el título arroja “solo” mil doscientos (todas los resultados de búsquedas mencionados en esta Unidad se llevaron a cabo entre septiembre-octubre de 2007).
Otra posibilidad habitual es buscar por el contenido de la página. Puede parecer sorprendente la posibilidad de restringir una búsqueda al contenido de la página (¿acaso no buscamos siempre en el contenido de la página?). La razón es que cuando hacemos una búsqueda simple, muchos motores buscan no solamente en la página sino también en los enlaces de entrada que recibe la página, es decir, en el texto que aparece en la etiqueta <a> de los enlaces de entrada. Por ejemplo, si la página A es enlazada por la página B mediante un enlace con el texto “clicable” que indica “ mascotas para niños ”, muchos motores (entre ellos Google) consideran que la página A “contiene” de forma virtual las palabras mascotas y niños y la página A aparecerá en los resultados aunque en el cuerpo de la misma no aparezca ninguna de esas palabras.
3.3. Filtros
La tercera opción no es menos potente que la búsqueda por campos. En efecto, una de las posibilidades más útiles (y reveladoras) es filtrar resultados por el dominio . Esto significa lo siguiente: el motor buscará documentos únicamente en el dominio indicado. Lo mejor de todo es que suele admitarse cualquier nivel de dominio, por ejemplo, podemos restringir una búsqueda a dominios .es (o .edu, .com, .es, .gov, etc.) o podemos restingir una búsqueda al dominio upf.edu ; o al dominio iula.upf.edu , etc.
Por ejemplo, una búsqueda por el término ontologias AND tesauros proporcionó más de 11 mil resultados. Sin embargo, si filtramos a páginas o documentos del dominio .edu nos quedamos exactamente con 47 documentos. Otros filtros habituales son el idioma y rangos de fechas (las últimas 24 horas, 6 meses, un año, etc.). El problema con este último filtro es que no corresponde exactamente a la fecha del documento, sino, dependiendo del buscador, o bien a la fecha en la cual el documento ha sido incorporado por primera vez al índice del buscador o a la fecha del archivo. Como los motores no entienden el contenido de un documento, si yo subo en mayo del 2007 por primera vez a mi servidor un documento publicado originalmente en 1999, para un motor será un documento de mayo del 2007. O si lo he reescrito de nuevo en septiembre del 2007 y he cambiado una sola letra de su nombre de archivo, etc.
Actividad 2: AlltheWeb fue, en su momento una de las grandes promesas de la búsqueda europea (pertenece a una empresa noruega). Actualmente forma parte del grupo Yahoo. Una de sus mejores características era la búsqueda avanzada. Entre en AlltheWeb www.alltheweb.com y ponga a prueba su sistema de búsqueda simple y avanzada con algún tema de su interés.
3.4. Minería de datos
La minería de datos consiste en examinar grandes cantidades de información mediante algotimos determinados con el fin de encontrar regularidades que no son aparentes a simple vista. Desde el punto de vista de las búsquedas, una de las operaciones más preoductivas posiblemente sea la de encontrar páginas similares entre sí. La minería de datos permite muchas otras opciones, pero los motores de búsqueda parecen especialmente celosos y parcos en este apartado. La única posibilidad que suelen ofrece es la ya anunciada de buscar páginas similares a una dada. En el caso concreto de Google, la opción de buscar páginas similares consiste en lanzar una búsqueda con las palabras más frecuentes de la página de partida.
4. Principales sistemas
A continuación, examinaremos (y practicaremos) la búsqueda avanzada en los tres motores que, de acuerdo con las estadísticas de uso son los más utilizados tanto en España como a nivel internacional (obviamos AOL, uno de los motores más usados en América, por su escasa o nula utilización en España en particualr y en Europa en general). Los cuatro motores, presentados por orden de importancia (cuota de mercado) son los siguientes:
Para el análisis que presentaremos a continuación, y en todos los casos, usaremos la versión del motor para España. Obviamente, en algún momento determinado, la versión internacional puede presentar cambios respecto a la versión local (España), pero una comparación entre ambas en el momento de prepara esta Unidad (septiembre/octubre 2007) no mostró ninguna diferencia significativa. Por tanto, aunque usaremos la versión española de cada motor, hasta donde hemos podido comprobar es la misma que la internacional (English).
4.1. Google
Google es un motor tan conocido que sería ridículo querer presentarlo aquí. Revisaremos directamente las opciones más originales de su búsqueda avanzada. Las dos opciones más características de la búsqueda avanzada de Google están relacionadas con la posibilidad de filtrar contenidos en función de los derechos de uso (p.e., documentos que se puedan utilizar libremente) y la opción de búsqueda de páginas similares.La imagen siguiente destaca las principales opciones de su búsqueda avanzada.

Actividad 3: Utilize la búsqueda simple de Google para realizar una búsqueda por un tema de su interés. Examine los 10 primeros resultados. Acceda a la búsqueda avanzada de Google y haga la misma búsqueda añadiendo alguna restricción o filtro. Por ejemplo, filtre los resultados por dominio (sitios .edu por ejemplo). Compare los 10 primeros resultados.
4.2. Yahoo
El buscador Yahoo fué mucho antes el directorio más importante de la Web. Poco a poco, fue dando lugar a un aunténtico portal con decenas de servicios. Finalmente, la presión de Google que sirvió para eliminar (virtualmente) los directorios hizo que Yahoo desarrollara su propio buscador. En poco tiempo ha sido capaz de obtener la segunda posición en el mundo de los buscadores, superando a Live. La siguiente imagen destaca de forma gráfica los elementos más característicos de la busqueda avanzada de Yahoo. Su sistema de búsqueda avanzada no presenta ninguna característica específica mientras que carece de la opción de buscar páginas relacionadas.

Actividad 4: Utilize la búsqueda simple de Yahoo para realizar una búsqueda por un tema de su interés. Examine los 10 primeros resultados. Acceda a la búsqueda avanzada de Yahoo y haga la misma búsqueda añadiendo alguna restricción o filtro. Por ejemplo, filtre los resultados tipo de documento (pdf, por ejemplo) o por dominio (sitios .edu por ejemplo). Compare los 10 primeros resultados con los anteriores.
4.3. Live
Live es el enésimo intento de Microsoft de desarrollar un buscador creíble. Es sorprendente que una de las principales empresas de informática del mundo haya fracasado de forma sistemática y continuada en el objetivo de desarrollar un buscador capaz de competir con Google; no decimos capaz de superarlo, decimos simplemente capaz de medirse con él. De hecho no solamente no se acerc al número 1, sino que ni siquiera el número 2 le está reservado, un puesto que la mayor parte de los analistas creen que corresponde claramente a (Yahoo). La siguiente imagen destaca las opciones de su búsqueda avanzada.

Actividad 5: Utilize la búsqueda simple de Live para realizar una búsqueda por un tema de su interés. Examine los 10 primeros resultados. Acceda a la búsqueda avanzada de Live y haga la misma búsqueda añadiendo alguna restricción o filtro. Por ejemplo, filtre los resultados tipo de documento (pdf, por ejemplo) o por dominio (sitios .edu por ejemplo). Compare los 10 primeros resultados con los anteriores.
5. Conclusiones
Como hemos podido ver el liderazgo de Google se manifiesta también en las opciones de búsqueda avanzada. No solamente es el único que presenta los principales componentes, o sea, si se nos permite el juego de palabras: no es solamente el único que carece de carencias , sino que añade opciones exclusivas, como la opcón de minería de datos (buscar páginas relacionadas) y de búsquedas por tipo de licencia de derechos de autor.
Dejando anécdotas o prestaciones concretas de cada motor, una vez más cabe señalar la eficacia indudable y la enorme ventaja de utilizar búsquedas avanzadas cuando el problema de información lo requiera.
El único inconveniente suele consistir en la simple fuerza de la inercia (la tendencia a usar la búsqueda simple). En este sentido, nuestra recomenación es clara: para un profesional, adquirir el hábito de utiliza la búsqueda avanzada en lugar de tirar la toalla cada vez que una búsqueda simple no arroje resultados, puede marcar una diferencia esencial a nuestro favor como profesionales.
6. Bibliografia
Bell, S. Librarian's Guide to Online Searching . Libraries Unlimited, 2006
Chowdhury, G. Introduction to modern information retrieval. London: Facet, 2004
Cordón, J.A.; López J.; Vaquero, J. R. Manual de búsqueda documental y práctica bibliográfica . Madrid: Pirámide, 1999
Shaw, M. Mastering Online Research: A Comprehensive Guide to Effective and Efficient Search Strategies . Writer Digest Book, 2007