Documentación, internet y medios de comunicación
LAS NUEVAS TECNOLOGÍAS APLICADAS A LA DOCUMENTACIÓN
Búsqueda y recuperación de la información en Internet

1. Planteamiento de búsqueda efectiva.

La premisa fundamental de una búsqueda efectiva pasa por una formulación correcta del enunciado de la pregunta. Para ello se ha de mantener una pequeña entrevista con la persona que gestiona y analiza la información. Se trata de aproximar los conceptos para acercar la realidad informativa, es decir, las materias sobre las que se desea la información, el tiempo concreto (fechas), e incluso en que idiomas se quiere recibir. La búsqueda efectiva facilita el trabajo entre el gestor y el propio usuario.

Otras consideraciones a tener en cuenta son:

• La implicación de las nuevas tecnologías no siempre garantiza que el resultado sea más efectivo, si bien los métodos de análisis, estructuración y clasificación de la información son más rápidos desde que se emplean las tecnologías.
• A mayor número de información no corresponde una mayor garantía informativa (si una búsqueda puede resolverse manualmente, mucho mejor).
• Es necesario por tanto, una adaptación entre los datos que se pueden obtener y los que el usuario puede asumir o controlar. De tal forma que el documentalista, en ocasiones, debe seleccionar las partes más importantes de la información y determinar que conceptos no se adaptan a la realidad informativa. Ha de procurar que los resultados tengan una aplicación inmediata, y llevar a cabo un contraanálisis de la información para valorar su interés, generar nuevos recursos informativos y ofrecer otros contenidos que posibiliten nuevos clientes.
• Debe cumplimentarse en todas las fases el proceso de búsqueda, una labor de control y seguimiento para determinar la eficacia en los resultados finales que se obtengan.

2. Determinación del valor de la información.

El siglo XX ha sido considerado como el de la comunicación, el de la información, la informática, las telecomunicaciones, etc., pero en todos los procesos en los que se utilizan los recursos informáticos, los resultados que se obtienen no son superiores a los que se consiguen cuando se hacen búsquedas manuales.

Para tomar decisiones hay que estar bien informados y mejor formados. La información seguirá siendo el soporte fundamental del siglo XXI, al menos durante la primera década. Esta información viene avalada por las grandes inversiones que se están realizando en las empresas de comunicación.

Desde el punto de vista documental, disponer de muchas informaciones no sirve para conseguir mejores resultados, por lo tanto, habrá que replantear las funciones clásicas de análisis, selección, clasificación y recuperación. Para ello:

• Son necesarios otros indicadores para valorar la información.
• Se requieren especialistas formados en el campo de la comunicación y la documentación.
• Una eliminación previa de aspectos sin valor evita pérdidas de tiempo.
• La realización de todo espectáculo implica que los resultados están siendo aplicados en consideraciones ventajosas.

El valor de la información viene dado no tanto por su análisis, sino por los resultados que se obtienen.

3. Buscadores y metabuscadores: Yahoo!, Google, Lycos, Buscopio, Altavista...

No siempre resulta fácil conseguir información y menos dentro de Internet. La estructura que presentan los buscadores no es nueva ya que la mayoría de las bases de datos ya emplean estos conceptos.

3.1 Buscadores (robots).
También se les conoce como arañas, crawlers o robots, generalmente se dedican a recopilar información atravesando la estructura de hipertexto de la Red y recuperando páginas y vínculos para crear índices basándose en las palabras que contienen dichas páginas. Cuando un usuario introduce una palabra en un campo de búsqueda, la spider consulta su índice y le da las URL que contienen dicha palabra. Básicamente, todos los buscadores son robots, pero hay diferentes tipos de robot: spiders, crawlers y otros.
Cualquier programa que se dedique a buscar URL en la Red es un robot. Pero no todos los robots son spiders. Además de buscadores, los robots pueden tener otras utilidades. Por ejemplo, algunos robots se construyen para atravesar la red y medir su tamaño. A estos robots se les conoce con el nombre de vagabundos (wanderers).
Otros se construyen para que combinen la capacidad de indexación de los buscadores con la que compartir resultados. A estos robots se les llama hormigas (ants). Aún hay otro tipo de robots que se crean para interactuar con los humanos utilizando el lenguaje natural. Estos son los MUD bots o los chatterbots.
También se pueden diseñar robots para que se contesten a si mismos y viajen de máquina en máquina a través de las redes. Estos son los más temidos, ya que se suelen construir con malas intenciones, y se les conoce con el nombre de gusanos (worms) o virus.

Por tanto, los buscadores son grandes catálogos de recursos organizados temáticamente en categorías (Yahoo! contiene mas de 20.000) y en cada categoría indican enlaces a recursos relacionados y subcategorías si se desea concretar más la búsqueda.

3.1.1 Diferentes tipos de buscadores:

3.1.1.1 Buscadores Automáticos: aquellos que a partir de cierta información entregada en lenguaje natural permiten deducir y recuperar la información que se esta buscando. Su objetivo es encontrar documentos que contengan las palabras claves utilizadas. Están compuesto por tres partes:

a. una serie de ordenadores que recorren la red analizándola.
b. una base de datos que se forman a partir de los conceptos obtenidos por los ordenadores.
c. un motor de búsqueda que facilita la consulta de las bases de datos.

3.1.1.2 Buscadores Temáticos: son una guía jerárquica de directorios que van de los temas más generales a los más particulares, por lo tanto, listan lugares y los clasifican en categorías a las que añaden una serie de comentarios identificativos. El objetivo es encontrar los documentos que pertenezcan sólo al área temática seleccionada. Los problemas que ofrece es la falta de actualización, es lento ya que exige varios pasos previos y podemos distraernos antes de localizar lo que realmente nos interesa.

3.1.1.3 Buscadores Especializados: aquellos que son muy parecidos a los buscadores temáticos, aunque sólo abordan algunas áreas concretas. Suelen ser grandes recopilaciones de recursos sobre un tema específico.

3.2 Metabuscadores.
Junto con  los metaíndices son herramientas que realizan búsquedas simultáneas en diversos sistemas de búsqueda o bien son índices de índices. Las búsquedas no suelen ser tan potentes en cada sistema como si se usara por separado, pero permite obtener resultados más eficaces la mayoría de las veces.

Los buscadores y metabuscadores agrupan información de manera temática, es decir, tratan de colocar por áreas próximas los conceptos más importantes, desde los más generales a los más particulares. Existen algunos metabuscadores que permiten diferentes combinaciones de búsquedas pero no siempre garantizan que los resultados obtenidos sean mejores que usando un único buscador.

Como norma general se debe considerar que existe mucha información fuera de las páginas web como por ejemplo bibliotecas y centros de documentación que han sido la base de la cultura durante muchos siglos. Además de los buscadores más utilizados por la mayoría de los usuarios, hay que trabajar de vez en cuando con Yahoo!, Google,  Buscopio del Grupo Prisa, etc. Lo más importante del concepto del metabuscador es que se repiten documentos. El metabuscador más popular es MetaCrawler http://www.metacrawler.com   aunque existen muchos otros, como Starting Point. En cuanto a metaíndices existen dos excelentes herramientas de este tipo en castellano: el índice de índices MIBE y el índice de buscadores del GOBIB.

Además de los buscadores y de los metabuscadores, están los índices, siendo éstos los grupos de categorías en los que se dividen las herramientas:

Los índices son grandes bases de datos en las que se busca por palabras o por conceptos. Los más potentes, como http://www.altavista.magallanes.net poseen un auténtico lenguaje propio para realizar estas búsquedas, con múltiples operadores booleanos y comodines para afinar los conceptos deseados. Los índices también suelen incluir utilidades de búsqueda, pero limitadas a las páginas que han sido indexadas, usando una estructura totalmente diferente de los buscadores propiamente dichos.

Tanto índices como buscadores añaden otros servicios además de la búsqueda de recursos, como buscar en grupos de news, listados de los mejores sites, y, a menudo, una opción para dirigirse a una pagina seleccionada al azar. Si se quiere buscar algo concreto, se puede optar por los índices. Si se trata de un concepto más abstracto, o no se está seguro de que términos de búsqueda se debería usar, es mejor probar con los buscadores.

3.3 Lycos.
http://www.lycos.com (lycos.es)
Ofrece las siguientes opciones para hacer búsquedas efectivas:

• Dónde buscar: es decir imágenes, páginas web, etc.
• Cómo buscar: utilizando un descriptor cualquiera (cualquier palabra); consulta en lenguaje natural; todas las palabras y la frase exacta.
• Para búsquedas más avanzadas hay que utilizar operadores booleanos.
• Lycos: nos posibilita cómo organizar los resultados, cuántos resultados necesitamos (entre 30-40).

• Es aconsejable las primeras veces que se acude a un buscador ir a Help/ayuda, donde se explica cómo hacer las búsquedas y las distintas opciones que tiene cada buscador.

Todos los motores de búsqueda tienen trucos o sugerencias que a través de ejemplos permiten solicitar sólo aquellos documentos que más se aproximan al concepto de búsqueda.

3.4 Alltavista.
http://www.altavista.magallanes.net
Hay que tener en cuenta dos consideraciones; la primera es que se trata de un motor de búsqueda, y la segunda es que es una herramienta que permite encontrar información entre más de 100 millones de páginas web.
Este motor de búsqueda permite filtrar búsquedas de informaciones de forma que solo aparezcan páginas en un determinado idioma. Tiene reconocidos entre 20-25 idiomas, con lo que se puede traducir de unos a otros. También se pueden plantear búsquedas de información de modo natural y sencillo. Afinar, filtrar los criterios de búsqueda de forma que se puede elegir entre más de un conjunto de posibilidades significativas para un mismo concepto. El resto de posibilidades son similares a Lycos.

Este motor de búsqueda de la empresa Digital es otro de los que aporta mejores contenidos, sobre todo para realizar trabajos en el campo de las comunicaciones. Es una herramienta concebida para ayudar a encontrar información de su interés entre más de 100 millones de 'páginas web'.

Con AltaVista-Magallanes se puede (está sacado de la ayuda de su propia página web):

1.- Filtrar sus búsquedas de información de forma que sólo aparezcan páginas publicadas en un idioma determinado (de entre los más de veinte reconocidos por AltaVista-Magallanes).
2.- Plantear sus búsquedas de información de un modo natural y sencillo, sin por ello renunciar al pleno uso de todas las posibilidades funcionales que ofrece AltaVista-Magallanes.
3.- Visualizar cualquier página que sea de su interés mediante un simple 'click' en la lista de resultados que AltaVista-Magallanes le ofrecerá al culminar cada búsqueda.
4.- Afinar (refinar, filtrar) sus criterios de búsqueda, de forma que pueda elegir entre más de un conjunto de posibles significados para un mismo concepto.
5.- Búsquedas en Lenguaje Natural. Teclee una palabra, o un frase, o incluso una pregunta (por ejemplo, restaurantes Montevideo). Haga 'click' en Buscar . AltaVista le ofrecerá una o varias páginas de respuestas. Si lo que busca no aparece en la primera o en la segunda de estas páginas de respuestas Altavista recomienda que añada más términos a la búsqueda, de forma que se vuelva más específica.

Términos Requeridos y Términos Excluyentes:

1.- En las ocasiones en que busque documentos en que algún término deba estar presente de un modo forzoso, deberá identificar dicho término, incluso si es el primero, añadiéndole un signo '+' (por ejemplo, si busca clínicas u hospitales en Quito, deberá teclear hospitales clínicas +Quito).
2.- En las ocasiones en que los resultados de una búsqueda resulten excesivamente numerosos, a causa de alguna vaguedad en los términos propuestos, podrá limitar su número por medio de la exclusión de los documentos que contengan algún término en el que no esté interesado (por ej., si busca periódicos o editoriales en Chile, pero no tiene interés en ninguno de Valparaíso, deber· teclear periódicos editoriales Chile -Valparaíso).

Frases Literales:

Si está seguro de que una determinada frase forma parte del documento o documentos en que está interesado, tecléela precedida y seguida por el símbolo 'dobles comillas’ (por ej., si busca documentos que hagan referencia a una determinada obra del poeta portugués José Afonso, teclee "Grándola vila morena").

Funciones Especiales:

AltaVista-Magallanes no sólo busca información a partir de textos. Dispone también de comandos especiales, destinados a facilitar la búsqueda de información por otros medios. Estas funciones o comandos son los siguientes:

Palabra clave:                                                                                                                  Función

Anchor:text: Encuentra las páginas que contienen la palabra o frase especificada en el texto de un hiperenlace (ejemplo: anchor:"Click here to visit AltaVista" encontrar· todas las páginas que contengan "Click here to visit AltaVista" como un enlace o 'link').
Applet:class: Encuentra las páginas que contienen una aplicación Java de la clase especificada (ejemplo: applet:morph encontrar todas las páginas que usen applets denominados 'morph').
Domain: domain name: Encuentra las páginas con la palabra o frase especificada en el nombre de dominio (la porción de la derecha de un nombre de host Internet es el nombre de dominio) del servidor Web donde residen dichas páginas (ejemplo: añadir +domain: .it a los términos de una búsqueda, los que sean, limitar en el alcance de ésta a las páginas que hayan sido publicadas en el dominio .it -el correspondiente a Italia-).
Host: name: Encuentra las páginas que residan en un servidor web específico (ejemplo: host:www.telefonica.es localiza todas las páginas publicadas en el servidor web del Grupo Telefónica).
Image: filename: Encuentra las páginas que contienen alguna imagen cuyo nombre, o parte de él, coincida con el especificado (ejemplo: image:titanic +domain:.uk localiza todas las páginas publicadas en el dominio .uk que posean alguna imagen -gráfico- de nombre 'Titanic').
Link: URL text: Encuentra las páginas que contengan algún enlace a la dirección URL especificada (ejemplo: link:cvc.cervantes.es localiza las páginas que posean un enlace al Centro Virtual Cervantes.
Text: text: Encuentra las páginas que contengan el texto especificado en cualquier lugar que no sea un indicador de imagen, de enlace o URL (ejemplo: text: AltaVista localiza las páginas que contengan la palabra 'AltaVista' fuera de un 'image tag', un 'link' o una 'url'.
Title: text: Encuentra las páginas que contienen la palabra o frase especificada en el título (ejemplo: title:"islas malvinas" localiza las páginas que contengan la expresión 'Islas Malvinas' en su título o cabecera).
Url:text: Encuentra las páginas que contienen la palabra o frase especificada en la dirección URL (ejemplo: url:elpais localiza las páginas que en alguno de los parámetros de sus url's hagan referencia a El País Digital).

3.5 ¿Cómo buscar?

http:// www.wfs.vub.ac.be/schools/timeline/search/Buscar/Quebusco.htm

Contiene: Operadores, Buscadores, ¿Qué busco?, Ayuda y Trucos. Estos sistemas de búsqueda obligan a reducir la ambigüedad al formular nuestras preguntas y dudas. Clase de búsqueda, Buscador recomendado, Exploración indefinida, Temáticos, Búsqueda genérica, Especializados, Búsqueda concreta y Automáticos.

4. Clasificación de operadores dentro de Internet.

4.1 Operadores lógicos.
Los operadores lógicos o boléanos facilitan una recuperación más selectiva. Para los ejemplos siguientes usaremos dos conjuntos de elementos; los estudiantes y los europeos que representaremos gráficamente con dos círculos.

Y lógico (AND)
Es la intersección de dos conjuntos de búsqueda. Apareciendo en el resultado únicamente los elementos comunes a los dos conjuntos. Es un operador de reducción.

Ejemplo:

estudiantes AND europeos

Es decir, los estudiantes europeos.

  • En nuestro ejemplo:

  • Sólo devolverá las páginas que contengan ambos elementos.

  • No devolverá las páginas que sólo contengan uno de los dos o ninguno.

  • También podemos usar & en vez de AND

 

NO lógico (NOT)
Excluye los elementos de uno de los dos conjuntos de la búsqueda. Apareciendo en la búsqueda únicamente los elementos que no aparecen en el conjunto indicado. Es un operador de reducción. Ejemplo:

estudiantes AND NOT europeos

Es decir los estudiantes que no sean europeos.

  • En nuestro ejemplo:

  • Sólo devolverá las páginas que contengan el primer elemento y no el segundo.

  • No devolverá las páginas en las que figure la palabra europeo.

  • También podemos usar ! en vez de NOT.

 

O lógico (OR)
Unión de los elementos de los dos conjuntos de la búsqueda. Apareciendo en la búsqueda todos los elementos. Es un operador de ampliación. Ejemplo:

estudiantes OR europeos

Es decir los estudiantes o europeos.

  • En nuestro ejemplo:

  • Devolverá las páginas que contengan algún elemento de los dos o los dos.

  • No devolverá las páginas que no contengan ningún elemento de los dos.

  • Tambien podemos usar | en vez de OR.

  • Cuando no indicamos ningún operador entre palabras los buscadores lo interpretan como si hubiéramos colocado OR.

Es muy útil para buscar varias formas de escritura simultáneamente. Ejemplo:

España OR Spain OR Espagne

4.2 Operadores de proximidad.
Para obtener unos resultados precisos el operador de proximidad nos permite especificar la relación entre elementos presentes de nuestra búsqueda.  

Cerca (NEAR)
Es la intersección de los dos conjuntos de búsqueda. Se parece a Y lógico, pero además exige que entre ambas palabras no haya más de 10 palabras. Ejemplo: estudiantes NEAR europeos

Es decir que las palabras estudiantes y europeo aparezcan relativamente juntas.

  • Trucos:

  • Lo tiene el buscador Alta Vista en su modalidad de búsqueda avanzada.

  • Es ideal para nombres y apellidos.

  • Use corchetes ([ ]) para encontrar palabras juntas en InfoSeek.

Junto (ADJ)
Es la intersección de los dos conjuntos de búsqueda que además están adyacentes. Se parece al Y lógico pero además exige que entre ambas palabras no haya otra palabra. Ejemplo: estudiantes ADJ europeos

Es decir que las palabras estudiantes y europeos aparezcan juntas.

  • Trucos:

    No lo tiene el buscador Alta Vista pero puede usar comillas con un resultado idéntico "estudiantes europeos"

    También puede usar un guión entre las palabras que desea juntar estudiantes-europeos

Frases
Es la intersección de la palabras de búsqueda que además están adyacentes y en el orden en que se describen. Se parece al Y lógico pero además exige que la secuencia de palabras sea idéntica. Ejemplo: "estudiantes europeos conectados a Internet"

Es decir que la frase aparezcan igual.

  • Trucos:

    Puede usar el guión - para concatenar y obtener un resultado idéntico: estudiantes-europeos-conectados-a-Internet

    Cuando buscamos un texto concreto es muy útil.

4.3 Operadores de existencia.

Presencia.
Especifica palabras que deban aparecer en el resultado. Se puede exigir la presencia de alguna palabra clave en el documento, de tal forma que si no está presente en él no se incluirá en la lista de resultado.  Habitualmente se añade al inicio de la palabra clave el signo más (+) .No ponga ningún espacio entre el + y la palabra a buscar.  Por ejemplo: +olímpico baloncesto fútbol voleibol balonmano.  

Ausencia.
Se puede exigir la ausencia de alguna palabra clave en el documento, de tal forma que si está presente en él no lo incluirá en la lista de resultado.  Habitualmente se indica añadiendo el signo menos - al inicio de la palabra clave. Por ejemplo: juventud -racismo. Nota: Podemos obtenerlo también a través de estos dos operadores lógicos. juventud AND NOT racismo.

4.4 Operadores de exactitud.

Familia.
Si quiere que la búsqueda localice también aquellos documentos donde las palabras tecleadas aparezcan como partes de otras palabras. Seleccione la opción Substrings en Yahoo! o ponga el signo (*) en AltaVista o ($) en Lycos después de la palabra a buscar para hacer que se expanda. De esta manera, una búsqueda de "educa" incluirá también en la respuesta "educador" y "educativo". Esto es ideal si no se sabe como escribir la palabra a buscar exactamente.

Truncar la palabra.
Para encontrar sólo aquellas referencias que tengan la palabra exacta y no extensiones, seleccione la opción Complete words en Yahoo! y en Lycos use el punto (.) al final de una palabra en la búsqueda para limitarla. Por ejemplo "ciudad" encontrará referencias que contengan la palabra "ciudad" pero no así "ciudadano" ni "ciudadanía".

Operadores de forma resumida:

1. Operadores lógicos, los hay de tres clases:

And (y )

es la intersección de dos conjuntos de búsqueda y en el resultado sólo aparecen los elementos que forman parte de los dos conjuntos. Es un operador de reducción. También se puede usar este símbolo &

Not (no)

es un operador de reducción, excluye los elementos de uno de los conjuntos de la búsqueda.

Or (o)

es la unión de los elementos de los dos conjuntos de la búsqueda; es un operador de ampliación. También se puede usar una barra.

2. Operadores de proximidad:

Near/ Before:

es la intersección de los dos conjuntos de búsqueda, pero además exige que entre las palabras (descriptores) no haya por delante (near) o por detrás (before) más de 10-25 palabras.

ADJ (adyacente)

es la intersección de los dos conjuntos de búsqueda (los dos descriptores) que, además, están adyacentes. Se parece a "and" pero exige que entre ambos descriptores no haya separación.

Frases

es la intersección de palabras de búsqueda que, además, estén adyacentes y en el orden en el que se describen.

3. Operadores de existencia:

De presencia

especifican las palabras que deben aparecer en el resultado. Se puede exigir la presencia de una palabra clave en el documento de tal forma que si esta no aparece no se incluirá en la lista de resultados. El elemento que se usa es el signo más y a continuación las palabras claves.

De ausencia

nos permite exigir la ausencia de alguna palabra clave en el documento, de tal forma que si está presente no lo incluye en la lista de resultados. El elemento que se usa es el menos y a continuación las palabras claves.

4. Operadores de exactitud:

Familia

nos permite localizar en la búsqueda aquellos documentos donde las palabras utilizadas aparezcan como partes de otras palabras. El símbolo usado depende del buscador

Truncar palabras

sólo nos buscará aquellas referencias que tengan la palabra exacta y no sus extensiones.

Ampliar apuntes en:
http://www.ucm.es/info/multidoc/prof/fvalle/Recdatrecdoc.htm 
http://www.ucm.es/info/multidoc/prof/fvalle/3dperiod.htm




Volver