Ar@cne
REVISTA ELECTRÓNICA DE RECURSOS EN INTERNET
SOBRE GEOGRAFÍA Y CIENCIAS SOCIALES
Universidad de Barcelona
Nº 83, 1 de mayo de 2006
ISSN 1578-0007
Depósito Legal: B. 21.743-98


MÉTODOS DE BÚSQUEDA EN FUENTES DE INFORMACIÓN EN CIENCIAS SOCIALES Y HUMANIDADES

José Martín Brocos Fernández
Profesor de la Universidad San Pablo-CEU, Madrid (Madrid), España
jmbrocos.ihum@ceu.es

Carlos Ortiz de Landázuri
Prof. Universidad de Navarra, Pamplona (Navarra), España
cortiz@unav.es


Métodos de búsqueda en fuentes de información en ciencias sociales y humanidades (Resumen)

Tras una presentación de la información en Internet, procedemos al análisis de los principales recursos informativos existentes en las disciplinas pertenecientes a las ciencias sociales y humanas, para después mostrar los sistemas de recuperación de las fuentes de información socio-humanísticas. Para ello, partiendo de criterios de evaluación de las fuentes de información y de búsqueda, entramos a analizar los servicios y aplicaciones que permiten investigar y encontrar información. Transferencias de ordenadores remotos, búsqueda de ficheros específicos, consulta a ordenadores remotos, HyTelnet, Wide Area Information Server, servicios integrados de búsqueda de información con la exploración de internet a través de menús y enlaces, y Verónica, así como el uso de servicios y aplicaciones que permiten encontrar información; la búsqueda con WinSPIRS y WebSPIRS y valoración de los mismos.

Palabras clave: Búsqueda, ciencias sociales, humanidades, Motores.


Search methods inside information sources about social sciences and humanities (Abstract)

After a short survey of internet information, we expose the analysis of the main information resources in social and human sciences, in order to show the recuperation systems concerning social and human informations. Beginning with the criteria for the evaluation of information and research sources, we analyze the services and applications that assist the research and finding out of information. Transference from remote computers, research of specific folders, pop into remote computers, HyTelnet, Wide Area Information Server, integrated researching services through internet exploration by links and menus, and Veronica, as well as the use of services and application suitable to find out information; the research by WinSPIRS and WebSPIRS and their evaluation.

Keywords: Research, Social Sciences, Humanities, Search Engines.


Ante el gran número de fuentes de información que aparecen a diario en Internet, se hace necesario usar un criterio de evaluación para seleccionar los recursos más apropiados para nuestras investigaciones, un instrumento para decidir si una fuente determinada puede unirse a nuestra guía de recursos, o para juzgar la capacidad e resolver las necesidades de información nueva.

Sin un criterio de evaluación, las páginas web de selecciones de recursos de información serían en muchos casos herramientas de dudoso valor. El profesor José Antonio Cordón expone estos criterios de evaluación de fuentes de información en Internet[1].

Existen dos tipos de informaciones en Internet, teniendo en cuenta el acceso a ella. Por un lado se puede acceder a información de distintas bases de datos de los distintos servicios de información electrónica, o sea acceso a información elaborada, con instrumentos de búsqueda sofisticados, previa autorización, mayoritariamente de pago y con un acceso por suscripción.

El otro tipo de información es la que ofrecen las entidades y organismos generalmente públicos, aunque también existen empresas privadas y personas individualmente, en la mayoría de los casos sin una gran elaboración, con pocos instrumentos de búsqueda, gratuita, y donde la búsqueda debe hacerse fuente a fuente, o sea buscando la misma información en distintos Webs[2]. Tanto en un caso como en otro, el problema sigue siendo cómo encontrar la información deseada, aunque el WWW (World Wide Web) permite un acceso amigable y muy sencillo a la información.

Para poder resolver este problema de búsqueda y acceso a la información, han aparecido distintos servidores de páginas Web, o máquinas de búsqueda en el WWW que ayudan a localizar los servidores que contienen una determinada información. Pueden llamarse también buscadores, localizadores, directorios de recursos, robots, arañas (spiders) o vagabundos (wanderers), entre otros términos.

Fuentes de información en ciencias sociales y humanidades. Análisis de manuales y repertorios impresos. Directorios telemáticos

Manuales y repertorios impresos

R. Blazer y E Aversa (2000). The Humanities: A Selective Guide to Information Sources. Distingue entre acceso a la información sobre cada disciplina y las principales fuentes de las mismas. Tiene descripciones de las áreas que abarcan cada disciplina. No ofrece descripciones de los tipos de información. Tiene índice de autores y títulos, además de índice de materias. Con una descripción del contenido y utilidad de cada fuente seleccionada.

Gloria Carrizo Sainero (2000). La información en ciencias sociales. Distingue entre fuentes primarias y fuentes secundarias (repertorios bibliográficos, bases de datos, etc). Dedica dos capítulos a la literatura gris. Delimita el campo de actuación de las disciplinas, incluyendo su evolución histórica. En los primeros capítulos se definen los distintos tipos de fuentes de información. Su índice es analítico (autores, títulos, materias). Referencias desiguales e incompletas de las fuentes y descripción de contenido de las mismas.

Nancy Herron (ed.) (2002). The social sciences: a cross disciplinary guide to selected sources. Antes de cada  disciplina ofrece explicaciones teóricas sobre la misma. No incluye teoría relativa a las fuentes de información. Tiene índice de autores, títulos y materias, así como referencias y breves reseñas de las fuentes seleccionadas.

Tze-chung Li (2000). Social science reference sources: a practical guide. Distingue entre acceso a las fuentes (guías, bibliografías, resúmenes, tesis, reseñas, índices, etc.) y fuentes de información (enciclopedias, diccionarios, directorios, diccionarios, biografías, manuales, etc). Breves explicaciones sobre las ciencias y más detalladas sobre las fuentes. Índice de autores y títulos; índice de URL citadas. Tiene referencias de las obras seleccionadas y una breve reseña sobre su contenido y utilidad.

Susana Romanos de Tiratel (2000). Guía de fuentes de información especializadas: Humanidades y  Ciencias Sociales. Estructura su obra a partir de las fuentes de información: obras de referencia, acceso a libros y publicaciones seriadas, acceso a los contenidos de las publicaciones seriadas, acceso a las publicaciones oficiales y fuentes no bibliográficas. Extensos capítulos dedicados a delimitar las disciplinas que integran las ciencias socio-humanísticas. Índice de autores y títulos. Referencias y descripción breve de contenido y utilidad de las fuentes que se han seleccionado de cada disciplina

Directorios telemáticos

Social Science Information Gateway (SOSIG). URL: <http://www.sosig.ac.uk>. Responsable la Universidad de Bristol. Institute for Learning and research Technology. La selección se realiza a partir de una serie de criterios, tanto relativos a la calidad de la información, como a los sistemas de recuperación empleados. Las fuentes incluidas en este directorio se presentan agrupadas por tipología documental.

Voice of the Shuttle (VoS). URL: <http://vos.ucsb.edu>. Responsable: Universidad de California. El equipo que elabora el directorio se encarga de incluir nuevos links, aunque también pueden hacerlo usuarios registrados. No tiene establecidos criterios de selección. La clasificación se hace desde las submaterias[3].

Información bibliográfica (bases de datos ISBN, bibliografías nacionales, directorios de editoriales, catálogos colectivos)

Información bibliográfica (bases de datos ISSN)

ISBN. URL: <http://www.mcu.es/bases/spa/isbn/ISBN.html>. Productor: Agencias Española de ISBN. Documentos editados en España para la venta, sujetos al Decreto 2984/1972 de 2 de noviembre. Más de un millón de documentos (1972-). Incluye todas las lenguas en las que se hayan publicado documentos en España. Relacionada con una base de datos de editores españoles.

Global Books in Print. URL: <http://www.globalbooksinprint.com>. Productor: Browker/Whitaker. Registros ISBN de USA, Reino Unido, Canadá, Australia y Sudáfrica. Suma de varios repertorios. Supera los 8 millones de títulos de lengua inglesa de unos 170.000 editores.

Repertorio Integrado de Libros en venta en Iberoamérica (RILVI). URL: <http://www.cerlalc.org/rilvi/index.php>. Productor: CERLAC y Agencias ISBN de Iberoamérica. Cerca de 2 millones de monografías[4].

Información bibliográfica (bibliografías nacionales)

Bibliografía Nacional Española. Productor: BNE. Se forma con obras ingresadas por Depósito Legal. Carácter oficial desde 1958. Su contenido es el mismo que el del catálogo ARIADNA, y accedemos a través de URL: <http://www.bne.es>. Libros modernos desde 1831, libros antiguos hasta 1830, manuscritos, documentos, mapas, grabados, dibujos, revistas, periódicos, fotografías, planos, partituras, grabaciones sonoras y videograbaciones.

Bibliografía Nacional Portuguesa em CD-ROM. Editor: ProQuest Information and Learning – Chadwyck-Healey. (1986-). Bibliografia Nacional Portuguesa em linha. URL: <http://bnp.bn.pt/>[5].

Información bibliográfica (directorios de editoriales)

Buscaeditorial. Buscador de editoriales españolas. URL: <http://www.bibliotecagodella.com/buscaeditorial/> Responsable: Ricardo Fornas Carrasco (el mismo que Buscopio). Unos 1000 enlaces. Opciones de búsqueda avanzada

Editoriales. URL: <http://www.mcu.es/bases/spa/edit/EDIT.html> Responsable: Agencia Española de ISBN. Puede localizarse e-mail y web de la editorial.

Publisher`s Catalogues. URL: <http://www.lights.com/publisher/> Responsable:  Peter Scott, Northern Lights Internet Solution Ltd. Directorio y buscador de webs de editorials de todo el mundo. Búsqueda directa, a través de motor de búsqueda, por países, por materias y por los tipos de documentos que publican

Directorio: Editoriales, Distribuidoras y Librerías (relacionado con el RILVI). URL: <http://www.cerlalc.org/directorioeditoriales/directorio.php> Responsable: CERLALC. Información sobre el sector del libro en Hispanoamérica, tanto editores, distribuidores y libreros. Hay enlaces a Agencias ISBN iberoamericanas.

Información bibliográfica (catálogos colectivos)

Otros consorcios y catálogos colectivos. URL: <http://www.cbuc.es/> (opción Enllaços d`interès. Vas continentes→Países→Redes de Bibliotecas→CC=Catálogo colectivo) Responsable: CBUC. Podemos localizar desde el enlace los catálogos colectivos puestos en marcha por consorcios de bibliotecas de cualquier país del mundo

REBIUN. Catálogo general. URL: <http://rebiun.crue.org/cgi-bin/abnetop/X16136/ID1997242528?ACC=101> Tres catálogos colectivos: general, publicaciones periódicas y fondo antiguo.

Catálogos de Bibliotecas Públicas del Estado (BPE) <http://www.mcu.es/bpe/bpe.html> Responsable: Ministerio de Educación, Cultura y Deporte. Acceso a los catálogos de las BPE, así como a las Bibliotecas Centrales de Comunidades Autónomas y Servicios Autonómicos[6].

Tesis Doctorales, Pasarelas y Revistas electrónicas

Tesis Doctorales

TESEO URL: <http://www.mcu.es/TESEO/teseo.html> Productor: Ministerio de Educación, Cultura y Deporte. Contiene información sobre las tesis doctorales leídas en Universidades españolas. Los descriptores están establecidos en un breve tesauro. Índice. Lista de materias. No tiene sistema de suministro de documentos. (1976-)

Dissertation abstract / Digital Dissertations. Tiene tesis doctorales y otros trabajos de investigación, como tesinas y trabajos de postgrado, presentadas en más de mil facultades de todo el mundo. Consulta por Search (Basic/Advanced) o Browser (disciplina/subdisciplina). Registros con extenso resumen. Sirven documentos desde 1997 en papel, en microficha o en formato electrónico. De los documentos posteriores a 1997 pueden consultarse las 24 primeras páginas en .pdf  (1861-) URL: <http://library.dialog.com/bluesheets/html/bl0035.html>[7].

Pasarelas y Revistas electrónicas

PCI Full Text / Periodical Content Index (PCI). Base de datos que recoge información bibliográfica de artículos publicados en más de 4.000 revistas de ciencias sociales y humanidades. Digitaliza revistas antiguas. (XVIII-).

Emerald Full Text. Acceso a más de un centenar de revistas publicadas por MCB University Press sobre materias relacionadas con las ciencias sociales, en particular. Economía, gestión y ciencias de la información.

Ebsco Host Electronic Journal Service (EJS). Pasarela. Pueden consultarse revistas o artículos. Unas 10.000 revistas, la mitad a texto completo.

SwetsWise. Pasarela. Acceso a unas 18.000 revistas. Búsquedas por artículos, revistas o editores[8].

Servicio de suministro de documentos

Document Suply Centre, de Brithish Library. URL: <http://www.bl.uk/services/document/dsc.html>. Colecciones para préstamo y para envío de fotocopias. Múltiples servicios. Base Inside actualizada diariamente. Para el envío de documentos cabe varios procedimientos, entre lo que se encuentra el software Ariel, que combina escáner con e-mail.

Article Science, de INIST. URL: <http://articlesciences.inist.fr>. (1990). Envío por correo ordinario.

Servicio de acceso al documento, de CINDOC. URL: <http://marte.cindoc.csic.es/cindoc/servicios.htm>. Envío por correo ordinario, por FAX o mediante Ariel.

Article Finder / Table of Contents, de Infotrieve. URL: <http://www.infotrieve.com>. Consulta gratuita, pero no el envío de documentos[9].

Principales bases de datos de ciencias sociales y humanidades

Project Gutenberg (cooperativo) URL: <http://www.promo.net/pg>

Biblioteca digital. Gratuita. Lingüística y Literatura

Biblioteca Virtual Miguel de Cervantes. URL: <http://www.cervantesvirtual.com>

Obras clásicas de la literatura hispanoamericana. Acceso a “Bibliotecas de autor”.

MLA International Bibliography. Lingüística y Literatura. Base bibliográfica a partir de publicaciones especializadas. Tesauro propio.

Bibliografía de la Literatura Española. Literatura. En CD-ROM permite que se pueda pasar  a formato MARC. URL: <http://ble.chadwyck.com/>.

Aranzadi. Derecho. Base de datos de legislación y jurisprudencia desde 1930

Indiboe (B.O.E.). Derecho. Gratuita. Sumarios a partir de 1995. Textos completos en IBERLEX (legislación nacional) e IBELEX-UE (legislación europea), mientras que las normas históricas se recopilan en la base GAZETA.

EUR-LEX. Derecho. Gratuito. Acceso a base de datos CELEX (de pago). URL: http://europa.eu.int/eur-lex/es/

Econlit. Economía. Base de datos bibliográfica realizada a partir de publicaciones periódicas especializadas. URL: <http://www.econlit.org/>

Philosopher´s Index. Filosofía. Desde 1940. Se actualiza cada tres meses. Documentos recogidos de revistas de cerca de 500 países. URL: <http://www.philinfo.org/electronic.htm>.

All music guide. Música. URL: <http://www.allmusic.com>. Portal de información musical y discográfica. Ofrece datos de intérpretes y estilos musicales de todos los tiempos, géneros y países. Varias posibilidades de consulta. Glosario.

Internet Movie Database. Cine. URL: <http://www.imdb.com> Portal dedicado al mundo del cine. Amplios datos ofrecidos para cada película. Para investigadores.

Películas españolas y extranjeras estrenadas en España. Cine. Responsable: Instituto de la Cinematografía y las Artes Visuales (MECD) URL: <http://www.mcu.es/jsp/plantilla_wai.jsp?id=23&area=centrosdoc> Base de datos. Amplia posibilidades de búsqueda. Incluye número de espectadores y recaudación obtenida.

Library & Information Science Abstract (LISA), de CAS. Biblioteconomía y Documentación. Base de datos bibliográfica. URL: <http://www.csa.com/factsheets/lisa-set-c.php>.

Sociological Abstract, de CAS. Sociología.  Base de datos bibliográfica. Incluye tesis doctorales. Da información de las veces que ha sido citado un documento. (1963-). URL: <http://www.csa.com/factsheets/socioabs-set-c.php>.

ERIC. Responsable: Departamento de Educación USA. Pedagogía. Base de datos. Acceso gratuito a través de Internet.  Tesauro propio. URL: <http://www.eric.ed.gov/>.

Psycinfo, de la APA. Psicología. Recoge tb tesis. (1887-). Tesauro que ayuda a la recuperación de información en la base. URL: <http://www.apa.org/psycinfo/>

Historical Abstract. Historia. (1955-). Consulta a través de la Web. Opción “Clio Notes” de búsqueda conjunta[10].

Criterios de búsqueda. Búsqueda automatizada

El profesor José Antonio Cordón (2001) aborda la búsqueda bibliográfica, y utilización de los operadores lógicos. Establece criterios de búsqueda que nos permitirán establecer el nivel y la cobertura que ha de tener la misma. Estos criterios son: el período que debe cubrir la búsqueda, corriente o retrospectiva; las lenguas deseadas para la recuperación de la información; y el tipo de documentos deseados: monografías, artículos, tesis, patentes, etc.

Una vez establecidos los criterios de búsqueda se pasa al desarrollo de ésta, para lo cual tenemos que elaborar una estrategia de búsqueda que mediante unos procedimientos lógicos permita obtener los resultados deseados. También el profesor José Antonio Cordón expone con profundidad los pasos para una correcta  estrategia de búsqueda manual y automatizadas[11].

La profesora de la UAB, María Eulalia Fuentes trata este tema con más amplitud[12]. Abordando en tema de los servidores de páginas web, afirma que dado que la información recogida por estos servidores se puede almacenar por palabras clave o por conceptos, o con la información jerarquizada o estructurada arborescentemente, es posible localizar y recuperar la información también de distintas manera:

- En la indización por palabras clave el programa recogerá las palabras que tienen que ver con el contenido del documento (en el título, en el resumen ...), y por lo tanto estos términos de búsqueda no podrán ser ambiguos. En la indización por conceptos los documentos aparecen ordenados por temas o conceptos, y por lo tanto al realizar la búsqueda será necesario introducir gran número de términos relacionados con el tema buscado, para que el sistema realice con mayor exactitud la información requerida.
- También es posible realizar búsquedas a través de los directorios, donde se ordena la información jerárquicamente por temas de interés general, hasta llegar a temas específicos. De todas maneras este tipo de búsquedas, muy válido para localizar datos relacionados con un tema, es limitado puesto que no llegan a catalogar todo el contenido de la Red.
- Se trata pues de recuperar información precisa, sin ruido ni silencio[13], o por lo menos con un equilibrio entre ambos. La regla de oro de la recuperación de la información es la existencia de un equilibrio entre ruido y silencio, o lo que es lo mismo, entre precisión y exhaustividad.

Para obtener el máximo provecho de la consulta mediante estos localizadores es necesario elaborar la estrategia de búsqueda: definir la consulta; analizarla y seleccionar los términos básicos o esenciales y más significativos; búsqueda de sinónimos y equivalentes en otros idiomas para cada término; establecimiento de las relaciones entre términos usando los operadores lógicos o booleanos que admita el localizador, y teniendo en cuenta de delimitar entre paréntesis el alcance de cada operador.

Los tres operadores lógicos son: Intersección: Y / AND donde todos los términos o conceptos de la búsqueda aparecerán siempre en todos los documentos. Unión: O / OR donde alguno de los términos o conceptos de la búsqueda aparecerán en los documentos seleccionados. Negación: NO / AND NOT de un grupo de documentos se excluyen los que por las razones que sea, tengan elementos informativos que no interesen.

También dependiendo de las posibilidades de los distintos localizadores, pueden utilizarse los operadores de proximidad y los truncados.

La función de los operadores de proximidad[14] es profundizar en la precisión de la búsqueda a través de la proximidad de los términos escogidos. Se pueden buscar documentos que contengan dos o más términos y que estén en un mismo párrafo (near) o que estén separados por n palabras (w/8).

En cambio los truncados[15] permiten incrementar el nivel de exhaustividad en la búsqueda. Los truncados no son otra cosa que el uso de signos comodines (*, ¿, $, ...) que pueden sustituir de uno a n caracteres, tanto al principio, como en medio, como al final de la palabra. Debe tenerse cuidado con el uso de los truncados y el lugar del término donde se hace este truncado, puesto que pueden entorpecer la búsqueda más que ayudarla, aportando ruido documental.

Sistemas de búsqueda en Internet y valoración de los mismos

Sobre los sistemas de búsqueda en Internet, el profesor José Antonio Cordón nos dice que son similares[16]. Recursos como los operadores boléanos, and, or, not, etc., truncamientos, operadores de proximidad, se pueden emplear con el mismo nivel de eficacia que en una base de datos convencional.[17]

Catálogos Web, Buscadores y Metabuscadores

Internet es un inmenso pandemonium[18] en el que para encontrar la información buscada precisamos de herramientas de búsqueda, los llamados buscadores.

Un catálogo Web nos ofrece páginas clasificadas por temas. Según Ingo Laxkerbauer: "La búsqueda de campos temáticos o de empresas y organizaciones se simplifica gracias a la clara estructura y a la indexación. Detrás del catálogo Web se esconde una serie de espíritus trabajadores. Éstos buscan continuamente servidores Web nuevos que luego se clasifican por temas, se incluyen en el catálogo y se acompañan de una descripción"[19]. Por consiguiente, un catálogo Web no explora en la red para localizar lo pedido por el usuario, sino que acude a su propia base de datos.

El catálogo Web, al estar dividido por áreas temáticas, resulta adecuado para localizar un tema concreto. Nos aporta menos entradas que un buscador, pero éstas suelen estar más acorde con lo que queremos buscar.

Catálogos de búsqueda los tenemos por ejemplo en los portales[20] de, <www.terra.es>, <www.biwe.es>, <www.lycos.es> o <www.yahoo.com>.

Por el contrario, un servidor de búsqueda sí pesca en el conjunto de Internet. Es por ello que es necesario cuando utilizamos un motor de búsqueda indicar con la máxima claridad y precisión el concepto de búsqueda.

Cada buscador tiene su metodología de búsqueda, y lo mejor para ello es tomarse unos minutos en leer la ayuda de cada uno. Aquí ofrecemos el análisis de algunos de los más utilizados y que mayor precisión ofrecen en el campo de las ciencias sociales y humanidades.

Google. URL: <http://www.google.com>. Podemos realizar una búsqueda exacta de frases. Para ello escribimos entre comillas la frase que queremos buscar. El directorio permite acceder a la información por categorías temáticas. Si ponemos un signo menos (-) delate de un término, con ello excluimos una palabra de la búsqueda. Es imprescindible incluir un espacio antes de este signo. Podemos utilizar el operador or. No acepta truncamientos. No hay diferencia entre mayúsculas y minúsculas. Utilización del signo +. Para ello debemos introducir un espacio delante del signo. Para saber quienes han efectuado enlaces a una página concreta o establecer redes de citas hacia una URL se emplea la fórmula siguiente: link: url

Altavista. URL: <http://www.altavista.com>. El buscador Altavista permite localizar de forma separada distintos recursos de la red Internet: páginas web, noticias, foros de discusión, productos, imágenes, vídeos y audio. La presentación de resultados siempre será por orden de pertinencia. Las búsquedas simples las realizamos desde la pantalla principal. Podemos restringir las búsquedas especificando el idioma; en la actualidad tiene la opción de 25. Las comillas las utilizamos para encontrar la frase exacta. Si escribimos en mayúsculas, sólo localizará estas. Para que busque minúsculas y mayúsculas tenemos que poner p. ej. california=California, california, CALIFORNIA. Para inclusión de palabras, ponemos el signo (+) inmediatamente delante de la palabra sin espacio. Para exclusión de palabras ponemos el signo (-) inmediatamente después de la palabra sin espacio. Escribiendo un asterisco (*) al final de una palabra –truncamiento- buscará todas las formas posibles del término. Caracteres especiales como %, #, _, /, . y $, Altavista los interpreta como un separador para palabras. Con Altavista podemos utilizar funciones:

- anchor: text → Localiza páginas que tienen una palabra en el texto del  hipervínculo.
- domain: domainname → Se utiliza para buscar páginas de un dominio.

- image: filename → Busca imágenes guardadas con este nombre.
- link: URLtext    → Busca páginas que redireccionan una página.
- url: text → Localiza un texto dentro de la URL.

USSeek. URL: <http://www.usseek.com/>. Es uno de los más rápidos en cuanto a la búsqueda y recuperación de documentos y dispone de un amplio directorio temático accesible desde su página principal. Desde ella también se pueden realizar búsquedas sencillas o acceder al apartado de ayuda para búsquedas avanzadas, sin operadores boléanos, pero con unos caracteres clave que hacen funciones similares y realizando la búsqueda o a través del Web, de USEnet, FTP, Gopher o Newsgroups para buscar información adicional, pudiéndose trabajar en distintos idiomas.

Magellan. URL: <http://www.magellan.mckinley.com>. Es uno de los servidores de páginas Web más clásico con un buen sistema de ayuda y diversos servicios complementarios, como buscadores de e-mail o un directorio de páginas amarillas, y puede realizar búsquedas en el Web, en FTP, en Gopher y en Newsgroups. No incluye operadores boléanos, pero tiene diversos símbolos que hacen funciones parecidas y está provisto de un catálogo temático.

Sobre los metabuscadores, éstos actúan como pasarelas a los buscadores más conocidos[21]. La búsqueda con estos agentes multibuscadores ofrece un mejor rendimiento que la realizada tradicionalmente con buscadores[22].

Copernic[23] es uno de los metabuscadores más conocidos. La casa permite descargarlo freeware, pero con las limitaciones de acceso gratuito no están activadas todas sus funciones. Este robot de búsqueda cuenta con la gran ventaja de clasificar la información. La base de datos de direcciones de Copernic 2000 se divide en temas. El usuario podrá seleccionar el tema donde quiera buscar la información. Para poder localizar información en la red seguimos los siguientes pasos: Clic en el botón New que lo encontramos en la barra de herramientas; seleccionar una categoría para la información a través de la lista desplegable Category; introducir la cadena de búsqueda; especificar la búsqueda deseada; determinar el tipo de acción que tendrá que desarrollar Copernic 2000 una vez que finalice la búsqueda. Una opción interesante, si habilitada también si descargamos gratuitamente el programa, es  comprobar que todas las direcciones URL funcionen correctamente; clic en Search Now. Copernic nos muestra a continuación, completada ya la búsqueda, un informe con referencias y un breve resumen de cada página Web.

Subject Search Spider es otro robot de búsqueda especializado en localizar información en Internet. Este programa busca en varias bases de datos de información publicada en Internet y genera un resumen en un documento HTML. En este documento muestra el título de la página Web donde se encuentra la información solicitada, un hiperenlace para acceder a ella y un resumen de su contenido. Subject Search Spider permite configurar cada una de las búsquedas[24], determinar el idioma de la búsqueda, el número de páginas que se mostrarán en el resumen, el número de palabras que tendrá el informe de cada uno de los recursos localizados y el tiempo del que dispondrá para efectuar la búsqueda. Cuanto mayor sea el tiempo disponible, mejor será la calidad de la información suministrada. En el informe ordenará la información por importancia.

Portales

El crecimiento masivo de información en Internet está obligando a encontrar herramientas que permitan a los usuarios acceder a la información de su interés de una forma rápida y fiable. El problema de la gran acumulación de información apareció ya en los primeros años de Internet, por lo que las soluciones a buscar están unidas a la propia historia de la Red.

Hasta l990 los usuarios de Internet debían conocer los comandos Uníx para navegar y buscar en la Red. La herramienta principal para localización de ficheros era el comando grep de Uníx, Archie, que es una elaboración de grep y fue creado en 1980 por un grupo de investigadores del Centro de Computación de la Universidad McGill, en USA, con el fin de encontrar ficheros ftp más fácilmente.

En 1991, investigadores del Centro de Computación de la Universidad de Minnesota inventaron el Gopher, con un interface de usuario más amigable y un formato de menú de ficheros. Tal fue su popularidad que en poco tiempo aparecieron miles de sitios Gopher por todo el mundo, para los cuales no existía un índice central o mecanismo de búsqueda. Es por ello que en 1992 se creó Verónica, permitiendo a los usuarios de Gopher buscar en el Gopherespacio.

En 1989 comienza a fraguarse en concepto de World Wide Web –WWW- en el CERN –Centro Europeo de Investigaciones Nucleares, siendo Tim Berners-Lee uno de sus primeros responsables. La aparición de la Web supuso una revolución ya que su carácter gráfico e hipertextual la acercó al gran público, aumentando la cantidad de información existente, por lo  que se planteó de nuevo la creación de otras herramientas que permitieran buscar y encontrar en la Web. El WWW permite el acceso a todos los recursos de información disponibles mediante referencias cruzadas de información, y cada página Web tiene conexiones que permite acceder a otras páginas Web mediante lazos asociativos. El WWW es, actualmente, la aplicación estrella de Internet, y su diseño permite acceder, además de a servidores de WWW, a otro tipo de servicios y pasarelas que tradicionalmente habían sido proporcionados de manera individual, y que WWW ha conseguido unificar en un solo interface, como el FTP, Archie, Gopher y Verónica, Wais, servicios de direcciones como Whois o X500, Finger, Usenet, Telnet y Hytelnet, entre otros.

En 1993 la primera generación de motores –WWW Worm y WebCrawler- hace su aparición, aunque a principios de 1994 son sustituidos por motores de búsqueda más poderosos como Altavista, Excite, Infoseek, Lycos y OpenText. Pero incluso estos motores, que usan algoritmos de búsqueda por palabras, fallan para encontrar información relevante; es por ello por lo que actualmente se utilizan motores que incorporan algoritmos inteligentes –Inktomi`s Slurp- basados en indización por conceptos, es decir, tratan de determinar lo que el usuario piensa, no lo que dice.

Ya en el siglo XXI los portales se están constituyendo como una evolución lógica de las anteriores herramientas de búsqueda. Se está observando un proceso curioso: a mayor cantidad e información, menor esfuerzo del usuario por localizarla. Es en este sentido donde los portales tienen su éxito asegurado, ya que reúnen en una única dirección web aquellos links de mayor interés o difusión en Internet. El problema que plantean es que la información es previamente seleccionada y manipulada por un grupo de personas, por lo que la información que nos presentan puede estar manipulada.

El profesor José Antonio Cordón sostiene que los portales generalistas, que intentan abarcar todos los campos del conocimiento están abocados al fracaso frente a los portales especializados, más centrados en campos específicos del conocimiento[25].

Búsqueda con WinSPIRS

Para la búsqueda con WinSPIRS[26] es necesaria, normalmente, la intervención de dos tipos de organizaciones: una sería el productor de las bases de datos, bien en línea On-line, bien comercializada en Cd-Rom, y la otra el centro u organismo (centros de documentación, hospitales, centros de investigación, etc.) que disponga de los equipos de teledocumentación necesarios.

El equipo que precisamos para realizar búsquedas On-line es un terminal de ordenador, teléfono, módem e impresora. Para búsquedas en Cd-Rom precisamos de terminal de ordenador, red, multilector de Cd-Rom, Cd-Rom e impresora.

Los pasos para efectuar esta búsqueda los encontramos en el mencionado libro del profesor José Antonio Cordón[27].

Búsqueda con WebSPIRS

WebSPIRS es el programa de consulta de bases de datos SilverPlatter. Con WebSPIRS operan varias bases de datos de las más importantes del campo de las ciencias sociales y humanidades, p.ej. las mencionadas ERIC (educación), LISA (Documentación), MLA (Lengua y Literatura) y EconLit (Economía). La página de búsqueda de WebSPIRS permite construir peticiones de búsqueda y determinar como se mostrarán los registros. Podemos combinar términos mediante operadores lógicos que permiten formar peticiones de búsqueda compuestas –and, in, near, not, or, with, adj-, los operadores de campos límite -<, >, <=, >=, - -, y la utilización de truncamiento y comodines que permite variaciones de su término de búsqueda cuando construya sus búsquedas en las páginas de Selección de Bases de Datos y Búsquedas. El símbolo de truncación (* ) sirve como sustituto para cualquier cadena de cero o más caracteres. El símbolo de comodín (¿) sirve como sustituto de uno o más caracteres. Podemos utilizar la truncación y los comodines en cualquier lugar en su término de búsqueda, excepto como primer carácter.

Conclusiones finales

Para una localización específica de recursos de información en Internet, accesible bien mediante un browser o bien mediante pasarelas, debemos primero definir la búsqueda, entendida ésta como el conjunto de operaciones cuyo objeto es localizar, seleccionar y obtener los documentos que den respuesta a las preguntas formuladas por el usuario en función de sus necesidades de información. Lo ideal es manejar las diversas herramientas disponibles en la ejecución de una búsqueda genérica (v.gr. buscadores, directorios, portales, catálogos web, metabuscadores), específica (v. gr. portales temáticos, revistas en línea, bases de datos) e investigaciones varias (v. gr. complementar con grupos de discusión, P2P, IRC); a la par que conocer los detalles diferenciadores de cada fase y saber explotarlos.

Hay una serie de cuestiones que debemos plantearnos durante una búsqueda de recursos: definir la necesidad de información, seleccionar las fuentes de información, crear la estrategia de búsqueda: v. gr. comenzar escribiendo una frase que resuma lo que queremos buscar, establecer relaciones lógicas utilizando operadores; y la adecuación o feedback si los resultados son muchos, v. gr. añadir más conceptos utilizando AND, eliminar términos genéricos, eliminar truncamientos, buscar en campos específicos o delimitar con descriptores, fechas, tipología etc.; si los resultados relevantes son pocos v. gr. eliminado términos introducidos por AND utilizando sólo el más importante, añadiendo palabras clave utilizando el operador OR, usando los truncamientos, buscando en todos los campos como búsqueda libre si la base de datos nos lo permite; y si los resultados relevantes son muchos, v. gr. añadiendo más conceptos usando AND, eliminando términos genéricos que aporten demasiados resultados, eliminado truncamientos, buscando en campos específicos o delimitando con descriptores.

Lo importante es definir una buena estrategia de búsqueda y saber desenvolvernos con soltura utilizando las diversas herramientas y estrategias a nuestro alcance, y para ello se hace imprescindible conocer la existencia y posibilidades, las ventajas e inconvenientes, de cada herramienta.


Notas


[1] Cordón García, José Antonio. Manual de investigación bibliográfica y documental. Teoría y práctica, p. 46-60.

[2] Por ejemplo buscar la noticia en distintos periódicos.

[3]Fuente: Merlo Vega y elaboración propia.

[4] Fuente: Merlo Vega y elaboración propia.

[5] Fuente: Elaboración propia.

[6] Fuente: Merlo Vega y elaboración propia.

[7] Fuente: Elaboración propia

[8] Fuente: Elaboración propia

[9] Fuente: Elaboración propia.

[10] Fuente: Merlo Vega y elaboración propia.

[11] Cfr. Cordón García, José Antonio, op. cit. , pp. 63-68.

[12] Fuentes i Pujol, Mª Eulalia, La información en Internet, pp. 83-87.

[13] Una recuperación con ruido es aquella en la que se suministra al usuario documentos que no responden exactamente a su solicitud. Es una falta de precisión en la recuperación. En cambio una recuperación con silencio es aquella en la que se dejan de suministar al usuario algunos documentos que se refieren explícitamente a su solicitud, o sea que se produce una falta de exhaustividad en el momento de proporcionar los documentos.

[14] Para mayor información, Montes Hernández, Agustín. “Las posibilidades de los buscadores”; en El profesional de la información, pp. 12-13.

[15] Cfr. Montes Hernández, Agustín. “Las posibilidades de los buscadores”; en El profesional de la información, p. 11.

[16] Ibidem, p. 80.

[17] Cfr. Luis Lizasoain, Base de datos en CD-Rom, pp. 89-112. En estas páginas aborda las cuestiones generales sobre recuperación de la información, estructura de las bases de datos, y métodos y técnicas de interrogación. Es en este último apartado donde estudia los operadores boléanos, operadores de expansión, operadores de intervalo, operadores de proximidad o distancia, operadores de cualificación, y operadores de encadenamiento.

[18] En noviembre de 2001, la cifra de servidores activos era de 36.458.394, con la existencia de unas 1.600 millones de páginas Web. Cfr. Diario El Mundo, Las páginas Web celebran su décimo cumpleaños, p. 36.  Los datos de How Much Information? 2003 <http://www.sims.berkeley.edu/research/projects/how-much-info-2003/> elevan la cifra a cerca de 45.000.000 servidores.

[19] Lackerbauer, Ingo. Todo sobre Internet, pp. 58-59.

[20] La idea de un Portal es facilitar al usuario la navegación por Internet, además de mostrarle publicidad, ofertas, motores de búsqueda, información, o cualquier artículo que crean que puede interesar. Ofrecen la gran mayoría cuentas de correo gratuitas.

[21] Codina Bonilla, L. “Cómo funcionan los servicios de búsqueda en Internet: un informe especial para navegantes y creadores de información. Parte II”; en Information World en español,  p. 24.

[22] Cfr. Hipola, Pedro; Vargas-Quesada, Benjamín; Montes, Agustín. “Descripción y evaluación de agentes multibuscadores”; en El profesional de la información, pp. 15-24.

[23] Véase Marcos Mora, Mari Carmen. “Copernic”; en El profesional de la información, pp. 29-34.

[24] Aunque se pueden configurar varias búsquedas a la vez, Subject Search Spider las atenderá de una en una.

[25] Cfr. Cordón García, José Antonio, op. cit. , p. 86.

[26] Cfr. Cfr. Luis Lizasoain, Base de datos en CD-Rom, pp. 221-234.

[27] Cfr. Cordón García, José Antonio, op. cit. , pp. 69-72.


Referencias bibliográficas

BALAY, R. Guide to Referente Books. 11ª ed., Chicago: Ala, 1996.

CARRIZO SAINERO, Gloria. La información en Ciencias Sociales. Gijón: Trea, 2000.

CODINA BONILLA, L. Cómo funcionan los servicios de búsqueda en Internet: un informe especial para navegantes y creadores de información. Parte I. Information World en español. 1997, 6(5), 22-27.

CODINA BONILLA, L. Cómo funcionan los servicios de búsqueda en Internet: un informe especial para navegantes y creadores de información. Parte II. Information World en español. 1997, 6(6), 18-27.

CORDÓN GARCÍA, José Antonio; López Lucas, Jesús; Vázquez Pulido, José Raul. Manual de investigación bibliográfica y documental. Madrid: Pirámide, 2001.

FUENTES i PUJOL, Mª Eulalia. La información en Internet. Barcelona: CIMS, 1997.

GARZA MERCADO, A. Fuentes de información en Ciencias Sociales y Humanidades. México: El Colegio de México, 1999-.

HERRON, NANCY (et al.). The Social sciences: a cross disciplinary guide to selected sources. 3rd edition. Englewood: Libraries Unlimited, 2002.

HIPOLA, Pedro; VARGAS-QUESADA, Benjamín; MONTES, Agustín. Descripción y evaluación de agentes multibuscadores. El profesional de la información. 1999, v.8, n.11, 15-24.

LACKERBAUER, Ingo. Todo sobre Internet. Barcelona: Marcorbo, 2000

LIZASOAIN, Luis. Bases de datos en CD-ROM. Madrid: Paraninfo, 1992.

MALDONADO MARTÍNEZ, Á. (coord.). La información especializada en Internet. Directorio de Recursos de interés académico y profesional. Madrid: CINDOC, 2001.

MARCOS MORA, Mari Carmen. Diversos modos de acceso a catálogos en línea a través de Internet. El profesional de la información. 1999, v.8, n.1-2, 7-13.

MARCOS MORA, Mari Carmen. Copernic. El profesional de la información. 2001, v.10, n.10, 29-34.

MERLO VEGA, José Antonio. Apuntes de curso académico inéditos. Facultad de Documentación, Universidad de Salamanca, 2003.

MONTES HERNÁNDEZ, Agustín. Las posibilidades de los buscadores. El profesional de la información. 1999, v.8, n.3, 8-14.

SWEETLAND, J. H. Fundamental Referente Sources. 3rd ed. Chicago: ALA, 2001.

ROMANOS DE TIRATEL, S. Guía de fuentes especializadas: Humanidades y Ciencias Sociales. Buenos Aires: EB Publicaciones, 2000.

TORRES RAMÍREZ, I. de (ed.). Las fuentes de información: estudios teórico-prácticos. Madrid: Síntesis, 1998.

WALFORD'S. Walford`s guide to referente material. London: Library Association, 1994-1997.


Recursos electrónicos

BERKELEY UC. University of California. How much information 2003 [En línea]. Berkeley: Universidad de California, 2003. <http://www.sims.berkeley.edu/research/projects/how-much-info-2003/>. [Consulta: 25 de febrero 2006].

RECERK. Proyecto RecerK.com (2000-). [En línea]. <http://es.groups.yahoo.com/group/recerk/messages>. [Consulta: 25 de febrero 2006].


© Copyright José Martín Brocos Fernández y Carlos Ortiz de Landázuri, 2006.
© Copyright Ar@cne, 2006.

Ficha bibliográfica:

BROCOS FERNÁNDEZ, José Martín; ORTÍZ DE LANDÁZURI. , Carlos. Métodos de búsqueda en fuentes de información en ciencias sociales y humanidades. Ar@cne. Revista electrónica de recursos en Internet sobre Geografía y Ciencias Sociales. [En línea]. Barcelona: Universidad de Barcelona, nº 83, 1 de mayo de 2006. <http://www.ub.es/geocrit/aracne/aracne-083.htm>.



Geocritica