«ÍnDICEs CSIC»: control bibliogràfic d’articles de revista espanyols

Versió per a imprimirVersió per a imprimir

Amadeu Pons
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona


ÍnDICEs CSIC (2018). Madrid: CSIC. Centro de Ciencias Humanas y Sociales. És continuació de Bases de datos bibliográficas del CSIC. Disponible a: <https://indices.csic.es/>. [Consulta: 6/01/2019].


Presentació

A diferència de la majoria d’entrades d’aquest blog, aquesta no serà la ressenya d’un informe recent d’interès per a bibliotecaris, sinó l’anàlisi d’una base de dades bibliogràfica. Concretament, un recurs que ens permet conèixer la producció científica espanyola d’articles de revista. El motiu que fa que la ressenyem ara és que, tot i que aquesta base de dades existeix des de fa molts anys, fragmentada en tres blocs, al juliol de 2018 es va reunificar i va canviar de nom: ÍnDICEs CSIC.

Autoria

L’entitat productora és el Centro de Ciencias Humanas y Sociales (CCHS), que pertany al CSIC (Consejo Superior de Investigaciones Científicas). Aquesta unitat va ser creada el 2007 a partir de l’agrupació de diversos òrgans de recerca del Consejo mateix de l’àmbit de les humanitats i les ciències socials. Un d’aquests òrgans era l’Instituto de Estudios Documentales sobre Ciencia y Tecnología (IEDCYT), que era el substitut del CINDOC (Centro de Información y Documentación Científica), el qual, al seu torn, era fruit de la reunificació, el 1992, de dos centres creats el 1975: l’ICYT (Instituto de Información y Documentación en Ciencia y Tecnología) i l’ISOC (Instituto de Información y Documentación en Ciencias Sociales y Humanidades). Tot aquest seguit d’entitats han estat implicades en l’elaboració d’aquesta base de dades al llarg dels anys.

Abast temàtic i geogràfic

L’abast temàtic de la base de dades és multidisciplinari: s’analitzen revistes de caire científic de tots els camps del coneixement. Les revistes han de ser publicades a Espanya. Els criteris per considerar una revista com a científica i, per tant, candidata a ser indexada per aquesta base de dades, són els de Latindex: cal que la revista consti al «Catálogo» de Latindex.1

Com dèiem, aquest recurs bibliogràfic no és nou, es basa en la refosa de tres bases de dades que existien des de la dècada dels setanta i que eren conegudes, fins ara, amb el nom de Bases de datos del CSIC.2 Fins que no s’ha produït la unificació, es consultaven de manera independent: ICYT (de ciència i tècnica, creada el 1979), IME (medicina, de 1971) i ISOC (ciències socials i humanitats, de 1975). ICYT i ISOC eren produïdes a Madrid, pel CINDOC, i IME s’elaborava a València per un altre òrgan del CSIC: l’Institut d’Història de la Ciència i Documentació López Piñero, que tenia com a antecedent l'Institut d'Història de la Medicina. Després de diverses transformacions, aquest centre s’anomena des del 2008 Institut Interuniversitari López Piñero, i ja no elabora la bibliografia de ciències de la salut.

Abast cronològic

L’abast cronològic de la base de dades és difícil de precisar amb exactitud, ja que el document més antic que es troba data de 1916, i fins a 1939 se’n troben alguns més, molt pocs (48 en total); de la dècada de 1940 a 1950 ja en trobem 407. És a partir de 1971 que les xifres ja augmenten significativament.

Quantitat de dades

Segons les estadístiques proporcionades per la base de dades mateixa, el nombre total de revistes buidades és de 4.165 (de les quals, en són vives actualment 2.282, el 55 %), i el conjunt d’articles referenciats és a punt d’arribar a l’1,3 milions.3 Pel que fa a les matèries de les revistes, la major part correspon a les ciències socials (37 %), seguides per les humanitats (amb el 27 % dels títols), les ciències i tecnologies (16 %), la medicina (11 %) i les revistes multidisciplinàries (9 %). També disposem de xifres sobre la distribució dels títols per lloc de publicació (per comunitats autònomes). Madrid encapçala de llarg aquest rànquing, amb 1.594 títols (38 %), seguit per Catalunya, amb menys de la meitat, 705 (17 %) i Andalusia, amb 437 títols (10 %).

Del total d’articles recollits, el 29 % estan disponibles en línia (enllaçats des del seu registre) i el 37 % dels registres inclouen el resum publicat per la revista original. Quant als idiomes dels treballs inclosos, en català se’n troben prop de 36.000 (el 3 %), en gallec, pocs més de 6.200 (0,5 %), i en basc, únicament 10. 

És important tenir en compte que no totes les revistes són buidades exhaustivament: la política de cobertura varia entre «prioritària», «seleccionada no prioritària», «actualització parcial» i «no s’actualitza»; però ara per ara no es troben explicacions sobre l’abast d’aquestes expressions ni els criteris amb què s’apliquen a cada revista. A tall d’exemple, la revista Item figura com que «no s’actualitza» (s’hi troben 8 articles de 2018 i 22 de 2017; però cap del 2015 ni del 2016), BiD apareix com a «seleccionada no prioritària». De l’àmbit de la informació i la documentació, només hi ha cinc títols la cobertura dels quals és «prioritària»: Boletín de la Asociación Andaluza de Bibliotecarios, Documentación de las ciencias de la información, El profesional de la información, Revista española de documentación científica i Revista general de información y documentación.

Les dades dels articles poden ser incorporades directament pels editors de les revistes, mitjançant la tramesa de fitxers XML amb les metadades de l’esquema Dublin Core. El personal del CSIC valida les dades i hi afegeix la indexació per matèries «conforme a un lenguaje documental especializado y normalizado». 

Accés

La interfície es presenta en espanyol i anglès. Existeixen dues modalitats d’accés a la base de dades: gratuïta i per subscripció. Aquesta darrera, disponible per a totes les biblioteques universitàries públiques catalanes. Els usuaris d’aquestes universitats poden registrar-s’hi gratuïtament i guardar estratègies de cerca fetes i resultats, com també rebre alertes mensuals amb nous articles inclosos de les matèries prèviament seleccionades.

Dades dels registres

Un exemple de registre complet es pot veure en l’exemple següent: 

 

 

 

 

 

 

 

 

 

 

 

 

 

Com es pot veure a la imatge, els autors i les matèries són enllaços actius que poden generar noves cerques.

Opcions de cerca

En la versió gratuïta només és possible cercar per autor, títol de l’article, títol de la revista i any de publicació. En canvi, en la modalitat de pagament, hi ha quatre modalitats de cerca: la cerca simple (que recupera text dels camps de matèria, títol del document i resums; però no d’autors ni títols de les revistes), la cerca avançada (que permet limitar les cerques a qualsevol camp dels registres i combinar-les amb els operadors booleans), la cerca experta (que permet construir una estratègia d’acord amb una sintaxi determinada) i la cerca per índexs (que permet seleccionar els termes de quatre índexs: matèries, descriptors, identificadors i topònims). 

Cal dir que, en aquesta darrera modalitat hi ha una mica de confusió, ja que al camp de matèries s’hi han inclòs els termes d’altres camps de les bases de dades anteriors (topònims, identificadors i descriptors); tanmateix, els altres tres índexs sí que responen al seu nom. Pel que fa en concret a les matèries, cal tenir en compte que ÍnDICEs CSIC és la suma de tres bases de dades que fins aleshores eren independents, i per això es poden trobar incoherències. Actualment, s’està treballant per la unificació de criteris en la indexació i l’eliminació d’errors.

Dues funcions a valorar del motor de cerca: la cerca es realitza truncant per l’arrel de les paraules, cosa que amplia els resultats previstos (per exemple, si a les matèries demanem «independentismo», recuperem també «independencia», «independiente»...). A més, en determinats camps de la cerca avançada, el sistema suggereix els termes de cerca disponibles als índexs o bé ofereix la llista dels valors existents, cosa que en facilita la tria. D’altra banda, a l’índex de topònims, els noms que compten amb diferents formes (Terrassa-Tarrasa, London-Londres...) es troben unificats, s’arriba a la mateixa resposta interrogant des de qualsevol variant.

Lamentablement, no està disponible el llenguatge documental fet servir per indexar per matèries les entrades. Un altre punt millorable és la manca d’unificació dels noms dels autors, com es pot veure en la il·lustració següent, amb dues entrades diferents per a Mònica Baró i per a Joan Baró:

 

 

 

 

 

 

 

Així, per trobar els 22 articles de la Mònica Baró que consten a la base de dades, cal fer tres cerques diferents (perquè també apareix en minúscules, forma que dona uns altres resultats). 

Visualització i gestió de resultats

El sistema permet ordenar les respostes per diferents criteris i filtrar els resultats per 13 facetes diferents. En cas d’estar registrat, els resultats i les cerques es poden guardar per a una consulta posterior, i els resultats obtinguts es poden exportar amb diversos formats. 

Actualització de les dades

L’actualització de la base de dades és diària; però les dades que s’entren sembla que no són pas recents. Vegeu el quadre següent, dels documents existents per any de publicació:
 

 

 

 

 

 

 

 

 

 

 

 

 

Si fins els primers anys de la dècada dels 2010 la quantitat anual d’entrades ronda les 30.000, no sembla lògic que el 2016 baixi a menys de la meitat...4 D’altra banda, el centre valencià que s’encarregava de l’antic IME va deixar de fer aquesta feina el 2012. 

Comentaris finals

Què ens aporta ÍnDICEs CSIC en comparació amb RACO (el repositori de revistes vives publicades a Catalunya)?5 En xifres absolutes, RACO conté 500 títols,6 mentre que ÍnDICEs CSIC inclou 705 revistes publicades a Catalunya (de les quals, 358 vives). 

Comparem, a tall d’exemple, a les dues bases de dades, les revistes el títol de les quals comença per D, publicades a Catalunya i que encara són vives. Entre les dues fonts, se’n localitzen 19 en total. D’aquestes, n’hi ha vuit (42 %) que únicament apareixen a RACO: Dante e l’Arte, Datatèxtil, Didacticae, Doblele, Documentos de la Escuela de Ingenieros Industriales de Barcelona, Dossiers feministes, Dovella i Drassana. En canvi, hi ha dues revistes (11 %) que únicament apareixen a ÍnDICEs CSIC: Dictatorships and democracies i Dolor. La resta (nou, 47 %) apareixen a les dues plataformes.

Què ens aporta ÍnDICEs CSIC enfront de Dialnet? (base de dades multidisciplinària, d’abast internacional, amb unes 10.400 revistes buidades). Farem una comparació ràpida i només indicativa entre les revistes de química publicades a Espanya que es troben a les dues fonts. En total s’identifiquen 33 títols. D’aquests, tres (9 %) es troben únicament a Dialnet (Gemología & ciencia, Interempresas: industria química i MoleQla). En canvi, hi ha 11 títols (33 %) que apareixen únicament a ÍnDICEs CSIC: Acta química compostelana, Anales de química (quatre títols), Folia chimica theoretica latina, Instituto Químico de Sarriá, Química analítica, Química hoy, Reunión bienal (Real Sociedad Española de Química) i Studia chemica. 19 títols (58 %) apareixen a les dues fonts. 

Pel que fa a l’actualització del buidatge d’aquestes revistes de química, mentre que Dialnet es presenta prou al dia, a ÍnDICEs CSIC s’atura l’anàlisi fa anys en els títols següents, que continuen apareixent a dia d’avui: Afinidad, el 2012; Anales de la Real Sociedad Española de Química, el 2014; Cromatografía, el 2015.

Què ens aporta ÍnDICEs CSIC enfront d’IBECS? (l’Índice bibliográfico español en ciencias de la salud, elaborat per l’Instituto de Salud Carlos III). Mentre a IBECS es buiden 432 revistes espanyoles de les ciències de la salut, a ÍnDICEs CSIC n’hi ha 472. Si bé el nombre de títols en aquesta darrera font és superior, l’actualització deixa molt a desitjar. A tall d’exemple, amb la matèria «oncología» trobem a ÍnDICEs CSIC 4, 8 i 10 articles, publicats respectivament el 2014, 2015 i 2016; però cap article del 2017 o 2018. En canvi, a la base de dades especialitzada, trobem, amb el mateix terme de cerca, 6, 7 i 10 articles publicats els anys 2014-2016; però 12 per al 2017 i 11 per al 2018.

Conclusió

ÍnDICEs CSIC té uns punts forts: la quantitat de revistes espanyoles buidades, l’antiguitat de la informació disponible i la potència del seu motor de cerca. Però té diversos punts febles: la manca d’actualització del buidatge, la manca d’exhaustivitat en l’anàlisi de les revistes i les disfuncions en la recuperació de la informació a partir de les matèries. 

Tant de bo que el CSIC maldi per millorar el producte perquè sigui realment un recurs d’interès per a estudiosos de tots els camps.


1 Per al detall d’aquests criteris qualitatius, podeu veure: http://www.latindex.org/latindex/meto2 
2 Abans de l’aparició dels CD-ROM i d’Internet, es publicaven en paper. Els interessats en l’arqueologia bibliogràfica poden consultar: Villa Sanz, María de la. «Descripción de dos repertorios bibliográficos: el Índice español de ciencias sociales y el Índice español de humanidades». Boletín de la ANABAD, tomo 29, n.º 4 (1979), p. 51-57. Disponible en línia a: https://dialnet.unirioja.es/servlet/articulo?codigo=967409.
3 Escassament hi ha introduïdes monografies: tot just unes 9.000, entre llibres, informes i tesis.
4 Aquesta consulta es va fer el 5 de gener de 2019.
5 Vegeu una ressenya sobre RACO a Blok de BiD
6 Cal dir que no totes les 500 revistes són vives actualment: algunes han deixat de publicar-se.