[Versió castellana]


Elisenda Tarrats Pons

Professora associada de la Universitat Politècnica de Catalunya
Universitat Internacional de Catalunya

elisenda.tarrats@upc.edu



Resum [Abstract] [Resumen]

En les primeres fases d'una investigació, esdevé fonamental la detecció dels autors i publicacions més rellevants de la matèria objecte d'investigació. Sitkis, com a eina bibliomètrica, facilita el procés de recerca, selecció i tractament d'informació científica d'alta qualitat. A continuació especifiquem la descripció d'aquest programari, el funcionament, les utilitats principals, així com les limitacions. Com a conclusió destacaríem la seva utilitat i conveniència en el desenvolupament de l'estat de la qüestió d'una investigació o d'una tesi doctoral.


1 Introducció

En les primeres fases del desenvolupament d'una investigació és clau verificar les aportacions bibliogràfiques (autors, articles, revistes, etc.) fonamentals d'aquella disciplina d'estudi. D'acord amb les metodologies d'investigació tradicionals, la construcció de l'estat de la qüestió era fruit de successives immersions de l'investigador als fons documentals de les biblioteques, buscant documents i articles vinculats a la matèria d'estudi. De la lectura dels diferents textos seleccionats, s'obtenia una llista de referències utilitzades pels autors que permetien accedir a una nova informació, a través de aproximacions successives. El procés de recerca consumia molt de temps, era difícil de replicar donats els judicis subjectius implicats (Börner; Chen; Boyack, 2003).

En l'actualitat, gràcies a les noves tecnologies i específicament a les bases de dades electròniques, l'investigador té accés a un corpus científic habitualment inabastable pel temps de què disposa. Segons Lyman i Varian (2000) anualment es publiquen 38.000 revistes científiques que poden arribar a agrupar 2 milions d'articles. La finalitat de l'estat de la qüestió no és la lectura de tota la informació disponible sinó localitzar aquella informació científica més rellevant i d'alta qualitat.

Els investigadors per a poder fer front al tractament de tota la informació disponible, que garanteixi l'objectivitat i practicitat de la seva elecció, poden fer ús de les denominades eines bibliomètriques. Pritchard (1969) destaca que a través d'aquestes eines es poden analitzar matemàticament i estadísticament les cites dels articles de la base de dades proposada per l'investigador per extreure'n conclusions relacionades amb l'activitat, l'estructura i l'evolució tècnico-científica d'una temàtica determinada. La seva utilització garanteix l'objectivitat i practicitat dels resultats obtinguts.

Les anàlisis bibliomètriques assumeixen que les cites són indicadors de l'activitat passada i present dels articles científics (Garfield; Sher; Torpie, 1964; Small, 1973). Així mateix, s'assumeix que si dos articles estan citats en un mateix document, estaran relacionats entre ells, o bé perquè formen part d'una mateixa disciplina d'estudi, o bé perquè les àrees d'estudi de què formen part estan relacionades entre elles (Small, 1973). D'aquesta forma, les anàlisis bibliomètriques tracten les cites dels articles i de les seves referències a través dels mètodes estadístics de manera que, a part d'informar del nombre de vegades que se cita un article, autor, paraula clau o institució, permeten establir relacions entre elles. No es tracta doncs només de conèixer l'impacte global d'un article, autor o institució, sinó també de conèixer el seu l'impacte relatiu, que és aquell que vincula un autor, article o institució amb altres articles dintre d'una mateixa àrea d'estudi.

Sitkis, desenvolupat pel doctor Henri Schildt (2006) de la Helsinki University of Technology, és una eina bibliomètrica que facilita el procés de recerca, selecció i tractament d'informació.


2 Funcionament

Sitkis permet la recerca, recuperació i tractament d'un arxiu de dades de la Web of Knowledge1, reconeguda com una prestigiosa base de dades de referències bibliogràfiques d'articles de revistes científiques que permet l'accés a cites i resums d'autors de més de vuit mil publicacions periòdiques de distribució mundial.

Per un funcionament adequat de Sitkis és necessari que instal·lem en el nostre ordinador els programes: Run Time Enviroment de Java, versió 1.3 o posterior, Netdraw, així com disposar del Microsoft Access i Excel. Un cop instal·lats els programes de suport caldrà que exportem en un document format text, la base de dades procedent de l'ISI Web Of Knowledge que volem analitzar a través de Sitkis. Seguidament haurem de crear una ODBC (Open Data Base Connection) al nostre ordinador per tal d'establir la connexió entre l'ordinador i la base de dades. A continuació, ja podrem obrir Sitkis i amb l'opció "options-import" importar la nostre base de dades.

Figura 1. Funcionament gràfic de Sitkis

Figura 1. Funcionament gràfic de Sitkis

Sitkis permetrà executar mitjançant les diferents opcions que preveu el programa ("reference statistics, articles statistic, articles to reference, co-citation, cross citation, yearly reference statistic, keywords, institutes to articles, authors to articles & countries to articles") uns determinats arxius de text que exportats al Microsoft Excel, permeten visualitzar les taules resultat de l'anàlisi. Així mateix i mitjançant el programa NetDraw© es facilitarà la representació gràfica de les mesures d'anàlisi de nodes i xarxes.

Figura 2. Imatge del programa amb les diferents opcions que preveu

Figura 2. Imatge del programa amb les diferents opcions que preveu

Malgrat que l'eina pot ser criticada per les limitacions de què disposa , tal i com fem referència en l'apartat 4, cal ressenyar els principals avantatges que presenta:


3 Aplicacions disponibles

Sitkis ofereix una varietat àmplia d'opcions que permetran obtenir una "fotografia" de la mostra més rellevant de la bibliografia científica per l'investigador, sempre convenient pel fet de l'accelerat ritme del creixement d'informació i especialment en camps de coneixements multidisciplinaris (Börner; Chen; Boyack, 2003).

Entre les funcionalitats principals de Sitkis destacaríem la possibilitat de detectar el nombre de citacions que reben les referències de la nostra base de dades. Sitkis mitjançant l'opció "reference statistics", genera un arxiu que exportarem a Excel, d'un quadre representatiu dels principals autors, revistes i citacions d'un període determinat, tal i com podem veure en la taula 1.

Taula 1. Principals referències de la base de dades

Taula 1. Principals referències de la base de dades

De manera complementària, amb aquesta mateixa opció, podrem medir la productivitat en quantitat de publicacions realitzades que tenen els autors de la matèria en qüestió. Podem visualitzar aquesta informació en la Figura 2.

Figura 3. Principals autors referenciats segons nombre de publicacions

Figura 3. Principals autors referenciats segons nombre de publicacions

A través de les referències també podem obtenir mitjançant l'opció "yearly reference statistics", l'evolució al llarg dels anys de la publicació dels documents científics referenciats de la base de dades analitzada, tal i com podem observar en la Figura 3. En aquest cas Sitkis també generarà un document que haurem d'exportar a Excel.

Figura 4. Evolució per anys de la producció científica referenciada

Figura 4. Evolució per anys de la producció científica referenciada

Similar a l'obtenció de referències, Sitkis permet detectar els articles més citats de la nostre base de dades mitjançant l'opció "article statistics" que genera un document per exportar a Excel i que permet visualitzar l'impacte de cada un d'ells. Amb la mateixa opció podem determinar les revistes on publiquen els principals autors, tal i com mostra la figura 4.

Figura 5. Revistes més productives

Figura 5. Revistes més productives

Una anàlisi més exhaustiva mitjançant l'opció "articles to reference" permetrà generar un document per exportar al programa Netdraw els autors i les referències que citen en els seus articles, tal i com es representa en la figura 5. Això permet detectar els focus principals de discussió, així com les aportacions aïllades o no integrades en les principals línies de debat.

Figura 6. Relació entre els principals autors i les seves referències

Figura 6. Relació entre els principals autors i les seves referències

Finalment, podem realitzar una última anàlisi mitjançant l'opció "keyword relatedness", que, tal i com podem veure a la figura 7, permetrà decidir la conveniència de formular altres recerques de paraules clau que apareixen en la base de dades treballada i que complementarien la nostra anàlisi amb nous autors i referències.

Figura 7. Paraules clau

Figura 7. Paraules clau


4 Limitacions

Sitkis és un programari que treballa amb l'exportació de bases de dades procedents de l'ISI Web of Knownledge en aquest sentit i com alguns autors consideren, podria suposar un biaix, en relació a la bibliografia científica no disponible en anglès que haurà de ser analitzada de forma complementària per l'investigador. I, finalment, també destacaríem que una eina d'aquesta tipologia basa les seves anàlisis en les citacions que tenen els articles i/o textos de caràcter científic per part d'altres autors en posteriors articles o documents científics. En aquest sentit, les publicacions recents que incorpori la nostra base de dades, malgrat el seu interès potencial, no es podran veure reflectides en l'anàlisi, ja que no han tingut un temps suficient per poder ser citades per altres autors i, en aquest sentit, el seu nombre de cites no serà significatiu.


5 Altres programaris d'aplicacions bibliomètriques

Les anàlisis bibliomètriques a la pràctica s'han vist potenciats gràcies a la creació de diferents programes que faciliten aquesta tasca, essent molts d'ells gratuïts. Un dels primers va ser The Bibliometrics ToolBox de Terrence A. Brooks de l'University of Washington, una aplicació lliure que permet calcular un grup de mesures bibliomètriques a partir d'un fitxer d'entrada preparat per aquesta finalitat.

Bibexcel© creat per Olle Persson i el seu grup d'investigació Inforsk del Department of Sociology de Umeà University (Suècia) és una aplicació lliure dissenyada per al processament d'informació bibliogràfica, l'obtenció de freqüències, matrius de co-ocurrència i grafos (aquests últims requereixen un mòdul de systat i les matrius poden ser importades a SPSS© o qualssevol altre paquet estadístic). Bibexcel© està preparat per treballar directament amb fitxers que tinguin l'estructura de les bases de dades del Institute for Scientific Information© de Thomson Scientific és a dir els denominats com Citation Index (SCI, SSCI, A&HI), però també permet importar i convertir dades d'un altre format (USPTO, WinSpirs, Dialog, etc.). També aplicat a l'anàlisi de dades de les bases de Thomson ISI, Eugene Garfield ha desenvolupat HistCite un programari d'implementació d'historiografia algorítmica.

Altres aplicacions destacables són les desenvolupades pels investigadors francesos. És el cas de Dataview©, eina basada en els desenvolupaments anteriors de Datacode, Datalink i Datatrans. Leximappe©, Matheo-Patent© i Matheo-Analyzer©, creats per Centre Nationale de la Recherche Scientifique. També destaquem BibTechMon desenvolupat per l'Australian Research Centers, que facilita l'anàlisi de co-ocurrència de paraules i la seva representació en forma de mapes. També rellevant és l'aplicació desenvolupada per Chaomei Chen, denominada CiteSpace, que permet visualitzar tendències i patrons de la bibliografia científica. CiteSpace també en format lliure està desenvolupada en Java aspecte que permet que sigui treballat en qualsevol plataforma (sempre que es tingui instal•lat el Java Runtime Environment (JRE) 1.4 i Java Web Start. El professor Steven A. Morris ha desenvolupat DIVA, una aplicació per a l'anàlisi i visualització d'estructures i tendències en col•leccions de documents i patents. També per l'anàlisi de patents, Search Technology, Inc. ha desenvolupat, conjuntament amb les institucions Technology Policy and Assessment Center, Georgia Institute of Technology i Intelligent Information Services Corporation, un programari aplicat a la vigilància tecnològica i la mineria de dades.

Finalment, i a nivell espanyol, destaquem el programari Redes 2005 inclòs en el projecte CognoSfera desenvolupat per la Universidad de Granada que permet construir i visualitzar xarxes tecnocientífiques a partir de documents científics i tècnics. En el web CognoSfera es poden consultar i descarregar apunts i documents interessants, així com accedir al programari gratuït, caracteritzat per la seva facilitat d'ús i molt pedagògic per a anàlisis bibliomètriques.


6 Conclusions

Sitkis com a eina bibliomètrica es considera d'interès, especialment en les primeres fases d'investigació, en què esdevé clau centrar-se en els autors i en els articles més destacats de la disciplina d'estudi. Mitjançant aquesta eina podem utilitzar una metodologia que permeti determinar els principals autors per a la comunitat científica, quins d'aquests són de referència per a les investigacions actuals i les principals revistes on es publica.


Bibliografia

Börner, K.; Chen, C.; Boyack K.W. (2003) "Visualizing Knowledge Domains." Annual review of information science and technology, no. 37, p. 179-255.

Garfield, E., Sher, I.H.; Torpie, R.J. (1964). The use of citation data in writing the history of science. Philadelphia: Institute for Scientific Information.

Lyman P.; Varian, Hal R. (2000). "How much information?". Technical report, School of Information Management, UC Berkeley.

Pritchard, A. (1969). "Statistical bibliography or bibliometrics." Journal of Documentacion, no. 25, p. 348-369.

Schildt, H.A.& Mattsson J.T. (2006). "A dense network sub-gropuing algorithm for co-citation analysis and its implementation in the software tool Sitkis". Scientometrics, no. 67(1), p. 143-163.

Small, H. (1995). "Navigating the citation network". Proceedings of the Annual Meeting of the American Society for Information Science, no. 32, p. 118-126.


Data de recepció: 15/03/2012. Data d'acceptació: 26/04/2012.




Notes

1 Web of Knowledge és una plataforma en la que es poden consultar les dades de dades de la ISI Web of Science, el Current Contents Connect, el JCR, l'ISI Proceedings,l'ISI Essential Science Indicator, el Dervent Innovation Index, entre els més significatius.