Preservació d’eBooks, nou repte per a biblioteques i centres de documentació

Versió per a imprimirVersió per a imprimir
Lluís Vicente
Director de la Biblioteca i Arxiu històric
Ateneu Barcelonès

Amy Kirchhoff and Sheila Morrissey (2014). Preserving ebooks. Digital Preservation Coalition. Disponible a: http://dx.doi.org/10.7207/twr14-01 [Consulta: 13/07/2015]

L’ús d’eBooks i els serveis derivats per a biblioteques i centres de documentació ha estat un dels grans reptes del sector als darrers temps. Com accedeixen els usuaris, quina és la forma i condicions d’adquisició o quins han de ser els dispositius de lectura són qüestions treballades i tractades per professionals d’arreu del món. En aquest sentit, també s’han de tractar les qüestions relacionades amb la preservació digital, la qual ha de permetre l’accés i l’ús en el futur d’aquests nou tipus “d’artefacte llibre”. L’estudi Preserving eBooks d’Amy Kirchhof i Sheila Morrissey -dins del marc de l'anàlisi que fa la Digital Preservation Coalition en diversos camps- planteja quins són els principals problemes i models seguits en matèria de preservació digital de llibre electrònic. Els objectius de l’estudi són identificar els riscs generats i assegurar l’accessibilitat en el futur, tot treballant aspectes com la integritat, el context, la procedència i la identificació de les dades. En definitiva, com construir el patrimoni digital de biblioteques i centres de documentació.

En primer lloc, trobem les variacions del model de negoci aplicat per editorials o distribuïdores. A partir dels exemples exposats a l’estudi: no es ven un producte, sinó un servei, una llicència que dóna accés al producte. No hi ha una propietat, hi ha unes condicions d’accés i ús. En aquestes condicions no es recull generalment la garantia de preservació a repositoris coorporatius de la institució que adquireix eBooks. És un canvi, però no l’únic respecte del model analògic d’adquisició de llibres. Per exemple, la caducitat d’ús relacionada amb la superació d’un cert nombre de préstecs o la caducitat marcada per una temporalitat acordada... Si la llicència és efímera, no es pot garantir l’ús a llarg termini o preservar el seu contingut? Per donar resposta a aquesta qüestió, l’estudi ens parla del mercat que suposen les biblioteques universitàries o d’altres tipus de centres de recerca per al sector editorial. Com a model trobem les institucions de recerca nord-americanes, les quals han aconseguit eliminar o minimitzar l’efecte de la caducitat, fent valer aquesta força de compra. En el futur, les noves condicions haurien d’incloure acords favorables en preservació dels eBooks. A aquest fet, s’hi ha de sumar la preservació de llibres electrònics creats a plataformes d’autopublicació. 

En segon lloc, l’eBook compta amb una multiplicitat d’opcions d’enriquiment i actualització de continguts que dóna un dinamisme que pot arribar a dificultar la preservació del nou format. Per un costat, un llibre electrònic pot comptar amb incrustacions de continguts tipus vídeo o àudio i també enllaços a d’altres continguts a la xarxa. Com assegurar l’accés a aquesta informació, complementària o no, que es troba dins de l’objecte digital? L’editor té tots els drets sobre aquests continguts incrustats? Per l’altre costat, un editor o proveïdor pot actualitzar el contingut d’un llibre electrònic de manera regular. Quina versió és la que s’hauria de preservar? Com s’han de registrar aquestes actualitzacions? En ambdós casos, ens trobem amb el risc de la dificultat de garantir la integritat i l’estabilitat de la informació de cada exemplar i la pèrdua d’informació.  

Aquests no són els únics aspectes conflictius, n’hi ha més:

  • L’encriptació DRM dels eBooks, que serveix per a restringir l’ús i explotació de l’eBook, pot complicar futures migracions de format o recuperació de bits perduts en un futur- habitualment és tecnologia propietària i no ha de pertànyer a l’editor o distribuïdor.
  • Les normatives legals a diversos països poden no assegurar el dipòsit legal de la publicació electrònica. 
  • En menor mesura, el pas de l’analògic al digital. És a dir, la digitalització de llibres en domini públic, que si bé pot comportar menys dificultats, és una creació d’eBooks massiva i en alguns casos és compartida entre institucions públiques i empreses privades que no tenen entre els seus objectius la preservació digital (Google o Proquest).

L’estudi també parla de formats, metadades i sistemes reals de preservació d’eBooks. En referència als formats -estàndards de facto per l’adopció de la indústria-, trobem els que mantenen el contingut fix, copiant el model analògic. PDF n’és el màxim exponent i se’n desaconsella l’ús del format, ja que no hi ha validadors, tipus DROID o JHOVE, que l’analitzin totalment. També existeixen els formats que permeten canvis, aportant les opcions d’actualització comentades amb anterioritat. Són XHTML, XML i EPUB - es tracta del format proposat per l’International Digital Publishing Forum. Destaca el darrer, per la seva estructura i per ser de codi obert. Aquests formats facilitarien la futura preservació.

En referència a les metadades, hi ha dues alternatives. D’una banda, el MARC com a sistema ideal per a biblioteques i centres de documentació. De l’altra, l’ONIX, emprat per editors i proveïdors. La qualitat del primer no sempre és aplicada a la catalogació que fa la indústria, la qual es decanta pel segon, ja que inclou més metadades relacionades amb la distribució comercial de l’eBook. Dins dels aspectes lligats a les metadades, hi ha diverses alternatives per obtenir un identificador únic de l’objecte digital. El més estès és el DOI i com alternativa hi ha l’ISTC. El principal problema, en referència a l’identificador únic, són les diverses versions que pot tenir un llibre electrònic, i ambdós sistemes semblen solucionar-lo.

Com a casos que han de servir d’exemple per a la resta d’institucions destaquem:

  • La Biblioteca Nacional d’Holanda (KB) té un projecte de preservació de llibres electrònics centrat en la voluntarietat de la ingesta per part d’editors o proveïdors, els quals tenen tots els drets de les incrustacions del llibre, i a més aporten versions sense DRM. Els documents poden ser accessibles pels usuaris o poden estar embargats. Pel que fa a les metadades utilitza l’esquema METs, juntament amb Dublin Core i PREMIS i a més d’incorporar un indentificador únic propi, permet que l’editor-distribuïdor aporti l’ISBN i el DOI del llibre. Dins de l’àmbit de les biblioteques nacionals, també es parla del model de la Library of Congress, el qual es troba en una fase menys avançada que el sistema dels Països Baixos.
  • HaitiTrust és un consorci de diverses institucions de recerca i les seves biblioteques. Una de les missions és la preservació de tot tipus de continguts digitals, que es trobin entre la seva xarxa de consorciats i fora d’ella - incloent continguts que es trobin a Google, Microsoft o l’Internet Archive. El seu projecte de preservació utilitza MARC. El principal repte de HaitiTrust és donar accés a documents que en la seva majoria, fins a un 70% contenen drets d’autor.
  • El darrer cas ressenyat és el de Portico, plataforma de preservació d’ITHAKA. Un altre cop, es tracta d’una plataforma on els editors, de manera voluntària, poden ingestar els seus llibres. Demanen als editors que clarifiquin tots els drets dels continguts incrustats, eliminin les encriptacions dels DRM i mantenen  documents sense publicar. Només donen accés en cas que descatalogació de l’editor, que aquest no continuï amb la seva activitat o finalització d’un període d’embargament.

Finalment, entre les recomanacions realitzades per l’estudi ens trobem amb dues línies: una pels editors i proveïdors, i l’altra per les biblioteques o institucions de recerca o memòria que han de preservar aquest nou format de llibre. Els primers, han de tenir drets dels continguts incrustats, fer actualitzacions amb protocols que permetin a les biblioteques guardar les versions anteriors en repositoris que no donin accés públic- sempre que es consideri necessari-, utilitzar estàndards, tant pel que fa a formats, com pel que fa a les metadades. Els segons han d’arribar a acords d’adquisició de llicències que incloguin l’accessibilitat a llarg termini, l’eliminació de DRM i la participació d’editors i distribuïdors en les polítiques de preservació. També assumir l’eBook dins de les polítiques de preservació, treballar de manera consorciada amb altres centres similars. En resum, ens trobem davant de la important heterogeneïtat en formats, llicències, tecnologies, processos d’ingesta, l’única manera de fer sostenible el sistema és amb el compromís d’ambdues parts, ja que es podrà crear un sistema de preservació sostenible que permeti l’accés a aquest patrimoni nascut digital.