Descriptive Metadata for Web Archiving: un esquema de metadades d’OCLC per a la descripció de webs arxivades

Versió per a imprimirVersió per a imprimir

Andreu Sulé
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona


Dooley, Jackie; Bowers, Kate (2017). Descriptive Metadata for Web Archiving: recommendations of the OCLC Research Library Partnership Web Archiving Metadata Working Group. Dublin, Ohio: OCLC. 53 p. Disponible a: <https://www.oclc.org/research/publications/2018/oclcresearch-descriptive... [Consulta: 19/05/2018].


El control bibliogràfic universal ha estat, des de fa més de dos segles, un objectiu fonamental de la comunitat bibliotecària. Paul Otlet i Henri La Fontaine, a principi del segle XX, amb el seu Répertoire bibliographique universel, ja van voler descriure tota la documentació del món mitjançant fitxes mòbils. I si ja en el temps d’Otlet i La Fontaine aquest objectiu era difícil d’assolir, amb l’explosió de la producció documental a la segona meitat del segle XX la fita va esdevenir gairebé impossible. Després de la II Guerra Mundial el nombre de publicacions augmentà exponencialment i, a més, es presentà en formats molt diversos.

El cop de gràcia a aquesta cursa inassolible pel control bibliogràfic universal va ser l’aparició d’Internet, que amb les seves facilitats de publicació van posar a l’abast de qualsevol persona i institució la creació de continguts. A més, aquest nou contingut web té una de les característiques més pernicioses per al control bibliogràfic: la seva volatilitat. En efecte, si fins a llavors les publicacions, tot i el seu gran volum, eren materials relativament estables i de contingut inalterable, amb el web tot esdevé inestable. Es creen pàgines web algunes de les quals desapareixen en qüestió de setmanes o mesos, i la gran majoria actualitzen el seu contingut amb una freqüència tal que, parafrasejant Heràclit d'Efes, «un home no es pot banyar dos cops en la mateixa web».

La comunitat arxivística ha estat un altre dels sectors damnificats per aquest canvi en el volum i la naturalesa de la informació amb la irrupció del web. Tot i tenir un enfocament de la descripció diferent al de la comunitat bibliotecària (agrupacions de documents en lloc de recursos individuals; accent en el context més que no pas en la descripció; etc.), la variabilitat de les pàgines web ha dificultat la tasca per a l’elaboració de descripcions arxivístiques acurades.

Al llarg dels darrers anys, diversos han estat els intents d’elaborar uns criteris de representació dels continguts web que donessin resposta als reptes mencionats. Alguns han estat dissenyats dins d’un marc més ampli de descripció, com és el cas dels «recursos integrants» de Resource Description and Access, o Describing archives: a content standard en el context de l’arxivística, mentre que d’altres organitzacions, com el PADICAT, han aprofitat esquemes de metadades genèrics com Dublin Core per elaborar perfils d’aplicació específics per a la descripció de les pàgines web arxivades.

Ara, al 2018, és OCLC qui presenta la seva proposta d’esquema de metadades per a la descripció de webs arxivades, el Descriptive Metadata for Web Archiving. Es tracta d’una recomanació molt poc granulada, amb només 14 propietats, 8 de les quals són elements de Dublin Core Metadata Element Set.

Collector          Extent               Source of description
Contributor Genre/Form Subject
Creator             Language         Title
Date                 Relation            URL
Description      Rights      

Les autores de la proposta, Jackie Dooley i Kate Bowers, posen especial èmfasi en el fet que Descriptive Metadata for Web Archiving vol esdevenir «un pont entre els enfocaments bibliogràfics i arxivístics de la descripció» (p. 5). De fet, la proposta tracta de superar aquesta dualitat amb una metodologia d’elaboració plenament orientada a l’usuari, basada en l’informe Literature review of user needs, també d’OCLC. En aquest interessantíssim document, poc freqüent en projectes d’aquesta mena, s’analitzen les necessitats de dos tipus d’usuaris de metadades: els usuaris finals i els professionals de metadades. La revisió bibliogràfica conclou coses tan significatives com que per als usuaris finals és important disposar d’informació contextual de la procedència de les pàgines web arxivades, o com que per als professionals és força important trobar formes de combinar les normes bibliotecàries i les pràctiques arxivístiques.

Una altra idea forta de Descriptive Metadata for Web Archiving és la voluntat de ser un esquema compatible amb la resta d’esquemes ja existents, generalment més granulats. D’aquesta manera es pretén «millorar la compatibilitat i fomentar la consistència entre entorns de descobriment» (p. 16). En aquest sentit, la proposta d’OCLC sembla pretendre anar un pas més enllà de l’actual ús de Dublin Core Metadata Element Set com a «màxim comú divisor» de la interoperabilitat, tot agregant elements propis de la comunitat arxivística como el context de procedència i la descripció en l’àmbit de col·lecció.

Per finalitzar, destacar l’encert de dedicar bona part de la proposta als seus fonaments teòrics i metodològics. Gairebé un terç del total de les 53 pàgines que ocupa el document està dedicat a exposar i explicar els objectius, les pràctiques descriptives i els estàndards ja existents, els estudis previs fets per l’OCLC mateixa (el ja esmentat Literature review of user needs i Review of harvesting tools, una revisió d´eines de recol·lecció web), i un apartat molt interessant sobre diversos problemes sense resoldre encara que hauran de ser motiu de recerca en un futur.

Caldrà veure quin grau d’acceptació i d’implementació real tindrà Descriptive Metadata for Web Archiving, ja que la seva simplicitat pot ser, alhora, el seu punt fort i feble. Punt fort perquè dona una resposta mixta, escalable i econòmica a un problema compartit per biblioteques i arxius; punt feble perquè aquesta mateixa simplicitat pot fer la proposta poc atractiva per a institucions i serveis amb projectes de gran complexitat funcional.