Gallica i Google: polítiques de digitalització a França

Versió per a imprimirVersió per a imprimir
Lluís Agustí
Facultat de Biblioteconomia i Documentació
Universitat de Barcelona

 

La Bibliothèque nationale de France (BnF) ha estat capdavantera en els projectes de digitalització a Europa des que va presentar la seva primera versió de Gallica en 1997. La biblioteca digital francesa pretenia preservar i difondre a través d'Internet els fons patrimonials de la BnF en particular i de la cultura francesa en general. Però ben aviat va esdevenir alguna cosa més que una biblioteca digital, en certa manera representà i representa encara el gran projecte europeu alternatiu a la digitalització duta a terme per Google.

Aquesta alternativa s'estructurà i prengué forma a partir de la labor bibliogràfica i de selecció dels materials de Gallica, davant la digitalització massiva duta a terme per Google Books; per la vindicació de la "diversitat" de les altres cultures (i.e. la francesa), davant del monopoli anglòfon del cercador; i finalment per la defensa dels drets dels editors i els autors, davant de l'ús legalment dubtós de les obres sota drets vigents per part de Google.

Recordarem que aquesta reivindicació franco-europea davant Google va prendre forma definitiva quan l'antic director de la BnF, Jean-Noël Jeanneney, va publicar a Le Monde el 2005 "Quand Google défie l'Europe". França volia liderar un projecte francès i europeu que fes front a la voluntat totalitzadora del cercador americà.

Han passat alguns anys, molt de temps en termes d'Internet. Les coses han evolucionat: hi ha una experiència acumulada important quant als usos dels materials digitalitzats per part dels usuaris; Jeanneney no és al càrrec des de 2007; la BNF i d'altres biblioteques europees han arribat a acords puntuals amb Google; des de París la digitalització massiva no es veu amb mals ulls, fins i tot ja es planteja la digitalització exhaustiva de les obres arribades per via del Dipòsit Legal; els editors americans han començat a entendre's mínimament amb el gegant; el projecte Live Book Search, l'alternativa de Microsoft, Yahoo i d'altres enfront de Google Books ha deixat d'existir. I sobretot Google Books s'ha fet gran, molt gran, de fet "incontournable" .

Per reflexionar i veure cap a on s'havia d'anar, a finals de 2009, el ministre francès de la Cultura i de la Comunicació, Frédéric Miterrand, encarregava a un estudi sobre l'estat de la digitalització del patrimoni escrit. L'encàrrec el feia a un grup molt reduït d'especialistes de les biblioteques, els grups editorials i els mitjans de comunicació francesos, liderats per Marc Tessier.

Tessier és ben conegut en el món dels mitjans de comunicació i de la cultura a l'hexàgon. Format a l'École Nationale d'Adminstration (ENA) la prestigiosa escola responsable de la formació dels alts funcionaris que han de dirigir l'Estat francès, ha estat successivament inspector de finances de l'Estat, director del Centre national de la cinématographie (CNC), president de France Télévisions i actualment ho és d'un grup independent dedicat als estudis estratègics. Anteriorment, el 2007, el Ministeri de la Cultura ja havia encarregat Tessier de fer l'estudi La presse au défi du numérique sobre la situació de la premsa i els desafiaments amb que el sector s'enfrontava davant l'explosió de la tecnologia digital.

L'informe que ara pretenem resumir breument, el Rapport sur la numérisation du patrimoine écrit,va ser presentat al Ministre Miterrrand a principis de 2010 i ha de servir per a orientar la política de digitalització francesa a nivell estatal i europeu, i més especialment a definir les vies que han de permetre "renovar un diàleg equilibrat i exigent" entre els responsables del patrimoni cultural francès i Google. De fet aquesta és la gran pregunta i el motiu de l'encàrrec del Ministre: col·laborar o enfrontar-se a Google Books?, acceptar els fets consumats que semblen indicar que el cercador ha guanyat la cursa o esmolar Gallica i de pas Europeana tot pensant que encara no tot ha estat decidit?

El Rapport sur la numérisation du patrimoine écrit consta de tres parts i uns annexos:

1) Un resum del procés històric recent i l'estat actual de la digitalització en el marc internacional i a França, amb especial referència a Google Books i els problemes jurídics en relació als drets vigents dels autors i els editors sobre les obres digitalitzades; la manca d'una coordinació efectiva en polítiques de digitalització entre les institucions franceses i també europees; i, finalment, els dubtes quant a la definició de criteris de qualitat, tecnològics i d'estàndards. (pp.: 4-14)

2) Una revisió de les missions de conservació i accessibilitat de les biblioteques franceses contrastades amb els termes dels acords actuals amb Google. Segons l'anàlisi, els termes dels acords resulten inadequats per a la bona consecució d'ambdues missions. (pp.: 15-20)

3) Proposta d'acció per a la política digital nacional francesa basada en tres línees: a) renovació estratègica i tècnica de Gallica, entre d'altres canvis amb el pas de la digitalització selectiva a la massiva i l'accessibilitat de les digitalitzacions de Gallica a partir de cercadors; b) entaular noves relacions amb Google Books que passin per la possibilitat d'intercanvis de fitxers de digitalització i la supressió o modificació d'algunes de les clàusules, com ara són la d'exclusivitat, la durada temporal excessiva o la confidencialitat dels acords, actualment practicades pel cercador en les seves relacions amb les biblioteques; i c) impuls de les relacions de Gallica amb d'altres biblioteques franceses i sobretot amb el portal de consulta d'Europeana. (pp.: 21-37)

d) Clou l'informe la "Lettre de mission", això és els termes de l'encàrrec fet pel ministre Miterrand a Tessier; la llista de les persones contactades durant l'estudi (bibliotecaris, editors, professors universitaris, responsables jurídics de Google i Microsoft, responsables d'empreses, d'institucions culturals i associacions professionals i d'editors, etc.); una comparativa força interessant realitzada per Alban Cerisier on s'analitza a partir del concepte de digitalització massiva la pertinència i el rendiment de Gallica i Google Books; i finalment la llista de biblioteques europees que han arribat a acords de digitalització amb Google. (pp.: 38-64).

Alguns d'aquests punts del Rapport sur la numérisation...són interessants de ser analitzats una mica més de prop, per així millor entendre la posició francesa i l'opinió que sobre el projecte de Google Books hi ha des de l'hexàgon.

En primer lloc, l'experiència sobre l'evolució dels usos a Internet fa evident que els usuaris utilitzen de manera general els motors de cerca per a la localització de materials, privilegiant la immediatesa a la pertinència. Les digitalitzacions de qualitat de les biblioteques, com ara Gallica, queden fora de la llista dels resultats dels cercadors per raons tècniques conegudes. Cal rendir-se a l'evidència i fer accessibles els fons a través dels cercadors i canviar, si això ho fa necessari, l'organització i el sistema informàtic que suporta Gallica.

Cal tenir en compte però, que una de les clàusules imposades per Google Books impedeix les biblioteques de disposar de les digitalitzacions obtingudes dels seus fons lliurement, això és els seus textos plans en OCR no poden ser intercanviats amb d'altres institucions ni, i molt important, permetre que d'altres cercadors generals com Bing o Yahoo, les indexin i incorporin; d'aquesta manera les digitalitzacions són únicament recercables per Google.

Els acords que proposa Google són de més de 20 anys, el que sembla excessiu en termes d'Internet. Els fitxers que entrega Google Books a les biblioteques no són millorats a partir de la transferència, si hi hagut algun avenç tècnic, aquest no pervindrà a la biblioteca però sí beneficiarà la plataforma digital.

Segons l'informe, la confidencialitat dels acords no ha ajudat a aixecar els dubtes per part de les biblioteques sobre el balanç de costos i avantatges del partenariat amb Google Books. De fet, els termes de l'acord de Google amb l'única biblioteca francesa amb qui col·labora a gran escala, la Bibliothèque municipale de Lyon, no han estat fets públics i accessibles que a partir d'un procediment administratiu presentat a la Comissió francesa d'accés als documents administratius per part del redactor en cap de la revista Livres-Hebdo.

Uns dels aspectes més contestats a l'informe són les qüestions legals i en especial l'ús pròdig en benefici propi per part de Google Books de la noció del "fair use" amb els llibres subjectes a drets,això és la consulta pels "snippets", la previsualització d'unes línies del text digitalitzat.

També el procés d'apropiació econòmica per part del cercador dels anomenats "llibres orfes", aquells que no es poden localitzar els propietaris dels drets. El fet és vist com abusiu i resta pendent de decisió per part dels tribunals nord-americans; a Europa ha estat ja contestada aquesta pretensió. Alguns dels aspectes tècnics de la qualitat de la digitalització de Google també estan posats en dubte.

Tot plegat fa que, segons Tessier i el seu equip, els acords de col·laboració amb Google Books esdevinguin d'entrada sospitosos de monopolístics, abusius des del punt de vista del dret d'autors i tècnicament insuficients, i per tant cal posar-lo en quarantena i apunten una sèrie de pistes als responsables polítics sobre les accions que han de ser preses: a) el patrimoni escrit francès de Gallica ha de ser consultable des dels cercadors, com a via preferida pels internautes; b) Gallica, amb quasi un milió de documents digitalitzats, ha de fer imperativament un pas endavant cap a la digitalització massiva a partir d'acords amb d'altres biblioteques, els editors i la digitalització de tot el que arribi per DL; i, si cal, amb acords d'igual a igual amb Google, que compta ja amb més de 10 milions de llibres digitalitzats; c) cal fer evolucionar Europeana.

Per resumir, el Rapport sur la numérisation du patrimoine écrit informa de en quin estat es troba la digitalització del patrimoni a França i al món, suggereix què cal fer des de les institucions franceses i europees amb les relacions amb Google Books, i proposa els responsables culturals francesos de fer de Gallica la peça clau de l'organització de la digitalització francesa i francòfona, tot apuntant què és el que cal canviar de Gallica (potser fins i tot el nom i tota l'estructura tècnica i informàtica que la suporta). Tot plegat per tal que Gallica es converteixi en el pal de paller d'una Europeana millorada i pugui esdevenir així més competent, i per tant i sense cap timidesa ser un rival –o potser un col·laborador- de Google Books.

 Ra

pport sur la numérisation du patrimoine écrit Remis par Marc Tessier au Ministre de la culture et de la communication le 12 janvier 2010. 64 p.