dades

Comença a obrir-se pas a una excepció legal per impulsar la mineria de dades

Luis Fernando Ramos-Simón
Departamento de Biblioteconomía y Documentación
Universidad Complutense de Madrid
 

Study on the legal framework of text and data mining (TDM) (2014). Jeal Paul Triaille et alii. Estudio de la Consultora De Wolf & Partners para la Comisión Europea http://ec.europa.eu/internal_market/copyright/docs/studies/1403_study2_en.pdf. [Consulta: 12/07/2014]

Un estudi encarregat per la Comissió Europea aborda el tractament legal de la mineria automatitzada de textos i dades i si és possible l'aprovació generalitzada d'una excepció legal en l'àmbit de la propietat intel·lectual en les activitats d'anàlisi de dades assegurant un equilibri dels diferents interessos implicats, tal excepció ja existeix en alguns països com el Japó. L'estudi resulta interessant per l'exhaustivitat amb la que analitza les dades i la seva vinculació amb els drets d'autor, les bases de dades sui generis i altres aspectes legals, com la protecció de dades, la seguretat o les mesures tècniques de protecció. Fins a concloure amb la presentació detallada dels elements que justifiquen aquesta nova excepció.

Els autors prefereixen l'expressió anàlisi de dades, en lloc de mineria de textos i dades, que es defineix com "el processament automàtic de materials digitals, els quals poden incloure textos, dades, sons, imatges o altres elements o una combinació d'aquests, amb la finalitat de descobrir nou coneixement o idees estratègiques". Un aspecte interessant d'aquest procés, previ al tractament, és com accedir a les dades. Aquí els autors distingeixen quatre tipus: dades en lliure accés (dades per a tots), dades de les xarxes socials (de molts per a molts), dades accessibles a través de contracte (d'un per a molts) i dades confidencials (d'un a un altre). També s'analitzen en aquest apartat els models d'Accés Obert i Creative Commons com a rellevants per a l'anàlisi de dades, així com les directives europees de reutilització d'informació del sector públic que afecten les dades originades per organisme públics.

El camí incert de la gestió de dades

Alicia García-García
Universidad Católica de Valencia

Fernanda Peset
Universitat Politècnica de València
 

Council on Library and Information Resources (2013). Research Data Management: Principles, Practices, and Prospects. Washington, D.C.: CLIR. ISBN 978-1-932326-47-5 http://www.clir.org/pubs/reports/pub160/pub160.pdf

L'Informe del Council on Library and Information Resources examina com els organismes d'investigació i els professionals de les biblioteques i de ciències de la informació (LIS) poden respondre als requeriments de les agències de finançament per a la gestió de les dades de recerca (National Science Foundation - NSF i National Institutes of Health - NIH). Recull sis interessants estudis que pivoten sobre el projecte DataRes, que es descriu detalladament en els dos primers treballs (Halbert, 2013 i Keralis, et al., 2013). El tercer (Crabtree, et al., 2013) és la Declaració de Denton, que resumeix els principis i intencions que sorgeixen de DataRes. El quart treball (Deards, 2013) proporciona un nou estat de la qüestió. El cinquè (Jordan et al., 2013) és una revisió d'iniciatives i projectes. L'últim (Jahnke i Asher, 2013) aborda els aspectes ètics des d'una perspectiva quasi filosòfica, el que confereix un interès especial a aquest treball.

Interoperabilitat i dades enllaçades en l'entorn de les biblioteques

Jesús Gascón García
Departament de Biblioteconomia i Documentació
Universitat de Barcelona


Seminar Global Interoperability and Linked Data (2012: Florència, Itàlia). Global interoperability and linked data in libraries. Ed.: Mauro Guerrini; proceedings by Gianfranco Crupi and Ginevra Peruginelli. [Firenze]: Università di Firenze, Dipartimento SAGAS, Storia, Archeologia, Geografia, Arte e Spettacolo, 2013. Núm. especial de: JLIS.it: Italian journal of library and information science (vol. 4, n. 1). <http://leo.cilea.it/index.php/jlis/issue/current>. [Consulta: 22 juliol 2013].

Linked Data (Semantic Web) candies

Les dades, habitualment sobre recursos documentals, produïdes per les biblioteques constitueixen catàlegs però, malgrat que aquests són al web, es mantenen al marge de la web semàntica i habitualment són dades ignorades pels cercadors genèrics. És paradoxal que aquestes dades "bibliotecàries" són de gran qualitat i molt estructurades, tant en els registres bibliogràfics com en els d'autoritat, i, en canvi, no són aprofitades fora del seu àmbit. 

L'adopció de dades enllaçades als catàlegs, vinculades al web, poden facilitar la cerca i la recuperació de continguts, traient profit del control i la precisió característiques dels llenguatges i metallenguatges emprats en les eines bibliotecàries, dels vocabularis controlats i les ontologies. Igualment, els catàlegs poden integrar informacions i dades procedents d'altres entorns, per tal d'enriquir la informació que donen. D'altra banda, aquestes eines adquireixen una visibilitat i un ús que fins ara no han tingut, i per usuaris aliens a la comunitat bibliotecària. 

Estratègies per publicar informació bibliogràfica en Linked Open Data

Xavier Agenjo
Fundación Ignacio Larramendi


Subirats, Imma; Lei Zeng, Marcia (2012). LODE BD Recommendations 2.0: Report on how to select appropriate encoding strategies for producing Linked Open Data (LOD) - enabled bibliographical data. Roma: AIMS-FAO of the United Nations, 2012. Disponible a: <http://www.digitalmeetsculture.net/wp-content/uploads/2012/10/LODE-BD-2.pdf>. [Consulta: 20 març 2013].

Open Data Stickers

Per fortuna el nombre de conjunts de dades publicades en Linked Open Data va augmentant de forma notable, encara que no tant el nombre d'aplicacions capaces de gestionar-les amb tota la potencialitat que aquesta tecnologia suposa. De fet al proper congrés de l'IFLA que se celebra aquest any a Singapur, es durà a terme un Workshop titulat User Interaction Built on Library Linked Data (UILLD) i és que en efecte des que el 2008 la Biblioteca Nacional de Suècia va començar a publicar els seus fitxers d'autoritats i la seva informació bibliogràfica en Linked Open Data la tendència no ha fet més que créixer.

La publicació l'octubre de 2011 de l'Informe Final del W3C Library Linked Data Incubator Group va definir amb nitidesa les pràctiques i els objectius que havien de seguir les biblioteques (i els arxius i els museus) amb el propòsit de fer disponibles els seus conjunts de dades. No obstant això, aquest Informe Final no baixava al detall, ja que es tractava de recomanacions de caràcter genèric. Per això és tan important la publicació, ja en la seva versió 2.0, de les LODE-BD Recommendations preparada per l'Imma Subirats i per la Marcia Lei Zeng. Entre parèntesi cal assenyalar que la Marcia Llei Zeng va ser la traductora de l'Informe Final al xinès i que va participar en la redacció del mateix Informe Final. Aquesta traducció va aparèixer tot just uns dies després de la traducció espanyola.

Web semàntica a les biblioteques: del material que estan fets els somnis

Jesús Tramullas
Departamento de Ciencias de la Documentación

Universidad de Zaragoza
 

W3C Library Linked Data Incubator Group (2011). Draft report with transclusion. September 2011. W3C. <http://www.w3.org/2005/Incubator/lld/wiki/DraftReportWithTransclusion>. [Consulta: 14/09/2011].

"La teoria és quan se sap tot i res funciona. La pràctica és quan tot funciona i ningú sap per què. En aquest cas hem combinat la teoria i la pràctica: res funciona ... i ningú sap per què." (Albert Einstein)

La web semàntica, el paradís somiat de Tim Berners-Lee, està tardant en arribar més del previst. Les promeses de l'accés a la informació interrelacionada semàntica i significativament en temps real, mitjançant qualsevol dispositiu, segueixen sent una meta anhelada. La veritat és que, després de vint anys de World Wide Web, i deu anys després de l'escrit seminal de Berners-Lee, Hendler i Lassila en Scientific American, resulta sorprenent que les tecnologies semàntiques no hagin assolit les expectatives previstes. El 1988, Berners-Lee i el W3C ja havien publicat un roadmap de la web semàntica (http://www.w3.org/DesignIssues/Semantic.html). Les eines software necessàries per crear i explotar conjunts semàntics d'informació ja existeixen, tant en productes comercials, com en nombroses eines resultants de projectes de recerca. Es disposa d'un ampli conjunt de llenguatges i esquemes d'etiquetatge d'informació, que permeten fer interoperables grans volums d'informació ... amb tot això disponible, en algun lloc ha de trobar-se el motiu o motius del retard.

Pàgines

Subscriure a RSS - dades