datos

Comienza a abrirse paso una excepción legal para impulsar la minería de datos

Luis Fernando Ramos-Simón
Departamento de Biblioteconomía y Documentación
Universidad Complutense de Madrid
 

Study on the legal framework of text and data mining (TDM) (2014). Jeal Paul Triaille et alii. Estudio de la Consultora De Wolf & Partners para la Comisión Europea http://ec.europa.eu/internal_market/copyright/docs/studies/1403_study2_en.pdf. [Consulta: 12/07/2014]

Un estudio encargado por la Comisión Europea aborda el tratamiento legal de la minería automatizada de textos y datos y si es posible la aprobación generalizada de una excepción legal en el ámbito de la propiedad intelectual en las actividades de análisis de datos asegurando un equilibrio de los diferentes intereses implicados, tal excepción ya existe en algunos países como Japón. El estudio resulta interesante por la exhaustividad con la que analiza los datos y su vinculación con los derechos de autor, las bases de datos sui generis y otros aspectos legales, como la protección de datos, la seguridad o las medidas técnicas de protección. Hasta concluir con la presentación pormenorizada de los elementos que justifican esta nueva excepción.

Los autores prefieren la expresión análisis de datos, en lugar de minería de textos y datos, que se define como "el procesamiento automático de materiales digitales, los cuales pueden incluir textos, datos, sonidos, imágenes u otros elementos o una combinación de estos, con el fin de descubrir nuevo conocimiento o ideas estratégicas". Un aspecto interesante de este proceso, previo al tratamiento, es cómo acceder a los datos. Aquí los autores distinguen cuatro tipos: datos en libre acceso (datos para todos), datos de las redes sociales (de muchos para muchos), datos accesibles a través de contrato (de uno para muchos) y datos confidenciales (de uno a otro). También se analizan en este apartado los modelos de Acceso Abierto y Creative Commons como relevantes para el análisis de datos, así como las directivas europeas de reutilización de información del sector público que afectan a los datos originados por organismo públicos.

El camino incierto de la gestión de los datos

Alicia García-García
Universidad Católica de Valencia

Fernanda Peset
Universitat Politècnica de València
 

Council on Library and Information Resources (2013). Research Data Management: Principles, Practices, and Prospects. Washington, D.C.: CLIR. ISBN 978-1-932326-47-5 http://www.clir.org/pubs/reports/pub160/pub160.pdf

El Informe del Council on Library and Information Resources examina cómo los organismos de investigación y los profesionales de las bibliotecas y de ciencias de la información (LIS) pueden responder a los requerimientos de las agencias de financiación para la gestión de los datos de investigación (National Science Foundation-NSF y National Institutes of Health-NIH). Recoge seis interesantes estudios que pivotan sobre el proyecto DataRes, que se describe detalladamente en los dos primeros trabajos (Halbert, 2013 y Keralis, et al., 2013). El tercero (Crabtree, et al., 2013) es la Declaración de Denton, que resume los principios e intenciones que surgen de DataRes. El cuarto trabajo (Deards, 2013) proporciona un nuevo estado de la cuestión. El quinto (Jordan, et al., 2013) es una revisión de iniciativas y proyectos. El último (Jahnke y Asher, 2013) aborda los aspectos éticos desde una perspectiva cuasi filosófica, lo que confiere un interés especial a este trabajo.

Web semántico en bibliotecas: del material del que están hechos los sueños

Jesús Tramullas
Departamento de Ciencias de la Documentación

Universidad de Zaragoza
 

W3C Library Linked Data Incubator Group (2011). Draft report with transclusion. September 2011. W3C. <http://www.w3.org/2005/Incubator/lld/wiki/DraftReportWithTransclusion>. [Consulta: 14/09/2011].

"La teoría es cuando se sabe todo y nada funciona. La práctica es cuando todo funciona y nadie sabe por qué. En este caso hemos combinado la teoría y la práctica: nada funciona... y nadie sabe por qué." (Albert Einstein)

El web semántico, el paraíso soñado de Tim Berners-Lee, está tardando en llegar más de lo previsto. Las promesas del acceso a la información interrelacionada semántica y significativamente en tiempo real, mediante cualquier dispositivo, siguen siendo una meta anhelada. Lo cierto es que, tras veinte años de World Wide Web, y diez años después del escrito seminal de Berners-Lee, Hendler y Lassila en Scientific American, resulta sorprendente que las tecnologías semánticas no hayan alcanzado las expectativas previstas. En 1988, Berners-Lee y el W3C ya habían publicado un roadmap del web semántico (http://www.w3.org/DesignIssues/Semantic.html). Las herramientas software necesarias para crear y explotar conjuntos semánticos de información ya existen, tanto en productos comerciales, como en numerosas herramientas resultantes de proyectos de investigación. Se dispone de un amplio conjunto de lenguajes y esquemas de etiquetado de información, que permiten hacer interoperables grandes volúmenes de información... con todo esto disponible, en algún lugar debe encontrarse el motivo o motivos del retraso.

Páginas

Suscribirse a RSS - datos