![]() |
Grup d'Investigació en Lingüística Computacional - Universitat de Barcelona |

Contenidos:
Historia,
Presentación,
Organización
Navegación
Desde su creación el GILCUB lleva a cabo investigación básica y aplicada hacia sistemas de procesamiento del lenguaje natural especialmente en traducción automática y en la mayoría de subáreas directamente relacionadas con ella: formalización de gramáticas computacionales, estudios contrastivos, lexicografía aplicada a herramientas informáticas, etc., además de otras actividades afines: semántica formal, desarrollo de gramáticas basadas en formalismos de unificación y experimentación e implementación de distintos formalismos gramaticales, con el objetivo de profundizar en la aplicación de conocimientos lingüísticos a sistemas informáticos:
Para hablar de las líneas de investigación en el GILCUB hemos de empezar hablando de Eurotra - el sistema de Traducción Automática de diseño avanzado- proyecto europeo en el que el grupo de investigación participó desde 1987 hasta su finalización en 1992. Este proyecto, a raíz del cual se creó el núcleo inicial del GILCUB, ha marcado la trayectoria y los objetivos científicos de nuestro grupo. Eurotra surgió en 1982 después de una serie de avances clave en la Lingüística Computacional que animaron a plantear un nuevo diseño lingüístico y de software:
La traducción no se trata, como pensaban algunos, de una substitución de palabras:
John was given a book by Mary
* Juan fue dado un libro por Maria
sino que toma relevancia la idea de llegar a una representación de la información que conlleva una expresión lingüística para poder cambiar su formulación dependiendo de la lengua de salida. Se trata pues de realizar un ANÁLISIS LINGÜÍSTICO y de definir un lenguaje de representación que permita "transferir" información de forma que, para lenguas tipológicamente similares, se pueda generalizar dejando como único proceso bilingüe la substitución léxica.
Así un programa de TA está basado en la elaboración de gramáticas (declaración de conocimiento lingüístico en relación a una lengua) y diccionarios con información pertinente. La tarea de la TA se centra entonces en desarrollar programas de análisis lingüístico para lo que es necesario:
Los resultados de este trabajo son:
Estos resultados se convierten en recursos potencialmente utilizables para cualquier aplicación de PLN. Así el planteamiento del trabajo en Eurotra y los recursos obtenidos han determinado parcialmente las líneas de investigación de nuestro grupo.
La importancia de la reutilización de recursos se hace patente en la comunidad con la creación del grupo EAGLES al que somos invitados a participar para la creación de estándares en la descripción lingüística.
Siguiendo esta línea de interés de la Comunidad en sus programas de I+D, participamos en el proyecto LSGRAM: recuperar información y expresarla en una nueva familia de formalismos, un nuevo prototipo de herramientas de software para el PLN. También hemos participado en el proyecto TRADE para recuperar las gramáticas de eurotra y con cambios mínimos pasarlo a un sistema más eficiente para conseguir un prototipo operativo industrializable junto con una industria española Centro de Cálculo de Sabadell. De estos contactos con la industria pudimos ver sus intereses y desarrollar otra línea estratégica de investigación aplicada y basada en la llamada "transferencia de tecnología". Así entramos junto también con CCS formulando un proyecto basado en Eurolang al Plan PEIN ,de ámbito español, para el desarrollo de un sistema de traducción a SQL. Este traductor centra el problema de la comunicación con bases de datos planteándolo no como un sistema experto donde se necesita conocimiento del mundo sino como un proceso de traducción de un lenguaje formal a un lenguaje natural. La información que ha de suministrar el usuario es exactamente la misma que debería utilizar en caso de utilizar el lenguaje estándar de interrogación a BD que es SQL pero sin tener que aprender el lenguaje en sí. También con esta idea base pero con una elaboración más sofisticada y con otras herramientas ha sido recientemente aprobado dentro de las Acciones PASO el proyecto INTERNAT.
Otra línea de carácter aplicado que empezamos hace unos años debido a la carencia de herramientas para el castellano fue el de herramientas para análisis de colecciones de textos de gran envergadura. Estas herramientas se utilizan sobre todo en editoriales para la creación de concordancias, diccionarios, etc. , en aplicaciones derivadas de herramientas de recuperación de la información. Son herramientas como: categorización automática: deducir la categoría morfosintáctica lematización automática: poder generalizar la aparición de determinadas palabras independientemente de su forma morfológica: cantaba, cantar, cantando ... elaboración de estadísticas. Nuestras herramientas están basadas en la minimización del diccionario al que tienen que acceder.
Dada esta línea de investigación decidimos participar en el proyecto MULTEXT que tiene como objetivos la creación de herramientas multilingües, y en la actualidad estamos participando en el proyecto LE-PAROLE que tiene como objetivo la creación de recursos léxicos en formato estándar.
El Grupo también colabora en la organización y realización del Programa de Doctorado "Inteligencia Artificial", de la Facultad de Informática de la Universidad Politécnica de Cataluña.
El Grupo de Investigación fue creado inicialmente por el Prof. Ramon Cerdà Massó para cubrir la participación española como Unidad de Investigación en el proyecto de traducción automática comunitario EUROTRA a raíz de la accesión de España como miembro de la Unión Europea el año 1986.
El Ministerio de educación encargó a nuestro director, Prof. Ramon Cerdà, y a la Dr. Montserrat Meya el establecimiento de un equipo de investigación que llevara a cabo el desarrollo de los módulos españoles para el proyecto. En 1986 el núcleo inicial del grupo investigador ya se había constituido y en Agosto de 1987 ya estaba plenamente integrado en las tareas y actividades de EUROTRA y Nuria Bel fue designada como Jefe de la Unidad de investigación. El grupo fue creciendo gradualmente a partir de esas fechas y en diciembre del mismo año se contituía otro grupo en la Universidad Autónoma de Madrid (UAM) bajo la responsabilidad del Prof. F. Marcos Marín. Desde agosto de 1987 hasta el final del proyecto en Diciembre de 1992, un total de 42
Nuestro grupo de investigación está dirigido por el Dr. Ramon Cerdà Massó, Catedrático de Lingüística de la Universidad de Barcelona y depende administrativamente de la Fundación Bosch Gimpera - Universidad de Barcelona . Esta institución fue creada en 1983 para estimular y facilitar las relaciones entre los grupos de trabajo de la Universidad de Barcelona y las empresas.

|
Investigación |
Recursos |
Demos |
Publicaciones |
Actividades |
Personal |
Dirección
