UB
gilcUB logo
Grup d'Investigació en Lingüística Computacional - Universitat de Barcelona
multext logo


Contenidos: Resumen, Resultados, Consorcio, Más información sobre Multext, Navegación

MULTEXT

(LRE62050, III Programa Marco de I+D de la CEE, Línea de investigación: Sistemas telemáticos de interés general, área 6: Investigación e ingeniería lingüística).

Resumen

El proyecto tiene dos objetivos principales. Primero, establecer estándares de software en el desarrollo de dos tipos de recursos para el trabajo con corpus. MULTEXT construirá herramientas de anotación y explotación de córpora de acuerdo con los estándares propuestos en coordinación con las recomendaciones de otras iniciativas como el Text Encoding Initiative (TEI) y el grupo EAGLES (European Advisory Group for Linguistic Engineering Standards). Gracias a una interficie de usuario común las herramientas se integrarán en un sistema de manipulación de corpus con todas las funcionalidades necesarias para la investigación académica e industrial. Segundo, MULTEXT comprobará y ampliará las convenciones basadas en el TEI con especificaciones especialmente dedicadas a corpus multilingües y a las necesidades de las herramientas para el procesamiento del lenguaje natural y la investigación en traducción automática basada en corpus. El proyecto tiene una duración prevista desde enero de 1994 hasta agosto de 1996 y el GILCUB tuvo una participación de 12,5 personas/mes. Esta participación se llevó a cabo en las siguientes áreas:

Resultados del Proyecto

El proyecto Multext ha desarrollado para el castellano los siguientes recursos:

Diccionario de 15000 lemas con información morfológica
Diccionario de formas completas con información morfosintáctica correspondiente a los 15000 lemas
Gramática morfológica de doble nivel para generación
Etiquetador estadístico
Corpus etiquetado y validado
Para acceder a la documentación:

Informe Etiquetador estadístico

Informe Generador morfológico

Informe Diccionarios

Consorcio

Más información sobre MULTEXT

Coordinador del Proyecto:

Dr. Jean Veronis
Head of Natural Language and Speech Processing Group
Laboratoire Parole et Langage, CNRS

e_mail:veronis@univ-aix.fr

Otros puntos de información: http:/www2.echo.lu/langeng/en/lre2/multext.html


HOME | Investigación | Recursos | Demos | Publicaciones | Actividades | Personal | Dirección

Comentaris: info@gilc.ub.es. Última actualització: 14 de maig de 1997.