|
Departament Departament de Lingüística General Universitat de Barcelona
Llengua Català
Objectius Conèixer les aplicacions més característiques relacionades amb el processament del llenguatge natural. Presentar els aspectes essencials de les tècniques i mètodes més actuals de processament del llenguatge natural. Veure com s’estructura la informació lingüística en els diferents mòduls d’aquestes aplicacions i conèixer els recursos lingüístics bàsics associats a cadascun d’aquests mòduls. Estructura i continguts 1. Introducció: Les aplicacions en PLN 2. Tecnologies de la parla 2.1. Síntesi de la parla 2.2. Reconeixement de la parla 3. Extracció i Recuperació d’informació 3.1. Components bàsics dels sistemes de Recuperació d’Informació 3.2. Components bàsics dels sistemes d’Extracció d’Informació 3.3. Sistemes de Cerca de Respostes (CR) 3.3.1. Components d’un sistema de CR 3.3.2. Sistemes actuals: exemplificació 4. Traducció Automàtica (TA) 4.1. Components dels sistemes de TA 4.2. Tècniques per a la TA 4.3. Sistemes de traducció: exemplificació 5. Reconeixement i classificació d’entitats 5.1. Delimitació del concepte d’entitat 5.1.1. Entitats discursives, anàfora i correferència 5.2. Identificació de les entitats 5.3. Classificació de les entitats 5.4. Sistemes basats en regles vs. sistemes basats en aprenentatge automàtic 6. Paràfrasi. Identificació de relacions 6.1. Paràfrasi lèxica 6.2. Paràfrasi sintagmàtica 6.3. Paràfrasi discursiva
Metodologia Els curs s’organitza en 7 sessions presencials de 3h, bàsicament teòriques, en les quals es desenvoluparà cadascun dels temes proposats. En la primera sessió es farà una introducció general a les diferents aplicacions destacant, de manera especial, els mòduls en què s’organitzen, els recursos lingüístics que necessiten i les tècniques que utilitzen. En aquesta primera sessió també s’assignarà a cada alumne les lectures que hauran de presentar durant el curs.
A la resta de sessions, es combinarà la presentació per part del professor d’una nova aplicació amb l’exposició, per part de l’alumne, de les lectures especialitzades triades.
Avaluació L’alumne haurà d’exposar a classe com a mínim dos articles especialitzats sobre una de les diferents aplicacions que es presentaran al llarg del curs.
Bibliografia bàsica i enllaços web més importants Arévalo, M., M. Civit & M.A. Martí (2004) “MICE: a Module for Named-Entities Recognition and Classification”, in International Journal of Corpus Lingüistics, vol. 9 num. 1. John Benjamins, Amsterdam. Dale, R., H. Moisl & H. Somers (2000), Handbook of Natural Language Processing, New York, Marcel Dekker. Llisterri, J., C. Carbó, M. J. Machuca, C. de la Mota, M. Riera, A. Ríos, (2003) “El papel de la lingüística en el desarrollo de las tecnologías del habla”, in Casas Gómez, M. (Dir.) - Varo, C. (Ed.) VII Jornadas de Lingüística. Cádiz: Servicio de Publicaciones de la Universidad de Cádiz. pp. 137-191. http://liceu.uab.es/~joaquim/publicacions/ McEnery and Wilson (1997) Corpus Linguistics, Edinburgh University Press. Mitkov, R. (Ed.) (2003) The Oxford Handbook of Computational Linguistics, Oxford/Nova York, Oxford University Press. Peñas, A. (2004) Técnicas lingüísticas aplicadas a la búsqueda textual multilingüe: Ambigüedad, variación terminológica y multilingüismo, Colección de monografías: Sociedad Española para el Procesamiento del Lenguaje Natural , nº 4, Compobell, SL. Proceedings dels diferents certàmens MUC (Message Understanding Conference). Proceedings dels diferents certàmens TREC (Text Retrieval Conference). Slocum, J. (1988), Machine Translation Systems, Cambridge, Cambridge University Press. Van Einde, F. (1992) Linguistic Issues in Machine Translation. London: Pinter Publishers. Vicedo, J.L. (2003) Recuperación de información de alta precisión: los sistemas de búsqueda de respuestas, Colección de monografías: Sociedad Española para el Procesamiento del Lenguaje Natural , nº 2, Compobell, SL. Villarrubia, L., M.Á. Rodríguez, J. Relaño, F.J. Garijo, J. Bernat, L.A. Hernández, D. Tapias, L.A. María, (2003) “Tecnología del habla para aplicaciones multilingües, multiservicio y multiplataforma”, Comunicaciones de Telefónica I+D 30: 47-78. http://www.tid.es/documentos/revista_comunicaciones_i%2Bd/numero30.pdf Xin Li & D. Roth (1998) Learning Question Classifiers: The Role of Semantic Information: Cambridge University Press. |
|||||||||||||||||||||||||||||||||