Introducció a la lingüística computacional M.Taulé

               

 

Professorat

M. Taulé i Professorat UPF

 

Departament

Universitat de Barcelona i UPF

 

Llengua

Català

 

Objectius 

Conèixer els nivells bàsics de processament del llenguatge: morfològic, sintàctic i semàntic.

Conèixer les diferents aplicacions relacionades amb la lingüística computacional.

Veure com s’estructura la informació lingüística en els diferents mòduls d’aquestes aplicacions.

Presentar els aspectes essencials de les tècniques i mètodes de processament del llenguatge natural.

Justificar la necessitat d’una aproximació rigorosa i formal al llenguatge, per tal de poder-ne fer un tractament computacional.

 

Estructura i continguts

1.  Què és la Lingüística Computacional i quins són els seus objectius?

1.1. Disciplines entorn del PLN.

1.2. Breu visió històrica.

1.3. Mòduls estàndards en els sistemes de PLN.

1.4. L’ambigüitat del llenguatge natural i el concepte de subllenguatge.

2.  Tècniques associades a l’anàlisi del llenguatge.

2.1. Tècniques d’anàlisi morfològica.

   2.1.1. Anàlisi textual.

   2.1.2. Anàlisi morfològica.

   2.1.3. Desambiguació morfosintàctica.

2.2. Tècniques d’anàlisi sintàctica.

   2.2.1. Anàlisi superficial vs. anàlisi en profunditat.

    2.2.2. Tècniques d’anàlisi robusta.

3. Aplicacions de la Lingüística Computacional.

3.1. Edició de documents.

3.2. Traducció Automàtica.

3.3. Interfícies en llenguatge natural.

3.4. Extracció i Recuperació d’informació.

4. Lingüística de corpus.

4.1. Fonaments: la Lingüística de corpus.

4.1.1. Una mica d’història.

4.1.2. Què és un corpus?

4.1.3. Codificació i anotació del text.

      4.1.4. Aplicacions dels corpus.

Metodologia

Les sessions teòriques dels temes es combinaran amb la realització de diferents pràctiques relacionades amb la matèria que s’imparteixi en cada moment. En aquest sentit, la part teòrica es farà paral·lelament a la part més aplicada. Les classes pràctiques (50% del contingut del curs) es duran a terme a l’aula de PCs. Les classes teòriques (50% del contingut del curs) es complementaran amb unes lectures obligatòries sobre les quals es basarà l’examen final.

 

Avaluació

L’avaluació de l’assignatura, consistirà en la realització d’un examen final (60% de la nota final), un examen pràctic (25% de la nota final) i en el lliurament d’un treball pràctic d’anàlisi morfològica (15% de la nota final) que es realitzarà al llarg del curs a classe.

Per tal de superar l’assignatura serà necessària la realització dels exercicis pràctics proposats i, evidentment, aprovar l’examen final i pràctic.

 

Bibliografia

Bibliografia bàsica

Civit, M., (2003) Criterios de etiquetación y desambiguación morfosintática de corpus en español, SEPLN.

Martí M. A. (coord.) (2000) Les tecnologies del llenguatge, Edicions de la Universitat Oberta de Catalunya, EDIUOC, pàg. 1- 272 (Hi col·laboren: H. Rodríguez, A.. Badia,  F. Verdejo, J.A. Alonso, J. Gonzalo, J. Gómez,  J. Campàs, J. Rafel, J. Solé.

Martí M. A. i I. Castellón (2001)  Lingüística Computacional, pàg.: 1-160. Barcelona, Edicions UB.

 

Bibliografia complementària

Badia, T.  (2000) Tècniques de processament del llenguatge, a Martí (ed.) Llengua catalana IV, Barcelona, Edicions UOC.

Butler, Ch. S. (ed.) (1992) Computers and Written Texts, Blackell.

Dale, R., Moisl, H., Somers, H. (Eds.) (2000) Handbook of Natural Language Processing, Nova York, Marcel Dekker.

Grishman, R. (1994), Computational Linguistics. An Introduction , Cambridge, Cambridge University Press. Trad. Castellana: Introducción a la lingüística computacional, Madrid, Visor.

Martí, M.A. i J. Llisterri (2002) Tratamiento del Lenguaje Natural, pàgs. 1-206. Edicions de la Universitat de Barcelona i la Fundación Duques de Soria.

McEnery and Wilson (1997) Corpus Linguistics, Edinburgh University Press.

Mitkov, R. (Ed.) (2003) The Oxford Handbook of Computational Linguistics, Oxford/Nova York, Oxford University Press.

Rodríguez et. al (2001) Mètodes robustos per a l'anàlisi del llenguatge, a Martí (ed.) Lingüística Computacional, Barcelona, Edicions UOC.