corpus

ARCA, l’Arxiu de revistes catalanes antigues

L’Arxiu de revistes catalanes antigues (ARCA) és un portal impulsat per la Biblioteca de Catalunya que, juntament amb altres institucions que hi col·laboren, preserva digitalment i posa a l’abast del públic un gran nombre de revistes impreses des del 1761. D’aquesta manera, facilita la consulta de tot aquest corpus a qui li pugui interessar.  […]
torre circular de llibres

Corpus textual informatitzat de la llengua catalana (CTILC)

El Corpus textual informatitzat de la llengua catalana (CTILC) és el corpus de referència del català contemporani. Es tracta d’un corpus lematitzat de més de 52 milions d’ocurrències, procedents d’una gran varietat d’obres literàries i no literàries, referides a un període comprès entre el 1833 (data simbòlica d’inici de la Renaixença) fins pràcticament als nostres dies.  […]

Corpus textuals del castellà

Els corpus són conjunts extensos de textos de tipologia diversa, convenientment tractats, que poden ser consultats per obtenir informació lingüística.  La Reial Acadèmia de la Llengua Espanyola ofereix tres corpus que corresponen a textos de tres períodes diferents i de procedència geogràfica diversa: CORPES XXI, CREA i CORDE. CORPES XXI El Corpus del español del siglo XXI (CORPES XXI) conté més de 225 milions de paraules i 237.678 textos (escrits i orals), procedents de documents del 2001 ençà, a la darrera versió del 2016. […]
cica

Corpus informatitzat del català antic

El Corpus informatitzat del català antic (CICA) és un recurs força desconegut fora de l’àmbit acadèmic especialitzat, però molt útil per a la lingüística històrica. El projecte està dirigit per Joan Torruella (ICREA-UAB), Manuel Pérez Saldanya (UV-IEC) i Josep Martines (UA-IEC). Es tracta d’un corpus de textos escrits en llengua catalana que conté obres des del segle XI fins al segle XVIII. […]