corpus

ARCA, l’Arxiu de revistes catalanes antigues

L’Arxiu de revistes catalanes antigues (ARCA) és un portal impulsat per la Biblioteca de Catalunya que, juntament amb altres institucions que hi col·laboren, preserva digitalment i posa a l’abast del públic un gran nombre de revistes impreses des del 1761. D’aquesta manera, facilita la consulta de tot aquest corpus a qui li pugui interessar.  […]

Corpus textuals del castellà

Els corpus són conjunts extensos de textos de tipologia diversa, convenientment tractats, que poden ser consultats per obtenir informació lingüística.  La Reial Acadèmia de la Llengua Espanyola ofereix tres corpus que corresponen a textos de tres períodes diferents i de procedència geogràfica diversa: CORPES XXI, CREA i CORDE. CORPES XXI El Corpus del español del siglo XXI (CORPES XXI) conté més de 225 milions de paraules i 237.678 textos (escrits i orals), procedents de documents del 2001 ençà, a la darrera versió del 2016. […]
cica

Corpus informatitzat del català antic

El Corpus informatitzat del català antic (CICA) és un recurs força desconegut fora de l’àmbit acadèmic especialitzat, però molt útil per a la lingüística històrica. El projecte està dirigit per Joan Torruella (ICREA-UAB), Manuel Pérez Saldanya (UV-IEC) i Josep Martines (UA-IEC). Es tracta d’un corpus de textos escrits en llengua catalana que conté obres des del segle XI fins al segle XVIII. […]