Grup de Recerca per a l'Estudi del Repertori Lingüístic (GRERLI)
Grup consolidat reconegut i finançat per la Generalitat de Catalunya (2005-2008)


Català - English

índex presentació membres projectes publicacions tesis doctorals activitats corpus

 

< Corpus Spencer >
< Corpus CesCa >

< Corpus Spencer >

El corpus Spencer és constituït per quatre subcorpus:

•  castellà L1. Textos obtinguts a Còrdova (entorn monolingüe) i Barcelona (entorn bilingüe). Projecte Spencer: Developing Literacy in different contexts and in different languages

•  català L1 . Textos obtinguts a Barcelona. Projectes Procesamiento y organización discursiva de textos expositivos orales y escritos (ref.: 1999-RED-5020-2A) i Recursos lingüísticos de despersonalización: perspectivas translingüística, evolutiva y didáctica (ref : BSO2000-0676 )

•  castellà L2 . Textos recollits a Múrcia i Madrid de subjectes d'origen àrab, xinès i coreà. Projecte El desarrollo del repertorio lingüístico en hablantes no nativos de castellano y catalán (ref : SEJ2006-11083 )

•  català L2 . Textos recollits a l'àrea metropolitana de Barcelona, de subjectes d'origen àrab, xinès i coreà. Projecte El desarrollo del repertorio lingüístico en hablantes no nativos de castellano y catalán (ref : SEJ2006-11083 )

El conjunt d'aquests quatre subcorpus é format per mostres d'ús de parlants natius i no natius de castellà i català, en dos registres ( narratiu i expositiu ) i dues modalitats diferents ( oral i escrita ), a partir de les mateixes condicions de producció ( Berman i Verhoeven , 2002; Aparici, Argerich , Perera, Rosado i Tolchinsky ( eds .), 2000; Tolchinsky i Rosado, 2005).

Quant a les característiques dels subjectes, es tracta de 4 grups, en funció de l'edat o nivell de formació lingüística dels informants: 9 anys (4t curs de Primària), 12 anys (2n curs d'ESO), 16 anys (2n curs de Batxillerat) i adults (estudiants universitaris).

Els subcorpus de parlants natius (espanyol L1 i català L1) inclouen les produccions de 20 subjectes per grup d'edat (prop de 800 textos en total) i els subcorpus de parlants no natius inclouen les produccions d'una mitjana de 10 subjectes per grup (en total, uns 450 textos).

                                                  [tornar]

<Corpus CesCa>

El Català Escolar Escrit a Catalunya

La finalitat del projecte CesCa ha estat proporcionar a la comunitat educativa una eina fonamental per conèixer els usos lingüístics del seu alumnat: un corpus de referència del català escrit escolar a Catalunya amb les dades derivades que s'obtindran a partir del seu procesament.

S'han recollit i processat 2.426 textos, produts per nens i nenes des del darrer curs d'educació infantil (P5) fins al darrer curs d'educació obligatòria (4t d'ESO), de 31 centres educatius de diferents comarques de Catalunya.

El corpus conté el lèxic produït per a cinc camps lèxics:

S'hi pot trobar informació organitzada sobre:

Accès al corpus CesCa