|
Grup de Recerca per a l'Estudi del Repertori Lingüístic (GRERLI) |
![]() |
Català - English
| índex | presentació | membres | projectes | publicacions | tesis doctorals | activitats | corpus |
| < Corpus Spencer > |
| < Corpus CesCa > |
El corpus Spencer és constituït per quatre subcorpus:
castellà L1. Textos obtinguts a Còrdova (entorn monolingüe) i Barcelona (entorn bilingüe). Projecte Spencer: Developing Literacy in different contexts and in different languages
català L1 . Textos obtinguts a Barcelona. Projectes Procesamiento y organización discursiva de textos expositivos orales y escritos (ref.: 1999-RED-5020-2A) i Recursos lingüísticos de despersonalización: perspectivas translingüística, evolutiva y didáctica (ref : BSO2000-0676 )
castellà L2 . Textos recollits a Múrcia i Madrid de subjectes d'origen àrab, xinès i coreà. Projecte El desarrollo del repertorio lingüístico en hablantes no nativos de castellano y catalán (ref : SEJ2006-11083 )
català L2 . Textos recollits a l'àrea metropolitana de Barcelona, de subjectes d'origen àrab, xinès i coreà. Projecte El desarrollo del repertorio lingüístico en hablantes no nativos de castellano y catalán (ref : SEJ2006-11083 )
El conjunt d'aquests quatre subcorpus é format per mostres d'ús de parlants natius i no natius de castellà i català, en dos registres ( narratiu i expositiu ) i dues modalitats diferents ( oral i escrita ), a partir de les mateixes condicions de producció ( Berman i Verhoeven , 2002; Aparici, Argerich , Perera, Rosado i Tolchinsky ( eds .), 2000; Tolchinsky i Rosado, 2005).
Quant a les característiques dels subjectes, es tracta de 4 grups, en funció de l'edat o nivell de formació lingüística dels informants: 9 anys (4t curs de Primària), 12 anys (2n curs d'ESO), 16 anys (2n curs de Batxillerat) i adults (estudiants universitaris).
Els subcorpus de parlants natius (espanyol L1 i català L1) inclouen les produccions de 20 subjectes per grup d'edat (prop de 800 textos en total) i els subcorpus de parlants no natius inclouen les produccions d'una mitjana de 10 subjectes per grup (en total, uns 450 textos).
El Català Escolar Escrit a Catalunya
La finalitat del projecte CesCa ha estat proporcionar a la comunitat educativa una eina fonamental per conèixer els usos lingüístics del seu alumnat: un corpus de referència del català escrit escolar a Catalunya amb les dades derivades que s'obtindran a partir del seu procesament.
S'han recollit i processat 2.426 textos, produts per nens i nenes des del darrer curs d'educació infantil (P5) fins al darrer curs d'educació obligatòria (4t d'ESO), de 31 centres educatius de diferents comarques de Catalunya.
El corpus conté el lèxic produït per a cinc camps lèxics:
- noms d'aliments
- peces de roba
- fenòmens de la natura
- activitats de lleure
- trets de personalitat.
S'hi pot trobar informació organitzada sobre:
- freqüència d'ús de paraules: formes i lemes
- relacions entre formes i lemes
- distribució de lemes pel nivell escolar, pel temps que fa que els informants parlen català i per la llengua materna.