|
|
Acceso a una muestra
del diccionario:
|
En este proyecto de
investigación, que
continúa
una línea ya iniciada en trabajos anteriores (PB95-0275,
PB98-1223
y BFF2002-00898),
partimos de la hipótesis
de que muchas de las posteriores innovaciones del castellano
renacentista
fueron inicialmente introducidas en la Corona de Aragón donde,
como
consecuencia de los contactos políticos y culturales con Italia,
se produjo una temprana adopción de los modelos
lingüísticos
del naciente Humanismo.
En anteriores investigaciones (PB91-0063 "El castellano
en los documentos de la Cancillería Catalano-Aragonesa del siglo
XV") analizamos en qué medida la generalización de unos
usos
lingüísticos cancillerescos aragoneses, adaptados al
castellano
ya desde principios del siglo XV, contribuyó decisivamente a la
configuración de un lenguaje político castellano,
claramente
diferenciado del que había sido propio del periodo medieval.
Los estimulantes resultados del primer proyecto nos
sugirieron
la conveniencia de ampliar considerablemente nuestro ámbito de
estudio.
Por ello, en un segundo proyecto (PB95-0275
"Corpus
léxico
del castellano del siglo XV en la Corona de
Aragón")
procedimos a introducir en nuestra base de datos un extenso corpus de
textos
de registros diversos —algunos de ellos ya editados, pero no analizados
lingüísticamente, y otros todavía inéditos—
que
por la variedad de registros a que pertenece nos permitiera extraer
conclusiones
de más largo alcance.
A continuación, elaboramos un programa que
permitía
la lematización automática de los términos.
Partimos
para ello de tres criterios: por una parte, un repertorio de los
términos
de mayor frecuencia de aparición -elementos gramaticales y un
número
relativamente reducido de elementos léxicos-; por otra, una
identificación
de las unidades lingüísticas a partir de sus
características
formales (flexivas y derivativas); y, finalmente, una
diferenciación
de posibles casos de homonimia a partir de los respectivos contextos de
aparición.
Con los textos
ya
lematizados
emprendemos ahora una nueva etapa en la que procedemos a la
identificación
de los valores semánticos y funcionales de cada una de las
ocurrencias
de los términos. Y finalmente, procederemos a la
confección
de una nueva base en que los vocablos aparezcan agrupados a partir del
lema común y con especificación de su etimología.
Las distintas bases están interrelacionadas, de manera que las
búsquedas
puedan realizarse a partir de criterios distintos (listados por
frecuencias,
listados de los contextos de un determinado vocablo, listados de
familias
léxicas).
El hecho de presentar los términos
lematizados
y con el significado y la información sintáctica y
etimológica
correspondientes supone una importante novedad respecto de los
repertorios
léxicos existentes de este periodo tan importante de la historia
de la lengua española.
Los recientes avances en transferencia de datos nos
permitirán
ofrecer a la comunidad investigadora una importante herramienta de
trabajo,
de difícil difusión a través de los soportes
tradicionales.