Google Books Ngram Viewer

Els traductors i correctors sovint fem cerques a Google per esbrinar l’ús o la freqüència de determinats termes. El problema és que hem d’anar discriminant entre el que és «fiable» i el que no. Us presentem una nova eina que ens fa la cerca només en textos publicats:¹ es diu Google Books Ngram Viewer.

Com funciona?

1. Aneu al web de  Google Books Ngram Viewer i poseu la paraula o seqüència que us interessa cercar en el primer quadre (si voleu posar-hi diverses paraules, cal separar-les amb coma). En el nostre cas, hem cercat emprendimiento al corpus d’espanyol entre els anys 1800 i 2000.

 

2. Quan feu clic a la icona Search lots of books, us ensenya un gràfic on es veu molt clarament quin ha estat l’ús d’aquesta paraula, que ha estat inclosa a la 23a edició de la RAE.

3. Si feu clic en els valors d’anys, anireu a una cerca de Google amb les publicacions digitalitzades. Si hi feu clic, entrareu a la publicació i, marcat en groc, veureu el que us interessa.

I això no és tot, si dubteu entre dos termes, també podeu fer comparacions. Mireu-vos aquesta imatge:

Si voleu tenir en compte un rang de dades més ampli, podeu fer servir l’opció smoothing. Si hi poseu el valor 1 amb l’any 1950, voldrà dir que us farà una mitjana amb l’any que us interessa (1950), l’any anterior (1949) i l’any posterior (1951). Això es fa perquè sigui més fiable la mostra analitzada.

Un punt important: perquè un mot aparegui al gràfic ha de sortir almenys en quaranta llibres.

___________

1. Com ja sabeu, Google ha digitalitzat  un ingent nombre de publicacions (més de 12 milions de llibres, publicats entre el 1500 i el 2010) i que es poden consultar al Google Books. Dels llibres digitalitzats n’ha extret onze corpus diferents en alemany, anglès, espanyol, francès, hebreu, rus i xinès. I ara tot això està a la nostra disposició per fer-hi cerques gràcies a Google Books Ngram Viewer. Esperem que ben aviat aquesta base de dades també inclogui un corpus en català.

Deixa un comentari

L'adreça electrònica no es publicarà.