Entrevista a la Dra. Marta Recasens, lingüista i investigadora a Google

La Dra. Marta Recasens és investigadora a Google des del 2013. Anteriorment va ser investigadora postdoctoral a la Universitat de Stanford i membre del Stanford NLP Group. Va obtenir el doctorat en Lingüística a la Universitat de Barcelona l'any 2010 amb una tesi sobre la resolució de la coreferència.

La seva investigació se centra en aproximacions empíriques i aplicades a la semàntica i pragmàtica del llenguatge des de la Lingüística Computacional. Actualment treballa en millorar les representacions semàntiques utilitzades pels agents de diàleg.

Com definiria la seva activitat professional actual?

Fa sis anys que treballo a Google i les feines que he fet han anat variant al llarg d'aquests anys, adoptant un perfil de programadora o un perfil lingüista, aplicant les meves idees a un producte concret o centrant-me en la recerca, com també dedicant-me a aspectes de personal com són la coordinació i creixement d'un grup. Ser versàtil és molt apreciat. Les necessitats de l'empresa i dels productes canvien constantment i un s'ha d'adaptar i fer allò que es necessita segons el moment. Un projecte també passa per diferents etapes i no sempre estàs fent el mateix, cal ser flexible.

De quina manera la seva formació a la Universitat de Barcelona en l'àmbit de la Filologia Anglesa i la Lingüística li ha permès desenvolupar la seva ocupació actual?

Els anys d 'estudi a la UB em van ensenyar a tenir rigor lingüístic i sensibilitat pels aspect es lingüístics. Tothom sap parlar i escriure, però utilitzar el llenguatge diàriament no vol dir entendre com funciona el llenguatge i poder-hi treballar.

La carrera de Filologia, que barreja assignatures de literatura i lingüística, és desconeguda a la majoria d'altres països, que separen la literatura i la lingüística en dues carreres diferents. És veritat que són aspectes diferents (per bé que complementaris). Els cursos de literatura em van ensenyar a llegir i apreciar el llenguatge d'una manera especial. Tot i que la meva ocupació actual està més directament relacionada amb els estudis lingüístics que vaig fer, estic segura que la sensibilitat lingüística que tinc deu molt a les lectures literàries durant la meva formació.

Revisant la seva recerca s'observa un interès per la interdisciplinarietat entre àmbits com la lingüística, la informàtica, la ciència cognitiva, l'estadística o la filosofia. És aquesta perspectiva múltiple la base per fer avançar cada cop més la recerca?

Sí, definitivament. Per fer avançar una disciplina i ser innovador ajuda prendre perspectives noves. Si indaguem quina formació van tenir els principals innovadors d'un camp, en molts casos sorprèn descobrir que venien d'un camp diferent.

La coreferència va ser el tema principal de la seva tesi doctoral, en què consisteix?

La referència és la connexió entre la llengua i el món, com aconseguim que allò que diem i sentim s'entengui en relació amb el que ens envolta. Puc parlar de la universitat on vaig estudiar i la UB per referir-me al mateix, la Universitat de Barcelona. Donat un context concret on la UB ha estat mencionada en el context, un pronom com allà també em servirà per referir-me a la UB sense repetir el nom explícit. Es diu que aquestes expressions corefereixen.

Després d'anys de recerca i de formar part del Centre de Llenguatge i Computació (CLiC) va continuar els seus estudis postdoctorals a la Universitat d'Stanford. Què li va aportar tenir l'oportunitat de continuar els seus estudis a l'estranger i formar part del grup de recerca Stanford NLP?

Anar a fora és sempre una experiència molt enriquidora: t'exposa a entorns i maneres de fer diferents que t'eixamplen el teu repertori d'habilitats a la vegada que et permeten adoptar una actitud crítica d'allò que has tingut fins llavors. Sovint cal marxar per adonar-te dels aspectes positius i negatius del lloc d'on has marxat, que quan estàs immers a dins no veus. Si no t'exposes a res diferent, no tens res amb què comparar-ho.

En concret, jo vaig anar a parar a la Universitat d'Stanford, al centre de Silicon Valley, que en l'actual era tecnològica és com anar a parar a Florència durant el Renaixement. Internet i les aplicacions de mòbil han fet que tenir una idea i posar-la a la pràctica per veure quina rebuda té estigui fàcilment a l'abast de tothom qui pot programar un ordinador. En aquest entorn, Stanford és un motor d'idees i dona oportunitats a moltes start-ups de la zona. Només un percentatge petit acaba en una gran empresa com Google, però aquí no hi ha la idea de fracàs, només la idea d'intentar-ho i el camí fins a treure l'aplicació al mercat és una experiència enriquidora en si mateixa. Aquest és l'aire que es respira a Stanford: els investigadors no s'encaixonen en la dicotomia universitat-empresa, sinó que els dos aspectes conviuen lligats un a l'altre.

Des de l'any 2013 treballa com a investigadora a Google, quines són les seves principals línies de recerca?

El que sempre m'ha interessat són les aplicacions automàtiques del llenguatge natural que em permeten entendre millor com funciona aquesta facultat única de l'ésser humà. Quan tens un sistema capaç de processar milions de textos o de diàlegs, et posa a l'abast exemples de llengua reals i et fa veure la complexitat del llenguatge humà en acció. Amb els diferents projectes que he dut a terme a Google sempre he intentat utilitzar el meu coneixement del llenguatge per millorar els sistemes automàtics, analitzar exemples de llengua que són difícils d'analitzar pel sistema automàtic i pensant i experimentant de quina manera es poden millorar amb tècniques d'aprenentatge automàtic o combinades amb coneixement humà. He treballat en diferents productes però darrerament m'he centrat en l'assistent de Google, l'agent de diàleg que s'ofereix a través de telèfons Android, el Google Home que pots tenir a casa, televisions android, etc., que et permet utilitzar llenguatge natural per demanar-li que et realitzi una acció com posar un despertador o tocar una cançó.

Durant tots aquests anys ha format part de diversos projectes d'investigació realitzant un bon nombre de publicacions (més d'una trentena), participant en xerrades i en diverses iniciatives. Les seves línies de recerca no s'aturen mai?

Com més recerca fas, més preguntes se t'obren, és inacabable! Especialment, en el camp de la Lingüística Computacional encara queda molt camí per recórrer. Els ordinadors poden processar certs exemples de llengua amb èxit, d'una manera més o menys superficial, però encara tenen moltes dificultats per realment comprendre la llengua. Per fer una comparació, el camp de la visió artificial ha pogut avançar molt: donat un conjunt d'entrenament, un ordinador pot aprendre a distingir què hi ha a la imatge amb resultats molt positius. Ara bé, el llenguatge humà està ple d'ambigüitat i fa gran ús de coneixement del món i sentit comú, que són aspectes molt difícils d'adquirir per un ordinador, i difícils per un humà de modelar i sistematitzar.

Tot sovint costa donar visibilitat a l'impacte en la societat de la recerca acadèmica i professional. Considera que les seves investigacions són quelcom que es pugui traslladar a la societat en general? Quin impacte té en el nostre dia a dia?

Aquest és un dels avantatges de formar part d'una empresa com Google que crea productes que automàticament són utilitzats per milions de persones arreu del món. La meva recerca s'aplica a aquests productes i, per tant, puc veure un impacte immediat. Per exemple, l'assistent de Google que he mencionat abans. Si podem millorar i fer que els usuaris es comuniquin amb més facilitat amb l'assistent, això els impactarà directament. És un dels aspectes més gratificants de treballar a Google en comparació a treballar en un entorn acadèmic on molta de la recerca que es fa es queda en publicacions i mai arriba a tenir un efecte directe a la societat.

Des de la seva experiència, quines recomanacions donaria als alumnes de filologia que actualment estan valorant les seves perspectives professionals de futur?

Com deia abans, utilitzar el llenguatge no vol dir entendre com funciona i, en aquest sentit, són cada dia més les professions que s'han adonat que necessiten lingüistes als seus equips. Una recomanació és que adoptin una perspectiva oberta i àmplia de les ciències, és a dir, que no es tanquin en l'etiqueta de "jo soc de lletres i no vull saber res de números". El llenguatge s'observa en les seves instàncies d'ús, la qual cosa requereix recollir dades i quantificar-les, és computació o lingüística això? Tant se val. El teu objectiu últim pot ser demostrar una hipòtesi relacionada amb el llenguatge, però per arribar-hi pots necessitar utilitzar eines d'altres camps i adaptar-les al teu objectiu. En la meva experiència, els estudis més interessants acaben sent aquells que combinen una perspectiva quantitativa i qualitativa.

En aquest sentit, en quins àmbits creu que cal reforçar la seva formació?

Definitivament, en el tractament automàtic de dades. El poder que et dona que un ordinador pugui automàticament realitzar una acció per a tu, des d'un pur recompte a seguir una sèrie d'instruccions o automàticament aprendre de dades és immens. Avui en dia, les eines computacionals s'han convertit en un instrument bàsic de totes les carreres, com són llegir o escriure, i no parlo de saber utilitzar un processador de text, sinó de programar. No es tracta que tothom faci la carrera d'informàtica, sinó que els estudiants es formin amb la mentalitat i la pràctica requerides per programar de manera que puguin ajudar-se d'un ordinador per analitzar grans conjunts de dades. En tot allò que requereix inferència i raonament, els humans som excepcionals i els ordinadors ho són en tot procés que sigui repetitiu i requereixi grans quantitats de memòria.

Tenint en compte que ens trobem en un àmbit de recerca molt ampli, quins considera que seran les línies d'investigació futura? Cap a on evolucionaran els seus camps de recerca?

Més i més interdisciplinarietat. En el llenguatge hi intervenen molts factors, com la facultat cognitiva de l'ésser humà, la percepció del món a través dels sentits, el coneixement del món en general, etc. i, per tant, per comprendre millor com funciona el llenguatge, i que un ordinador pugui replicar un humà, ens cal ser encara més interdisciplinaris i combinar la investigació en percepció artificial i llenguatge, per exemple. Si el terme d' intel·ligència artificial torna a estar de moda és perquè un ordinador no pot entendre el llenguatge sense a la vegada ser capaç de percebre el món, realitzar una acció en el món i raonar. Tot està estretament lligat i cal que connectem tots els diferents camps si volem avançar en el camp de la intel·ligència artificial.