Apertium: traducció automàtica lliure per al català (però no sols!)

Un tipus de programari que pot ser de gran utilitat a l’hora de produir textos en català (o valencià, que és com li diem a ma casa) és la traducció automàtica. Si el text està ja en una altra llengua (normalment l’espanyol), el podem traduir automàticament i corregir-ne el resultat (postedició) perquè siga un text adequat al propòsit previst. Quan la llengua de partida s’assembla molt al català, fer-ho així pot ser molt més eficient que traduir-lo des de zero.

Sortosament, hi ha molts programes que tradueixen de diverses llengües al català. Entre ells, l’Apertium destaca per diverses raons. Una molt important és que és programari lliure i de codi font obert: si voleu instal·lar-lo, vos el podeu descarregar lliurement; podeu passar-ne còpia a altra gent, i, si sabeu com fer-ho, podeu modificar-ne el codi font i distribuir-ne versions millorades. Una conseqüència d’açò és que el podeu usar en línia en molts llocs1 o instal·lar-vos-el en el vostre mòbil Android o en l’ordinador de taula,2 com a extensió d’algun entorn de traducció assistida com ara l’OmegaT, o integrat en Wikipedia.3

Una altra conseqüència interessant és que, si vos hi animeu, podeu aprendre una miqueta com està fet per dins, passar a formar part de la comunitat de l’Apertium4 i millorar-lo per a tothom. No cal que sapieu programar: només heu de perdre-li la por a usar GNU/Linux i a teclejar en la línia d’ordres, saber una miqueta d’XML, i alguna cosa més: hi ha un muntó de lingüistes en la comunitat de l’Apertium.

En l’actualitat, l’Apertium connecta el català a moltes llengües: l’espanyol, el portugués, el francés, l’aragonés, l’occità general i a l’aranés, a l’anglés i a l’esperanto. Les millors traduccions les produeix entre el català i l’espanyol, el parell de llengües que té les dades més completes. La majoria de les instal·lacions poden traduir documents de text pla (.txt) però també OOXML (.docx), ODF (.odt), RTF i HTML.

  1. Entre d’altres, la Universitat d’Alacant, la Universitat Politècnica de Catalunya, Prompsit o Softcatalà.
  2. Per exemple, teniu les aplicacions Apertium-Caffeine i Apertium Simpletin IU.
  3. Cal que entreu en el vostre usuari de la viquipèdia i a l’apartat Beta seleccioneu Traducció de contingut i podreu traduir (usant l’Apertium) articles de l’espanyol al català anant a Contribucions.
  4. Podeu començar subscrivint-vos a la llista de distribució i presentant-vos-hi, però també podeu entrar directament en el xat IRC del projecte.

Mikel L. Forcada
Catedràtic del Departament de Llenguatges i Sistemes Informàtics de la Universitat d’Alacant i cap de recerca de Prompsit Language Engineering, Elx

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *