Skip to main content
Transcriure àudio i vídeo a text amb Softcatalà

Transcriure àudio i vídeo a text amb Softcatalà

En l'actualitat, la tecnologia ha transformat la forma en què es duu a terme l'educació, oferint diverses eines per a millorar l'eficàcia de l'ensenyament i facilitar l'aprenentatge dels estudiants. Una d'aquestes eines són les eines de transcripció d'àudio i vídeo a text, que tenen la capacitat de convertir el contingut parlat en text escrit de manera precisa i ràpida.

Aquesta eina s'ha tornat cada vegada més popular en l'educació, ja que permet que els estudiants tinguin accés a una varietat de recursos que abans eren difícils de trobar o entendre. En aquest article educatiu, s'explicarà per què les eines de transcripció d'àudio i vídeo a text són tan útils en l'ensenyament, com poden millorar l'experiència d'aprenentatge i com poden ser utilitzades per a millorar l'ensenyament. En l'educació, aquestes eines són especialment útils per als estudiants que necessiten accedir a la informació en un format escrit o per a aquells que tenen dificultats auditives. També són útils per als professors, ja que poden utilitzar la transcripció com una eina per a crear subtítols en els seus materials didàctics, fer transcripcions de conferències i presentacions, i per a la creació de material didàctic accessible per a estudiants amb necessitats especials.

La transcripció d'àudio i vídeo a text es pot realitzar de manera manual, però això pot ser un procés tediós i propens a errors humans. Per aquesta raó, s'han desenvolupat eines especialitzades que permeten la transcripció automàtica i precisa d'arxius d'àudio i vídeo.

Existeixen diverses eines de transcripció disponibles en el mercat, algunes gratuïtes i altres de pagament. Aquestes eines utilitzen tecnologia de reconeixement de veu per a convertir el contingut parlat en text escrit. No obstant això, és important tenir en compte que la precisió de la transcripció depèn en gran manera de la qualitat de l'àudio o vídeo original i la claredat de la parla.

 

Softcatalà

El web de Softcatalà ens ofereix serveis de transcripció d'àudio i vídeo a text. Tal i com es cita a la seva pàgina: "això pot ser útil per a trasncriure gravacions, apunts o pòdcast a text o per crear subtítols per a vídeos".

Es pot realitzar la transcripció tant en línia com en local, al nostre ordinador.


En línia

La seva interfície és molt senzilla, ja que se'ns presentarà un bloc amb tres camps a omplir:

 

1. Model que voleu utilitzar: aquí podreu decidir quin model voleu que sigui el que faci la transcripció. Segons el web, la informació sobre aquests models és la següent:

"Aquest servei utilitza els models de reconeixement de la parla Whisper, creats i alliberats per l’empresa OpenAI. Considerem que són els models lliures de millor qualitat existents per al català, són resilients al soroll de fons i prediuen també la puntuació i majúscules.
A Softcatalà hem refinat aquests models Whisper, reentrenant-los amb corpus en català per tal de millorar encara més la qualitat de la transcripció en la nostra llengua. Al desplegable, podeu triar els models originals o els nostres.
A més, oferim diverses variants dels models: com més gran és el model, millor qualitat us donarà, però més temps trigarà a processar-se el fitxer".

Nosaltres recomanem el model mitjà de Softcatalà, ja que és la qualitat més alta.

 

2. Seleccioneu un fitxer d'àudio o vídeo: en aquest camp, haureu de pujar el vídeo o àudio que voleu transcriure. La mida màxima serà d'1GB i els formats admesos seran mp3, wav, ogg, flac, avi, mp4, mov i mkv.

 

3. Correu on voleu que us avisem: serà en l'adreça que poseu on s'enviarà un correu d'avís on se us donarà l'enllaç de la transcripció.

 

Un cop el sistema hagi acabat de fer la transcripció, rebrem un correu amb un text similar a aquest:

"Ja tenim el vostre fitxer XXXX transcrit amb el model XXXX. El podeu baixar des de: XXXX"

 

Si accediu a l'enllaç, trobareu la transcripció feta amb oTranscribe. Veureu com estarà dividida per minuts i podreu escoltar-la mentre la llegiu, així com també editar-la i descarregar-la.

 


En local

En cas que vulguem realitzar la transcripció al nostre ordinador, Softcatala recomana fer-ho amb l'eina Buzz. Serveix tant per Windows com per a macOS. 

1. Per descarregar el programa, accediu a aquest enllaç: https://github.com/chidiwilliams/buzz/releases/tag/v0.7.2 i seleccioneu l'opció que millor s'adapti a les vostres necessitats (les trobareu sota l'apartat "Assets". En el nostre cas, seleccionarem "Buzz-0.7.2-windows.exe".

 

2. Un cop descarregat el programa, instal·leu-lo al vostre ordinador seguint les passes que se us indicaran al quadre de diàleg d'instal·lació.

3. A continuació, executeu el programa. Per carregar un arxiu, feu clic a l'apartat "fitxer", ubicat a la cantonada esquerra superior de la pantalla:

4. Un cop carregat l'arxiu, s'obrirà un quadre de diàleg a través del qual podreu configurar el que el programa farà amb ell. Entre d'altres coses, podreu triar entre transcriure o traduir, així com també especificar l'idioma. Un cop configurat, feu clic a "executa".

 

5. El procés pot trigar una estona, depenent de la mida del fitxer:

 

6. Finalment, quan el procés hagi acabat, apareixerà el nom de l'arxiu al llistat del programa. Feu clic a sobre i s'obrirà una finestra emergent amb la transcripció o traducció, que podreu exportar tot fent clic a "exporta", ubicat a la cantonada inferior dreta de la pàgina.

 

 
Altres opcions de transcripció d'àudio al català

Softcatalà també ofereix altres eines per a la transcripció d'àudio al català. Es tracta d'opcions addicionals, que poden adaptar-se millor a les necessitats específiques dels usuaris, en cas que les anteriors no ho hagin fet. A continuació, us enganxem la informació tal i com figura a la seva pàgina:

  • oTranscribe+ del projecte Aina: S’executa en el navegador, permet transcripció en temps real i editar-la posteriorment.

  • dictation.io: Ofereix transcripció de dictats en temps real (usa Google Cloud) i requereix un navegador que usi el motor de Chrome.

  • Google Docs i Google Workspace: L’opció de dictat de veu requereix un navegador que usi el motor de Chrome.

  • transcribe de Wreally: Opció professional de pagament.

  • HappyScribe: Opció professional de pagament.

  • Servei STT al núvol de Google: El servei al núvol de pagament de Google que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.

  • Servei STT al núvol Azure de Microsoft: El servei al núvol de pagament de Microsoft que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.

  • Servei STT al núvol d’OpenAI: El servei al núvol de pagament d’OpenAI que permet a desenvolupadors integrar reconeixement de veu en les seves aplicacions.

 


Tal i com hem vist, la transcripció d'àudio a text s'ha convertit en una eina imprescindible en l'educació actual. L'accessibilitat de la informació és fonamental per a un aprenentatge inclusiu i eficaç, i la transcripció d'àudio a text ofereix precisament això. Els estudiants poden accedir a la informació en un format que els resulta més fàcil de comprendre i poden repassar el material al seu propi ritme. Els professors poden utilitzar la transcripció per a crear materials didàctics més accessibles i per a adaptar el seu ensenyament a les necessitats individuals dels estudiants.

A més, la transcripció d'àudio a text és una eina valuosa per a estudiants amb discapacitats auditives o que parlen un idioma diferent del de la classe. Permet que aquests estudiants participin plenament en la classe i se sentin inclosos en la comunitat escolar.

En resum, la transcripció d'àudio a text és una tecnologia en constant evolució que té el potencial de transformar l'educació. En proporcionar accés a la informació en un format més accessible i adaptable, aquesta eina pot ajudar els estudiants a tenir èxit en el seu aprenentatge i als professors a millorar el seu ensenyament. És important continuar explorant i desenvolupant aquesta eina perquè continuï sent útil i accessible per a tots els estudiants i educadors.

Sobre això

En aquest Portal del CRAI, trobaràs un recull d'eines i recursos TIC i TAC per ajudar als usuaris en el seu aprenentatge i la docència, així com píndoles formatives. Us podeu subscriure al Blog i estar sempre informats del que es vagi publicant.

Publicacions destacades

Contacte

La Unitat de Docència del CRAI gestiona i ofereix a la comunitat UB recursos d'informació i serveis útils per a la tasca docent.

  • Baldiri Reixac, 2 08028 Barcelona
  • +34934034731 / +34934034013
  • udcrai@ub.edu