Projecte AINA

"Si ens acostumem a parlar castellà amb la rentadora costarà molt de canviar"

26.000 voluntaris catalans ja han ofert la seva veu al projecte AINA, que rep una injecció de tres milions a l'any

María Teresa Echalecu, una senyora de 89 anyos, amb un robot assistencial facilitat per l'Ajuntament de Barcelona
30/12/2022
4 min

Barcelona"Estem en un moment tan disruptiu, tan bèstia, que si el català no hi és present ens acostumarem a parlar castellà amb les màquines", diu Marta Villegas, colíder de la Unitat de Mineria de Textos del Barcelona Supercomputing Center (BSC). En un futur pròxim, totes les interaccions que ara fem amb números i formularis (premi 1, premi 2) les farem sense pantalles ni teclats, només amb la veu. Això facilitarà la usabilitat de les màquines, i encara més per a la gent gran o les persones amb diversitat funcional. Però a una llengua mitjana com la catalana, que batalla constantment contra els algoritmes de les grans plataformes com Google o Twitch, la posa davant un nou repte: ¿podrem fer que les màquines parlin català?

Inscriu-te a la newsletter Llengua En català i sense complexos
Inscriu-t’hi

El Govern ha anunciat recentment una injecció de 12 milions d'euros per als pròxims 4 anys per continuar el projecte AINA, que ha impulsat en aliança amb el BSC. El mes passat, el consell de ministres també va anunciar una ajuda de 3 milions més al BSC: dos per al projecte AINA i un per coordinar les llengües oficials de l'Estat excepte el castellà. Tot i aquest nom humà, l'AINA no és un assistent de veu com la Siri ni l'Alexa, és la infraestructura lingüística que ha de facilitar la inclusió del català en les aplicacions d'intel·ligència artificial (IA) i, d'aquí, al navegador del cotxe, al caixer o a la Siri. És més aviat com el diccionari català per a les tecnologies del llenguatge. "Estem en un moment fantàstic. I tant que les màquines parlaran català –diu, taxativa, Villegas–, però només si som capaços de proveir un gran volum de dades. Si ens acostumem a parlar castellà amb la rentadora costarà molt de canviar". La diglòssia digital és un dels perills si el català perd el tren tecnològic.

Com s'entrenen les màquines?

La tecnologia de la veu, que és un dels àmbits de la IA amb més potencial i complexitat, ara treballa amb el deep learning. Són sistemes de xarxes neuronals profundes que tenen una capacitat de còmput brutal i, en el fons, el que fan és senzillament aprendre com es combinen les paraules per poder predir cadenes de paraules. L'avantatge és que és un sistema que, tot i ser creat en anglès per les grans tecnològiques, val per a totes les llengües, tant hi fa l'alemany com el català (i, de fet, aquest 2022 el dataset Massive, que és el que fa servir l'Alexa d'Amazon, ja inclou el català entre els 50 idiomes en els quals es poden desenvolupar aplicacions). El desavantatge del deep learning és que necessita nodrir-se de moltes dades. La intel·ligència artificial funciona com la dels humans, amb immersió lingüística: hores i hores de textos i veus. Però han de ser dades estructurades, no s'hi val tot. Fent un paral·lelisme, seria com tenir dades endreçades en un Excel i no escrites en un Word.

Les tecnologies de la veu tindran aplicacions molt presentens en el dia a dia

"L'estratègia és que tinguem prou dades en català perquè els grans models l'incloguin de sortida i perquè els que es facin ad hoc per a una aplicació en concret, per exemple el servei d'atenció ciutadana de l'Ajuntament, ho pugui fer una empresa local", diu Villegas. "Les grans tecnològiques no tenen problema en incloure més llengües, però faran l'esforç per al castellà o el francès perquè el mercat és suficient, no per al català", afegeix. Aquest esforç és AINA, el peatge per ser competitius empresarialment i tenir els serveis d'una llengua global. "Elimina les excuses de qualsevol empresa per poder treballar en català", afirma a l'ARA Gina Tost, secretària de Polítiques Digitals de la Generalitat. "Ho aconseguirem en aquesta etapa fins al 2026", garanteix Josep M. Martorell, director associat del BSC.

Un exèrcit de veus

El principal objectiu d'AINA és sistematitzar un bon cabal constant de dades estructurades en català. En text se n'han aconseguit 35 gigues xuclant dades de fonts oficials com la CCMA, l'ACN, el DOGC i el Parlament, però en calen més (en anglès, funcionen amb un cabal de 850 gigues) i de més dominis (biomèdic, legal, cultural...). En veu, s'han enregistrat a la plataforma Common Voice 2.700 hores gràcies a 30.000 voluntaris de la campanya que es va engegar fa un any. Però ara cal validar-les. Cal un exèrcit de validadors de 2.400 frases al dia. També cal tenir més veus per garantir que el català té totes les variants dialectals, veus de totes les edats, èpoques i procedències. "És important treballar l'impacte ètic de la intel·ligència artificial perquè els corpus que generem no tinguin biaixos de sexe, gènere o raça", apunta Martorell. "La tecnologia canviarà d'aquí un any, però les dades sempre seran necessàries, i és el que farà que una llengua estigui a primera divisió", diu Villegas.

Entre els prototips que AINA ha elaborat per provar les dades que processa hi ha un assistent virtual català i un xatbot de veu. L'objectiu també és servir de revulsiu per a la indústria i "encendre la guspira creativa", diu Tost, per això es tracta d'un sistema obert. "Demostrar que es pot fer tecnologia en català i que sigui un negoci. La indústria ja hi és, però a vegades no col·loca el català en la prioritat que voldríem", apunta. Justament des d'Empresa s'ha fet el primer estudi de les companyies que es dediquen al deep tech, i hi ha 291 start-ups que generen 1.700 llocs de treball altament qualificats, un 30% de les quals dedicades a intel·ligència artificial i robòtica.

stats