Carles Sierra: "DeepSeek obre un camí en el qual Europa es podrà enganxar per generar models a un preu més raonable"
Director de l'Institut d'Investigació en Intel·ligència Artificial


Carles Sierra (Barcelona, 1963) és un investigador i científic català i un dels grans experts en intel·ligència artificial (IA) de casa nostra. És director de l'Institut d'Investigació en Intel·ligència Artificial i professor del CSIC i també professor adjunt de la Universitat de Tecnologia de Sydney (UTS). Sierra, que ja va firmar una carta amb centenars d'experts en IA que demanava frenar la cursa per la IA generativa d'aplicacions com ChatGPT, considera que "s'està corrent massa" i que cal calmar les aigües, però veu la irrupció de la xinesa DeepSeek com una oportunitat per democratitzar la IA. Amb tot, ho té clar: "Som en una bombolla".
Quina diria que és la situació de la IA ara mateix?
— Estem en una època convulsa perquè durant dècades els progressos han anat sent progressius, alguns han sorprès molt, però ara hi ha hagut una sorpresa generalitzada, sobretot pels bons resultats que aquests sistemes d'IA generativa han aconseguit. Són resultats bons, però porten implícits molts interrogants.
Com ara?
— A aquests models se'ls han atribuït una sèrie de propietats que no tenen. La gent ha cregut que aquests sistemes deien la veritat i no és cert. Intenten produir contingut que sigui creïble, però no necessàriament cert. Aquesta confusió ha creat falses expectatives sobre aquests models. D'altra banda, ha posat en evidència la feblesa de la protecció que ens ofereixen els governs, els estats, la feblesa de protegir el ciutadà del mal ús d'aquestes tecnologies. No estem prou protegits.
Vostè va ser un dels firmants, fa cosa de dos anys, amb centenars d'experts d'arreu del món, d'una carta que demanava aturar la cursa de la IA generativa. Creu que s'està corrent massa?
— Sí. Ha passat que hi ha una sèrie d'empreses nord-americanes que es van llançar a aquesta cursa perquè hi ha molts diners implicats. El primer és qui s'emporta el tros gros del pastís. OpenAI va llançar el ChatGPT sense tenir les salvaguardes necessàries a nivell de protecció, sense estar segurs que allò funcionaria de manera correcta. Per tant, s'ha obert una capsa de pandora amb l'ús d'aquests sistemes. El que es demanava en aquella carta era simple: "Escolteu abans de començar una cursa desenfrenada, reflexionem una mica i veiem quins límits posem a aquesta tecnologia". Les empreses, evidentment, no van ni immutar-se i la cosa va continuar.
Som en una bombolla?
— Sí, i tant. Les empreses nord-americanes han fet unes inversions tan enormes que ara, el retorn d'aquests diners per part dels inversors, es veu molt difícil, perquè estem parlant de molts diners; s'estan invertint uns 100.000 milions de dòlars a l'any en IA. Per tant, és una aposta molt forta dels inversors i que ha fet que aquestes empreses tinguin un valor en borsa absolutament desorbitat. Considero que això és una bombolla. Només cal veure què va passar a la borsa fa pocs dies. Les coses s'han calmat una mica a la borsa ara, els diners tenen molta por sempre. Hem de posar una mica de tranquil·litat.
S'està treballant l'ètica en la IA?
— No ha acabat de funcionar, però a Europa s'ha treballat la creació d'una llei sobre la intel·ligència artificial que posa límits en l'ús que se li dona en segons quines àrees. Per tant, els diuen, mira, en sanitat això es pot fer o això no es pot fer, i si es fa això ha de ser amb certes garanties, etcètera. En educació, el mateix. Aquesta és l'aproximació europea. L'aproximació nord-americana és la de no regular, la idea que el mercat es regula sol. És una visió diferent.
— A la Xina, en canvi, sempre s'ha parlat que és un règim de control del ciutadà i de no permetre llibertat. Sí que és cert que en aquest sistema [el DeepSeek] hi ha alguns elements de censura, perquè si li preguntes què va passar a la plaça Tiananmen et diu que no respon perquè és política, però si li demanes que es parli de la Xina, et diu que és un lloc meravellós. Els ciutadans hem d'estar informats.
Per tant, la gestió de regulació que s'està fent des d'Europa és bona?
— La gestió que està fent Europa és intentar protegir els ciutadans a còpia de regulacions, que han estat criticades per uns i agraïdes per molts, i això es fa en contraposició als Estats Units, on el que s'intenta aconseguir és la desregulació de la tecnologia per fer que les empreses guanyin encara més diners i que no estableixin cap mena de salvaguarda als usuaris de la tecnologia. Necessitem que les aigües es calmin una mica per veure clarament quins són els beneficis que ens pot donar la IA generativa, i quins són els riscos i els perills, i posar-hi una mica d'ordre.
Quines conseqüències pot tenir DeepSeek en l'avenç de la IA?
— A la Xina hi ha hagut una sèrie d'enginyers que, utilitzant una programació intel·ligent i molt creativa en aquests sistemes, han aconseguit obtenir resultats molt semblants als de les grans empreses nord-americanes amb molts menys recursos. També a l'hora de crear el model, perquè hi ha la part anomenada d'entrenament del model, que és quan dones una sèrie de dades i el model es construeix a còpia de moltíssimes hores de processament d'ordinador. Doncs han aconseguit estabilitat numèrica tot i utilitzar tècniques o operacions aritmètiques més petites que les que es fan servir en aquests models nord-americans competitius. I això els ha permès, de manera molt més eficient, molt més ràpida, aconseguir models que són tan o més acurats que els models nord-americans que han costat, diria jo, vint vegades menys pel que fa a diners i hores de processament o d'energia. Bàsicament, el que han fet servir és l'enginy per fer que els sistemes siguin més eficients.
Què implica que sigui un model obert?
— El xinès és un model open source, un model obert, però no és l'únic. Hi ha molts models oberts nord-americans: per exemple, n'hi ha un de conegut que es diu Llama. Però el xinès és un model obert que funciona igual de bé que els models comercials. Aquest és el punt clau. Un ChatGPT em demana 20 dòlars al mes perquè pugui fer una sèrie de consultes, però aquest me'l donen gratis i a més el puc descarregar al meu ordinador i assegurar-me que ningú tindrà accés a les meves dades. Això el ChatGPT no t'ho ofereix. Això també és un element molt interessant perquè la gent té por de ser controlada.
La tecnologia que ha fet servir DeepSeek, com que és un model obert, la poden adoptar d'altres?
— Sí, passa que ells el que han fet open source és el model. Han entrenat un model. Però el programa que genera el model no és obert, és el seu secret industrial. Això cap empresa ho està donant. Però farà la tecnologia més barata perquè generar un nou model els costa vint vegades menys que la que teníem fins ara.
Quina posició ocupa Europa en tot això?
— La veritat és que Europa no genera models de llenguatge del nivell dels nord-americans ni els xinesos. Aquí les coses són més lentes, sempre s'ha de passar per molts processos de decisió i mai hi ha prou diners per fer coses més especulatives. Potser no han tingut les idees que han tingut aquestes empreses xineses. No hem sabut enfocar-nos a veure què podíem fer amb un hardwaremés dolent, amb menys recursos... La qüestió és que aquí anem una mica endarrerits amb el tema de la generació d'aquests sistemes. Però crec que els xinesos amb DeepSeek obren un camí en el qual Europa es podrà enganxar per generar models a un preu més raonable. Penso que és una bona notícia en el sentit que hi haurà més competència entre les empreses i podrem tenir, també els acadèmics, accés a aquests models per fer uns altres tipus d'aplicacions.
Quines són les aplicacions que creu que avançaran més?
— La robòtica. La interacció robot-home en el futur estarà claríssimament intermediada per models de llenguatge com aquests que veiem. És un canvi radical que aquests models portaran a aquesta àrea. És la idea que una persona gran interactuï amb un robot que l'ajuda, que pugui tenir-hi una conversa. Això és molt més a prop gràcies a aquests models. També en les tecnologies de la llengua serà una altra aplicació important. La traducció, pràcticament en temps real, l'aconseguirem gràcies a aquestes eines. També en educació, en medicina, en totes les àrees que calguin resums de documents... Hi ha moltíssimes aplicacions que es poden fer.