Aquest robot sap pintar. Però és art?
Els investigadors de la Carnegie Mellon University han creat, gràcies a la intel·ligència artificial, un braç que sap fer una pintura acrílica abstracta. És art?
Fa pocs dies, sobre una taula del laboratori de Jean Oh a Squirrel Hill, un barri de Pittsburgh, un braç robòtic treballava concentrat en una tela. A poc a poc, com si l’aire fos viscós, va mullar el pinzell en la pintura gris clar de la paleta, es va girar, va aplicar l’estri a la tela i va deixar una marca de 2,5 centímetres de llarg enmig d’un grup de pinzellades. Aleshores va recular i es va quedar quiet, com si volgués valorar la feina feta.
Les pinzellades, la majoria de diferents tons de gris, recordaven una cosa abstracta: un formiguer, potser. La doctora Oh, cap del Robot Intelligence Group de la Carnegie Mellon University, s’ho mirava amb aire d’aprovació, vestida amb una dessuadora que deia “Entre nosaltres hi ha artistes”. El doctorand Peter Schaldenbrand era al seu costat.
Simulació i realitat
Les investigacions de la doctora Oh, que inclouen la visió robòtica i temes relacionats amb l’aviació autònoma, sovint tenen a veure amb l’anomenada bretxa entre simulació i realitat: com actuen en el món real les màquines entrenades en un entorn simulat. Aquests últims anys Peter Schaldenbrand ha dirigit una iniciativa per superar aquesta bretxa entre els sofisticats programes de generació d’imatges, com Stable Diffusion, i les obres d’art físiques, com dibuixos i pintures. Ho hem pogut veure sobretot en el projecte denominat FRIDA, l’última iteració del qual brunzia rítmicament en un racó del laboratori. (FRIDA és l’acrònim de Framework and Robotics Initiative for Developing Arts, tot i que els investigadors van triar l’acrònim inspirant-se en Frida Kahlo abans de decidir què significaven les lletres).
El procés de passar de les indicacions en forma de text a les imatges pixelades i després a les pinzellades pot ser complicat, perquè el robot ha de tenir en compte “el soroll del món real”, explica la doctora Oh. Però, com Schaldenbrand i Jim McCann –un especialista en robòtica de la Carnegie Mellon University que també ha ajudat a desenvolupar FRIDA–, creu que val la pena tirar endavant la investigació per dos motius: perquè pot millorar la interfície entre humans i màquines i, a través de l’art, pot ajudar les persones a interconnectar-se.
McCann, referint-se als grans models de llenguatge en què es basen eines com el ChatGPT i DALL-E, explica: “Aquests models s’entrenen a partir de dades de tothom. Per això crec que estem intentant descobrir de quina manera projectes com aquest, que utilitzen aquests models, poden aportar alguna utilitat a la gent”.
La dificultat de pintar
La bretxa entre simulació i realitat planteja un problema sorprenentment complicat als especialistes en robòtica i els enginyers informàtics. Hi ha sistemes d’intel·ligència artificial (IA) capaços d’enumerar els passos que intervenen en el fet de caminar (tensar els quàdriceps i flexionar les tíbies posteriors, inclinar el pes cap enrere i tensar el gluti major) i poden fer caminar un cos simulat en un món virtual. En conseqüència, la temptació és pensar que aquests sistemes són capaços de fer caminar amb gran facilitat un cos físic pel món real.
Doncs no. Als anys 80, l’informàtic Hans Moravec va observar que la intel·ligència artificial anava molt bé per fer raonaments complicats i analitzar enormes quantitats de dades, però no per a les activitats físiques senzilles, com agafar una ampolla d’aigua. D’això se’n diu la paradoxa de Moravec. (La superioritat física dels humans es deu potser a la llarga història evolutiva del nostre cos; les tasques que ens resulten fàcils tenen al darrere milions d’anys d’experimentació darwiniana.)
La pintura, que sovint barreja idees elevades i accions físiques bàsiques, posa en relleu aquesta paradoxa: ¿com aconseguim reflectir l’absurditat de la consciència humana amb els moviments d’un braç?
Per entrenar les eines de generació d’imatges d’IA –com ara Midjourney, DALL-E i Stable Diffusion– s’alimenten xarxes neuronals amb enormes bases de dades d’imatges i amb les corresponents descripcions de text. L’objectiu programat és modelar les relacions entre els significats de les paraules i les característiques de les imatges, i després utilitzar aquestes relacions en un “model de difusió” per crear imatges originals que conservin el significat de descripcions concretes. (L’apunt “Una família fent pícnic al parc” generarà una nova imatge cada vegada que s’utilitzi; cadascuna d’elles s’entendrà com una família fent pícnic al parc.)
Els investigadors també han desenvolupat un sistema perquè el robot de tant en tant es distanciï de la pintura que està fent per valorar fins a quin punt s’ha acostat a l’objectiu que ha generat en píxels i per revisar després aquest objectiu pixelat. Una marca desviada es pot convertir en el moviment de la granota ballarina saltant, o la cella aixecada d’algú del seu públic. Així doncs, cada dotze pinzellades, FRIDA s’allunyava de la tela, feia una foto de la feina feta fins aleshores, feia una pausa i després tornava a treballar.
“Potser els artistes humans ho fan així –diu la doctora Oh–. Fan unes pinzellades i, a continuació, reculen, es miren tota la tela i s’ho replantegen tot. Volíem imitar aquest procés”. Un procés d’autodescobriment artístic, en certa manera, encara que mecanitzat, algorítmic i estadístic.
Els resultats d’aquests mètodes s’exposen al laboratori. Retrats de professors, personatges històrics, paisatges, paisatges urbans, la granota ballarina, tot amb un estil força característic i abstracte: fins i tot hi ha un autoretrat del primer robot FRIDA. La sensació de coherència entre les pintures fa pensar en una visió artística unificada, el mèrit de la qual no correspon a Schaldenbrand, ni a McCann ni a Oh, segons ells mateixos diuen. Atribueixen totes les obres a FRIDA.
¿Però FRIDA és capaç de fer una obra d’art sense tenir voluntat, ni cor ni ungles? ¿Un robot pot ser artista?
L’artista i la tècnica
Amy LaViers, una informàtica i ballarina que dirigeix el Robotics, Automation and Dance Lab, una organització independent sense ànim de lucre, diu que aquests temes no semblarien tan agafats pels pèls ni farien tanta por si estiguéssim disposats a diluir la distinció tan estricta que establim entre l’artista i la tècnica. Tot –sigui l’aquarel·la, els generadors d’imatges amb IA o el desig d’expressivitat– està integrat en l’art. Fins i tot pot semblar que una cosa tan senzilla com la pintura té una ment pròpia, i el pintor ha de reaccionar veient com es mou per la tela. LaViers proposa que considerem FRIDA com un “pinzell robòtic” i no com un robot pintor. “Amb els cossos artificials es poden fer coses que els humans no saben fer. Això amplia la paleta de l’expressió humana”, diu.
La doctora Oh subratlla que els humans encara tenen un paper fonamental en les pintures de FRIDA. Donen instruccions a la màquina i barregen les pintures, instal·len la tela i limiten el nombre total de pinzellades per a cada peça. Les dades que es fan servir per entrenar FRIDA i altres generadors d’imatges contenen pintures i fotografies creades per altres persones. Però, afegeix la doctora Oh, l’objectiu no ha sigut mai fer una cosa que competeixi amb artistes humans: “Volem promoure la creativitat humana. Volem que la gent expressi els seus pensaments d’una manera diferent”.
Al laboratori, Schaldenbrand observa com a poc a poc va sorgint una pintura de les pausades pinzellades grises de FRIDA: una carretera emboirada, les formes dels cotxes, els llums del darrere. “És difícil d’explicar –diu–. No vull transmetre la idea falsa que aquí hi ha una activitat conscient. Però de vegades fingir és divertit”.