La IA per portar posada encara no funciona
Els dispositius que pretenen substituir l’'smartphone' per la IA encara estan molt verds
BarcelonaUn efecte col·lateral de la febre per la intel·ligència artificial (IA) generativa és l’arribada de nous dispositius basats en aquesta tecnologia, que aspiren a desplaçar l'smartphone com a mitjà preferent d’interacció amb els serveis i els continguts digitals. Malauradament, els primers aparells que han sortit al mercat mostren moltes limitacions.
El cas més flagrant de potencial no assolit és l’AI Pin de l’empresa Humane. Aquest medalló connectat de mida gairebé quadrada –45 x 48 mil·límetres– que l’usuari porta al pit està equipat amb una càmera que pot identificar i fer fotografies i vídeos –fins a 15 segons– del que tens al davant, un micròfon per escoltar les teves ordres verbals, un altaveu per respondre-les i un projector làser que projecta sobre el palmell de la teva mà la informació visual (monocromàtica) que li hagis demanat, com l’hora o la previsió meteorològica. La superfície davantera de l’aparell també fa de panell tàctil per activar algunes funcions. D’altres, com agafar o penjar una trucada o canviar de pantalla, es fan amb el gest de pinçar amb els dits índex i polze. Però la majoria de les operacions es fan dialogant amb la IA d’OpenAI que l’aparell porta integrada. Per exemple, quan ets al davant d’un restaurant, demanar-li que en faci una foto i consulti si els usuaris el valoren bé.
La primera aparició pública de l’AI Pin va ser ara fa un any, en una xerrada TED. Imran Chaudhri, un dels cofundadors d’Humane –l’altra és la seva parella, Bethany Bongiorno, tots dos antics empleats d’Apple durant més de dues dècades– va fer-lo servir per coses com telefonar a Bongiorno en directe, escoltar música i traduir en temps real frases del francès a l’anglès. Mesos després vàrem poder veure a la Setmana de la Moda de París una desfilada on les models, Naomi Campbell inclosa, portaven l’AI Pin a la solapa. Mentrestant vàrem saber que Humane portava recaptats 250 milions de dòlars, aportats per lluminàries del sector tecnològic com Marc Benioff, el conseller delegat de Salesforce, i Sam Altman, el seu homòleg d’OpenAI, que apostaven amb la cartera per una nova categoria de dispositius, suposadament capaços de substituir els smartphones i el seu model tradicional de ‘treu-me de la butxaca/bossa, busca la icona de l’aplicació, fes-hi clic, escriu el que vols fer/buscar/comprar, espera la resposta a la pantalla, repeteix-ho fins que acabis i torna’m a guardar’.
El problema de l’AI Pin és que quan ha sortit a la venda s’ha vist que no respon a les expectatives. Els especialistes que l’han provat als EUA admeten que és més còmoda que un mòbil, que la qualitat de fabricació de l’aparell i els seus accessoris és bona i que les trucades en mans lliures funcionen, però, en canvi, no entén la meitat de les ordres verbals, es creu en el dret de censurar el que dius –encara que sigui en broma– si li sembla insultant, tria per iniciativa pròpia l’idioma de les traduccions segons el país on ets, la bateria magnètica que et poses per dins de la roba per enganxar-hi el medalló per fora s’escalfa massa, i per escoltar música t’has d’abonar a la plataforma Tidal. És possible que futures actualitzacions de programari corregeixin els defectes actuals, però algunes crítiques han sigut tan demolidores (el youtuber Marques Brownlee, amb 18 milions de seguidors, considera l’AI Pin “el pitjor producte que ha provat fins ara”) que el mercat ja el dona per mort i enterrat. Sense dubte, el preu hi ajuda: l’AI Pin costa 699 dòlars, més 24 dòlars mensuals per la línia mòbil de veu i dades de l’operadora T-Mobile, que a sobre no es pot vincular al número de telèfon que l’usuari ja té.
La tendència accelera
És possible que els compradors potencials siguin menys exigents amb altres productes més assequibles. Per exemple, el Rabbit R1 presentat a la fira CES costa 199 dòlars, té la mida de mig smartphone, porta pantalla de 2,88 polzades, càmera i altaveu. Però en comptes d’incorporar un LLM (model de llenguatge gran) com ChatGPT, fa servir l’anomenat LAM (model d’accions gran) creat específicament per servir de controlador universal per a diverses plataformes de tercers, entrenat prèviament de manera manual per saber com funcionen, per exemple, les principals de música, menjar a domicili, reserves d’entrades, turisme, mapes o demanar un taxi.
És un model semblant al que Deutsche Telekom va presentar al recent MWC de Barcelona, tot i que en aquest cas l’operadora no pretén prescindir de l'smartphone, sinó només de les aplicacions. L’aparell, en estat de prototip, és un telèfon d’aspecte convencional, però l’habitual graella d’icones ha estat substituïda per una llista d’accions que l’usuari pot necessitar.
Mentrestant, també sorgeixen nous aparells amb IA integrada, però sense ambicions multifuncionals. El Pendant que l’empresa Limitless promet vendre per 99 dòlars abans que acabi aquest any és un penjoll que enregistra l’àudio de les nostres reunions, trucades a clients, visites al metge, pensaments, idees o recordatoris que vulguem anotar sobre la marxa, i després els pot transcriure o fer-ne un resum en una aplicació mòbil que assegura preservar la privadesa.
En general, els aparells que semblen tenir més futur a curt termini són ara com ara els més específics, com les ulleres –d’aspecte convencional, però connectades– Meta Smart Glasses, fruit de l’aliança entre Meta Platforms i Ray-Ban. Costen uns 350 euros i serveixen per escoltar música, atendre trucades, fer fotos i, esclar, publicar-les a les xarxes socials. Per a més endavant, l’allau d’andròmines amb IA no sembla tenir final. L’esmentat Sam Altman d’OpenAI s’ha aliat amb Jony Ive –el mític dissenyador d’Apple i confident de Steve Jobs– per captar fins a 1.000 milions de dòlars de la japonesa SoftBank i dedicar-los al que qualifiquen de “l’iPhone de la IA”.
El recorregut d’aquesta categoria incipient de productes està per veure. Tots els smartphones que portem a la butxaca permeten dialogar amb Google Assistant o amb Siri (o amb majordomes de tercers com Alexa), però l’ús d’aquesta opció no és general ni de bon tros. Sembla poc probable que els usuaris acceptin ara prescindir del telèfon per passar a interactuar exclusivament amb una IA. I els catalanoparlants no hem d’oblidar la dimensió de la llengua.