Dígits i Andròmines

La IA d’Apple: jugada mestra o tret al peu?

El fabricant dels iPhone s’afegeix a la febre per la intel·ligència artificial presumint de prudència i privadesa.

L'esdeveniment d'Apple en què la companyia va mostrar les seves novetats en matèria d'intel·ligència artificial
14/06/2024
5 min

Tal com s’esperava, la intel·ligència artificial (IA) ha protagonitzat la WWDC, el congrés anual d’Apple per als creadors d’aplicacions i serveis vinculats a les plataformes de la marca. Tothom donava per fet que l’empresa mouria fitxa en aquest àmbit del mercat tecnològic on l’activitat s’ha desfermat l'últim any i mig. I així ha estat, però a la manera d’Apple, que alguns trobaran poc ambiciosa i uns altres magistral.

Inscriu-te a la newsletter Sèries Totes les estrenes i altres perles
Inscriu-t’hi

Si bé a la WWDC s’han presentat noves funcions de tots els sistemes operatius –més avall en parlarem–, la IA va impregnar l’acte inaugural, inusualment llarg. Tot i això, els diversos directius d’Apple van evitar en tot moment pronunciar les paraules intel·ligència artificial, optant per les referències al machine learning o aprenentatge automàtic. Potser per esquivar les connotacions negatives de la IA i per evitar comparacions amb els sistemes d’OpenAI/Microsoft i Google, però també aprofitant la coincidència de sigles amb el que denominen Intel·ligència Apple.

Tècnicament, aquesta IA de collita pròpia és tan generativa com els coneguts ChatGPT i Gemini, però Apple ha optat per integrar-la en les aplicacions i limitar-la a tres àmbits. El primer són les eines d’ajuda a la redacció, per resumir, reescriure o ajustar el to del contingut escrit existent, siguin documents, missatges de correu o notes. Vaja, a l’estil del Copilot de Microsoft per a les aplicacions d’Office, però sense la possibilitat de partir d’un full en blanc. També ens pot resumir els correus que tenim a la safata d’entrada, pendents de llegir.

La IA d'Apple permet resumir, reescriure o ajustar el to del contingut escrit existent

El segon àmbit és l’anomenat Image Playground, que sí que permet crear imatges des de zero, per exemple en un missatge o una presentació de Keynote, però només en tres estils (animació, il·lustració i esbós), que exclouen específicament les creacions fotogràfiques realistes d’altres sistemes que puguin plantejar dubtes sobre autenticitat. També es poden generar emojis sobre la marxa, a partir de fotos de l’usuari i els seus contactes, per incloure’ls als xats.

El tercer dels àmbits de la IA d’Apple és una Siri del tot renovada. La veterana majordoma digital guanya naturalitat, capacitat de comprensió i és capaç de respondre seguint el fil d’una petició encara que l’usuari s’entrebanqui o rectifiqui el que acaba de demanar. També reconeix el que surt a la pantalla i pot actuar depenent del context personal: en una de les demostracions se li demana "a quina hora arriba la mare" i respon amb les dades del vol que ha trobat als missatges; en una altra, fa la llista de les sèries de televisió o la música que ens han recomanat darrerament al xat dels amics. Siri també ha guanyat capacitat d’intervenir sobre el dispositiu, sigui programant l’enviament d’un missatge, apagant el wifi o activant el mode fosc. Igualment, pot endreçar les notificacions rebudes, prioritzant les més importants d’acord amb l’historial d’ús.

Val a dir que la IA d’Apple s’executarà principalment dins el dispositiu, però els dos models fundacionals de creació pròpia –el de text i el d’imatge– requereixen un processador compatible, a partir de l’A17 (iPhone 15 Pro i posteriors) i de l’M1 en el cas dels Mac i els iPad. Fins i tot així, quan la petició sigui de més abast, s’enviarà a un nou núvol privat d’Apple per ser atesa. Segons l’empresa, només sortiran del telèfon les dades imprescindibles, anonimitzades i protegides per una capa de xifratge. També promet que no s’emmagatzemaran enlloc ni es faran servir per entrenar els models d’Apple. Els servidors d’aquest nou núvol privat fan servir xips d’Apple –evitant la dependència de Nvidia que tenen altres sistemes– i com que formen part de la infraestructura pròpia, estan sotmesos al compromís d’operar només amb energia renovable. Apple també es declara disposada a permetre que auditors externs certifiquin la privadesa de tot el sistema. Caldrà veure com afecta tot plegat la percepció pública d’Apple com la marca que més protegeix la privadesa dels consumidors.

Aliança amb ChatGPT, per si de cas

Conscient que arriba a un mercat malcriat pels excessos d’altres plataformes d’IA generativa, Apple afegirà una opció enginyosa: quan la petició de l’usuari excedeixi les capacitats de la IA pròpia, el sistema oferirà desviar-la a un servei extern. Inicialment, es proposarà el ChatGPT d’OpenAI, però el model de negoci preveu afegir-ne d’altres.

No sabem els detalls de l’acord entre Apple i OpenAI, però The Information assegura que cap de les dues parts pagarà res a l’altra, a diferència dels milions que Google abona a Apple per ser el cercador web preferent dels iPhone. En aquest cas, OpenAI aconsegueix incloure en tots els nous aparells d’Apple (més de la meitat dels smartphones que es venen als EUA, sense anar més lluny) un esquer per captar usuaris de pagament de ChatGPT. A canvi, Apple ingressarà fins a un 30% de comissió per cadascuna de les altes, com amb qualsevol altra aplicació.

Com a anècdota, l’inefable Elon Musk –que també té una empresa d’IA– s’ha ofès tant amb l’acord Apple-OpenAI que ha amenaçat amb prohibir l’ús d’iPhones amb ChatGPT dins les seves empreses, començant per Tesla, perquè ho considera un forat de privadesa. Sorprèn que no vulgui prohibir també els PC amb sistema Windows i l'AI Copilot de Microsoft, basada en el mateix ChatGPT.

Ara sí: calculadora als iPad

Els detalls de la IA pròpia han deixat en segon terme les nombroses novetats dels sistemes operatius d’Apple. A la WWDC s’ha mostrat un visionOS amb pantalla virtual més panoràmica; un iOS 18 molt més personalitzable, amb icones que es poden acolorir i posar en qualsevol lloc de la pantalla d’inici, una carpeta protegida amb biometria on amagar aplicacions que no volem ensenyar, la possibilitat d’enviar via satèl·lit missatges normals, no només d’emergència, i la funció de transferir diners entre usuaris posant en contacte els dos iPhones; els auriculars AirPods reconeixen el gest d’assentir i negar amb el cap per respondre a Siri quan no pots parlar; amb macOS 15 (es diu Sequoia) es pot fer servir a l’ordinador l’iPhone que ens hem deixat en una altra habitació; i iPadOS 18 dona la benvinguda a una apli de calculadora, que en les tauletes amb Apple Intelligence reconeixerà les expressions matemàtiques manuscrites amb el llapis tàctil Pencil i les resoldrà quan l’usuari escrigui el signe d’igual.

Probablement, aquesta onada d’incorporacions en els sistemes operatius d’Apple és la que més mereix dels últims anys l’habitual comentari passiu-agressiu dels usuaris del binomi rival Android/Windows, en el sentit que "això no és nou, nosaltres fa anys que ho tenim". Una excepció notable: la funció d’enregistrament –avisant prèviament l’interlocutor– i posterior transcripció de les trucades telefòniques a iOS 18. Els periodistes, un gremi amb forta presència d’iPhones, ho han acollit amb alegria. Als mòbils Android s’havia pogut fer durant molts anys amb aplicacions de tercers, però Google ho va desactivar. Ves que no acabi reapareixent en la pròxima versió d’Android.

stats