DÍGITS I ANDRÒMINES

Deixa que ho faci Google

El gegant d’internet proposa la intel·ligència artificial per simplificar i automatitzar moltes tasques quotidianes, aposta per la veu, promet respectar la privadesa i presenta telèfons més assequibles

“Tenim moltes coses per explicar-vos, però provarem de fer-ho en menys de dues hores perquè avui juguen Barcelona i Liverpool i sabem que molts ho voleu veure”. Sundar Pichai, el conseller delegat de Google, inaugurava dimarts d’aquesta manera, a l’amfiteatre Shoreline de Mountain View (Califòrnia), la convenció anual I/O de l’empresa per a desenvolupadors d’aplicacions. Tal com va acabar el partit a Anfield, segur que molts dels espectadors culers haurien preferit que Pichai incomplís la seva promesa i els hagués entretingut encara més estona amb les novetats que el gegant d’internet prepara per als pròxims mesos en matèria de facilitat d’ús dels seus productes, privadesa de les dades personals i nous dispositius.

En alguns casos, millorar la facilitat d’ús consisteix en incloure dins dels serveis de Google funcions que fins ara requerien una aplicació separada. Si la nostra consulta al cercador està vinculada amb un tema d’actualitat, el resultat anirà acompanyat de notícies que hi fan referència, presentades en ordre cronològic que reflecteix quin va ser el primer mitjà a informar-ne. Altres cerques proporcionaran imatges 3D de l’objecte d’interès, que podrem manipular virtualment sobre la pantalla i visualitzar amb el telèfon mòbil en el lloc on som gràcies a la realitat augmentada.

En la demostració es van veure exemples d’anatomia i es va simular la presència d’un tauró gegant a l’escenari, però també s’espera que les marques comercials aprofitin la tecnologia perquè comprovem si la peça de roba que ens volen vendre combinarà amb les que ja tenim a l’armari. També hi haurà realitat augmentada en les indicacions de navegació de Google Maps, que superposarà a la imatge del món real captada amb la càmera del mòbil una fletxa que indicarà cap on hem de girar. Maps, per cert, tindrà un nou mode d’incògnit per desactivar el rastreig dels llocs que busquem i per on passem.

La funció Google Lens de reconeixement d’objectes físics, que els usuaris ja han fet servir més de 1.000 milions de vegades, tindrà encara més presència. Des d’ara pot identificar plantes i obres d’art, però també els plats més populars de la carta d’un restaurant -i ensenyar-nos les fotos i els comentaris que n’han fet altres clients, i dividir el compte entre tots els comensals enfocant el tiquet amb la càmera-, i no només traduir en temps real els rètols en idiomes desconeguts, sinó també llegir-nos la traducció en veu alta mentre va destacant sobre la imatge la paraula que estem sentint en cada moment. Un pas endavant en accessibilitat que Google complementa amb la transcripció automàtica en pantalla del contingut de qualsevol vídeo i àudio que reproduïm al nostre dispositiu.

Per a les persones sordmudes

Especialment impressionant és la nova funció Live Relay, que permet a les persones sordmudes mantenir converses telefòniques combinant la síntesi de veu d’allò que escriuen i la transcripció en pantalla del que diu l’interlocutor. També s’ha presentat Euphonia, un projecte per millorar la capacitat dels sistemes de Google per entendre les persones amb dificultats de parla, com ara els afectats d’esclerosi o de tartamudesa.

Darrere d’aquestes capacitats hi ha els algoritmes d’intel·ligència artificial (IA) de Google, que s’han optimitzat i compactat fins a aconseguir que funcionin en els telèfons més barats i sense necessitat de connexió. D’aquesta manera es multiplica per 10 la velocitat i es respecta la privadesa, sense renunciar al que Google anomena aprenentatge federat, en que cada ús de l’algoritme contribueix de manera anònima a entrenar-lo i millorar-ne la precisió per a tots els seus usuaris. En l’entrenament dels algoritmes, Google s’ha proposat evitar alguns biaixos: des d’ara, en les fotografies de metges, el model de reconeixement d’imatge donarà més pes a la presència d’una bata blanca o d’un estetoscopi que al gènere de la persona que els porta.

També s’aplica la IA per redactar un missatge de Gmail, indicar l’assumpte, incloure-hi una imatge de Fotos i enviar-lo fent servir només ordres de veu. I perquè les consultes del pronòstic del temps en un lloc -o de la ruta per anar-hi- entenguin que ens referim a casa de la nostra mare i no, posem per cas, a una pizzeria que es diu La Mamma. La importància que Google dona a la veu també queda de manifest en la nova indexació del contingut dels podcasts, que permetrà trobar els que ens interessin a partir del que s’hi diu i no només de la descripció escrita com fins ara.

El sistema Duplex, que l’any passat podia telefonar a un comerç i dialogar amb l’humà de l’altre costat en nom nostre, ara ja pot també suplantar-nos per emplenar el formulari web de reserva d’un cotxe de lloguer o el de compra d’entrades per a un espectacle fent servir automàticament les nostres dades i preferències, que coneix d’operacions anteriors.

Les aplicacions i la ubicació

Les opcions de privadesa del sistema Android s’han fet més visibles: a partir de la versió Q, ja disponible en forma preliminar per a alguns models de telèfon, sortiran destacades al menú de configuració, i també s’hi accedirà directament des de la fotografia del perfil d’usuari al cercador, a Chrome, a Maps i a YouTube. També arriba l’esperada opció de permetre a les aplicacions que accedeixin a la nostra ubicació només mentre les estem fent servir, que els usuaris d’iPhone ja coneixen. En relació amb Apple, els directius de Google no han deixat passar l’ocasió d’assenyalar que Android ja té 2.500 milions de dispositius actius al món i que és l’únic sistema que disposa de telèfons desplegables i de models compatibles amb les noves xarxes 5G.

Malauradament per a Google, ben pocs d’aquests dispositius Android són telèfons de la seva pròpia marca Pixel, centrada fins ara en la gamma alta del mercat. Per tractar de corregir-ho, l’empresa ha presentat dos nous models, els Pixel 3a i 3a XL, que traslladen a la competitiva gamma mitjana (a partir dels 400 euros) l’excel·lent càmera fotogràfica dels models existents, més basada en el software que en el captador d’imatge. Això sí, a costa d’una reducció en la qualitat dels materials i en la potència de procés i de renunciar a la càrrega sense fils. En canvi, es recupera la sortida minijack per a auriculars, abandonada per pràcticament totes les altres marques amb excepció de Samsung. L’altre aparell nou de Google en aquesta edició de l’I/O és un altaveu intel·ligent amb pantalla de 10 polzades, equipat amb càmera per reconèixer cadascun dels membres de la família i mostrar-los informació personalitzada. De moment no arribarà aquí, però encara que ho fes no ens seria gaire útil perquè la majordoma digital Assistant segueix sense entendre ni parlar català.