07/03/2015

Connectant el món físic i el virtual

4 min

Sortir del metro en una ciutat que visitem per primera vegada i voler saber quin és el monument que tenim al davant. Una situació molt habitual que tradicionalment resolíem consultant un plànol. Actualment, per identificar-lo només ens cal enfocar-lo amb la càmera del telèfon mòbil, que ens indicarà de quin edifici es tracta, en quin horari podem visitar-lo i, probablement, ens oferirà comprar les entrades per fer-ho. Aquesta màgia es pot fer de dues maneres. La primera són les aplicacions de realitat augmentada, que combinen el GPS del telèfon -que sap on som-, la brúixola -que detecta cap on mirem- i les bases de dades d’internet per deduir què és el que veiem pel visor i buscar informació relacionada. És el que fan aplicacions com Layar i Here City Lens, que també faciliten l’operació inversa: saber en quina direcció hem d’avançar per arribar al lloc on volem anar, sigui un museu, una farmàcia o una estació de metro. La funció també s’ha anat incorporant a aplicacions genèriques, com la de Transports Metropolitans de Barcelona, que indica visualment on són les parades d’autobús més properes.

L’altra possibilitat és el reconeixement d’imatges. Cada vegada queden al món menys persones, objectes i llocs que no hagin estat fotografiats alguna vegada i publicats a la web amb una descripció. Títols per a mòbil com Google Goggles permeten fotografiar el que volem identificar i comparar-ho amb les imatges de la base de dades de Google, amb un grau d’encert prou raonable. La funció també es pot activar directament des del cercador.

La identificació d’imatges és cada vegada més sofisticada. Al Mobile World Congress, Qualcomm ha fet demostracions de la tecnologia Zeroth d’informàtica cognitiva que portaran els seus pròxims xips de mòbil. Sense connexió a la xarxa, el sistema reconeix de manera genèrica quin tipus d’objectes apareixen en una imatge: arbres, una bicicleta, una mà, un rellotge de polsera... La potència del sistema es comprova aplicant-lo a les carpetes amb milers de fotografies que anem acumulant als nostres dispositius, perquè permet trobar, per posar un exemple, totes les que continguin un cotxe vermell amb el mar de fons.

Amb el contingut d’una imatge es poden fer encara més coses, com interpretar-lo. El mateix Zeroth pot transcriure textos manuscrits sense entrenament previ, i la versió més recent de l’aplicació de Google mostra a la pantalla del mòbil la traducció en temps real del text que captem amb la càmera, sigui un rètol o el menú d’un restaurant, i ho fa mantenint l’aspecte de l’original.

També es poden identificar automàticament sons: Shazam, SoundHound i alguns cercadors de mòbil reconeixen en pocs segons la cançó que estem sentint a la ràdio o en un bar i, a continuació, ens ofereixen comprar-ne la versió digital. El president de Shazam ha explicat aquesta setmana al 4YFN de Barcelona que ja preparen una ampliació de les funcions al reconeixement d’objectes físics, amb el mateix model de negoci. En aquest terreny ja hi trobaran empreses com la catalana Similify, que té una apli mòbil per identificar sabates i peces de roba a partir d’una foto.

Identificar automàticament el contingut audiovisual també obre noves possibilitats d’interacció, com fa l’aplicació mòbil del concurs Oh happy day de TV3, que formula preguntes i votacions relacionades amb el que s’està veient en cada moment. A la de SincroGuíaTV, hereva de la plataforma InOutTV, li hem de dir actualment quin canal estem mirant perquè ens mostri informació detallada a la pantalla del mòbil, però els seus creadors ja preparen una ampliació que el reconeixerà automàticament sigui quin sigui el canal.

Tornant a la realitat augmentada, les aplicacions en el mercat de consum són molt diverses, però on ja s’està utilitzant a fons és en el camp industrial: les ulleres connectades de Fujitsu, Sony i Epson guien els operaris de muntatge i manteniment indicant-los quina és la peça que han de col·locar i en quin lloc exacte ho han de fer, sense haver de consultar un manual separat. Els guants alemanys ProGlove detecten si el treballador ha agafat l’eina correcta per a cada operació i l’avisen en cas contrari.

El comerç és un dels àmbits on la relació virtual del client amb l’entorn pot ser implícita: els beacons o balises de posició detecten de manera implícita en quin lloc d’una botiga som i ens ofereix promocions específiques del producte que tenim a l’abast.

Més explícites són les tècniques d’identificació biomètrica, que ens permeten accedir als dispositius mitjançant característiques físiques personals i intransferibles: els mòbils de gamma alta d’Apple, Samsung i Huawei ja disposen de lector dactilar per desbloquejar-los i identificar-nos en processos de descàrrega i pagament, i Fujitsu ha mostrat a Barcelona un lector d’iris per a telèfons i tauletes que dóna deu vegades menys falsos positius que les empremtes dactilars.

Però a l’hora d’identificar persones, el camp de batalla són les xarxes socials. Als àlbums de fotos de Facebook i Flickr els teus amics et poden etiquetar i qualsevol pot recopilar totes les imatges on surts, i la funció d’identificació automàtica té una eficàcia cada vegada més gran. Afortunadament, també hi ha remei per a això: l’empresa de seguretat AVG ha presentat al MWC el prototip d’unes ulleres amb llums infraroigs en una posició estratègica que neutralitzen l’autodetecció de rostres de Facebook.

stats