09/04/2017

Dades massives contra llençar el menjar

4 min
Dades massives contra llençar el menjar

Una gran part dels compradors de smartphones marquem durant el procés inicial de configuració la discreta casella en què acceptem que el nostre aparell enviï periòdicament informació de diagnòstic al núvol del fabricant per millorar la qualitat del servei. Aquesta informació permet saber, per exemple, si les trucades fetes amb les antenes d’una companyia en una zona determinada es tallen més sovint que les altres i facilita posar-hi remei. Però per detectar aquesta mena d’incidències cal analitzar de manera continuada un volum de dades enorme -només l’any passat, Samsung va vendre 310 milions de smartphones, Apple 215 milions i Huawei 139 milions- que a més conté informació potencialment indiscreta: creuant els identificadors únics de dispositiu amb les geolocalitzacions, el fabricant del nostre telèfon podria rastrejar tots els llocs on hem estat. Per evitar la possibilitat de conflictes legals, Samsung ha adoptat una aplicació de Dataguise per anonimitzar les dades i elimina les que permetrien identificar un dispositiu concret abans de passar la resta de la informació al software de Teradata que els tècnics de la firma coreana fan servir per analitzar els paràmetres de connexió.

Aquest és només un dels casos particulars d’aplicació que s’han exposat aquesta setmana durant la convenció Teradata Universe, en què l’empresa nord-americana especialitzada en sistemes per analitzar dades massives ha reunit els seus clients europeus per presentar-los les novetats en aquesta tecnologia. Són sobretot empreses dels sectors de les finances, les telecomunicacions, els subministraments, la distribució, el transport i l’administració pública: Victor Lund, conseller delegat de Teradata des de fa menys d’un any, diu que el mercat de la seva empresa són les 500 empreses més grans del món que depenen d’un ús òptim de les dades per al seu negoci, i especifica que aquesta llista només coincideix en un 25% amb la de les 500 empreses que facturen més.

Així, a Niça hem sabut que Siemens atribueix a l’anàlisi de dades massives el 99,9% de puntualitat dels seus trens AVE per a Renfe, gràcies als sensors que detecten el sobreescalfament de determinades peces com els rodaments i li permet canviar-les abans que es produeixi l’avaria: cada tren genera entre 1.000 i 4.000 milions de punts de dades a l’any, equivalents a uns 50 gigabytes de dades mensuals. Aquest volum no para de créixer: cada nova generació de la plataforma Railigent de l’empresa alemanya duplica, triplica o quadruplica la quantitat d’informació generada. GE també fa servir tècniques de manteniment preventiu per als seus motors d’aviació, igual que Audi i Volvo monitoritzen proactivament l’estat de milions dels vehicles que tenen en circulació. El sector de l’automoció ho té clar: del 50% al 60% del valor d’un cotxe seran els dispositius i eines digitals que incorpori, i un altre 20% correspondrà a la bateria. Per tant, qui no estigui present en aquests àmbits s’haurà de limitar a produir “finestres, seients i rodes”.

Coca-Cola -1.900 milions de consumicions diàries dels seus productes- ha abraçat les dades massives per recuperar el terreny perdut davant l’etern rival Pepsi: segons Roy Beckelhymer, el seu director d’anàlisi de dades, ara poden segmentar fins al punt de saber quants diners han de dedicar, posem per cas, a “promoure la venda de sucs de fruita als colmados d’Indonèsia”. Això tenint sempre present que els clients no som els consumidors, sinó els establiments on comprem o consumim, des de cadenes de restaurants fins a supermercats: Coca-Cola té 200 persones centrades només a analitzar les dades de vendes de Walmart, un gegant de la distribució que deu també la seva hegemonia a les dades; va ser la primera empresa privada amb una xarxa pròpia de comunicació via satèl·lit. Sense sortir del ram de l’alimentació, la cadena Tesco ha aplicat les dades massives per reduir el malbaratament de menjar en els 3.224 supermercats que té al Regne Unit, que tenen a la venda entre 1.000 i 78.000 referències segons la seva superfície i generen 40 milions de comandes diàries als magatzems. Tot i que Neil Roques diu que ja llençaven poc menjar -60.000 tones d’aliments sobre un total de 10 milions de tones venudes-, afinant els lliuraments i els recomptes d’existències al final de cada jornada encara han reduït el malbaratament en 2.300 tones més.

En trobem exemples en altres àmbits: Vodafone -com Orange i Movistar- diu que analitza les dades de consum i la qualitat de servei dels abonats per oferir-los una tarifa millor o una compensació en cas d’incidència. BNP Paribas depèn de les dades per atendre una clientela que l’any passat va interactuar sis milions de vegades per telèfon i correu electrònic, 20 milions a les sucursals, 160 milions per internet i 200 milions des del telèfon mòbil. Desigual -el primer client català de Teradata- gestiona des del centre de dades a Barcelona l’activitat de les seves botigues a tot el món. A Niça hi havia també especialistes de Gas Natural -que aquest any començarà a oferir termòstats connectats als seus abonats-, Repsol, Viajes El Corte Inglés i Bankia, entre altres empreses properes.

En la trobada s’han fet evidents dues grans tendències tecnològiques en el camp de les dades massives. La primera és el desplaçament dels sistemes d’anàlisi cap al núvol d’internet. Algunes empreses seguiran volent tenir-los a dins de les seves pròpies instal·lacions, i per això Teradata segueix oferint equips específics, ara equipats amb unitats d’emmagatzematge en memòria que ja igualen els discs durs en capacitat i preu. Però en altres casos les funcions d’anàlisi es poden realitzar externament, als núvols d’Amazon, Microsoft o la mateixa Teradata, pagant per consum sense inversió inicial. Una conseqüència d’això és que ara es poden abordar projectes d’anàlisi de dades massives dedicant-hi menys recursos que abans, un factor molt important perquè el 73% de les iniciatives encara fracassen.

L’altra gran tendència en dades massives és l’adopció d’intel·ligència artificial (IA): Stephen Brobst, el director de tecnologia de Teradata i un dels gurus mundials en matèria de dades massives, és prudent: tot i reconèixer que les mencions de la IA en els discursos públics dels directius de grans empreses s’han disparat en els últims mesos, Brobst apunta que en molts casos “no saben exactament de què parlen”, però els seus subordinats disposen ara de diners per dedicar-hi. I la utilitat de les tècniques d’aprenentatge profund ( deep learning ) és indiscutible: amb elles PayPal ha reduït a la meitat els errors en detecció d’operacions fraudulentes. I el grau d’encert en la identificació automàtica d’imatges s’ha multiplicat gairebé per 10 en només cinc anys: els algoritmes actuals l’encerten el 97% de les vegades. Sigui com sigui, els analistes de dades tenen un futur laboral esplèndid.

stats