Entrades amb l'etiqueta ‘Frédo Durand’

Els ordinadors visuals

dijous, 27/04/2017

Fa poc, en una conversa amb en Gérard Berry, va sorgir el tema dels telèfons mòbils. En Gérard opina que les coses s’estan capgirant. Vam passar del telèfon fix d’ara fa vint anys a uns mòbils que bàsicament servien per trucar i enviar missatges de text, amb poques capacitats de càlcul i emmagatzemament. Després, hem passat lentament a tenir petites màquines amb altes capacitats de computació i tractament de dades, que continuem anomenant telèfons però que de fet són potents ordinadors que poden telefonar, ajudar-nos a cercar informació o mostrar-nos mapes. Els mòbils s’han convertit en ordinadors que capten fotos i vídeos i que fan moltes més coses. I de fet, ben aviat estarem envoltats d’ordinadors que “ens ajuden” a fer-ho tot, controlant les nostres cases, cotxes i electrodomèstics.

La fotografia ha sofert dues revolucions en menys de vint anys. La primera, que va començar els darrers anys del segle XX, va significar el pas, dràstic, de la fotografia analògica a la digital. Algunes empreses com Kodak es van enfonsar, i la gent va deixar de revelar rodets de fotos. Ja no calia mirar-s’hi molt, a l’hora de fer fotos, perquè en podíem fer moltes i escollir després la que més ens agradava sense cap cost addicional. En eliminar el cost de cada foto individual, va començar a canviar l’essència mateixa de la fotografia. Lentament, vam anar entrant a l’època de la massificació de la imatge, perquè tot era fàcil i a l’abast de tothom.

Després va venir la segona revolució, més invisible, que ens han portat els telèfons mòbils. Us heu preguntat alguna vegada com és que, amb un objectiu tan petit i amb una distància focal tan minsa, els telèfons actuals poden fer fotos tan bones? És clar que els objectius de les càmeres convencionals i els de les més bones (com les rèflex) recullen molta més llum i poden obtenir fotos de molt bona qualitat, però el que a mi sempre m’ha sorprès és que els telèfons puguin fer les fotos que fan amb uns objectius tan petits, de pocs mil·límetres. La resposta, que ens explica en Frédéric Guichard en aquest vídeo, es troba en els algorismes de tractament d’imatge dels nostres mòbils, que són veritables ordinadors visuals. Abans, les lents dels sistemes òptics de les càmeres es fabricaven amb un procés delicat i d’alta precisió. Ara no cal, perquè durant el control de qualitat final, cada càmera individual s’ajusta per tal d’aconseguir el màxim de prestacions. Com que ja no es pot tocar la lent òptica, el que es fa és ajustar els algorismes que tracten la imatge capturada de manera que compensin els errors i distorsions de la lent. Cada telèfon adapta, de manera quasi òptima, el tractament de les imatges als defectes del seu sistema òptic, de manera que acaba tenint un conjunt lent-algorismes únic i que no té cap altre telèfon. Aquesta segona revolució de la fotografia ha canviat totalment els sistemes de fabricació de les lents dels objectius de les càmeres fotogràfiques, com bé explica en Frédéric Guichard: enlloc de fabricar lents d’alta precisió i conjunts òptics que compensin les aberracions, fem lents de baix cost més imperfectes i després corregim intel·ligentment els errors que apareixen a la imatge capturada.

Hi ha tota una nova àrea de recerca, anomenada fotografia computacional, que estudia els algorismes que, a qualsevol telèfon mòbil, “cuinen” la imatge crua que capta el sensor de la càmera fins deixar-la preparada per a que la puguem veure. La imatge de dalt, que he compost a partir del vídeo d’aquesta conferència d’en Gérard Berry, mostra dues d’aquestes transformacions. Dalt a la esquerra veiem la imatge “crua” tal com surt del xip de sensors de la càmera, i a la dreta tenim com queda un cop s’han ajustat automàticament els colors. La fila de baix mostra com es corregeix l’anomenada aberració esfèrica: les imatges d’esquerra i dreta mostren la imatge, primer crua i després d’haver estat tractada pels algorismes (personalitzats per a cada telèfon) de correcció de distorsions.  Com bé diu en Frédo Durand, els mòbils han passat a ser les càmeres de fotos per antonomàsia, i en ells, el component central de la creació de les imatges és la computació (i els algorismes). El que fa qualsevol mòbil en el breu període de temps que hi ha des que premem el botó de l’obturador fins que ens mostra la foto en el visor és increïble, com explica en Gérard Berry a la seva conferència. Cuina i millora els colors, corregeix distorsions, compensa zones molt fosques o molt clares, elimina sorolls i altres tipus d’errors, detecta cares i analitza si algú ha tancat els ulls… És la nova informàtica, dels colors, de la forma i de la imatge.

Un darrer detall. En Frédéric Guichard explica que moltes vegades, la foto que obtenim no és de l’instant que premem el disparador, sino que és d’uns moments abans. Això és possible perquè les actuals càmeres dels mòbils no capturen una única imatge, sino que, mentre estem ajustant l’enquadrament, es guarden temporalment tota la ràfega de fotos dels fotogrames que veiem en el visor de la càmera quan som a punt de fer la foto. Part del processat de la imatge que fa l’ordinador-càmera consisteix en analitzar les fotos anteriors a la darrera, identificar cares de la gent, i substituir aquelles cares de persones que han quedat amb els ulls tancats, pels trossos corresponents d’imatge a altres fotogrames on han quedat millor. La foto final no és més que un collage de trossos de fotogrames amb distorsió i colors adequadament corregits.

Els ordinadors, les aplicacions i tots els ginys intel·ligents que van entrant a les nostres vides ben segur que ens ajudaran a viure millor, però impliquen una responsabilitat per part nostra: la de saber marcar els límits. No parem de fer i enviar-nos fotos i vídeos. Però, on les tenim? Qui controla aquesta informació tan etèria que va i ve per la xarxa? Podem estar segurs que ningú farà servir fotos nostres sense el nostre permís? Podem trobar una foto determinada que vam fer fa set anys? Fem còpies de seguretat (en dispositius privats nostres) o còpies en paper de tot el que deixem al “núvol”? Tenim una immensa capacitat de compartir informació visual, però sembla que només ens importi el present. I el més probable és que, d’aquí a 20 anys, quasi totes les fotos i vídeos actuals hagin desaparegut. No sé què feu vosaltres, però a mi m’agrada regirar capses i trobar fotos i cartes dels meus avis. Podran fer el mateix, els nostres néts i besnéts? La informació que ens enviem i compartim és volàtil com els núvols. Si limitem el temps que dediquem a la immediatesa de la comunicació i no estem sempre connectats, si trobem temps per gaudir de les fotos que hem fet i de les que ens han enviat, si podem veure-les amb la mirada de l’assossec, segurament descobrirem que algunes d’elles han de ser mimades, recordades i conservades, perquè són part del que ens queda d’aquells que estimem o hem estimat. Aturem-nos, limitem el nostre constant neguit, escollim, evoquem, gaudim, i conservem.

Per cert, la Marxa per la Ciència és una iniciativa que va començar als Estats Units però que ara ja aplega més de 500 ciutats de tot el planeta i compta, a més, amb el suport de més de 220 organitzacions científiques oficials. El comunicat diu textualment que són molts el que veuen que cal fer un pas més i exigir que les polítiques públiques no estiguin en mans d’indocumentats que menyspreen el coneixement i es guien per prejudicis, interessos espuris o dogmes religiosos.