Els ordinadors visuals

Fa poc, en una conversa amb en Gérard Berry, va sorgir el tema dels telèfons mòbils. En Gérard opina que les coses s’estan capgirant. Vam passar del telèfon fix d’ara fa vint anys a uns mòbils que bàsicament servien per trucar i enviar missatges de text, amb poques capacitats de càlcul i emmagatzemament. Després, hem passat lentament a tenir petites màquines amb altes capacitats de computació i tractament de dades, que continuem anomenant telèfons però que de fet són potents ordinadors que poden telefonar, ajudar-nos a cercar informació o mostrar-nos mapes. Els mòbils s’han convertit en ordinadors que capten fotos i vídeos i que fan moltes més coses. I de fet, ben aviat estarem envoltats d’ordinadors que “ens ajuden” a fer-ho tot, controlant les nostres cases, cotxes i electrodomèstics.

La fotografia ha sofert dues revolucions en menys de vint anys. La primera, que va començar els darrers anys del segle XX, va significar el pas, dràstic, de la fotografia analògica a la digital. Algunes empreses com Kodak es van enfonsar, i la gent va deixar de revelar rodets de fotos. Ja no calia mirar-s’hi molt, a l’hora de fer fotos, perquè en podíem fer moltes i escollir després la que més ens agradava sense cap cost addicional. En eliminar el cost de cada foto individual, va començar a canviar l’essència mateixa de la fotografia. Lentament, vam anar entrant a l’època de la massificació de la imatge, perquè tot era fàcil i a l’abast de tothom.

Després va venir la segona revolució, més invisible, que ens han portat els telèfons mòbils. Us heu preguntat alguna vegada com és que, amb un objectiu tan petit i amb una distància focal tan minsa, els telèfons actuals poden fer fotos tan bones? És clar que els objectius de les càmeres convencionals i els de les més bones (com les rèflex) recullen molta més llum i poden obtenir fotos de molt bona qualitat, però el que a mi sempre m’ha sorprès és que els telèfons puguin fer les fotos que fan amb uns objectius tan petits, de pocs mil·límetres. La resposta, que ens explica en Frédéric Guichard en aquest vídeo, es troba en els algorismes de tractament d’imatge dels nostres mòbils, que són veritables ordinadors visuals. Abans, les lents dels sistemes òptics de les càmeres es fabricaven amb un procés delicat i d’alta precisió. Ara no cal, perquè durant el control de qualitat final, cada càmera individual s’ajusta per tal d’aconseguir el màxim de prestacions. Com que ja no es pot tocar la lent òptica, el que es fa és ajustar els algorismes que tracten la imatge capturada de manera que compensin els errors i distorsions de la lent. Cada telèfon adapta, de manera quasi òptima, el tractament de les imatges als defectes del seu sistema òptic, de manera que acaba tenint un conjunt lent-algorismes únic i que no té cap altre telèfon. Aquesta segona revolució de la fotografia ha canviat totalment els sistemes de fabricació de les lents dels objectius de les càmeres fotogràfiques, com bé explica en Frédéric Guichard: enlloc de fabricar lents d’alta precisió i conjunts òptics que compensin les aberracions, fem lents de baix cost més imperfectes i després corregim intel·ligentment els errors que apareixen a la imatge capturada.

Hi ha tota una nova àrea de recerca, anomenada fotografia computacional, que estudia els algorismes que, a qualsevol telèfon mòbil, “cuinen” la imatge crua que capta el sensor de la càmera fins deixar-la preparada per a que la puguem veure. La imatge de dalt, que he compost a partir del vídeo d’aquesta conferència d’en Gérard Berry, mostra dues d’aquestes transformacions. Dalt a la esquerra veiem la imatge “crua” tal com surt del xip de sensors de la càmera, i a la dreta tenim com queda un cop s’han ajustat automàticament els colors. La fila de baix mostra com es corregeix l’anomenada aberració esfèrica: les imatges d’esquerra i dreta mostren la imatge, primer crua i després d’haver estat tractada pels algorismes (personalitzats per a cada telèfon) de correcció de distorsions.  Com bé diu en Frédo Durand, els mòbils han passat a ser les càmeres de fotos per antonomàsia, i en ells, el component central de la creació de les imatges és la computació (i els algorismes). El que fa qualsevol mòbil en el breu període de temps que hi ha des que premem el botó de l’obturador fins que ens mostra la foto en el visor és increïble, com explica en Gérard Berry a la seva conferència. Cuina i millora els colors, corregeix distorsions, compensa zones molt fosques o molt clares, elimina sorolls i altres tipus d’errors, detecta cares i analitza si algú ha tancat els ulls… És la nova informàtica, dels colors, de la forma i de la imatge.

Un darrer detall. En Frédéric Guichard explica que moltes vegades, la foto que obtenim no és de l’instant que premem el disparador, sino que és d’uns moments abans. Això és possible perquè les actuals càmeres dels mòbils no capturen una única imatge, sino que, mentre estem ajustant l’enquadrament, es guarden temporalment tota la ràfega de fotos dels fotogrames que veiem en el visor de la càmera quan som a punt de fer la foto. Part del processat de la imatge que fa l’ordinador-càmera consisteix en analitzar les fotos anteriors a la darrera, identificar cares de la gent, i substituir aquelles cares de persones que han quedat amb els ulls tancats, pels trossos corresponents d’imatge a altres fotogrames on han quedat millor. La foto final no és més que un collage de trossos de fotogrames amb distorsió i colors adequadament corregits.

Els ordinadors, les aplicacions i tots els ginys intel·ligents que van entrant a les nostres vides ben segur que ens ajudaran a viure millor, però impliquen una responsabilitat per part nostra: la de saber marcar els límits. No parem de fer i enviar-nos fotos i vídeos. Però, on les tenim? Qui controla aquesta informació tan etèria que va i ve per la xarxa? Podem estar segurs que ningú farà servir fotos nostres sense el nostre permís? Podem trobar una foto determinada que vam fer fa set anys? Fem còpies de seguretat (en dispositius privats nostres) o còpies en paper de tot el que deixem al “núvol”? Tenim una immensa capacitat de compartir informació visual, però sembla que només ens importi el present. I el més probable és que, d’aquí a 20 anys, quasi totes les fotos i vídeos actuals hagin desaparegut. No sé què feu vosaltres, però a mi m’agrada regirar capses i trobar fotos i cartes dels meus avis. Podran fer el mateix, els nostres néts i besnéts? La informació que ens enviem i compartim és volàtil com els núvols. Si limitem el temps que dediquem a la immediatesa de la comunicació i no estem sempre connectats, si trobem temps per gaudir de les fotos que hem fet i de les que ens han enviat, si podem veure-les amb la mirada de l’assossec, segurament descobrirem que algunes d’elles han de ser mimades, recordades i conservades, perquè són part del que ens queda d’aquells que estimem o hem estimat. Aturem-nos, limitem el nostre constant neguit, escollim, evoquem, gaudim, i conservem.

Per cert, la Marxa per la Ciència és una iniciativa que va començar als Estats Units però que ara ja aplega més de 500 ciutats de tot el planeta i compta, a més, amb el suport de més de 220 organitzacions científiques oficials. El comunicat diu textualment que són molts el que veuen que cal fer un pas més i exigir que les polítiques públiques no estiguin en mans d’indocumentats que menyspreen el coneixement i es guien per prejudicis, interessos espuris o dogmes religiosos.

2 comentaris

  • enric

    03/05/2017 16:16

    la pintura ja va patir a la fotografia ara fa 150 anys, ara es hora de que pateixin els fotografs professionals quant tothom pot fer fotos de gran qualitat només prement un botó.

  • Jordi Domènech

    30/04/2017 11:00

    La segona revolució, però, té unes limitacions. De mida. El diàmetre de l’objectiu, per una banda, per motiu de la difracció limita la resolució màxima possible; i per altra banda la quantitat de llum. La segona limitació es podria suplir amb exposicions més llargues, però no sempre és possible.
    Potser el que la potència de càlcul podrà solucionar és el tema de l’enfocament. És possible, sobre una imatge amb desenfocament gaussià, tirar enrere i calcular la imatge enfocada, però encara ho veig una mica lluny de la potència de càlcul dels telèfons, si he de jutjar pel que es triga amb un ordinador «de debò». I anant més enllà, en principi i en teoria, seria possible tirar enrere les imatges mogudes, soda que ens permetria fer exposicions més llargues quan hi ha poca llum, que al menys en el meu cas és gairebé sempre.
    En astronomia ja ho fem una mica això, es prenen imatges d’un planeta molt ampliat amb una webcam, les imatges surten «mogudes» per causa de la turbulència atmosfèrica. I, a posteriori, es combinen els diversos quadres, eliminant els més dolents i movent i ajustant la resta per tal de sumar-los i obtenir la màxima resolució possible. Val a dir que amb aquesta tècnica i un telescopi d’aficionat de la gama mitja, s’obtenen imatges planetàries més bones que les que eren possibles amb els grans telescopis professionals abans d’ella. Aquest procés, cada vegada es va automatitzant més, i podem esperar que un dia ho sigui del tot i aplicable, gairebé en temps real, a la fotografia convencional.
    De moment, sempre porto al damunt una càmera mitjaneta, que recull unes cent vegades més llum que un telèfon mòbil…

Comenta

*

(*) Camps obligatoris

L'enviament de comentaris implica l'acceptació de les normes d'ús