Entrades amb l'etiqueta ‘David Foster Wallace’

La paradoxa de la informació

divendres, 8/09/2017

La informació no té una definició única. La gran enciclopèdia catalana diu que informació és una “notícia o notícies que hom tracta de saber, que hom rep”, però que també és el “contingut d’una o més dades, tot fent abstracció de la representació concreta que adopta”. Coses que volem saber o que acabem sabent, i que podem extreure de les dades que rebem. La Wikipèdia, d’altra banda, la defineix com “tot allò que un ser humà és capaç de percebre, incloent-hi les comunicacions escrites i orals, les imatges, l’art o la música”, i com “el fet de processar, manipular i organitzar dades d’una forma que produeixin coneixement i esvaeixin el desordre”.

La informació és multifacètica. És el que percebem, el que incrementa el nostre coneixement. També, en paraules de Claude Shannon, informació és allò que redueix la incertesa. La frase “avui a la nit serà fosc” no és informativa perquè és quelcom que tots sabem. Però si dic “aquesta nit no vindré a sopar” estic concretant, disminueixo la incertesa, i per tant informo (vegeu la nota al final). Ara bé, a més d’aquest aspecte cultural i comunicatiu, la informació s’ha de transmetre, i aquí és on apareixen les dades, l’ordre i el substrat que la suporta. Les plantes informen amb les seves olors, les formigues amb els rastres i els ocells amb els seus cants. Els sons dels dofins o dels rossinyols, perfectament codificats, ordenats i seqüenciats, són útils als seus companys encara que nosaltres no els entenguem. Per això, podem dir que la informació requereix un determinat ordre en un cert substrat, a més d’un codi que li doni sentit i ens permeti llegir-ne el significat. Podem llegir un article a la pantalla de l’ordinador només quan el seu conjunt de més d’un milió de píxels s’ordena i ens mostra les lletres del text en negre sobre blanc, i tot seguit el podem recordar gràcies a l’ordre químic de les neurones del nostre cervell. Quan una persona parla en una llengua que desconeixem o escriu signes que no entenem, observem l’ordre sonor o gràfic del que fa, però no podem captar la semàntica dels seus missatges.

Què ens diu, la imatge de dalt? A primera vista, són 15 ametlles disposades en un ordre estrany damunt una pedra, formant set columnes amb 4, 3, 2, 1, 1, 2 i 2 fruits secs. Imagineu ara que tenim una quadrícula imaginària amb 4 files i 8 columnes, de manera que la primera columna és a l’esquerra i no té cap ametlla. L’ordre es fa més explícit, i ens presenta quatre files de 8 caselles, algunes plenes i altres buides. Ara ja veiem, en aquest substrat d’ametlles, una taula ordenada; però encara ens falta el descodificador. Però només cal que ens diguin que les hem disposat en files seguint el codi ASCII dels ordinadors, i ja podrem llegir el missatge: les quatre files codifiquen les quatre lletres de la paraula “Bits”.

En informàtica, tota la informació es codifica i representa amb seqüències de bits. Cada lletra dels texts que escrivim als missatges i correus electrònics i cada lletra dels articles i llibres que llegim i que trobem a la web, es guarda en un “byte“, que són 8 bits. Els sons, els missatges de veu, les fotos, la nostra agenda, els vídeos i tot el que tenim als ordinadors tenen el mateix aspecte: una llarga tirallonga de bits “1” i “0”. Els ordinadors funcionen gràcies a que apliquen el descodificador adequat a cada tipus d’informació, perquè si per exemple utilitzessin el codi ASCII per interpretar vídeos, no veuríem res. D’altra banda, els bits són també una eina de mesura: si codifiquem la informació de manera òptima i eliminant totes les possibles redundàncies, la quantitat d’informació es pot mesurar pel nombre de bits que ocupa. Però aquesta mesura acaba sent diferent pels humans i pels ordinadors, cosa que té conseqüències pràctiques molt concretes, per exemple quan l’ordinador o el mòbil ens demana que escollim i entrem una nova paraula clau (un nou “password“): tenim una falsa percepció d’allò que és indesxifrable (vegeu un cop més la nota al final).

Per bé o per mal, som al segle de la informació. En Gérard Berry comenta que el segle XIX va ser el segle de la matèria, de la química i de la síntesi dels metalls i altres elements. El segle XX, en canvi, va ser el segle de l’energia, a més de la matèria: l’electricitat, el petroli, l’energia nuclear i fins i tot l’inici de les renovables. El segle passat va veure el naixement de la informàtica, però no ha estat fins el segle XXI que hem vist un creixement quasi explosiu de la quantitat informació que corre pel món. Recordo que, l’any 1992, el disc dur del meu ordinador era de 20 MB (un “MegaByte” és un milió de bytes, equivalent a 8 milions de bits). Ara, qualsevol targeta “MicroSD” de mòbil té 16 o 32 GB, més de mil vegades més que el que jo podia guardar fa tan sols 25 anys. No parem de generar, guardar i “compartir” informació.

La paradoxa del moment actual, però, ens l’explica molt bé en Renee Morad. Internet fa que la informació sigui més accessible que mai. Però molts dubten (dubtem) de la veracitat del que hi troben. Aquesta desconfiança (sobretot en fonts “llunyanes”, tal vegada esbiaixades i poc contrastades) alimenta una demanda de nova informació que és cada vegada més gran. En altres paraules: hi ha massa informació; però, en no saber quina és certa i quina és falsa i del tot il·lusòria, nosaltres en generem més. Com que moltes persones fan el mateix, es manté el creixement continu de la quantitat d’informació. Cada cop hi ha més informació que és menys fiable en mitjana i cada cop es farà més difícil filtrar-la. Incrementem la quantitat mentre reduïm la qualitat. Llegir és fàcil, entendre i comprendre serà cada vegada més difícil.

Per cert, en David Foster Wallace deia que ensenyar a pensar és ensenyar a ser una mica menys arrogant i a contemplar-nos nosaltres mateixos i les nostres certeses amb consciència crítica, perquè un gran percentatge del que tendim a donar per segur s’acaba demostrant que és fals i del tot il·lusòri.

———

NOTA: L’entropia de Shannon és una mesura del desordre que conté un missatge. És clau per a quantificar la informació que conté. En concret, la informació que conté un missatge es pot mesurar com la inversa de seva probabilitat (aquí, per exemple, en podeu veure una explicació senzilla i basada en exemples de predicció meteorològica). Quan ens parlen d’un fenomen rar, la seva probabilitat és baixa i per tant, la mesura de la informació que aporta és alta. En canvi, quan ens diuen una obvietat d’absoluta certesa (com que “la sang és vermella”), la probabilitat és màxima i la informació, nul·la. En tot cas, la novetat d’una certa informació depèn del receptor: la frase “la capital de Finlàndia és Hèlsinki” segurament no aporta cap nova informació a moltes persones mentre que, per algunes altres, pot ser quelcom nou i informatiu.

Com podeu veure en aquesta auca, la dificultat de les paraules clau que utilitzem (i la informació que contenen) és molt diferent pels humans i per les màquines. L’auca compara les paraules clau “Tr0ub4dor&3” i “correcthorsebatterystaple“. La primera es basa en escollir una paraula poc usada (en aquest cas podria ser “troubador” en anglès), posar o no la primera lletra en majúscules, fer un parell de substitucions, i afegir al final un signe de puntuació (“&” en aquest cas) i un dígit numèric. La segona consisteix simplement en concatenar quatre paraules més o menys corrents, “correct horse battery staple“.

L’entropia de la primera opció és de l’ordre de 28 bits, si pensem que el diccionari de paraules poc usades que utilitzem té unes 65 mil paraules (2 a la 16); la resta de bits són deguts a decisions sobre com hem de modificar aquesta paraula i quins són els darrers dos caràcters de la paraula clau. Una màquina que faci mil tests per segon pot provar totes les possibilitats (2 a la 28) en uns tres dies i per tant acabarà descobrint el nostre password. Però als humans se’ns fa molt difícil recordar la paraula inicial i tots els canvis i substitucions. Segur que al cap d’un temps no recordem el que havíem posat.

En canvi, l’entropia de la segona opció és de l’ordre de 44 bits, si pensem que el diccionari de paraules que utilitzem té dues mil paraules (2 a la 11), perquè 11 per 4 és 44. A raó de 1000 tests per segon, una màquina necessitaria 550 anys per provar totes les possibilitats (2 a la 41 segons). En aquest cas tenim una paraula clau que ens és fàcil de recordar si pensem en alguna regla mnemotècnica o en alguna idea que ho lligui tot, però que en canvi les màquines i sistemes automàtics no la podran desxifrar.

Com diu l’auca, després de vint anys d’esforços, hem après a usar paraules clau que els humans no som capaços de recordar, però que les màquines poden desxifrar fàcilment. Un consell: si volem tenir paraules clau que siguin realment privades, millor que pensem en trucs que siguin complicats per les màquines i sistemes automàtics, encara que a nosaltres ens semblin fàcils…

Som (o hauríem de ser) científics

dimecres, 20/07/2016

Fa un mes, quan l’Atul Gawande va començar el discurs de graduació als estudiants de l’Institut de Tecnologia de Califòrnia, els va dir: “si les coses s’han fet bé, ara tots heu esdevingut científics”. Va ser força xocant, perquè molts d’ells no s’haguessin mai definit com científics. I va continuar dient “I tots vol dir tots, fins i tot els d’història i els de filologia anglesa”. Perquè, va afegir, la ciència no és una carrera sinó un compromís amb una forma sistemàtica de pensar i la lleialtat a una manera de construir el coneixement i d’explicar l’univers a través de proves i observació dels fets. La ciència, va dir, confereix una manera critica de veure la realitat perquè es basa a qüestionar-se el que és dogma i en demostrar les hipòtesis amb fets. Aquí podeu trobar el discurs complet.

L’Atul Gawande també diu que la mala fama de la ciència és probablement deguda a que el pensament científic no és una forma normal de pensament. És antinatural i contrari a la intuïció i al sentit comú. I, sobretot, s’oposa frontalment als dogmes i a “a saviesa de la divinitat”. He de dir que vaig descobrir aquestes frases d’Atul Gawande gràcies a l’article de la Montserrat Vendrell, que també cita el discurs “l’aigua és això” de David Foster Wallace. Wallace ens diu que ensenyar a pensar és ensenyar-nos a ser una mica menys arrogants i a contemplar-nos a nosaltres i les nostres certeses amb “consciència crítica”, perquè un gran percentatge del que tendim a donar per segur s’acaba demostrant que és fals i del tot il·lusori. Els humans inventem històries, ens agrada explicar-les, i ens agrada creure les històries que expliquem.

Aquest és el punt clau, crec. Un gran percentatge del que tendim a donar per segur s’acaba demostrant que és fals i il·lusori. Això inclou els dogmes i les veritats “revelades”, el que ens diuen que hem de creure, el que ens volen vendre, el que llegim als diaris i el que veiem als mitjans de comunicació i a les xarxes socials. Per això, l’Atul Gawande ens diu que hem de ser científics. Perquè l’actitud científica es basa en dubtar de tot el que ens diuen, siguin dogmes o teories científiques, i només acceptar el que podem comprovar i demostrar. En Freeman Dyson explica una bonica historia que involucra Albert Einstein i Henri Poincaré. Comenta que Einstein va poder crear i proposar la seva teoria perquè va dubtar i no es va creure que la mecànica de Newton i la teoria de l’èter fossin dogmes immutables; Poincaré, en canvi, tot i intuir el mateix que Einstein, no es va atrevir a refutar els dogmes establerts i va acabar enredat en teories absurdes. En d’altres paraules: el científic de veritat (sigui de lletres o de ciències) no permet que ningú camini per la seva ment amb els peus bruts.

L’actitud científica és universal. Hi ha científics de professió, però també hi ha humanistes de ciències. Són escriptors, periodistes, humanistes i artistes que s’interessen per la ciència i que han entès que no cal ser de ciències per tenir una actitud científica davant la vida. En aquest sentit, hi ha articles de la Rosa Montero que trobo molt encertats. La Rosa Montero explica que va estudiar lletres, però que la ciència li encanta i que sempre ha lamentat el gran acientifisme de la societat espanyola. Tot seguit, comenta el projecte de l’Institut d’Astrofísica de Canàries (IAC) en el qual diu que ha participat i que considera un preciós regal: L’IAC ha convidat un grup d’escriptors a visitar durant quatre dies les seves instal·lacions, demanant-los que després escriguin un conte per un llibre que volen publicar. Acaba dient que haurien d’obligar tots els ciutadans a visitar els observatoris almenys un cop l’any, per aprendre a mirar Andròmeda en comptes d’estar absorts en el nostre melic…

———

Per cert, en Norbert Bilbeny diu que la intel·ligència interior bruta del planeta ha crescut exponencialment, però que en canvi sembla que estigui creixent en relació inversa al nostre contingut mental. Constata la pobresa mental quan veu que la gent llegeix però no assimila el que llegeix. I pensa que ens perdem en les tres V: visualitat, virtualitat, velocitat.

La llum i la inèrcia

dimecres, 2/09/2015

A primers de setembre tenim la llum del 10 d’abril, en els dies clars i sense núvols. Ja sé que no estic dient res de nou, perquè tots sabem que el moviment aparent del Sol al cel és simètric respecte el solstici d’estiu del 21 de juny. Ara tenim la llum de principis d’abril de la mateixa manera que el dia 21 de setembre repetirem la llum del 21 de març, quan va començar la primavera.

Tampoc és cap novetat el fet que les temperatures van endarrerides en relació a la llum. Els dies de més llum, quan ens preparem per les festes de Sant Joan, no són pas els més calorosos. Sí que són els de més escalfament solar, perquè els dies de més hores de Sol també són els de màxima exposició a la seva radiació infraroja. Però escalfament no és sinònim de temperatura. La gran inèrcia tèrmica de la Terra i dels mars fa que tot es retardi. Quan posem aliments al forn, la radiació de les seves parets tarda una estona fins escalfar i coure’ls. I el mateix passa quan deixem menjars al congelador. Ens hem d’esperar. Tots els processos de canvi de temperatures són essencialment lents, perquè comporten infinitat d’intercanvis energètics entre molècules. La llum del mes de juny escalfa força, però els seus efectes no es deixen notar, habitualment, fins mitjans de juliol.

Qui té més inèrcia tèrmica, la terra ferma o el mar? Ho podem saber si estudiem els climogrames. A la imatge de l’esquerra podeu veure, a la part de dalt, el climograma de l’observatori Fabra de Barcelona amb dades amitjanades entre els anys 1971 i 2000 (la imatge és d’aquesta pàgina web). La temperatura ambient és la corba en vermell, mentre que les barres blaves mostren la pluviositat. A sota, podeu veure la gràfica de la temperatura de l’aigua del mar, també de Barcelona, segons dades d’aquesta pàgina web. La corba en negre, més suau, mostra dades amitjanades entre els anys 2006 i 2013, mentre que la corba en blau indica les temperatures de l’any 2014, més variables: les àrees en blau indiquen els períodes en què la temperatura de l’aigua del mar del 2014 va ser inferior a l’esperat, mentre que les zones en vermell són períodes en els que la temperatura l’any passat va ser més alta del que hom podia esperar. Ens vam trobar en aquesta darrera situació els mesos de febrer, març i abril, així com després del 15 d’octubre. Encara que el gràfic superior indica els mesos i l’inferior les setmanes, he ajustat ambdues gràfiques per a que les dates coincideixin en vertical. Podeu trobar més dades d’aquest i d’altres llocs, en aquesta altra pàgina web.

La línia negre vertical de la imatge, corresponent a l’inici del mes de setembre, ens indica que la temperatura ambient mitjana, la que podem esperar, ja ha començat a baixar. El raonable és que la temperatura de l’u de setembre sigui semblant a la de finals del mes de juny. En canvi, la temperatura del mar és força estable, al voltant d’uns 25 graus, entre el 20 de juliol i primers de setembre. El mar encara no s’ha començat a refredar.

Les corbes de temperatura ambient i de l’aigua del mar són força simètriques, encara que la primera puja una mica més lentament del que baixa. Podem fer l’exercici, ben senzill, de calcular l’eix de simetria d’una i altra. És un càlcul ben senzill (vegeu la nota al final) però, si l’aritmètica ens fa mandra, ho podem deduir fins i tot amb mètodes manuals: imprimim la gràfica, posem el paper damunt el vidre d’una finestra que rebi la llum del Sol per l’altra banda, i anem provant doblecs verticals fins trobar la millor superposició (per transparència) entre les parts esquerra i dreta de la corba. Mentre que l’eix de simetria de la corba de la llum solar correspon evidentment al 21 de juny, veurem que l’eix simetria de la temperatura ambient és aproximadament l’u d’agost mentre que el de l’aigua del mar es troba als voltants del 15 d’agost. Resumint: la inèrcia de l’aigua de mar és més gran que la de la terra ferma. Per això ens podem banyar al mar quan ja comença a fresquejar…

Per cert, en David Foster Wallace deia que la llibertat i la veneració realment important comporta atenció, consciència, disciplina, esforç i la capacitat de preocupar-te de debò pels altres, una vegada i una altra, en una miríada de petits gestos ínfims i poc seductors, cada dia. És la llibertat que dóna l’educació veritable: poder decidir conscientment què té sentit i què no. Deia que l’aigua és això.

——

NOTA: Per a calcular l’eix de simetria d’una corba com les del climograma, una possible solució numèrica consisteix en treballar a partir d’una discretització en l’eix vertical. Discretitzem, per exemple, de grau en grau. Per a cada valor de la temperatura, mirem quines són les dues dates xi, yi (primavera i tardor) en què aquesta s’assoleix (utilitzo la notació xi, yi, di per indicar “x sub i”, “y sub i”, “d sub i”). Les dates les podem identificar amb un número que indiqui el nombre de dies que han passat des de l’u de gener. Per exemple, i en el cas de la temperatura mitjana de l’aigua de mar de la imatge de dalt, les dues dates corresponents als 15 graus són 109 i 347 (són les dates que corresponen a 15,6 i 49,6 setmanes). Doncs bé, l’eix de simetria més adaptat a aquesta parella de dates és justament la seva mitjana. Sumem 109+347, dividim per 2, i el resultat és 228. Ara, si aquest càlcul el fem de grau en grau, obtindrem moltes parelles (xi, yi) i cada una d’elles tindrà la seva mitjana di. Només cal fer la mitjana de totes aquests resultats parcials di (sumant-les i dividint pel nombre de temperatures que hem considerat) i aquest és el valor de la data corresponent a l’eix de simetria. És fàcil veure que aquesta és també la solució que troba el ben conegut algorisme de mínims quadrats, que en aquest cas calcularia el valor de la data d que minimitza la suma de quadrats de tots els termes (xi + yi -2*d) per a totes les parelles de valors que estem considerant.