Arxiu del divendres, 13/09/2019

Un embolic per l’autocorrector d’Excel

divendres, 13/09/2019

Sou dels que pensàveu que els científics són una comunitat de gent molt espavilada que treballa amb una precisió envejable i que aconsegueix uns resultats fiables, reproduïbles i… vaja, que el que diuen va a missa? Doncs ja us ho podeu treure del cap. Oblideu CSI i sèries similars, molt allunyades de la realitat dels laboratoris. El món real és més prosaic i per recordar-ho acaben de descobrir que una bona part de les dades publicades en estudis de genètica contenen errors per culpa del…. Excel!

Els fulls de càlcul són una eina genial per treballar, però també poden resultar diabòlicament enganyoses. Els errors que amaguen passen molt fàcilment desapercebuts, de manera que sempre insisteixo als estudiants que verifiquin més d’una vegada que tot està bé. El que no comptava era que l’autocorrector fos una font de problemes afegits.

Sí, sí. El maleït autocorrector del full de càlcul Excel, omnipresent a tots els ordinadors, té la mania de corregir el que opina que són errors tipogràfics. I encara més irritant resulta quan decideix que el que has escrit deu ser una data i també ho arregla deixant-lo, preferentment, en el format anglosaxó. De vegades resulta útil, però segons el que estiguis introduint pot ser una font d’embolics considerable.

Per exemple, hi ha un gen anomenat Septina-2 (SEPT2). La família de les septines es va descobrir estudiant la divisió cel·lular. Quan una cèl·lula es divideix en dos, durant una estona es mantenen unides per estructura compartida anomenada “septe”. Per això, les proteïnes que feien allà la seva funció les van anomenar “septines”. El problema és que si poses SEPT2 a Excel, el programa interpreta que estàs escrivint una data, el dos de setembre en anglès (September, 2  ->  Sept 2) i la punyetera pàgina ho corregeix automàticament. Tu havies escrit el nom del gen “SEPT2” i si no t’hi fixes, el que et sortirà serà “2019/09/02”.

Anecdòtic? Doncs no. El 20% dels treballs publicats amb fulls Excel per descriure les llistes de gens o proteïnes identificades i com s’han processat, contenen errors atribuïbles a l’autocorrector. Que ho hauríem de revisar? Sobre el paper sí, però cal tenir en compte que actualment els gens o les proteïnes ja s’analitzen amb sistemes automatitzats que generen llistes de centenars o milers de dades presentades, molt sovint, en un full d’Excel. Normalment ens fixem en aquells gens que ens interessen particularment, els més alterats en l’estudi concret o els més relacionats amb la patologia o el mecanisme que estudiem, però difícilment els repasses tots.

De manera que la propera vegada que un full de càlcul us faci una mala passada, recordeu que als millors científics del món i a les revistes científiques més prestigioses els passa el mateix. Tots som humans i l’autocorrector d’Excel és un generador d’errors inesperats infatigable, inescrutable, invencible!