Un equip IDIBAPS-Clínic mostra per primer cop els beneficis dels “big data” Google-Pubmed en la geoepidemiologia de les malalties autoimmunes sistèmiques

Els big data o dades massives estan canviant el panorama de la recerca científica, també en medicina, on en àrees com l’epidemiologia o la genètica permeten analitzar poblacions totals o gairebé totals en estudis que poden ser relativament bàsics (determinar les incidències d’una malaltia en una població concreta), o molt complexes (analitzar l’eficàcia de nous fàrmacs sobre tot un conjunt global de població o una investigació genètica a gran escala).

Ara, un estudi de geoepidemiologia autoimmune realitzat sobre 394.827 pacients amb malalties autoimmunes sistèmiques (SAD) liderat per l’equip IDIBAPS de Malaties Autoimmunes i Sistèmiques, el Grup Transversal de recerca en Atenció Primària d’IDIBAPS i CAPSBE i l’Hospital Clínic, en col·laboració amb la Tel Aviv University, el King’s College University de Londres i la Harvard Medical School de Boston, mostra els resultats d’una cerca amb dades massives utilitzant Google i Pubmed de forma combinada i els beneficis que es poden obtenir per a la investigació mèdica en les malalties autoimmunes sistèmiques (SAD). L’estudi està disponible en línia a la revista científica Autoimmunity Reviews.

El treball, signat per Manuel Ramos-Casals, Pilar Brito-Zerón, Belchin Kostov, Antoni Sisó-Almirall, Xavier Bosch, David Buss, Antoni Trilla, John H. Stone, Munther A. Khamashta i Yehuda Shoenfeld, explora el potencial del motor de cerca de Google per a recollir i agrupar una gran sèrie de SAD referenciades en la base de dades científica Pubmed, amb l’objectiu d’obtenir com a resultat un ‘mapa’ geoepidemiològic d’alta definició de cada malaltia a partir d'una sèrie de variables epidemiològiques, geogràfiques, de tipus de bases de dades emprades, ètniques i clíniques.

Metodologia

L’equip va realitzar una cerca de text a Google entre el 20 i el 31 de gener de 2015 utilitzant l’algorisme de cerca de text ““malaltia autoimmune sistèmicai1.000…100.000 pacientsi www.ncbi.nim.nig.gov””. A les referències obtingudes mitjançant Google els investigadors van afegir manualment llistes de referències a articles rellevants que la cerca no va recollir, i van excloure les revisions, les meta-anàlisi, els estudis epidemiològics en pacients que no tenien malalties autoimmunes sistèmiques i les cohorts duplicades.

Les referències resultants van ser analitzades de forma independent per dos revisors, i de les finalment seleccionades es van extreure les dades referents al tipus de SAD, nombre de pacients, país, fonts de les dades, tipus de bases de dades, criteris d’inclusió i exclusió, distribució per gènere, edat a l’inici de l’estudi seleccionat, diagnòstic, i/o entrada a l’estudi seleccionat i dades ètniques.

Les SAD més estudiades

Del total de SAD cercades en l’estudi  es van recollir dades rellevants de: lupus eritematós sistèmic (LES), malaltia de Kawasaki, arteritis de cèl·lula gegant, malaltia de Behçet, esclerosi sistèmica, síndrome de Sjögren primari, sarcoidosi, immunodeficiències primàries, amiloïdosi, vasculitis de mida mitjana, polimiàlgia reumàtica, miopaties inflamatòries, granulomatosi amb poliangiïtis, la malaltia de Schonlein-Henoch i la síndrome antifosfolípida. L’estudi no va obtenir dades rellevants de 10 de les SAD analitzades: policondritis recurrent, malaltia de Still, síndrome hemofagocític, malaltia relacionada a IgC4, poliarteritis nodosa, arteritis de Takayasu, malaltia de Buerger, granulomatosi eosinofílica amb poliangiitis, poliangiitis microscòpica i malaltia de Cogan. En total, els investigadors va recollir dades d’un total 85 estudis i 394.827 pacients, dels quals van analitzar finalment les dades de 359.838 pacients.

Les SAD amb un nombre més elevat de casos reportats van ser, en infants, la síndrome de Kawasaki; en adults, el lupus eritematós sistèmic (LES), l’arteritis de cèl·lula gegant, la malaltia de Behçet, l’esclerosi sistèmica i la síndrome de Sjögren.

L’anàlisi mostra una predominança de la utilització de bases de dades mèdiques enfront de les administratives (74% vs. 26%), del sistema públic de salut davant fonts d’asseguradores en salut (88% vs. 12%), dels dissenys dels estudis basats en pacients enfront de dissenys basats en la població (82% vs. 18%), i l’ús de criteris de classificació enfront d'aproximacions clíniques i codis diagnòstics (53% vs. 22% vs. 25%).

El sexe i l’edat de les SAD

La predisposició del sexe femení a desenvolupar una malaltia autoimmune és ben coneguda, tot i que encara se'n desconeix la causa concreta d’aquesta predominança de gènere. No obstant això, la desigualtat en la proporció de gènere varia significativament segons les malalties, i també es produeixen diferències significatives entre les SAD desenvolupades en adults i les que es manifesten en infants.

L’estudi amb dades massives mostra que, de 178.603 pacients, el 73,1% (130.539 pacients) eren dones, amb una proporció global dona/home de 3 a 1. En malalties, la proporció de gènere més desigual es va trobar en la síndrome de Sjögren primari, amb quasi 10 dones afectades per cada home afectat, seguit del LES, l’esclerosi sistèmica (SSc) i la síndrome antifosfolípida (APS), ambdues amb una proporció de quasi 5 dones per home afectat; i per l'arteritis de cèl·lula gegant (GCA), la polimiàlgia reumàtica i les miopaties inflamatòries, amb una proporció dona – home de 2-3 a 1. La sarcoïdosi i la malaltia de Behçet van mostrar una proporció molt equilibrada (1 a 1), mentre que en la vasculitis i l’amiloïdosi la proporció canvia de gènere, essent més freqüents en homes que en dones. Les tres SAD infantils –les immunodeficiències primàries, la malaltia de Kawasaki i la malaltia de Schonlein-Henoch- van mostrar una predominança en homes, amb un 58% dels casos.

Pel que fa referència a l’edat d’inici de les SAD, l’estudi amb dades massives mostra una gran variabilitat: per a algunes malalties, l’edat d’inici es de 0 a 1 any, mentre que en altres, com la síndrome antifosfolípida (APS) i la malaltia de Behçet, l’edat màxima de diagnòstic és de 94 a 96 anys.

Les dades massives confirmen una característica ben coneguda de les SAD: cada malaltia afecta predominantment un grup d’edat específic. La malaltia de Kawasaki (2,57 anys a l’inici), les immunodeficiències primàries (3,3 anys) i la malaltia de Schonlein-Henoch (5,24 anys) afecten la població infantil, mentre que el LES (33 anys), la malaltia de Behçet (36 anys) i la sarcoïdosi (38 anys) afecten adults joves. L'esclerosi sistèmica (51 anys) i la vasculitis (52 anys) afecten persones de mitjana edat, mentre que l’amiloïdosi (63 anys), la polimiàlgia reumàtica (PMR) i l’arteritis de cèl·lula gegant (GCA) (73 anys) afecten les persones grans.

SAD per geografia i ètnia

Els investigadors han trobat que els estudis de cada malaltia presenten una concentració geogràfica significativa: 6 de 7 estudis de pacients amb arteritis de cèl·lula gegant (GPC) o polimiàlgia reumàtica (PMR) es van portar a terme al nord d’Europa; el mateix succeeix en el cas de l’amiloïdosi, amb 5 de 6 estudis realitzats als EUA; i amb la malaltia de Behçet (11 estudis de 12) i la malaltia de Kawasaki (5 de 7 estudis) realitzats a Àsia. Igualment, es va mostrar una concentració geogràfica significativa pel que fa a l’origen de les bases de dades emprades als estudis analitzats, amb una predominança de les bases de dades administratives davant les mèdiques.

Respecte a l’origen ètnic dels pacients dels estudis, només en 14 estudis analitzats (16%) es detallava la distribució ètnica; 5 estudis es van dur a terme amb mostres etnològicament molt homogènies, amb un 90% de pacients caucàsics o asiàtics. Els 9 estudis restants es van realitzar en cohorts multiètniques d’Amèrica, principalment dels EUA però també del Canadà i de Llatinoamèrica.

D’aquests 9 estudis, 6 es van desenvolupar en una àrea geogràfica ben definida, la qual cosa va permetre a l’equip investigador fer una comparació de les principals característiques epidemiològiques per ètnia amb les reportades per a la població general de la mateixa àrea geogràfica. Els resultats mostren que es dóna una major freqüència de tres SAD (LES, miopaties antiinflamatòries i malaltia de Kawasaki) en pacients afroamericans, i una més alta freqüència de la malaltia de Kawasaki en pacients asiàtics. En dos d’aquests estudis, realitzats amb pacients de Califòrnia amb LES, es va trobar que la malaltia mostrava una freqüència més alta en pacients caucàsics i més baixa en pacients hispans, reflectint possiblement la influència dels diferents nivells d’accés a plans d’assistència mèdica d’aquests col·lectius.

El futur de la recerca mèdica al segle XXI

La recerca mèdica del segle XXI ha iniciat un canvi radical gràcies a la creixent convergència de la medicina amb els avenços tecnològics, especialment en l’àmbit digital. Els projectes de màxima innovació en l’actualitat promouen la interacció de la medicina amb les grans innovacions d’aquest començament de segle (Big Data, Internet of Things (IoT), 3D Printing, Analytics i Social Media). Els líders de la recerca mèdica en els pròxims anys necessitaran no només un altíssim nivell d’expertesa mèdica en el seu àmbit sinó també tenir sòlids coneixements en aquestes noves àrees del coneixement tecnològic i capacitat de treballar i de liderar equips que integrin, a més de metges, biòlegs, genetistes o estadístics, a matemàtics, bioinformàtics, programadors, experts en comunicació social i tècnics en robòtica o impressió 3D.

Referència

Ramos-Casals M,et al.:  Google-driven search for big data in autoimmune geoepidemiology: Analysis of 394,827 patients with systemic autoimmune diseases, Autoimmun Rev (2015), http://dx.doi.org/10.1016/j.autrev.2015.03.008