Grup d’Anàlisi Quantitativa Regional (AQR–UB)
AQR COVID-19 / #11
Barcelona, 25 de Maig de 2020
Antecedents i objectius
La creixent disponibilitat d’informació estadística sobre la propagació i la incidència de la COVID-19 a nivell territorial està permetent monitoritzar la distribució espacial de l’epidèmia i vincular la seva incidència amb diverses característiques dels territoris. En el cas de Catalunya, l’Agència Catalana de Qualitat i Avaluació de la Salut (AQuAS) ha estat proporcionant, des de finals de març, informació sobre el nombre diari de casos positius de la COVID-19 per àrees bàsiques de salut (ABS) i per municipis.
En píndoles anteriors hem mostrat evidència sobre l’associació entre la distribució geogràfica de la COVID-19 i alguns factors d’interès, com ara la densitat de població, els factors meteorològics o les condicions socio-econòmiques de la població en els diferents territoris, entre d’altres factors. Aquestes anàlisis prèvies, com s’ha fet principalment en la literatura existent, es van centrar en la incidència de propagació de la COVID-19 mesurada com la fracció de persones que van donar positiu i el percentatge de la població. Borjas (2020) argumenta que les anàlisis basats en un sol número podrien ser un problema. De fet, la taxa d’infecció en la població és el resultat del producte de dos factors diferents: la freqüència de les proves en una àrea en particular i la fracció de les proves positives entre els avaluats. Considerant el cas de Nova York, Borjas (2020) va argumentar que la incidència de les proves/tests a la ciutat no era aleatòria i va analitzar com les característiques socioeconòmiques es correlacionen amb cada un dels dos determinants de la taxa d’infecció. Els resultats han demostrat que alguns factors socioeconòmics estaven correlacionats en direccions oposades amb cada un dels dos determinants de la taxa d’infeccions, obtenint una correlació “zero” amb les taxes d’infecció sobre la població. Com a conseqüència, l’efecte que aquestes variables han tingut en la propagació de la COVID-19 roman ocult. Més detalladament, va demostrar que la incidència de les proves es va correlacionar positivament amb els ingressos de la llar en certs veïnats, assenyalant així que les àrees més riques tenien més probabilitats de ser avaluades. No obstant això, una vegada que s’havien administrat les proves, la probabilitat d’infectar-se estava inversament relacionada amb els ingressos; les llars més pobres tenien més probabilitats d’infecció. A més, en general, els seus resultats han demostrat que la probabilitat condicional d’un resultat positiu de la prova va ser molt més gran per a les persones que viuen en veïnats pobres, on un gran nombre de persones resideixen juntes i en veïnats amb una elevada població negra o immigrant. Al mateix temps, però, les persones que resideixen en barris pobres o immigrants tenien menys probabilitats de fer-se la prova. Aquests resultats poden dependre de les característiques del sistema de salut dels EUA., ja que es necessita una assegurança de salut (o prou recursos econòmics) per obtenir assistència mèdica, ja que la majoria dels centres de salut són gestionats per empreses privades[1].
El sistema de salut a (la majoria) dels països europeus és diferent del dels EUA., ja que és principalment públic i (gairebé) totalment finançat per l’Estat. Per tant, accedir a assistència mèdica a Europa no està condicionat per tenir una assegurança de salut. Per tant, sorgeix una pregunta natural: com es correlacionen els factors socioeconòmics amb cada un dels dos determinants de les taxes d’infecció a Europa en comparació amb els Estats Units? Això ajudarà a comprendre si les diferències en els sistemes de salut podrien tenir un paper en com el sistema de salut ha combatut la propagació de la COVID-19. En aquesta píndola, considerem la regió europea de Catalunya (Espanya) i analitzem el paper de diversos factors socioeconòmics en les taxes d’infecció i en els seus dos determinants, utilitzant dades definides a nivell d’Àrees Bàsiques de Salut (ABS).[2]
L’anàlisi empírica utilitza dades de secció transversal pel 8 d’abril, que és l’últim dia en què les autoritats sanitàries catalanes van proporcionar informació sobre el nombre de proves realitzades. Analitzem l’associació entre la taxa d’infeccions sobre la població, la taxa de proves sobre la població i la taxa d’infeccions sobre les proves, amb un conjunt de dades relacionades amb els indicadors demogràfics i socioeconòmics de la població de Catalunya. Pel que fa a l’evidència descriptiva, per a la regió total de Catalunya a data 8 d’abril, s’han dut a terme 65.394 proves, que representen menys de l’1% de la població. A més, al voltant del 43% de les proves van donar resultats positius, mentre que el nombre de casos positius per cada 10.000 habitants va ser de 36,44. A més, la correlació entre els casos positius sobre la població i el nombre de proves sobre la població és de 0,89, mentre que la correlació entre el nombre d’infeccions sobre la població i el nombre d’infeccions sobre les proves és de 0,67. Finalment, la correlació entre el nombre de proves sobre la població i el nombre d’infeccions detectades durant les proves és de 0,34.
En aquesta píndola ens hem centrat en les següents variables explicatives: densitat, percentatge de persones majors de 65 anys, taxa de mortalitat, percentatge de població dependent més gran de 15 anys[3], un índex de socioprivació[4] i un conjunt de variables relacionades amb la població estrangera, com el nombre d’estrangers, també diferenciats per regions d’origen, com els països desenvolupats[5], la Xina, Itàlia i la UE. [6]
Determinants de les taxes d’infecció, taxes de proves i taxes d’infecció sobre les proves
Realitzem una regressió logit grupal usant mínims quadrats ponderats per a la mostra de 371 ABS amb dades fins al 8 d’abril de 2020. Totes les regressions controlen els factors meteorològics (usant la temperatura i humitat mitjana entre dos i tres setmanes abans de la data de referència), contaminació (usant la mitjana en els últims anys de NO2 i PM10), el dia des de la primera prova (o cas) i el seu valor al quadrat, i una variable fictícia que identifica una àrea (Conca d’Òdena) on hi ha hagut un brot significatiu a Catalunya. Atès que les nostres variables independents estan en gran mesura altament correlacionades entre elles, les inserirem per separat en una sèrie de regressions. No obstant això, també executem les regressions amb totes les variables, per verificar les troballes individuals. La Taula 1 resumeix els resultats obtinguts en termes de signes i significació de cada variable [7].
A la Taula 1 es pot veure que la taxa d’infeccions sobre la població s’associa positivament amb moltes de les variables que s’han tingut en compte, com el percentatge de població major de 65 anys, el percentatge de població amb dependència major de 15 anys, la densitat de l’activitat econòmica i l’índex de socioprivació[8]. D’altra banda, vam descobrir una associació negativa amb la presència relativa, en les ABS, d’immigrants, en particular quan provenen de la Unió Europea i, en menor mesura, d’Itàlia. No trobem cap associació significativa, en termes d’ABS, amb una presència relativament alta d’immigrants provinents de la Xina i dels països en desenvolupament; fins i tot l’associació amb la Xina és positiva, però estimada de forma poc precisa. A més, encara que existeixen correlacions significatives entre parells de variables, aquests patrons individuals es confirmen en l’anàlisi conjunta..
Taula 1. Explicació de la taxa d’infecció, la taxa de proves i la taxa d’infecció sobre les proves: comparació de signes i significat de les estimacions de paràmetres per a variables clau

Font: elaboració pròpia. Significació a l’1% ***, 5% ** i 10% *.
Ara observem els determinants de la taxa d’infecció sobre la població: la incidència de les proves sobre la població i la incidència de les proves positives sobre les proves totals. Analitzem cadascuna de les variables d’interès per separat.
Pel que fa a l’estructura d’edat i la morbiditat de la població, és possible observar que s’ha realitzat un nombre relativament gran de proves per càpita a les ABS caracteritzades per un major percentatge de població d’edat avançada (> 65) i taxa de mortalitat . Això podria haver estat justificat per la necessitat de “cobrir” relativament més aquest segment de la població, més propensos a patir de forma greu la malaltia. A més, podria estar en línia amb la política seguida a Catalunya, on només les persones amb símptomes greus han estat analitzades per detectar la COVID-19, i aquestes probablement eren persones grans. No obstant això, mantenint fix el nombre de proves, no hi ha una associació significativa amb la incidència d’infeccions (com a Borjas, 2020). Per tant, el major nombre d’infeccions sobre la població associades amb aquestes dues variables està impulsat pel nombre relativament gran de proves, el que suggereix que no hi ha una “predisposició” més gran per emmalaltir en aquest segment de la població [9]. D’altra banda, al considerar les ABS caracteritzades per un nombre relativament gran de persones amb una condició de dependència, s’han trobat taxes d’infeccions més altes per a aquest segment de la població, el que suggereix una major probabilitat d’infecció per a usuaris amb condicions elevades de morbiditat. No obstant això, no s’ha prestat més atenció a la prova d’aquest segment de la població pel que fa als altres, ja que l’associació amb la proporció de proves sobre la població és insignificant.
Pel que fa a la densitat, és coneguda l’associació positiva entre la taxa d’infecció i la població, i això es confirma també en el cas de Catalunya [10]. A més, tant la taxa de proves sobre la població com la taxa de proves positives sobre les proves totals mostren una associació positiva, amb major magnitud per al primer. Aquests resultats també es confirmen quan es prova la variable conjuntament, especialment pel que fa a la taxa de proves. Per contra, quan es considera l’estructura d’edat i morbiditat de la població en el cas de la taxa d’infeccions respecte al conjunt de proves realitzades, la relació no és significativa..
Considerant les àrees més desfavorides, també trobem una associació positiva amb les taxes d’infecció, impulsada tant per la incidència de les proves sobre la població com per la incidència de casos positius sobre les proves. En aquest cas, la magnitud de l’efecte és més gran pel nombre de casos positius. Per tant, les ABS caracteritzades per una major socio-privació tenien més probabilitats d’haver ser testats/provats i es van trobar més resultats positius respecte les ABS amb menor grau de socio-privació. Aquests resultats també es mantenen quan es proven conjuntament totes les variables d’interès. [11]
Finalment, considerant l’estructura estrangera/nativa de la població, sorgeixen altres troballes interessants. De fet, totes les ABS amb un nombre relativament alt de població estrangera han estat relativament menys provades/testejades que altres ABS, amb l’excepció (encara que individualment no s’estima amb precisió) d’aquelles caracteritzades per un percentatge relativament més gran de població xinesa.
No obstant això, considerant els immigrants en general, l’associació amb casos positius és insignificant. Per tant, l’associació negativa amb la taxa d’infecció sobre la població està impulsada per la menor mesura en què s’han avaluat aquestes àrees, més que per les taxes d’infecció més baixes durant les proves.
Passant a considerar col·lectius de manera més específica, en relació a la població xinesa, els resultats de la taxa d’infecció sobre la població han estat impulsats per una major atenció a fer proves/tests en àrees caracteritzades per una alta presència d’aquesta ètnia, que per un major nombre de taxes d’infecció respecte altres àrees. Aquests resultats també es mantenen quan es contrasten les variables conjuntament.
Tenint en compte les ABS amb un alt percentatge de població procedent dels països en desenvolupament, l’associació amb la taxa d’infecció en principi no és significativament diferent de 0. No obstant això, aquest és el resultat, com s’ha esmentat anteriorment, de la compensació entre relacions de signe invers respecte cada un dels dos determinants de la taxa d’infecció. De fet, aquestes àrees han estat relativament menys propenses a ser provades/testejades. No obstant això, una vegada controlada la quantitat de proves/tests realitzats, s’han trobat taxes d’infecció més altes.
L’última troballa podria estar relacionada amb la socio-privació, la qual augmenta la probabilitat d’infectar-, ja que una major socio-privació podria estar associada a àrees amb un alt percentatge de població provinent dels països en desenvolupament. No obstant això, aquest no sembla ser el cas, ja que quan es proven/contrasten conjuntament variables d’interès, donat el mateix nivell de socio-privació, les correlacions resultants no canvien significativament. Per tant, s’han dut a terme menys proves també en àrees més desfavorides caracteritzades per un major percentatge de població provinent dels països en desenvolupament en comparació amb les àrees més desfavorides caracteritzades per un major percentatge de població nativa, fins i tot si les ABS amb alta incidència de població provinent dels països en desenvolupament semblen estar relativament més afectades.
Quant als immigrants d’Itàlia i de la UE en general, la taxa d’infecció sobre la població està impulsada per una menor incidència de la prova i una menor taxa d’infecció en les proves, el que assenyala una menor atenció cap a aquestes àrees que van mostrar menys infeccions.
Conclusió
En general, aquests resultats mostren que, en comparació amb el cas dels Estats Units, Catalunya sembla haver-se comportat de manera diferent. Si bé els EUA ha concentrat més atenció en avaluar a individus en àrees més riques, encara que després es van trobar infeccions més altes en els segments relativament més pobres de la població, a Catalunya s’ha prestat més atenció a les àrees en principi que tenien més probabilitats de patir greus conseqüències de la malaltia, com aquells caracteritzats per una major privació i el que té una major presència de persones grans (en aquest últim cas, com en els Estats Units). No obstant això, com als Estats Units, Catalunya va posar menys atenció a les àrees amb un major percentatge de població estrangera. Això podria estar justificat en el cas d’immigrants “més rics” com els d’Itàlia i la UE donat que la incidència de la taxa d’infecció ha estat menor, però no en el cas de la població estrangera provinent de països en desenvolupament, on s’observa que la incidència de la taxa d’infecció ha estat més gran.
Aquesta imatge suggereix que, al menys en certa mesura, el sistema de salut català (que comparteix diverses característiques amb la resta dels sistemes de salut pública europeus) ha brindat més assistència als segments més pobres de la població respecte el sistema de salut dels EUA., per gestionar el brot de la COVID-19. temps Ara bé, no està clar si aquesta assistència ha privilegiat relativament més a la població nativa respecte al segment més feble de la població estrangera. Es necessitarien més anàlisis per aclarir millor l’últim punt.
Un altre resultat important de l’anàlisi general és la
rellevància de fer públiques les dades sobre la quantitat de proves realitzades
perquè, com hem demostrat, poden ressaltar diversos aspectes de la gestió de la
infecció que no és possible reunir sense accés a aquestes dades[12].
Per tant, és qüestionable la raó per la qual les autoritats sanitàries
catalanes (com probablement les espanyoles) han decidit deixat de fer disponibles
aquestes dades (al menys fins el moment d’escriure aquesta nota de recerca).
Aquesta nota sintetitza alguns dels resultats sobre l’anàlisi de la distribució geogràfica de la COVID-19 a Catalunya que s’està duent a terme per part
d’investigadors del Grup de Recerca AQR de la UB (http://www.ub.edu/aqr/). En ella es posa especial èmfasi a considerar els aspectes geogràfics i territorials, fets d’especial interès en la recerca del grup.
Els resultats detallats que s’han fet servir en aquesta nota es troben a disposició del lector interessat.
En l’elaboració d’aquesta nota han participat Josep Lluís Carrion-i-Silvestre, Antonio Di Paolo, Alicia García, José R. García, Enrique López-Bazo, Jordi López-Tamayo, Alessia Matano, Rosina Moreno, Ernest Pons, Raul Ramos, Jordi Suriñach i Esther Vayà.
[1] També és possible que les persones que resideixin en els barris més rics podrien haver tingutmillors xarxes d’informació o es podrien permetre amb més facilitat fer proves a altres llocs de la ciutat (cit. Borjas, 2020).
[2] Vegeu la nota metodològica de les fonts de dades https://www.ub.edu/aqr_covid19/docs/AQR_Covid19_NotaMetodologica_cast.pdf
[3] Fa referència a persones que necessiten algun tipus d’assistència per dur a terme activitats bàsiques diàries a causa de les seves condicions de salut.
[4] Veure definició de l’índex en una píndola anterior Doc AQR-COVID/ #03, http://www.ub.edu/aqr/fitxa-actualitat_en.php?id=104.
[5] Les dades dels països en desenvolupament provenen de la base de dades “Indicadors de salut comunitaris” de la Generalitat de Catalunya.
[6] És important subratllar que, en principi, algunes d’aquestes variables podrien estar correlacionades positivament amb la probabilitat que es poguessin provar i tenir una infecció, com per exemple el nombre de majors de 65 anys. En aquest cas la incidència mesuraria una resposta al brot. Al contrari, per a altres variables, com l’índex de socio-privació o el percentatge de població estrangera, és probable que s’eviti aquesta qüestió d’endogeneïtat, és a dir, no s’espera una correlació positiva amb els determinants de la taxa d’infecció total a causa de l’existència de brots de l’epidèmia.
[7]Veure la nota metodològica per obtenir resultats de les regressions https://www.ub.edu/aqr_covid19/docs/AQR_Covid19_NotaMetodologica_cast.pdf
[8] Veure una anàlisi més detallada d’aquests factors en píldores anteriors (Doc AQR-COVID/#01 i #03).
[9] Aquests resultats també es confirmen en general quan es proven conjuntament les variables, fins i tot si el nombre d’infeccions per proves en alguns casos està correlacionat positivament amb el percentatge de persones de 65 anys o més, mentre que la taxa de mortalitat és negativa, però això és probable a causa de la alta correlació entre aquestes dues variables (73%).
[10] https://www.ub.edu/aqr_covid19/docs/AQR_Covid19_density_eng.pdf
[11] https://www.ub.edu/aqr_covid19/docs/AQR_Covid19_soceco_eng.pdf
[12] Seria millor, com es va fer recentment a Itàlia, proporcionar informació sobre les dades de les proves i les “noves” proves, quan les persones es fan la prova per primera vegada. De fet, les dades sobre el nombre de noves proves són les noves proves i les que es realitzen a pacients per verificar que la infecció hagi desaparegut.