Tasas ajustadas por edad

Introducción

A partir de los datos del estudio de Telde es posible estimar la prevalencia (cruda) de diabetes en la población adulta de dicha ciudad (las personas seleccionadas para el estudio son todas adultas con 30 o más años). Para ello contamos cuantos sujetos diabéticos y no diabéticos hay en la muestra de Telde, y calculamos la proporción que representa cada grupo respecto al total:

library(openxlsx)
telde=read.xlsx("endocrino.xlsx")
telde$DM=ordered(telde$DM, levels=c(1,0),labels=c("DM+","DM-"))
table(telde$DM)

## 
## DM+ DM- 
## 128 902

pDM=prop.table(table(telde$DM))
pDM

## 
##       DM+       DM- 
## 0.1242718 0.8757282

Este resultado nos indica que la prevalencia de DM en la muestra de Telde es 0.1242718, esto es, aproximadamente el 12,43%.

Ahora bien, si queremos comparar la prevalencia de esta enfermedad en Telde con la prevalencia en otra ciudad es preciso tomar ciertas precauciones. En concreto, se sabe que la DM se asocia con la edad. Por tanto, si en una ciudad arbitraria hay mayor prevalencia de DM que en Telde bien podría ser porque la población de Telde fuese más joven que la de la ciudad con la que se compara. Para que la comparación entre ciudades tuviese sentido deberían compararse ciudades con la misma composición por edades. Este es el objetivo del cálculo de la prevalencia ajustada por edad. La idea clave consiste entonces en calcular cuál sería la prevalencia de la DM en Telde si la población de Telde tuviese una estructura de edades acorde a la de alguna población de referencia.

En esta tarea utilizaremos como referencia la población SEGI. En este estándar las edades de los individuos se agrupan en los siguientes grupos de edad:

De 30 a 39 años
De 40 a 49 años
De 50 a 59 años
De 60 a 69 años
70 o más años

siendo las proporciones respectivas de miembros de la población en cada clase las siguientes:

p.SEGI=c(0.2727,0.2727,0.2045,0.1591,0.0910)
names(p.SEGI)=c("30-39","40-49","50-59","60-69","70 o más")
p.SEGI

##    30-39    40-49    50-59    60-69 70 o más 
##   0.2727   0.2727   0.2045   0.1591   0.0910

Cálculo de la prevalencia ajustada por edad.

En Telde (datos del censo del INE) el número total de personas dentro de cada uno de estos grupos de edad es:

n.TELDE=c(16739, 11878, 8445, 6085, 4918)
names(n.TELDE)=c("30-39","40-49","50-59","60-69","70 o más")

La proporción dentro de cada clase puede calcularse entonces como:

p.TELDE=prop.table(n.TELDE)
p.TELDE

##     30-39     40-49     50-59     60-69  70 o más 
## 0.3482576 0.2471237 0.1756996 0.1265994 0.1023198

A continuación creamos una variable que a cada sujeto asigne su grupo de edad dentro de la muestra de 1030 personas de Telde:

grEdad=cut(telde$EDAD,breaks=c(30,40,50,60,70,100),right=FALSE)

Contamos cuantos sujetos hay en cada grupo de edad en la muestra de Telde, y su proporción:

n.Muestra <- table(grEdad)
n.Muestra

## grEdad
##  [30,40)  [40,50)  [50,60)  [60,70) [70,100) 
##      311      288      236      142       53

p.Muestra <- prop.table(table(grEdad))
p.Muestra

## grEdad
##    [30,40)    [40,50)    [50,60)    [60,70)   [70,100) 
## 0.30194175 0.27961165 0.22912621 0.13786408 0.05145631

Por último contamos cuantos diabéticos hay en cada grupo de edad y qué proporción representan los diabéticos en cada grupo:

table(telde$DM,grEdad)

##      grEdad
##       [30,40) [40,50) [50,60) [60,70) [70,100)
##   DM+       8      17      39      48       16
##   DM-     303     271     197      94       37

pdg <- prop.table(table(telde$DM,grEdad),2); # Proporción por columnas
pdg

##      grEdad
##          [30,40)    [40,50)    [50,60)    [60,70)   [70,100)
##   DM+ 0.02572347 0.05902778 0.16525424 0.33802817 0.30188679
##   DM- 0.97427653 0.94097222 0.83474576 0.66197183 0.69811321

La prevalencia de diabetes en cada grupo de edad es la primera fila de esta tabla:

preval.DMxEdad <- pdg[1,]
preval.DMxEdad

##    [30,40)    [40,50)    [50,60)    [60,70)   [70,100) 
## 0.02572347 0.05902778 0.16525424 0.33802817 0.30188679

Podemos presentar todos los datos anteriores en una única tabla:

library(pander)
tablaDM=data.frame(n.TELDE,
                   p.TELDE,
                   n.Muestra=as.numeric(n.Muestra),
                   p.Muestra=as.numeric(p.Muestra), 
                   preval.DMxEdad=as.numeric(preval.DMxEdad),
                   p.SEGI=p.SEGI)
rownames(tablaDM)=levels(grEdad)
pander(tablaDM)

	n.TELDE	p.TELDE	n.Muestra	p.Muestra	preval.DMxEdad	p.SEGI
[30,40)	16739	0.3483	311	0.3019	0.02572	0.2727
[40,50)	11878	0.2471	288	0.2796	0.05903	0.2727
[50,60)	8445	0.1757	236	0.2291	0.1653	0.2045
[60,70)	6085	0.1266	142	0.1379	0.338	0.1591
[70,100)	4918	0.1023	53	0.05146	0.3019	0.091

La prevalencia total se calcula como la suma de los productos de las prevalencias en cada grupo de edad por la proporción total de individuos en ese grupo:

\[P\left(D\right)=\sum_{i=1}^{5}P\left(D\left|E_{i}\right.\right)P\left(E_{i}\right)\]

En esta ecuación:

Los \(E_i\) son los 5 grupos de edad:

\(\,E_1=\) “30-39”, \(\,E_2=\) “40-49”, \(\,E_3=\) “50-59”, \(\,E_4=\) “60-69” y \(\,E_5 =\) “≥70”;
Las \(P\left(D\left|E_{i}\right.\right)\) son las prevalencias de la enfermedad dentro de cada grupo de edad, que corresponden a la columna preval.DMxEDAD en la tabla anterior.
Las \(P\left(E_i\right)\) son las probabilidades de pertenencia a cada uno de estos grupos.

Así pues, la prevalencia total en la muestra se obtendría eligiendo como \(p\left(E_i\right)\) las proporciones que representan los distintos grupos de edad \(E_i\) en la muestra, p.Muestra:

sum(preval.DMxEdad*p.Muestra)

## [1] 0.1242718

que, como vemos, coincide con la prevalencia muestral ya calculada en la introducción de este documento.

La prevalencia ajustada a la población total de Telde se calcularía eligiendo ahora como \(p\left(E_i\right)\) las proporciones de los grupos de edad \(E_i\) en la población total de Telde, p.TELDE:

sum(preval.DMxEdad*p.TELDE)

## [1] 0.1262638

y por último la prevalencia ajustada a la población SEGI se obtiene eligiendo como \(p\left(E_i\right)\) las proporciones de los grupos de edad \(E_i\) en la población de referencia SEGI, p.SEGI:

sum(preval.DMxEdad*p.SEGI)

## [1] 0.1381581

Ejercicio

Ajustar la prevalencia de DM en Telde a la población de referencia (WHO World Standard) de la OMS publicada en http://www.who.int/healthinfo/paper31.pdf (página 12) y que se reproduce a continuación:

edades=c(paste(seq(0,80,by=5),seq(4,84,by=5),sep="-"), "85+")
WWS=c(8.85,8.68,8.60,8.47,8.22,7.93,7.61,7.15,6.59,6.04,5.37,4.55,3.72,2.96,2.21,1.52,0.91,0.62)
names(WWS)=edades
library(pander)
pander(WWS)

Table continues below
0-4	5-9	10-14	15-19	20-24	25-29	30-34	35-39	40-44	45-49
8.85	8.68	8.6	8.47	8.22	7.93	7.61	7.15	6.59	6.04

50-54	55-59	60-64	65-69	70-74	75-79	80-84	85+
5.37	4.55	3.72	2.96	2.21	1.52	0.91	0.62

Téngase en cuenta:

En la WHO World Standard los intervalos de edad están de 5 en 5 años, por lo que habrán de recalcularse nuevos intervalos para las edades en Telde.
Estamos interesados sólo en la población adulta (30 años o más), por lo que en las proporciones de la WHO World Standard habrán de eliminarse las correspondientes a edades menores de 30 años y reajustando el resto para que sume 1.

Tarea 4: Tasas ajustadas por edad

Tasas ajustadas por edad

Introducción

Cálculo de la prevalencia ajustada por edad.

Ejercicio