A partir de los datos del estudio de Telde es posible estimar la prevalencia (cruda) de diabetes en la población adulta de dicha ciudad (las personas seleccionadas para el estudio son todas adultas con 30 o más años). Para ello contamos cuantos sujetos diabéticos y no diabéticos hay en la muestra de Telde, y calculamos la proporción que representa cada grupo respecto al total:
library(openxlsx)
telde=read.xlsx("endocrino.xlsx")
telde$DM=ordered(telde$DM, levels=c(1,0),labels=c("DM+","DM-"))
table(telde$DM)
##
## DM+ DM-
## 128 902
pDM=prop.table(table(telde$DM))
pDM
##
## DM+ DM-
## 0.1242718 0.8757282
Este resultado nos indica que la prevalencia de DM en la muestra de Telde es 0.1242718, esto es, aproximadamente el 12,43%.
Ahora bien, si queremos comparar la prevalencia de esta enfermedad en Telde con la prevalencia en otra ciudad es preciso tomar ciertas precauciones. En concreto, se sabe que la DM se asocia con la edad. Por tanto, si en una ciudad arbitraria hay mayor prevalencia de DM que en Telde bien podría ser porque la población de Telde fuese más joven que la de la ciudad con la que se compara. Para que la comparación entre ciudades tuviese sentido deberían compararse ciudades con la misma composición por edades. Este es el objetivo del cálculo de la prevalencia ajustada por edad. La idea clave consiste entonces en calcular cuál sería la prevalencia de la DM en Telde si la población de Telde tuviese una estructura de edades acorde a la de alguna población de referencia.
En esta tarea utilizaremos como referencia la población SEGI. En este estándar las edades de los individuos se agrupan en los siguientes grupos de edad:
siendo las proporciones respectivas de miembros de la población en cada clase las siguientes:
p.SEGI=c(0.2727,0.2727,0.2045,0.1591,0.0910)
names(p.SEGI)=c("30-39","40-49","50-59","60-69","70 o más")
p.SEGI
## 30-39 40-49 50-59 60-69 70 o más
## 0.2727 0.2727 0.2045 0.1591 0.0910
En Telde (datos del censo del INE) el número total de personas dentro de cada uno de estos grupos de edad es:
n.TELDE=c(16739, 11878, 8445, 6085, 4918)
names(n.TELDE)=c("30-39","40-49","50-59","60-69","70 o más")
La proporción dentro de cada clase puede calcularse entonces como:
p.TELDE=prop.table(n.TELDE)
p.TELDE
## 30-39 40-49 50-59 60-69 70 o más
## 0.3482576 0.2471237 0.1756996 0.1265994 0.1023198
A continuación creamos una variable que a cada sujeto asigne su grupo de edad dentro de la muestra de 1030 personas de Telde:
grEdad=cut(telde$EDAD,breaks=c(30,40,50,60,70,100),right=FALSE)
Contamos cuantos sujetos hay en cada grupo de edad en la muestra de Telde, y su proporción:
n.Muestra <- table(grEdad)
n.Muestra
## grEdad
## [30,40) [40,50) [50,60) [60,70) [70,100)
## 311 288 236 142 53
p.Muestra <- prop.table(table(grEdad))
p.Muestra
## grEdad
## [30,40) [40,50) [50,60) [60,70) [70,100)
## 0.30194175 0.27961165 0.22912621 0.13786408 0.05145631
Por último contamos cuantos diabéticos hay en cada grupo de edad y qué proporción representan los diabéticos en cada grupo:
table(telde$DM,grEdad)
## grEdad
## [30,40) [40,50) [50,60) [60,70) [70,100)
## DM+ 8 17 39 48 16
## DM- 303 271 197 94 37
pdg <- prop.table(table(telde$DM,grEdad),2); # Proporción por columnas
pdg
## grEdad
## [30,40) [40,50) [50,60) [60,70) [70,100)
## DM+ 0.02572347 0.05902778 0.16525424 0.33802817 0.30188679
## DM- 0.97427653 0.94097222 0.83474576 0.66197183 0.69811321
La prevalencia de diabetes en cada grupo de edad es la primera fila de esta tabla:
preval.DMxEdad <- pdg[1,]
preval.DMxEdad
## [30,40) [40,50) [50,60) [60,70) [70,100)
## 0.02572347 0.05902778 0.16525424 0.33802817 0.30188679
Podemos presentar todos los datos anteriores en una única tabla:
library(pander)
tablaDM=data.frame(n.TELDE,
p.TELDE,
n.Muestra=as.numeric(n.Muestra),
p.Muestra=as.numeric(p.Muestra),
preval.DMxEdad=as.numeric(preval.DMxEdad),
p.SEGI=p.SEGI)
rownames(tablaDM)=levels(grEdad)
pander(tablaDM)
n.TELDE | p.TELDE | n.Muestra | p.Muestra | preval.DMxEdad | p.SEGI | |
---|---|---|---|---|---|---|
[30,40) | 16739 | 0.3483 | 311 | 0.3019 | 0.02572 | 0.2727 |
[40,50) | 11878 | 0.2471 | 288 | 0.2796 | 0.05903 | 0.2727 |
[50,60) | 8445 | 0.1757 | 236 | 0.2291 | 0.1653 | 0.2045 |
[60,70) | 6085 | 0.1266 | 142 | 0.1379 | 0.338 | 0.1591 |
[70,100) | 4918 | 0.1023 | 53 | 0.05146 | 0.3019 | 0.091 |
La prevalencia total se calcula como la suma de los productos de las prevalencias en cada grupo de edad por la proporción total de individuos en ese grupo:
\[P\left(D\right)=\sum_{i=1}^{5}P\left(D\left|E_{i}\right.\right)P\left(E_{i}\right)\]
En esta ecuación:
Los \(E_i\) son los 5 grupos de edad:
\(\,E_1=\) “30-39”, \(\,E_2=\) “40-49”, \(\,E_3=\) “50-59”, \(\,E_4=\) “60-69” y \(\,E_5 =\) “≥70”;
Las \(P\left(D\left|E_{i}\right.\right)\) son las prevalencias de la enfermedad dentro de cada grupo de edad, que corresponden a la columna preval.DMxEDAD
en la tabla anterior.
Las \(P\left(E_i\right)\) son las probabilidades de pertenencia a cada uno de estos grupos.
Así pues, la prevalencia total en la muestra se obtendría eligiendo como \(p\left(E_i\right)\) las proporciones que representan los distintos grupos de edad \(E_i\) en la muestra, p.Muestra
:
sum(preval.DMxEdad*p.Muestra)
## [1] 0.1242718
que, como vemos, coincide con la prevalencia muestral ya calculada en la introducción de este documento.
La prevalencia ajustada a la población total de Telde se calcularía eligiendo ahora como \(p\left(E_i\right)\) las proporciones de los grupos de edad \(E_i\) en la población total de Telde, p.TELDE
:
sum(preval.DMxEdad*p.TELDE)
## [1] 0.1262638
y por último la prevalencia ajustada a la población SEGI se obtiene eligiendo como \(p\left(E_i\right)\) las proporciones de los grupos de edad \(E_i\) en la población de referencia SEGI, p.SEGI
:
sum(preval.DMxEdad*p.SEGI)
## [1] 0.1381581
Ajustar la prevalencia de DM en Telde a la población de referencia (WHO World Standard) de la OMS publicada en http://www.who.int/healthinfo/paper31.pdf (página 12) y que se reproduce a continuación:
edades=c(paste(seq(0,80,by=5),seq(4,84,by=5),sep="-"), "85+")
WWS=c(8.85,8.68,8.60,8.47,8.22,7.93,7.61,7.15,6.59,6.04,5.37,4.55,3.72,2.96,2.21,1.52,0.91,0.62)
names(WWS)=edades
library(pander)
pander(WWS)
0-4 | 5-9 | 10-14 | 15-19 | 20-24 | 25-29 | 30-34 | 35-39 | 40-44 | 45-49 |
---|---|---|---|---|---|---|---|---|---|
8.85 | 8.68 | 8.6 | 8.47 | 8.22 | 7.93 | 7.61 | 7.15 | 6.59 | 6.04 |
50-54 | 55-59 | 60-64 | 65-69 | 70-74 | 75-79 | 80-84 | 85+ |
---|---|---|---|---|---|---|---|
5.37 | 4.55 | 3.72 | 2.96 | 2.21 | 1.52 | 0.91 | 0.62 |
Téngase en cuenta:
En la WHO World Standard los intervalos de edad están de 5 en 5 años, por lo que habrán de recalcularse nuevos intervalos para las edades en Telde.
Estamos interesados sólo en la población adulta (30 años o más), por lo que en las proporciones de la WHO World Standard habrán de eliminarse las correspondientes a edades menores de 30 años y reajustando el resto para que sume 1.