1. Una de las condiciones para que el agua de abasto pueda considerarse potable es que la concentración media de sulfatos no exceda las 250 ppm. Se ha obtenido una muestra de 10 observaciones de esta variable en una tuberı́a de la red de abasto, con los siguientes valores: 232.13, 282.24, 261.98, 291.41, 283.44, 216.68, 211.35, 258.78, 303.89 y 272.70 ppm. ¿Puede aceptarse, con una significación del 5 % que el agua que circula por esta tuberı́a es potable? ¿Cuál es la potencia de este contraste si la concentración media real es de 280 ppm?
sulfatos <- c(232.13, 282.24, 261.98, 291.41, 283.44, 216.68, 211.35, 258.78, 303.89, 272.70 )

Solución:

En esta muestra, el valor medio de sulfatos es:

mean(sulfatos)
## [1] 261.46

Por tanto en la muestra se supera el valor 250. Pero sabemos que, por puro azar, los valores de sulfato pueden cambiar de una muestra a otra, y por tanto lo que tenemos que determinar es si el hecho de que en esta muestra se haya superado ese umbral puede ser atribuíble al azar, o si este valor constituye evidencia suficiente de que la concentración media en el agua de abasto está realmente por encima de las 250 ppm. Para ello hemos de plantear el contraste de hipótesis:

\[\begin{cases} H_{0}: & \mu\le250\\ H_{1}: & \mu>250 \end{cases}\]

Para resolver este contraste debemos calcular: \[t_{exp}=\frac{{\bar{X}-\mu_{0}}}{{S/\sqrt{n}}}\] con \(\mu_0=250\).

La regla de decisión es rechazar H_{0} si \(t_{exp}>t_{n-1,\alpha}=t_{9,0.05}=\mathsf{qt(0.95,9)}=1.8331\).

NOTA: Debe tenerse en cuenta que en las tablas de contrastes de hipótesis, el subíndice \(\alpha\) indica área (probabilidad) a la derecha; para encontrar en R el valor que deja un área \(\alpha\) a la derecha utilizamos el percentil que deja un área \(1-\alpha\) a la izquierda. Es por ello que \(t_{n-1,\alpha}=\mathsf{qt(1-\alpha,n-1)}\)

Calculamos la desviación típica de la muestra:

sd(sulfatos)
## [1] 31.83732

Sustituyendo la media y la desviación típica de la muestra en la fórmula anterior obtenemos:

\[t_{exp}=\frac{{\bar{X}-\mu_{0}}}{{S/\sqrt{n}}}=1.1382773\]

y como \(t_{exp}<1.8331\) concluimos que no hay evidencia suficiente para rechazar la hipótesis nula; o dicho de otra forma, la evidencia de que se esté superando el umbral de 250 ppm no es concluyente.

 

Podemos realizar el test directamente mediante la función t.test en R, especificando que la hipótesis alternativa es que \(\mu>250\):

t.test(sulfatos,mu=250,alternative="greater")
## 
##  One Sample t-test
## 
## data:  sulfatos
## t = 1.1383, df = 9, p-value = 0.1422
## alternative hypothesis: true mean is greater than 250
## 95 percent confidence interval:
##  243.0045      Inf
## sample estimates:
## mean of x 
##    261.46

El p-valor es mayor que 0.05 por lo que concluimos que no hay evidencia suficiente para rechazar \(H_0\)

 

Potencia del contraste:

Recordemos que la potencia de un contraste es la probabilidad de rechazar la hipótesis nula cuando es falsa. En este caso concreto, se trata de calcular la probabilidad de que el test rechace la hipótesis nula (\(\mu\le250\)) cuando es falsa porque en realidad \(\mu>280\).

Para calcular la potencia utilizamos la función power.t.test, especificando (pueden verse las opciones mediante help(power.t.test)):

power.t.test(n=10, delta=30, sd=sd(sulfatos),type="one.sample",alternative="one.sided")
## 
##      One-sample t test power calculation 
## 
##               n = 10
##           delta = 30
##              sd = 31.83732
##       sig.level = 0.05
##           power = 0.8644685
##     alternative = one.sided

Por tanto, la probabilidad de que es test rechace que el agua es potable cuando la concentración es de 280 ppm es 0.8644

 

 


 

  1. El número diario de piezas fabricadas por una máquina A en cinco dı́as ha sido: 50, 48, 53, 60, 37; mientras que, en esos mismos dı́as, una máquina B ha fabricado 40, 51, 62, 55 y 64 piezas. Suponiendo que la distribución de los datos es aproximadamente normal, ¿puede afirmarse que, en media, la máquina B fabrica diariamente más piezas que la A?. Determinar cuál deberı́a ser el tamaño muestral n de ambas muestras si se desea que la potencia del contraste para detectar una diferencia de al menos diez piezas entre ambas máquinas sea del 90 %
piezas <- data.frame(A=c( 50, 48, 53,60, 37), B=c(40, 51, 62, 55, 64))

Solución:

En principio, el problema no indica que haya ninguna razón para considerar que las muestras están emparejadas, más allá de haber medido los datos en los mismos días. Si tenemos dudas de si hay emparejamiento (asociación) entre las dos muestras, podemos hacer una gráfica:

piezas %>% ggplot(aes(x=A,y=B)) + geom_point() 

No parece haber asociación, por lo que consideramos las muestras como independientes. El número medio de piezas fabricado por cada máquina es:

piezas %>% summarize(A=mean(A),B=mean(B))
##      A    B
## 1 49.6 54.4

Para decidir si estos datos constituyen evidencia suficiente de que B produce más piezas que A planteamos el contraste:

\[\begin{cases} H_{0}: & \mu_{A}\ge\mu_{B}\\ H_{1}: & \mu_{A}<\mu_{B} \end{cases}\]

La regla de decisión es rechazar \(H_{0} si t_{exp}<-t_{n,\alpha}\), siendo en este caso:

\[t_{exp}=\frac{{\bar{X}_{1}-\bar{X}_{2}}}{{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}},\,\,\,\,\,\,n=REDONDEO\left[\frac{{\left({\frac{{s_{1}^{2}}}{{n_{1}}}+\frac{{s_{2}^{2}}}{{n_{2}}}}\right)^{2}}}{{\left({\frac{{s_{1}^{2}}}{{n_{1}}}}\right)^{2}\frac{1}{{n_{1}-1}}+\left({\frac{{s_{2}^{2}}}{{n_{2}}}}\right)^{2}\frac{1}{{n_{2}-1}}}}\right]\] Si calculamos la varianza en cada grupo, obtenemos:

piezas %>% summarize(A=var(A),B=var(B))
##      A    B
## 1 70.3 92.3

y sustituyendo en las expresiones anteriores resulta:

\[t_{exp}=-0.8417\;\;\;\; n=8\] Asimismo, podemos calcular \(-t_{n,\alpha}=-t_{8,0.05}=-\mathsf{qt(0.95,8)}=-1.8595\). Como el valor \(t_{exp}=-0.8417\) es mayor que el valor \(-t_{8,0.05}\) concluimos que no se cumple la condición de rechazo, y por tanto no hay evidencia suficiente de que la maquina B produzca más que la A.

En lugar de hacer los cálculos anteriores, podemos usar directamente la función t.test de R para hacer el contraste:

t.test(piezas$A,piezas$B)
## 
##  Welch Two Sample t-test
## 
## data:  piezas$A and piezas$B
## t = -0.84172, df = 7.8562, p-value = 0.4248
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -17.992312   8.392312
## sample estimates:
## mean of x mean of y 
##      49.6      54.4

Como vemos, el p-valor es mayor que 0.05 lo que indica que no hay evidencia para rechazar \(H_0\), y por tanto llegamos (como no podía ser de otra forma) a la misma conclusión que antes.

Nota:

Los datos podían estar colocados también de la forma siguiente:

piezas2 <- piezas %>% pivot_longer(everything(),names_to = "maquina",values_to="numPiezas")
piezas2
## # A tibble: 10 x 2
##    maquina numPiezas
##    <chr>       <dbl>
##  1 A              50
##  2 B              40
##  3 A              48
##  4 B              51
##  5 A              53
##  6 B              62
##  7 A              60
##  8 B              55
##  9 A              37
## 10 B              64

Si los datos estuvieran de colocados de esta forma, la sintaxis para el t.test sería:

t.test(numPiezas~maquina,data=piezas2)
## 
##  Welch Two Sample t-test
## 
## data:  numPiezas by maquina
## t = -0.84172, df = 7.8562, p-value = 0.4248
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -17.992312   8.392312
## sample estimates:
## mean in group A mean in group B 
##            49.6            54.4

que como vemos proporciona el mismo resultado.

 

Tamaño muestral

El problema pide calcular el tamaño muestral para detectar una diferencia de 10 piezas con una potencia del 90%. Usamos power.t.test, utilizando como desviación típica la del número de piezas producida por ambas máquinas:

power.t.test(delta=10,power=0.9,type="two.sample",alternative="one.sided",sig.level=0.05,sd=sd(piezas2$numPiezas))
## 
##      Two-sample t test power calculation 
## 
##               n = 14.20501
##           delta = 10
##              sd = 8.869423
##       sig.level = 0.05
##           power = 0.9
##     alternative = one.sided
## 
## NOTE: n is number in *each* group

Como el número en cada grupo es 14.2 y obviamente el tamaño de la muestra ha de ser un número entero, debemos tomar una muestra de 15 observaciones en cada máquina para garantizar la potencia pedida.

 

 


 

  1. Se realizan 10 determinaciones del porcentaje de riqueza en un polı́mero con dos instrumentos distintos. Las varianzas muestrales resultan ser 0.5419 y 0.6065. ¿Existe evidencia suficiente al 5 % de significación para asegurar que el segundo instrumento presenta más variabilidad en las medidas que el primero?

Hemos de realizar el contraste:

\[\begin{cases} H_{0}: & \sigma_{1}^{2}\ge\sigma_{2}^{2}\\ H_{1}: & \sigma_{1}^{2}<\sigma_{2}^{2} \end{cases}\]

Los datos muestran que la varianza muestral con el segundo instrumento es mayor que con el primero. Para determinar si puede generalizarse este resultado hemos de comprobar si \(F_{exp}<F_{n_{1}-1,n_{2}-1,1-\alpha}\).

donde:

\[F_{exp}=\frac{S_{1}^{2}}{S_{2}^{2}}=\frac{0.5419}{0.6065}=0.8934872\].

Para hallar \(F_{exp}<F_{n_{1}-1,n_{2}-1,1-\alpha}\) hemos de tener en cuenta que en las tablas de contrastes, el subíndice indica el área (probabilidad) a la izquierda; Si \(\alpha=0.05\), tenemos que hallar \(F_{9,9,0.95}\). Si el área a la derecha es 0.95, el área a la izquierda (que es la que nos da R) es 0.05. Por tanto:

\[F_{9,9,0.95}=\mathsf{qf(0.05,9,9)}=0.3145749\] Como \(F_{exp}>F_{9,9,0.95}\), concluimos que no se da la condición para el rechazo de H_{0}. Así pues, no hay evidencia suficiente de que el segundo instrumento presenta más variabilidad que el primero.

 

Este problema no proporciona los datos originales, por lo que no puede usarse R para hacer el contraste. Si tenemos los datos:

datos=data.frame(instrumento1=c(79.5449,78.0215,80.7523,80.1711,79.4498,79.5852,80.3741,79.8572,80.0624,79.5221),
                 instrumento2=c(80.4671,79.2428,78.4700,79.3168,78.9465,79.5263,80.2710,78.1486,80.0951,78.7245))

Comprobamos que las varianzas son las que dice el enunciado:

datos %>% summarize(var(instrumento1),var(instrumento2))
##   var(instrumento1) var(instrumento2)
## 1         0.5418858         0.6064825

El test se puede resolver mediante var.test:

var.test(datos$instrumento2,datos$instrumento1,alternative = "greater")
## 
##  F test to compare two variances
## 
## data:  datos$instrumento2 and datos$instrumento1
## F = 1.1192, num df = 9, denom df = 9, p-value = 0.4348
## alternative hypothesis: true ratio of variances is greater than 1
## 95 percent confidence interval:
##  0.3520745       Inf
## sample estimates:
## ratio of variances 
##           1.119207

y el p-valor=0.4248 indica que no hay evidencia suficiente de que la varianza del segundo instrumento sea mayor que la del primero.

 

 


 

  1. En una encuesta sobre el hábito de fumar se ha constatado que, de 900 personas entrevistadas en la ciudad A, 554 son fumadoras, mientras que en otra ciudad B, entre 600 entrevistadas se han encontrado 410 fumadoras. ¿Es significativamente distinta la proporción de fumadores en ambas ciudades?

Solución:

fumadores <- c(554, 410)
N <- c(900, 600)

Sean \(\pi_{A}\) la proporción de fumadores en A y \(\pi_{B}\) la proporción en B. Hemos de llevar a cabo el contraste:

\[\begin{cases} H_{0}: & \pi_{A}=\pi_{B}\\ H_{1}: & \pi_{A}\ne\pi_{B} \end{cases}\]

Para ello disponemos de dos muestras independientes de tamaños respectivos \(n_{A}=900\) y \(n_{B}=600\). Las proporciones estimadas de fumadores en cada ciudad son, respectivamente, \(p_{A}=\frac{554}{900}=0.6155556\) y \(p_{B}=\frac{410}{600}=0.6833333\). Dado que los tamaños muestrales son suficientemente grandes y siendo:

\[p^{*}=\frac{{n_{1}p_{1}+n_{2}p_{2}}}{{n_{1}+n_{2}}}=\frac{554+410}{900+600}=\frac{964}{1500}=0.6426667,\,\,\,\,\,\,q^{*}=1-p^{*}=0.3573333\] las proporciones globales de fumadores y no fumadores, respectivamente, se tiene que \(n_{A}p^{*}\), \(n_{A}q^{*}\), \(n_{B}p^{*}\), \(n_{B}q^{*}\). Por tanto podemos aplicar el contraste basado en el estadístico:

\[z_{exp}=\frac{{p_{A}-p_{B}}}{{\sqrt{p^{*}q^{*}\left({\frac{1}{{n_{A}}}+\frac{1}{{n_{B}}}}\right)}}}=-2.683545\]

La regla de decisión consiste en rechazar \(H_{0}\) si \(\left|z_{exp}\right|>z_{\alpha/2}\). Para \(\alpha=0.05\) es \(z_{0.025}=\mathsf{qnorm(0.975)}=1.96\), y como \(\left|-2.683545\right|>1.96\) concluimos que existe evidencia suficiente de que la proporción de fumadores difiere de manera significativa entre ambas ciudades. Podemos acompañar esta información por el intervalo de confianza:

\[\ln\left(\frac{\pi_{A}}{\pi_{B}}\right)\in\left[{\ln\left(\frac{p_{A}}{p_{B}}\right)\pm z_{\alpha/2}\sqrt{\frac{\left(1-p_{A}\right)}{n_{A}p_{A}}+\frac{\left(1-p_{B}\right)}{n_{B}p_{B}}}}\right]=\left[-0.1795105,-0.02940466\right]\] o lo que es lo mismo:

\[\frac{\pi_{A}}{\pi_{B}}\in\left[e^{-0.1795105},e^{-0.02940466}\right]=\left[0.8356792,0.9710235\right]\] lo que significa que la proporción de fumadores en A es entre un \(83.56792\)% y un \(97.10235\)% de la proporción de fumadores en B. El contraste se resuelve fácilmente en R mediante:

prop.test(c(554,410),c(900,600))
## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(554, 410) out of c(900, 600)
## X-squared = 6.9093, df = 1, p-value = 0.008575
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.11811043 -0.01744512
## sample estimates:
##    prop 1    prop 2 
## 0.6155556 0.6833333

R utiliza un método diferente del señalado aquí, si bien se llega a la misma conclusión (la diferencia entre proporciones es significativa) ya que el p-valor (0.0086) es menor que \(\alpha=0.05\). Asimismo, R muestra un intervalo para la diferencia de proporciones \(\pi_{A}-\pi_{B}\) que es negativo, indicando con ello que \(\pi_{A}<\pi_{B}\).

 

 


 

  1. Se desea determinar si el diámetro medio de los granos de arena es el mismo en dos distintas franjas de una playa; para ello se dispone de los siguientes datos (en centésimas de mm.):
arena <- data.frame(A=c(22,24,25,22,28,26,25,24,28,26,23,23),
                    B=c(8,27,27,29,26,29,27,30,28,27,26,29))

Decidir, con un nivel de significación del 5 % si el diámetro medio es el mismo en las dos zonas.

 

Solución:

Calculamos la media y la desviación típica de los diámetros de los granos de arena en cada zona:

arena %>% 
  pivot_longer(everything(),names_to = "zona", values_to = "diametro") %>% 
  group_by(zona) %>% 
  summarize(mean(diametro),sd(diametro))
## # A tibble: 2 x 3
##   zona  `mean(diametro)` `sd(diametro)`
##   <chr>            <dbl>          <dbl>
## 1 A                 24.7           2.06
## 2 B                 26.1           5.84

En estas muestras, los diámetros medios son distintos, pero ¿es la diferencia significativa?, es decir, ¿se podría asegurar que esta diferencia no se debe al azar del muestreo sino a que en realidad las zonas tienen granos de arena de distinto diámetro medio?

 

Antes de plantear el contraste hemos de tener en cuenta que el problema no nos informa de si los datos están emparejados o no (puede ser que los datos de A y B se hayan cogido, en cada caso, en la misma franja perpendicular a la costa). Un simple gráfico nos puede ayudar a decidir si hay o no emparejamiento:

arena %>% ggplot(aes(x=A,y=B)) + geom_point()

Este gráfico muestra claramente que no hay asociación entre A y B (no parece que el valor del diámetro del grano en A informe sobre su valor en B), por lo que podemos considerar ambas muestras como independientes. En caso de duda podríamos hacer previamente un contraste sobre la correlación entre ambas variables:

\[\left\{ \begin{array}{c} H_{0}:\rho=0\\ H_{1}:\rho\ne0 \end{array}\right.\]

que se resuelve calculando: \[t_{\exp}=\sqrt{\frac{{(n-2)r^{2}}}{{1-r^{2}}}}\] y si \(t_{exp}\le t_{n-2,\alpha/2}\) se acepta \(H_{0}\). En este caso, \(n=12\) y \(t_{10,0.025}=qt(0.975,10)=2.228\). Calculamos \(r\) y \(t_{exp}\):

r <- cor(arena$A,arena$B)  
r
## [1] 0.3351657
texp=sqrt(10*r^2/(1-r^2))
texp
## [1] 1.124955

Como \(t_{exp}\le2.228\) concluimos (como ya era evidente en el gráfico) que no existe asociación entre A y B. En R este contraste puede realizarse fácilmente mediante:

cor.test(arena$A,arena$B)
## 
##  Pearson's product-moment correlation
## 
## data:  arena$A and arena$B
## t = 1.125, df = 10, p-value = 0.2869
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.2955940  0.7624152
## sample estimates:
##       cor 
## 0.3351657

El p-valor es 0.2869 lo que indica que puede aceptarse la hipótesis nula (que la correlación entre A y B es cero)

Dicho todo lo anterior, para decidir si el diámetro medio de los granos de arena es el mismo en las dos zonas, resolvemos el contraste:

\[\begin{cases} H_{0}: & \mu_{A}=\mu_{B}\\ H_{1}: & \mu_{A}\ne\mu_{B} \end{cases}\]

considerando muestras independientes. Para ello calculamos el estadístico:

\[t_{exp}=\frac{{\bar{X}_{1}-\bar{X}_{2}}}{{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}}=-0.7927\]

y la regla de decisión consiste en rechazar \(H_{0}\) si \(\left|t_{exp}\right|>t_{n,\alpha/2}\), siendo:

\[n=REDONDEO\left[\frac{{\left({\frac{{s_{1}^{2}}}{{n_{1}}}+\frac{{s_{2}^{2}}}{{n_{2}}}}\right)^{2}}}{{\left({\frac{{s_{1}^{2}}}{{n_{1}}}}\right)^{2}\frac{1}{{n_{1}-1}}+\left({\frac{{s_{2}^{2}}}{{n_{2}}}}\right)^{2}\frac{1}{{n_{2}-1}}}}\right]=14\] Entonces \(t_{n,\alpha/2}=qt(0.975,14)=2.1448\). Como \(\left|t_{exp}\right|=0.7927<2.1448\) no hay evidencia suficiente para rechazar \(H_0\), y por tanto concluimos que no hay diferencia en el diámetro medio de los granos de arena en ambas zonas.

Este contraste se realiza muy fácilmente en R mediante:

t.test(arena$A,arena$B)
## 
##  Welch Two Sample t-test
## 
## data:  arena$A and arena$B
## t = -0.79271, df = 13.697, p-value = 0.4415
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -5.257648  2.424314
## sample estimates:
## mean of x mean of y 
##  24.66667  26.08333

El p-valor del test es 0.4415 lo que nos lleva a la misma conclusión ya señalada (se acepta \(H_0\), es decir, no hay diferencia en el diámetro medio de los granos de arena en ambas zonas).

 

 


 

  1. Se estudia la supervivencia de ratones de laboratorio a cierta enfermedad en función del tratamiento administrado; los siguientes datos muestran la supervivencia en dı́as desde que se contrae la enfermedad:
TRATAMIENTO1=c(29,42,38,40,43,40,30,42)
TRATAMIENTO2=c(30,35,39,28,31,31,29,35,29,33)

¿Existen diferencias entre los tiempos medios de supervivencia con cada tratamiento?

 

Solución:

Aplicamos t.test:

t.test(TRATAMIENTO1,TRATAMIENTO2)
## 
##  Welch Two Sample t-test
## 
## data:  TRATAMIENTO1 and TRATAMIENTO2
## t = 2.6968, df = 11.297, p-value = 0.02035
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   1.118781 10.881219
## sample estimates:
## mean of x mean of y 
##        38        32

Como el p-valor es menor que 0.05 concluimos que existe evidencia suficiente de que la supervivencia media difiere entre tratamientos. El intervalo de confianza indica que los ratones con el tratamiento 1 sobreviven en media enter 1.12 y 10.9 días más que con el tratamiento 2.

 

 

 

  1. Se desea probar la precisión de una balanza diseñada para pesar a bordo de un barco. Para ello se eligen al azar diez objetos y se pesan con esa balanza en el barco, y posteriormente en tierra. Los pesos medidos para cada objeto figuran en la siguiente tabla (en kg.):
balanza <- data.frame(BARCO=c(0.14,0.20,0.07,0.18,0.38,0.10,0.04,0.27,0.27,0.21),
                      TIERRA=c(0.16,0.19,0.09,0.20,0.34,0.10,0.08,0.29,0.28,0.17))

¿Puede aceptarse que, en media, el peso medido en el barco es el mismo que en tierra?. ¿Cuál es la potencia del contraste para detectar una diferencia media mı́nima de 0.1 kg. entre las dos medidas? Si se deseara que esta potencia fuese del 90 % ¿cuál deberı́a ser el tamaño de las muestras?

Solución:

Se trata obviamente de muestras emparejadas, ya que son los mismos objetos los que se pesan en tierra y a bordo del barco. Podemos hacer un gráfico que muestra claramente que hay asociación entre los valores, y que cuanto más pesa un objeto en tierra, más pesa en el barco:

ggplot(balanza,aes(x=TIERRA,y=BARCO)) + geom_point() + geom_smooth(method="lm")

La diferencia entre el peso de cada objeto en tierra y en el barco puede obtenerse como:

balanza %>% mutate(dif=TIERRA-BARCO) 
##    BARCO TIERRA   dif
## 1   0.14   0.16  0.02
## 2   0.20   0.19 -0.01
## 3   0.07   0.09  0.02
## 4   0.18   0.20  0.02
## 5   0.38   0.34 -0.04
## 6   0.10   0.10  0.00
## 7   0.04   0.08  0.04
## 8   0.27   0.29  0.02
## 9   0.27   0.28  0.01
## 10  0.21   0.17 -0.04
balanza %>% mutate(dif=TIERRA-BARCO) %>% summarize(mean(dif))
##   mean(dif)
## 1     0.004

Por tanto, en esta muestra los objetos pesados en tierra han pesado, en promedio, 4 gramos más que en el barco. No obstante, cuando miramos los valores vemos que no siempre el peso en tierra es mayor que en el barco, por lo que en principio podemos sospechar que la diferencia de 4 gramos que hemos detectado se debe simplemente al azar y no a que de manera sistemática el peso en tierra tienda a ser mayor que en el barco. Para confirmar esta sospecha, debemos resolver el contraste:

\[\begin{cases} H_{0}: & \mu_{BARCO}=\mu_{TIERRA}\\ H_{1}: & \mu_{BARCO}\ne\mu_{TIERRA} \end{cases}\]

Como las muestras como emparejadas y el contraste debe resolverse utilizando el estadístico:

\[t_{exp}=\frac{{\overline{X}_{1}-\overline{X}_{2}}}{{S_{D}/\sqrt{n}}}\]

siendo \(S_{D}=\sqrt{S_{1}^{2}+S_{2}^{2}-2rS_{1}S_{2}}\) y \(n\) el número de parejas de datos; la regla de decisión consiste en rechazar \(H_{0}\) si \(\left|t_{exp}\right|>t_{n-1,\alpha/2}=t_{9,0.025}=\mathsf{qt(0.975,9)}=2.2621572\).

Para calcular el valor \(t_{exp}\) podríamos calcular todos los valores involucrados en el cálculo:

balanza %>% summarize(mean(BARCO),mean(TIERRA),sd(BARCO),sd(TIERRA),var(BARCO),var(TIERRA),cor(BARCO,TIERRA))
##   mean(BARCO) mean(TIERRA) sd(BARCO) sd(TIERRA) var(BARCO) var(TIERRA)
## 1       0.186         0.19 0.1037304 0.08956686    0.01076 0.008022222
##   cor(BARCO, TIERRA)
## 1          0.9722872

y tras sustituir obtenemos: \[t_{exp}=\frac{{\overline{X}_{1}-\overline{X}_{2}}}{{S_{D}/\sqrt{n}}}=-0.47287\] Como \(t_{exp}=0.47287<t_{9,0.025}=2.262157\), concluimos que no hay evidencia de que el peso difiera de manera sistemática entre la tierra y el barco.

De manera más simple, podemos utilizar directamente el t.test:

t.test(balanza$BARCO,balanza$TIERRA,paired=TRUE)
## 
##  Paired t-test
## 
## data:  balanza$BARCO and balanza$TIERRA
## t = -0.47287, df = 9, p-value = 0.6476
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.0231357  0.0151357
## sample estimates:
## mean of the differences 
##                  -0.004

que produce un p-valor de 0.6476, lo que nos lleva a la conclusión ya señalada de que no hay diferencia entre ambas medidas.

 

Otro planteamiento posible para este problema sería contrastar la hipótesis de que la relación entre el peso en tierra y el peso en el barco se ajusta a la recta \(y=x+\varepsilon\) (es decir, que ambos pesos son iguales salvo pequeñas desviaciones aleatorias). Para comprobarlo simplemente ajustamos la recta de regresión:

recta=lm(BARCO~TIERRA, data=balanza)
recta
## 
## Call:
## lm(formula = BARCO ~ TIERRA, data = balanza)
## 
## Coefficients:
## (Intercept)       TIERRA  
##    -0.02795      1.12604

y calculamos intervalos de confianza para los coeficientes:

confint(recta)
##                   2.5 %    97.5 %
## (Intercept) -0.07389293 0.0179982
## TIERRA       0.90528946 1.3467881

Como puede comprobarse, el intervalo de confianza para \(\beta_0\) contiene al 0, por lo que puede aceptarse que \(\beta_0=0\). Asimismo, el intervalo de confianza para la pendiente contiene al 1, por lo que puede aceptarse que \(\beta_1=1\); por tanto, puede aceptarse que la recta \(BARCO=\beta_0+\beta_1\cdot TIERRA\) es de la forma BARCO=TIERRA, lo que significa que ambas medidas coinciden salvo pequeñas variaciones aleatorias (no hay diferencias sistemáticas entre ambas medidas)

 

 


 

  1. Dos industrias quı́micas vierten sus residuos directamente al mar. Se han tomado datos sobre el contenido en fenoles de estos residuos, eligiéndose para ello doce muestras de residuos procedentes de la primera industria y diez procedentes de la segunda. Los resultados obtenidos en los análisis se muestran a continuación (en % de fenoles por cada 100 gr de peso seco de los residuos):
A=c(28,32,45,23,34,21,38,19,41,23,18,24)
B=c(35,23,20,17,14,42,18,20,22,19)

Decidir, con un nivel de significación del 5 % si existen diferencias significativas en las cantidades de fenoles producidos por ambas industrias. De acuerdo con la normativa legal, el valor medio máximo de fenoles que puede ser vertido al mar sin tratamiento es del 25%. ¿Cumplen estas empresas con la normativa?. ¿Cuál debería ser el tamaño de la muestra, si se desea una probabilidad muy baja (0,01) de aceptar que se cumple la normativa cuando el valor medio del contenido en fenoles es del 30%?.

 

Solución:

El promedio de fenoles vertido por cada industria es:

mean(A)
## [1] 28.83333
mean(B)
## [1] 23

Para responder a la primera cuestión (si existen diferencias entre los vertidos de ambas industrias), hacemos el t-test:

t.test(A,B)
## 
##  Welch Two Sample t-test
## 
## data:  A and B
## t = 1.5384, df = 19.532, p-value = 0.14
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.088544 13.755211
## sample estimates:
## mean of x mean of y 
##  28.83333  23.00000

El p-valor 0.14 (mayor que 0.05) indica que no hay diferencias significativas entre las concentraciones de vertidos de ambas industrias.

Para responder a la segunda cuestión, tenemos que comparar la media de vertidos de cada industria con el 25% legal, de forma que haya solo un 1% de probabilidad de aceptar que la media es 25 cuando sea mayor que 25

\[\begin{cases} H_{0}: & \mu_{A} \le 30\\ H_{1}: & \mu_{A}>30 \end{cases}\]

y

\[\begin{cases} H_{0}: & \mu_{B} \le 30\\ H_{1}: & \mu_{B}>30 \end{cases}\]

Para resolver el primer contraste:

t.test(A,mu=25,alternative="greater")
## 
##  One Sample t-test
## 
## data:  A
## t = 1.47, df = 11, p-value = 0.08479
## alternative hypothesis: true mean is greater than 25
## 95 percent confidence interval:
##  24.15006      Inf
## sample estimates:
## mean of x 
##  28.83333

y para el segundo:

t.test(B,mu=25,alternative="greater")
## 
##  One Sample t-test
## 
## data:  B
## t = -0.72654, df = 9, p-value = 0.757
## alternative hypothesis: true mean is greater than 25
## 95 percent confidence interval:
##  17.95385      Inf
## sample estimates:
## mean of x 
##        23

Como en ambos casos los p-valores son mayores que 0.05, concluimos que no hay evidencia de que ninguna de las dos industrias esté superando el umbral del 25% (de hecho en el segundo contraste nos podíamos haber ahorrado el test ya que el valor medio observado (23%) es menor que el umbral del 25%, por lo que no hay ninguna evidencia de que se pueda estar superando ese umbral)

Por último para obtener el tamaño muestral pedido, basta tener en cuenta que el problema nos dice que la probabilidad de error tipo II es del 1%, lo que significa que la potencia debe ser del 99% para detectar una diferencia del 5% (la diferencia entre el valor umbral, 25%, y el valor del 30% para el que no se quiere cometer el error tipo II). Usamos power.t.test:

power.t.test(delta=5,power=0.99,alternative="one.sided", type="one.sample",sd=sd(c(A,B)))
## 
##      One-sample t test power calculation 
## 
##               n = 54.41598
##           delta = 5
##              sd = 9.168457
##       sig.level = 0.05
##           power = 0.99
##     alternative = one.sided

Necesitamos por tanto una muestra de 55 observaciones.

 

 


 

  1. Con objeto de determinar cuál de dos diferentes técnicas de cultivo de peces produce mayor rendimiento, se ha medido la producción, en toneladas, durante 12 periodos para la técnica A y durante 10 periodos para la B, con los siguientes resultados:
A=c(8.93,9.54,10.32,6.99,8.56,8.67,9.72,7.76,8.95,9.32,8.59,9.78)
B=c(5.69,7.56,6.88,10.26,9.57,7.88,8.95,9.35,6.58,7.32)

¿Existe evidencia de que el rendimiento medio obtenido con la técnica A es superior al obtenido con la B? Responder a esta cuestión:

  1. suponiendo que los datos siguen una distribución normal.

  2. suponiendo que los datos no siguen una distribución normal.

 

Solución:

El rendimiento medio obtenido con cada técnica es:

mean(A)
## [1] 8.9275
mean(B)
## [1] 8.004

Por tanto la muestra de A ha producido un mayor rendimiento que la muestra de B. Para determinar si esta conclusión puede extenderse a todos los cultivos realizados con A y a todos los realizados con B, debemos realizar un contraste de hipótesis.

  1. Si suponemos normalidad aplicamos el t.test:
t.test(A,B,alternative="greater")
## 
##  Welch Two Sample t-test
## 
## data:  A and B
## t = 1.722, df = 14.505, p-value = 0.05316
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  -0.0187691        Inf
## sample estimates:
## mean of x mean of y 
##    8.9275    8.0040

El p-valor es mayor que 0.05, por tanto no hay evidencia suficiente de que A produzca mayor rendimiento que B.

 

  1. Si suponemos que no hay normalidad, aplicamos el test de Wilcoxon:
wilcox.test(A,B,alternative="greater")
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  A and B
## W = 81.5, p-value = 0.08301
## alternative hypothesis: true location shift is greater than 0

Como vemos, también en este caso el p-valor es mayor que 0.05, con lo que alcanzamos la misma conclusión (no hay evidencia de que el rendimiento medio de la técnica A sea mayor que el de la B).

 

Podríamos determinar si los datos de cada muestra siguen o no distribuciones normales mediante el test de Shapiro-Wilk, cuya hipótesis nula es que los datos sean normales. Para la técnica A:

shapiro.test(A)
## 
##  Shapiro-Wilk normality test
## 
## data:  A
## W = 0.95842, p-value = 0.7611

El p-valor es mayor que 0.05 y por tanto se acepta la hipótesis nula (los rendimientos generados por la técnica A siguen una distribución normal).

Para la técnica B:

shapiro.test(B)
## 
##  Shapiro-Wilk normality test
## 
## data:  B
## W = 0.96576, p-value = 0.849

También el p-valor es mayor que 0.05, por lo que podemos aceptar la normalidad de la distribución de los rendimientos de B.

 

 


 

  1. Un laboratorio quı́mico desarrolla un nuevo insecticida para eliminar las plagas de pulgón en cultivos de cereales. El insecticida comercializado hasta ahora por el laboratorio tiene una eficacia del 60 % (esto es, elimina al 60 % de los pulgones sobre los que actúa, en un plazo inferior a 24 horas). Como prueba preliminar, el nuevo insecticida se ensaya sobre 14 pulgones, resultando nueve de ellos muertos antes de 24 horas ¿Es ésta evidencia suficiente de que el nuevo insecticida es más eficaz que el anterior? Posteriormente el insecticida se ensaya sobre 83 pulgones, muriendo 55 antes de las 24 horas. ¿Existe ahora evidencia de que el nuevo insecticida es más eficaz que el anterior?

 

Solución:

En la prueba preliminar murieron 9 pulgones de 14, es decir, un \(100\cdot 0/14=64.29\)%. Por tanto en esta muestra la eficacia fue algo mayor que el 60%. Ahora bien, la pregunta que se plantea en el enunciado es si esto constituye evidencia suficiente de que el porcentaje de pultones eliminados en general por el nuevo insecticida supera el 60%. Para ello debemos resolver el contraste:

\[\begin{cases} H_{0}: & \pi\le 0.6\\ H_{1}: & \pi>0.6 \end{cases}\]

Si utilizamos la tabla de contrastes, como el tamaño de muestra es pequeño (n=14) utilizamos como estadístico de contraste el número de éxitos \(N_{E}\) (en este caso el número de pulgones muertos), siendo la regla de decisión rechazar \(H_{0}\) si \(N_{E}>b_{n,\alpha}\left(\pi_{0}\right)\), con:

\[b_{n,\alpha}\left(\pi_{0}\right)=\min\left\{ {k\left|{\,P(X>k)\le\alpha}\right.}\right\} =\min\left\{ {k\left|{\,P(X\le k)\ge1-\alpha}\right.}\right\} =\mathsf{qbinom({1-\alpha},n,{\pi_{0}})}\]

El número de pulgones muertos en este experimento fue \(N_{E}=9\) de \(n=14\) (eficacia \(\frac{100\cdot9}{14}=64.29\)%). Utilizando R resulta \(b_{14,0.05}\left(0.6\right)=\mathsf{qbinom(0.95,14,0.6)}=11\). Como \(N_{E}=9<b_{14,0.05}\left(0.6\right)=11\), no se da la condición para rechazar \(H_{0}\), por lo que aunque la eficacia es este experimento ha sido algo mayor del 60%, la evidencia es insuficiente para asegurar con un nivel de significación del 5% que el nuevo insecticida es en general más eficaz que el anterior.

 

El contraste puede resolverse de manera más sencilla usando el procedimiento binom.test de R:

binom.test(9,14,0.6,alternative="greater")
## 
##  Exact binomial test
## 
## data:  9 and 14
## number of successes = 9, number of trials = 14, p-value = 0.4859
## alternative hypothesis: true probability of success is greater than 0.6
## 95 percent confidence interval:
##  0.3904149 1.0000000
## sample estimates:
## probability of success 
##              0.6428571

Como el p-valor es 0.4859, mayor que el 5%, llegamos a la misma conclusión: puede aceptarse \(H_0\) y por tanto que aunque en esta muestra la eficacia sea mayor que el 60%, la evidencia no es suficiente para poder asegurar con un 5% de significación que el nuevo insecticida tiene realmente esa eficacia. Lo que nos indica el contraste es que el resultado observado puede deberse simplemente a la variabilidad aleatoria inherente al muestreo.

 

 

El segundo apartado de la pregunta indica que el experimento se repite ahora sobre 83 pulgones, resultando muertos 55, es decir, un \(100\cdot 55/830=66.265\)% de la muestra. El contraste a realizar es el mismo de antes:

\[\begin{cases} H_{0}: & \pi\le 0.6\\ H_{1}: & \pi>0.6 \end{cases}\]

La única diferencia es que ahora el tamaño de la muestra es mayor, y la efectividad es un poquito más alta. Repetimos el procedimiento:

binom.test(55,83,0.6,alternative="greater")
## 
##  Exact binomial test
## 
## data:  55 and 83
## number of successes = 55, number of trials = 83, p-value = 0.1459
## alternative hypothesis: true probability of success is greater than 0.6
## 95 percent confidence interval:
##  0.5678127 1.0000000
## sample estimates:
## probability of success 
##              0.6626506

El p-valor es 0.1459, mayor que 0.05. Por tanto esta segunda muestra tampoco muestra evidencia suficiente de que la eficacia del insecticida supere el 60%.

 

NOTA: este segundo apartado podía haberse resuelto “a mano” utilizando la aproximación mostrada en la tabla de contrastes de hipótesis: \[z_{exp}=\frac{{p-\pi_{0}}}{{\sqrt{\frac{{\pi_{0}(1-\pi_{0})}}{n}}}}\], ya que \(n\ge30\), \(N_{E}>5\) y \(n-N_{E}>5\). En este caso:

\[z_{exp}=\frac{{p-\pi_{0}}}{{\sqrt{\frac{{\pi_{0}(1-\pi_{0})}}{n}}}}=\frac{0.6626506-0.6}{\sqrt{\frac{0.6\left(1-0.6\right)}{83}}}=-2.683545\]

y como \(z_{exp}<z_{0.05}=qnorm(0.95)=1.96\) concluimos que no existen evidencias suficientes para rechazar \(H_{0}\) (en otras palabras, el nuevo insecticida no ha demostrado ser más eficaz que el anterior).

 

 


 

  1. Los pulgones que atacan a la cebada constituyen una variedad diferente de la que ataca al trigo. El nuevo insecticida se ha desarrollado de tal forma que se espera que sea absolutamente genérico y que por tanto su eficacia sea la misma para ambas variedades de pulgón. Se ha aplicado el insecticida a 16 ejemplares de pulgón del trigo y a 19 de pulgón de la cebada. Al cabo de 24 horas han muerto 5 pulgones de la primera clase y 10 de la segunda. ¿Es ésta evidencia suficiente en contra de la hipótesis de que el insecticida es genérico?

 

Solución:

El contraste a resolver es de la forma:

\[\begin{cases} H_{0}: & \pi_{Trigo}=\pi_{Cebada}\\ H_{1}: & \pi_{Trigo}\ne\pi_{Cebada} \end{cases}\]

Nuestras estimaciones a partir de los datos aportados por las muestras son: \[p_{Trigo}=\frac{5}{16}=0.3125\,\,\,\,\,\,\,\,p_{Cebada}=\frac{10}{19}=0.5263158\]

Obviamente los valores son distintos; para determinar si la evidencia de que el efecto es distinto sobre ambas variedades de pulgón es suficiente para poder generalizarla a las poblaciones respectivas debemos llevar a cabo el test de Fisher, dado que los tamaños muestrales son pequeños:

Eficacia = matrix(c(5,10,11,9),nrow = 2,
    dimnames = list(Pulgon = c("Trigo", "Cebada"),
                    Muerto = c("Sí", "No")))
Eficacia
##         Muerto
## Pulgon   Sí No
##   Trigo   5 11
##   Cebada 10  9
fisher.test(Eficacia)
## 
##  Fisher's Exact Test for Count Data
## 
## data:  Eficacia
## p-value = 0.3064
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.07990299 1.97994916
## sample estimates:
## odds ratio 
##  0.4199278

El p-valor (0.3064) indica que no existe evidencia suficiente de haya diferencia en la eficacia sobre las dos especies. Por tanto, la diferencia observada en la muestra es atribuíble simplemente al azar.

 

 


 

  1. Se ha observado en cierta especie de pez que la competencia por el alimento puede conducir a comportamiento agresivo. Se realiza un experimento con 50 peces de esta especie en un tanque sujeto a restricciones alimentarias, observándose comportamiento agresivo en 20 de dichos peces. En una segunda fase del experimento el mismo tanque se somete a las mismas restricciones alimentarias, pero esta vez se introducen distractores (turbulencia, partículas en suspensión, etc). En esta segunda fase, de los 20 que fueron agresivos en el primer experimento, solo 12 volvieron a manifestar comportamiento agresivo, y 8 no; de los 30 que no mostraron agresividad en la primera fase, 2 se mostraron agresivos en esta ocasión (y 28 no). ¿Muestran estos datos evidencia suficiente de que los distractores modifican la agresividad?

Solución:

Dado que se están usando los mismos peces en los dos experimentos, se trata de un contraste de muestras emparejadas. Los datos son de la forma:

agresividad = matrix(c(12,2,8,28),nrow = 2,
    dimnames = list(exper1 = c("Sí", "No"),
                    exper2 = c("Sí", "No")))
agresividad
##       exper2
## exper1 Sí No
##     Sí 12  8
##     No  2 28

En definitiva, lo que los datos nos indican es que los distractores han cambiado el comportamiento de solo 10 peces, 8 agresivos que dejaron de serlo, y 2 no agresivos que pasaron a comportarse agresivamente; lo que debe contrastarse es si estas modificaciones en el comportamiento tienden a producirse preferentemente en un sentido (más agresivos que pasan a no agresivos que no agresivos que pasan a agresivos), o si simplemente el sentido del cambio es atribuible al azar. Para responder a esta pregunta podemos utilizar el test de McNemar:

mcnemar.test(agresividad)
## 
##  McNemar's Chi-squared test with continuity correction
## 
## data:  agresividad
## McNemar's chi-squared = 2.5, df = 1, p-value = 0.1138

El p-valor 0.1138 es mayor que 0.05 y por tanto concluimos que no existe evidencia suficiente de que los distractores hayan modificado de manera significativa el comportamiento agresivo de estos peces

 

 

NOTA: El test de McNemar es equivalente a contrastar la hipótesis nula de si entre los peces que cambian de comportamiento, los que cambian de agresivo a no agresivo son el 50% (lo que significaría que los que cambian en sentido contrario son el otro 50%). Aceptar la hipótesis nula significa entonces que la introducción de distractores no vuelve a los peces ni más ni menos agresivos. Desde esta perspectiva, la muestra de interés son los 10 que han cambiado de comportamiento, de entre los cuales 8 lo han hecho en un sentido. La hipótesis nula de si puede aceptarse que la proporción es del 50% puede contrastarse mediante prop.test:

prop.test(8,10,0.5)
## 
##  1-sample proportions test with continuity correction
## 
## data:  8 out of 10, null probability 0.5
## X-squared = 2.5, df = 1, p-value = 0.1138
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.4421814 0.9645731
## sample estimates:
##   p 
## 0.8

que, como puede verse, produce exactamente el mismo p.valor que el test de McNemar.