class: center, middle, inverse, title-slide # Tema 6: Inferencia Estadística III. Contrastes de hipótesis ###
Estadística. Grado en Ciencias del Mar --- # Contraste de hipótesis: motivación .pull-left[ ![](imagenes/algas.jpg) ] .pull-right[ Las algas de cierta especie que se cultivan con fines farmacológicos son muy sensibles al pH del agua. Se ha observado que el desarrollo de estas algas es óptimo cuando el pH promedio es `\(\mu=8.4\)`, y diariamente se realizan controles con el objetivo de aplicar medidas correctoras (añadir aditivos químicos al agua) si el pH se aparta de este valor. ] -- El control consiste en tomar 9 muestras de agua en diversas zonas del cultivo y medir su pH. Los valores observados en el último control fueron 8.7, 8.8, 9.8, 9.3, 10.5, 8.9, 7.8, 7.8, 8.5, siendo `\(\bar{x}=8.9\)` -- .resalta[ __Con estos valores ¿tendríamos información suficiente para asegurar que el pH medio del cultivo se ha apartado del valor óptimo de 8.4?__ ] --- # Contraste de hipótesis * El hecho de haber observado un pH medio (8.9) que es 0.5 unidades mayor que el óptimo (8.4) arroja cierta evidencia de que es posible que el pH del cultivo haya aumentado, pero: -- .resalta[ <p style="margin-top:10px"><center> <strong> ¿Es suficiente esta evidencia? </strong> </center><br> </p> ] -- * Debemos preguntarnos (y respondernos) si la diferencia observada (0.5 unidades) está dentro de lo que podría esperarse por puro azar al tomar una muestra aleatoria de agua en distintas zonas. -- .resalta[ * Si la diferencia observada es explicable por efecto del azar `\(\Rightarrow\)` <font color="blue"> __No hay evidencia de que el pH haya aumentado__</font>. {{content}} ] -- * Si la diferencia es mayor que lo esperable por efecto del azar `\(\Rightarrow\)` <font color="blue"> __Podemos afirmar con ciertas garantías que efectivamente el pH se ha incrementado__</font>. --- # Contraste de hipótesis * Una __hipótesis estadística__ es una afirmación o conjetura con respecto a alguna característica de interés de la distribución de una variable aleatoria. Llamaremos .blue[ __hipótesis nula__] ( `\(H_0\)` ) a la hipótesis de partida, que será aceptada como válida si la evidencia en su contra es débil o inexistente. -- * La .blue[ __hipótesis alternativa__] ( `\(H_1\)` ) es la hipótesis que será aceptada en caso de que se rechace `\(H_0\)`. -- <br> .resalta[ * Un <font color="blue"> __contraste de hipótesis estadístico__ </font> es una _regla de decisión_ que permite elegir entre la dos hipótesis, `\(H_0\)` y `\(H_1\)` , en función de la evidencia aportada por los datos disponibles y del _riesgo de error_ que estemos dispuestos a asumir. ] --- ## Contraste de hipótesis: .blue[Ejemplo] En nuestro ejemplo del control del pH en el cultivo de algas, el contraste se realiza entre las dos hipótesis siguientes: -- `$$\left\{ \begin{array}{c} {H_{0}:\mu=8.4}\\ {H_{1}:\mu\neq 8.4} \end{array}\right.$$` -- Hay dos maneras en que podemos equivocarnos: * Creer que las cosas van mal ( `\(\mu\neq 8.4\)` ) cuando en realidad van bien <br> ( `\(\mu=8.4\)` ) -- * Creer que las cosas van bien ( `\(\mu=8.4\)` ) cuando en realidad van mal <br> ( `\(\mu\neq 8.4\)` ) -- <br> Además, en algún momento tendremos que precisar cuanto se tiene que alejar el pH medio `\(\mu\)` de 8.4 para que sea indispensable intervenir ajustando el pH del agua: a lo mejor sólo hay que preocuparse si el pH sube de 9 o baja de 7.5, por lo que aceptar que es 8.4 cuando en realidad es 8.8 puede no tener mucha importancia. --- # Tipos de Error en los contrastes de hipótesis. * .blue[ __Error tipo I:__] Rechazar la hipótesis nula cuando es verdadera -- .resalta[ __Nivel de significación:__ `$$\alpha =P\left({\text{Error Tipo I}}\right)=P\left(\textrm{Rechazar} H_{0}\left|H_{0}\textrm{ es cierta}\right.\right)$$` ] -- * .blue[ __Error tipo II:__] Aceptar la hipótesis nula cuando es falsa. -- .resalta[ `$$\beta =P\left({\text{Error Tipo II}}\right)=P\left(\textrm{Aceptar} H_{0}\left|H_{0}\textrm{ es falsa}\right.\right)$$` ] -- <p style="line-height:0.1"></p> .resalta[ __Potencia:__ `$$1-\beta =P\left(\textrm{Rechazar} H_{0}\left|H_{0}\textrm{ es falsa}\right.\right)$$` ] --- ## Tipos de Error en los contrastes de hipótesis. <table> <thead> <tr class="header"> <th style="text-align: center;"></th> <th style="text-align: center;"></th> <th style="text-align: center;">Si <span class="math inline"><em>H</em><sub>0</sub></span> cierta</th> <th style="text-align: center;">Si <span class="math inline"><em>H</em><sub>0</sub></span> falsa</th> </tr> </thead> <tbody> <tr class="odd"> <td style="text-align: center;"><span><strong>Decisión</strong> </span></td> <td style="text-align: center;">Aceptar <span class="math inline"><em>H</em><sub>0</sub></span></td> <td style="text-align: center;">Decisión correcta (1-<span class="math inline"><em>α</em></span>)</td> <td style="text-align: center;">Error II (<span class="math inline"><em>β</em>)</span></td> </tr> <tr class="even"> <td style="text-align: center;"></td> <td style="text-align: center;">Rechazar <span class="math inline"><em>H</em><sub>0</sub></span></td> <td style="text-align: center;">Error I (<span class="math inline"><em>α</em>)</span></td> <td style="text-align: center;">Decisión Correcta (1-<span class="math inline"><em>β</em></span>)</td> </tr> </tbody> </table> -- <p style="line-height:0.1"></p> .resalta[ En general, al realizar un contraste de hipótesis se desea: * Que el nivel de significación `\(\alpha\)` sea lo más pequeño posible * Que la potencia `\(1-\beta\)` sea lo mayor posible ] -- En muchas ocasiones, sobre todo con muestras de tamaño `\(n\)` pequeño no será posible conseguir ambos objetivos simultáneamente; como veremos a continuación, los contrastes de hipótesis están diseñados de tal forma que .red[__el valor de__] `\(\boldsymbol{{\color{blue}\alpha}}\)` .red[__es siempre pequeño (0.05, 0.01, 0.005), aún a costa de que el valor de__] `\(\boldsymbol{{\color{blue}\beta}}\)` .red[__pueda ser bastante mayor__]: de esta forma __es difícil rechazar__ `\(H_0\)` __si es cierta pero puede ser fácil aceptarla si es falsa.__ --- ## Tipos de Error en los contrastes de hipótesis. <table> <thead> <tr class="header"> <th style="text-align: center;"></th> <th style="text-align: center;"></th> <th style="text-align: center;">Si <span class="math inline"><em>H</em><sub>0</sub></span> cierta</th> <th style="text-align: center;">Si <span class="math inline"><em>H</em><sub>0</sub></span> falsa</th> </tr> </thead> <tbody> <tr class="odd"> <td style="text-align: center;"><span><strong>Decisión</strong> </span></td> <td style="text-align: center;">Aceptar <span class="math inline"><em>H</em><sub>0</sub></span></td> <td style="text-align: center;">Decisión correcta (1-<span class="math inline"><em>α</em></span>)</td> <td style="text-align: center;">Error II (<span class="math inline"><em>β</em>)</span></td> </tr> <tr class="even"> <td style="text-align: center;"></td> <td style="text-align: center;">Rechazar <span class="math inline"><em>H</em><sub>0</sub></span></td> <td style="text-align: center;">Error I (<span class="math inline"><em>α</em>)</span></td> <td style="text-align: center;">Decisión Correcta (1-<span class="math inline"><em>β</em></span>)</td> </tr> </tbody> </table> <p style="line-height:0.1"></p> .resalta[ En general, al realizar un contraste de hipótesis se desea: * Que el nivel de significación `\(\alpha\)` sea lo más pequeño posible * Que la potencia `\(1-\beta\)` sea lo mayor posible ] <p style="line-height:0.1"></p> .fondoAzul[ Conseguir simultáneamente valores de `\(\alpha\)` pequeños y valores de `\(1−\beta\)` grandes requerirá normalmente tamaños de muestra grandes y/o diseños de muestreo/experimentos adecuados. ] --- ## Contraste de significación: Procedimiento 1. Fijar las hipótesis .blue[ __nula__] ( `\(H_{0}:\theta\in\Theta_{0}\)` ) y .blue[ __alternativa__] ( `\(H_{1}:\theta\notin\Theta_{0}\)` ). -- 2. Determinar una .blue[ __medida de discrepancia__] `\(T\left(X_{1},X_{2},\dots,X_{n}\right)\)` entre los datos y `\(H_0\)`; esta medida se denomina _estadístico de contraste_ y su distribución de probabilidad debe ser conocida cuando `\(H_{0}\)` es cierta. -- 3. Fijar la probabilidad `\(\alpha\)` de error de tipo I (nivel de significación), y determinar una .blue[__región crítica o de rechazo__] `\(R_{C}\)` de tal manera que si `\(H_0\)` es cierta sea .red[ __poco probable__] que el valor de `\(T\)` caiga en esa región : `$$P\left(T\left(X_{1},X_{2},\dots,X_{n}\right)\in R_{C}\left|H_{0}\textrm{ es cierta}\right.\right)=\alpha$$` -- 4. Obtener una muestra aleatoria `\(\left(X_{1},X_{2},\dots,X_{n}\right)\)` y utilizar la siguiente regla de decisión: .resalta[  Si `\(T\left(X_{1},X_{2},\dots,X_{n}\right)\in R_{C}\)` rechazar `\(H_{0}\)`. En caso contrario aceptar `\(H_{0}\)` ] --- ## .blue[Contraste de significación: Ejemplo] En nuestro ejemplo del control del pH del agua en un cultivo de algas se toman 9 muestras de agua. ¿Es aceptable que el pH medio es el óptimo, 8.4, o existe evidencia de que el pH medio del cultivo se ha apartado de dicho valor? -- `1.` Fijamos las hipótesis nula y alternativa: `$$\left\{ \begin{array}{c} {H_{0}:\mu=8.4}\\ {H_{1}:\mu\neq 8.4} \end{array}\right.$$` <br> -- `2.` Para medir la discrepancia entre la hipótesis nula ( `\(\mu=8.4\)` ) y los datos, resulta razonable comparar el valor de `\(\mu\)` esperado con el valor de `\(\bar{x}\)` observado. Podemos realizar dicha comparación mediante el estadístico: `$$T=\frac{\bar{x}-8.4}{s/\sqrt{9}}$$` que, si `\(H_0\)` es cierta, sabemos que sigue una distribución `\(t_{8}\)` ( `\(t\)` de Student con `\(8\)` grados de libertad) --- ## .blue[Contraste de significación: Ejemplo] `3.` Fijamos `\(\alpha=0.05\)` y determinamos la .blue[__región crítica__] `\(R_{C}\)` de tal manera que: `$$P\left(T\in R_{C}\left|H_{0}\textrm{ es cierta}\right.\right)=\alpha$$` .pull-left[ <img src="tema6_Contrastes_hipotesis_files/figure-html/unnamed-chunk-4-1.png" style="display: block; margin: auto;" /> ] -- .pull-right[ En este caso: `$$P\left(\left.\left|\frac{\bar{x}-8.4}{s/\sqrt{9}}\right| > t_{8,1-\alpha/2}\right|H_0\textrm{ cierta}\right) =\alpha$$` {{content}} ] -- <br> Por tanto, tomando `\(\alpha=0.05\)`: `$$R_C= \left(-\infty,t_{8,\alpha/2}\right]\cap\left[t_{8,1-\alpha/2},\infty\right)=$$` $$ = \left(-\infty,-2.306\right]\cap\left[2.306,\infty\right)$$ --- ## .blue[Contraste de significación: Ejemplo] `4.` Comprobamos si el valor de `\(T\)` observado a partir de nuestra muestra cae o no en la región crítica: ``` ## media s ## 8.900 0.877 ``` `$$T_{obs}=\frac{\bar{x}-8.4}{s/\sqrt{9}}=\frac{8.9-8.4}{0.877/3}=1.709 \notin R_C$$` -- Este valor cae fuera de la región crítica, lo que significa que es un valor con mucha probabilidad de ocurrir si la hipótesis nula ( `\(H_0:\mu=8,4\)` ) es cierta `\(\Rightarrow\)` __Aceptamos `\(H_0\)`__ -- .resalta[ La región complementaria a la región crítica se suele denominar .blue[ __Región de aceptación__] y corresponde al conjunto de valores del estadístico de contraste T con mayor probabilidad de ocurrir si `\(H_0\)` es cierta. ] -- En el ejemplo la región de aceptación es el intervalo `\([-2.306; 2.306]\)` --- ## Contrastes de significación: denominación del resultado <br> .resalta[ * Cuando en un contraste se rechaza la hipótesis nula, se suele expresar diciendo que el contraste ha resultado .blue[ __significativo__]. Si se acepta `\(H_0\)` el resultado del contraste es .blue[ __no significativo__] ] --- ## Contrastes de significación: interpretación * Nótese que en la construcción de la regla de decisión en un contraste de hipótesis solo se controla el error tipo I, cuya probabilidad se garantiza que es un valor pequeño `\(\alpha\)`. -- * Si la probabilidad `\(\beta\)` de error tipo II (aceptar `\(H_0\)` siendo falsa) no se controla a priori mediante un tamaño de muestra adecuado, es posible que dicha probabilidad sea alta. -- * Por tanto, .blue[ __cuando aceptamos__] la hipótesis nula `\(H_0\)` .red[ __no significa que estemos muy seguros de que sea cierta__]. Significa que los datos observados .red[ __son compatibles__] con dicha hipótesis y con el posible efecto del azar, y por tanto no muestran evidencia (suficiente) para rechazarla. De hecho incluso podría ocurrir que los datos fuesen compatibles con otras hipótesis distintas de `\(H_0\)`. -- * Por el contrario, .blue[ __cuando rechazamos__] `\(H_0\)` .red[ __podemos estar muy seguros de que es falsa__], pues los datos observados difícilmente podían haber ocurrido de ser cierta dicha hipótesis (la probabilidad de su ocurrencia siendo `\(H_0\)` cierta es inferior a `\(\alpha\)`). Diremos entonces que los datos muestran evidencia suficiente, con un nivel de significación `\(\alpha\)`, de que `\(H_0\)` es falsa. --- ## Contrastes de significación: interpretación * Por tanto, cuando no se controla la probabilidad `\(\beta\)` del error de tipo II, los posibles resultados de un contraste no son simétricos: -- + .blue[Es posible que la probabilidad de aceptar] `\(H_0\)` .blue[siendo falsa sea alta]: `\(H_0\)` se acepta no por tener fuerte evidencia a su favor, sino por tener poca evidencia en contra. -- <br> + Sin embargo, .blue[la probabilidad de rechazar] `\(H_0\)` .blue[siendo cierta es siempre pequeña] ( `\(\alpha\)` ), lo que significa que cuando se rechaza `\(H_0\)` es porque hay una fuerte evidencia a favor de `\(H_1\)` -- .resalta[ Por ello, al realizar un contraste de hipótesis colocaremos como hipótesis alternativa `\(H_1\)` aquella que sólo estaríamos dispuestos a aceptar si cuenta con una fuerte evidencia a su favor. ] --- ## Potencia de un contraste * En nuestro ejemplo hemos aceptado `\(H_0\)` y por tanto podemos preguntarnos ¿cuál es la probabilidad `\(\beta\)` de que estemos tomando una decisión errónea, esto es, que aceptemos `\(H_0\)` siendo falsa? -- * Para calcular esta probabilidad hay que especificar con qué alternativa se quiere comparar el resultado: intuitivamente si el _verdadero valor_ del parámetro (en nuestro ejemplo el pH medio del cultivo de algas) está muy cerca del _valor hipotético_ que hemos puesto en `\(H_0\)`, será más fácil equivocarse que si el verdadero valor estuviese muy alejado del valor hipotético. -- * Supongamos, en nuestro ejemplo, que queremos saber cuál sería la probabilidad de aceptar `\(H_0:\mu=8.4\)` a partir de una muestra de 9 observaciones si el verdadero valor medio de pH en el cultivo fuese `\(\mu=9.4\)`. -- * Hemos de tener en cuenta en tal caso que si `\(\mu=9.4\)`, el estadístico que sigue una distribución `\(t_8\)` es `$$T=\frac{\bar{x}-9.4}{s/\sqrt{9}}$$` --- ## Potencia de un contraste * Entonces: `$$\beta\left(9.4\right)=P\left(\left.\textrm{Aceptar }H_{0}\right|H_{0}\textrm{ falsa porque }\mu=9.4\right)=$$` -- `$${\small =P\left(\left.\left|\frac{\overline{x}-8.4}{s/\sqrt{9}}\right|\le2.306\right|\mu=9.4\right)=P\left(\left.-2.306\le\frac{\overline{x}-8.4}{s/\sqrt{9}}\le2.306\right|\mu=9.4\right)=}$$` -- `$${\small=P\left(\left.-2.306\le\frac{\overline{x}-9.4}{s/\sqrt{9}}+\frac{9.4-8.4}{s/\sqrt{9}}\le2.306\right|\mu=9.4\right)=}$$` -- `$${\small=P\left(\left.-2.306-\frac{1}{s/\sqrt{9}}\le\frac{\overline{x}-9.4}{s/\sqrt{9}}\le2.306-\frac{1}{s/\sqrt{9}}\right|\mu=9.4\right)=}$$` -- `$${\small=P\left(-2.306-\frac{1}{s/\sqrt{9}}\le t_{8}\le2.306-\frac{1}{s/\sqrt{9}}\right)=}$$` -- Como s=0.8775 `$${\small = P\left(-5.725\le t_{8}\le-1.113\right)=0.15}$$` --- ## Potencia de un contraste Si llamamos `\(\Delta=\mu-8.4\)`, la probabilidad de error II que acabamos de calcular puede expresarse en general como: `$${\small \beta\left(\Delta\right)=P\left(-2.306-\frac{\Delta}{s/\sqrt{9}}\le t_{8}\le2.306-\frac{\Delta}{s/\sqrt{9}}\right)}$$` -- Podemos utilizar R para calcular el valor de `\(\beta(\Delta)\)` para distintos valores de `\(\Delta\)`, obteniendo el gráfico siguiente: <img src="tema6_Contrastes_hipotesis_files/figure-html/unnamed-chunk-7-1.png" style="display: block; margin: auto;" /> --- ## Potencia de un contraste Asimismo, podemos evaluar también como se modifica la probabilidad de cometer un error tipo II en función del tamaño de la muestra; la expresión anterior para un `\(n\)` arbitrario es: `$${\small \beta\left(\Delta\right)=P\left(t_{n-1,\alpha/2}-\frac{\Delta}{s/\sqrt{n}}\le t_{n-1}\le t_{n-1,1-\alpha/2}-\frac{\Delta}{s/\sqrt{n}}\right)}$$` <img src="tema6_Contrastes_hipotesis_files/figure-html/unnamed-chunk-8-1.png" style="display: block; margin: auto;" /> --- ## Potencia de un contraste Teniendo en cuenta que `\(Potencia(\Delta) = 1-\beta(\Delta)\)`, la siguiente gráfica muestra el efecto del tamaño de la muestra sobre la potencia del contraste: `$${\small \textrm{Pot}(\Delta)=1-\beta\left(\Delta\right)=1-P\left(t_{n-1,\alpha/2}-\frac{\Delta}{s/\sqrt{n}}\le t_{n-1}\le t_{n-1,1-\alpha/2}-\frac{\Delta}{s/\sqrt{n}}\right)}$$` <img src="tema6_Contrastes_hipotesis_files/figure-html/unnamed-chunk-9-1.png" style="display: block; margin: auto;" /> --- # Tipos de Contrastes de Hipótesis `1.` .blue[ __Paramétricos:__] Se refieren a parámetros de la distribución. Pueden ser: `\(\qquad\)` a. .red[ __Bilaterales:__] `$$\left\{ \begin{array}{c} H_{0}:\theta=\theta_{0}\\ H_{1}:\theta\neq\theta_{0} \end{array}\right.$$` -- `\(\qquad\)` b. .red[ __Unilaterales:__] `$$\left\{ \begin{array}{c} H_{0}:\theta\ge\theta_{0}\\ H_{1}:\theta<\theta_{0} \end{array}\right.\qquad\quad\left\{ \begin{array}{c} H_{0}:\theta\le\theta_{0}\\ H_{1}:\theta>\theta_{0} \end{array}\right.$$` -- <br> `2.` .blue[ __No Paramétricos:__] Se refieren a la _forma_ de la distribución (o distribuciones). Por ejemplo: `$$\left\{ \begin{array}{c} H_{0}:X\approx N\left(\mu,\sigma\right)\\ H_{1}:X\not\approx N\left(\mu,\sigma\right) \end{array}\right.\qquad\quad\left\{ \begin{array}{c} H_{0}:\mathcal{F}_{1}\approx\mathcal{F}_{2}\\ H_{1}:\mathcal{F}_{1}\not\approx\mathcal{F}_{2} \end{array}\right.$$` --- # Contrastes Unilaterales: .blue[Ejemplo] Supongamos en nuestro ejemplo inicial del cultivo de algas, que el pH del agua resulta perjudicial para su crecimiento .red[si está por debajo de 7.5], y que valores de pH más altos no presentan problemas para el cultivo. El contraste a realizar en nuestros controles periódicos sería entonces: -- `$$\left\{ \begin{array}{c} H_{0}:\mu\ge7.5\\ H_{1}:\mu<7.5 \end{array}\right.$$` -- Para medir la discrepancia entre los datos observados y la hipótesis nula podemos utilizar nuevamente el estadístico: `$$T=\frac{\overline{x}-7.5}{s/\sqrt{n}}$$` -- .resalta[ Ahora bien, en este caso la discrepancia que nos llevaría al rechazo de la hipótesis nula es que el valor de `\(\bar{x}\)` fuese .red[__más pequeño__] que 7.5 de lo que cabría esperar por azar. ] --- # Contrastes Unilaterales: .blue[Ejemplo] .pull-left[ `$$\left\{ \begin{array}{c} H_{0}:\mu\ge7.5\\ H_{1}:\mu<7.5 \end{array}\right.$$` <img src="tema6_Contrastes_hipotesis_files/figure-html/unnamed-chunk-10-1.png" style="display: block; margin: auto;" /> ] -- .pull-right[ `$$T=\frac{\overline{x}-7.5}{s/\sqrt{n}}$$` {{content}} ] -- <br> La región crítica o de rechazo es: `$$R_C= \left(-\infty,t_{n-1,\alpha}\right]$$` <br> {{content}} -- En este caso: `$$P\left(\left.\frac{\bar{x}-7.5}{s/n}<t_{n-1,\alpha}\right|H_{0}\textrm{ cierta}\right)\le\alpha$$` --- # Contrastes Unilaterales: .blue[Ejemplo] Si la muestra observada es: 7.7, 6.1, 7.1, 5.3, 8.6, 6.8, 9.7, 7.1, 7.3 -- tenemos: ``` ## media s ## 7.300 1.293 ``` -- El valor observado del estadístico de contraste es entonces: `$$T_{obs}=\frac{7.3-7.5}{1.293/\sqrt{9}}=-0.464$$` -- y la región crítica: `\(R_C= \left(-\infty,t_{8,0.05}\right]=\left(-\infty,-1.86\right]\)` -- Como `\(T_{obs}=-0.464 \notin R_C \Rightarrow\)` __Aceptamos `\(H_0\)` __, esto es, no hay evidencia suficiente (con un nivel de significación del 5%) de que el ph haya descendido por debajo de `\(\mu=7.5\)`. --- # p-valor de un contraste * Hasta ahora hemos visto que la decisión en un contraste de hipótesis se toma fijando una región crítica que depende del nivel de significación: `$$P\left(T\in R_C \left| H_0 \textrm{ cierta}\right.\right) = \alpha$$` -- * El nivel de significación se fija .red[arbitrariamente], siendo los valores usuales 0.05, 0.01 ó incluso 0.001 -- * Cuando menor sea `\(\alpha\)` es más difícil rechazar `\(H_0\)` siendo cierta. -- .resalta[ * Dado el valor `\(T_{obs}\)` de un estadístico de contraste `\(T\)` calculado sobre una muestra, se llama .blue[ __p-valor__] al menor valor de `\(\alpha\)` para el que sería posible rechazar `\(H_0\)` ] -- * Dicho de otra forma, el p-valor es el área de la región de rechazo más pequeña que contiene al valor `\(T_{obs}\)` --- # p-valor de un contraste .pull-left[ <img src="tema6_Contrastes_hipotesis_files/figure-html/unnamed-chunk-13-1.png" style="display: block; margin: auto;" /> {{content}} ] -- `\(T_{obs} < t_{n-1,\alpha}\Rightarrow\)` Se rechaza `\(H_0\)` -- .pull-right[ * Cuando `\(T_{obs}\)` cae en la región de rechazo definida por el nivel de significación `\(\alpha\)` .red[(que hemos fijado arbitrariamente)], significa que `\(H_0\)` se podía haber rechazado incluso con un `\(\alpha\)` menor. {{content}} ] -- * El `\(p-valor\)` es el área de la menor región de rechazo que contiene a `\(T_{obs}\)` {{content}} -- * Por tanto, podemos basar la regla de decisión sobre `\(H_0\)` en el p-valor: `$$\bbox[#ffff80]{\begin{cases} p<\alpha & \Rightarrow\textrm{Rechazar }H_{0}\\ p\ge\alpha & \Rightarrow\textrm{Aceptar }H_{0} \end{cases}}$$` --- # p-valor de un contraste: .blue[Ejemplo] En nuestro ejemplo anterior, el test a realizar era: `$$\left\{ \begin{array}{c} H_{0}:\mu\ge7.5\\ H_{1}:\mu<7.5 \end{array}\right.$$` y se obtuvieron los datos: 7.7, 6.1, 7.1, 5.3, 8.6, 6.8, 9.7, 7.1, 7.3 ``` ## media s ## 7.300 1.293 ``` `$$T_{obs}=\frac{7.3-7.5}{1.293/\sqrt{9}}=-0.464$$` -- El p-valor en este caso es: `$$p-\textrm{valor} = P\left(t_8\le T_{obs}\right)=P\left(t_8\le-0.464\right)=0.3275$$` -- Si elegimos como nivel de significación `\(\alpha=0.05\)`, al ser `\(p\ge \alpha \Rightarrow\)` aceptamos `\(H_0\)`. --- # Contrastes de hipótesis con R: .blue[Ejemplos] * Para el contraste anterior: `$$\left\{ \begin{array}{c} H_{0}:\mu\ge7.5\\ H_{1}:\mu<7.5 \end{array}\right.$$` la sintaxis a emplear es: ```r ph=c(7.7, 6.1, 7.1, 5.3, 8.6, 6.8, 9.7, 7.1, 7.3) t.test(ph,mu=7.5, alternative="less") ``` -- ``` ## ## One Sample t-test ## ## data: ph ## t = -0.46395, df = 8, p-value = 0.3275 ## alternative hypothesis: true mean is less than 7.5 ## 95 percent confidence interval: ## -Inf 8.101621 ## sample estimates: ## mean of x ## 7.3 ``` --- # Contrastes de hipótesis con R: .blue[Ejemplos] * Para el primer contraste que habíamos visto: `$$\left\{ \begin{array}{c} H_{0}:\mu= 8.4\\ H_{1}:\mu\neq 8.4 \end{array}\right.$$` ```r ph=c(8.7, 8.8, 9.8, 9.3, 10.5, 8.9, 7.8, 7.8, 8.5) t.test(ph,mu=8.4, alternative="two.sided") ``` -- ``` ## ## One Sample t-test ## ## data: ph ## t = 1.7094, df = 8, p-value = 0.1257 ## alternative hypothesis: true mean is not equal to 8.4 ## 95 percent confidence interval: ## 8.225497 9.574503 ## sample estimates: ## mean of x ## 8.9 ``` --- # Contrastes de hipótesis más frecuentes En la sección [Descargas](http://estadistica-dma.ulpgc.es/estadFCM/pdf/Resumen_Contrastes_de_hipotesis.pdf) de la web de la asignatura se puede encontrar un documento pdf con la relación de contrastes de hipótesis más frecuentes. Para cada contraste se especifican: * La hipótesis nula y la alternativa * El estadístico de contraste * La regla para el rechazo de `\(H_0\)` -- En algunos contrastes además se muestra la fórmula que permite calcular el tamaño de muestra necesario para alcanzar una potencia `\(1-\beta\)` preespecificada. --- # Contrastes no paramétricos. Los contrastes no paramétricos son, en general, muy laboriosos de realizar a mano (con papel y calculadora). Por ello se recomienda utilizar R para su resolución. En todos los casos R calcula el p-valor cuya interpretación es inmediata, tal como hemos visto. Entre estos contrastes destacamos: -- * .blue[Contraste de Shapiro-Wilk]: (`shapiro.test`) sirve para decidir si una variable tiene o no distribución normal. La hipótesis nula es la de normalidad. -- * .blue[Contraste de Wilcoxon-Mann-Whitney]: (`wilcox.test`) sirve para contrastar si una variable medida en una población tiende a dar valores más altos (o más bajos) que esa misma variable medida en otra población. Sustituye al `t.test` cuando los datos no son normales. -- * .blue[Contraste de la chi-cuadrado]: (`chisq.test`) sirve para decidir si dos variables categóricas son o no independientes. --