class: center, middle, inverse, title-slide # Tema 2: Variables Aleatorias ###
Estadística. Grado en Ciencias del Mar --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/azar.jpg) background-size: cover background-position: 15% 45% class: inverse, top, left # 1. Variables Aleatorias --- ## Variables Aleatorias Llamamos .red[ __variable aleatoria__] a cualquier magnitud `\(X\)` cuyos valores son números reales que dependen del azar. -- ### .blue[Ejemplos] * La __duración__ de una borrasca -- * El __número de mensajes__ de WhatsApp que recibe una persona en un día arbitrario. -- * El __número de nidos de tortuga__ en una playa. -- * La __suma de valores__ obtenidos en dos tiradas sucesivas de un dado. -- * El __peso total__ de las capturas de atunes realizadas por un pesquero en un día arbitrario. --- ## Variables Aleatorias Formalmente, dado un espacio de probabilidad `\(\left(\Omega,\mathfrak{{F},}P\right)\)`, una __variable aleatoria__ `\(X\)` es cualquier función de la forma: `$$\LARGE{\begin{array}{cccl} X: & \Omega & \longrightarrow & \mathbb{{R}} \\ & \omega\in\Omega & \hookrightarrow & X\left(\omega\right)=r\in\mathbb{{R}} \end{array}}$$` esto es, una función que a los elementos del azar les asigna números reales. -- ###.blue[Ejemplo] Si observamos el resultado del lanzamiento de un dado tenemos que: `\(\Omega=\left\{\right.\)` ![:scale 2%](imagenes/unoR.png), ![:scale 2%](imagenes/dosR.png), ![:scale 2%](imagenes/tresR.png), ![:scale 2%](imagenes/cuatroR.png), ![:scale 2%](imagenes/cincoR.png), ![:scale 2%](imagenes/seisR.png) `\(\left.\right\}\)` .center[ `\(X\left(\right.\)` ![:scale 2%](imagenes/unoR.png) `\(\left.\right)=1\)`   `\(X\left(\right.\)` ![:scale 2%](imagenes/dosR.png) `\(\left.\right)=2\)`   `\(X\left(\right.\)` ![:scale 2%](imagenes/tresR.png) `\(\left.\right)=3\)` `\(X\left(\right.\)` ![:scale 2%](imagenes/cuatroR.png) `\(\left.\right)=4\)`   `\(X\left(\right.\)` ![:scale 2%](imagenes/cincoR.png) `\(\left.\right)=5\)`   `\(X\left(\right.\)` ![:scale 2%](imagenes/seisR.png) `\(\left.\right)=6\)` ] --- O, de una manera más gráfica: .center[ ![](tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-1-1.png)<!-- --> ] --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/azar.jpg) background-size: cover background-position: 15% 45% class: inverse, top, left # 2. Función de distribución de probabilidad de una variable aleatoria. --- ## Función de distribución de probabilidad de una variable aleatoria. Cuando estudiamos una variable aleatoria, la primera cuestión de interés es __como se reparte (_como se distribuye_) la probabilidad__ entre los distintos valores que puede tomar dicha variable. Como respuesta a esta cuestión se define la .red[ __función de distribución de probabilidad__] de una variable aleatoria como: <br> .resalta[ `$$\Large{F\left(x\right)=\Pr\left(X\leq x\right)\,\,\,:\,\,\,\,x\in\mathbb{R}}$$` ] --- ### .blue[Ejemplo: lanzamiento de un dado] .pull-left[ ![](tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-2-1.png)<!-- --> ] .pull-right[ `\(X\)`=_"Puntuación obtenida al lanzar un dado"_ `$$F\left(1\right) =P\left(X\le1\right)=\frac{1}{6}\\ F\left(2\right) =P\left(X\le2\right)=\frac{2}{6}\\ F\left(3\right) =P\left(X\le3\right)=\frac{3}{6}\\ F\left(4\right) =P\left(X\le4\right)=\frac{4}{6}\\ F\left(5\right) =P\left(X\le5\right)=\frac{5}{6}\\ F\left(6\right) =P\left(X\le6\right)=\frac{6}{6}=1$$` ] --- ### .blue[Ejemplo: lanzamiento de un dado] La función de distribución es .red[ __escalonada__ ] no decreciente y la probabilidad se concentra en los puntos de salto. -- <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-3-1.png" style="display: block; margin: auto;" /> -- `$$\large{P\left[X=a\right]=F\left(a\right)-F\left(a-\right)}$$` --- ### .blue[Ejemplo: lugar donde se produce una avería en una carretera] Se considera un tramo recto y llano de carretera de 6 km de longitud en el que se ha instalado un sistema de control. Sea `\(X\)` el punto kilométrico de este tramo donde se registra la primera parada por avería de un coche desde que se instaló el sistema. Suponiendo que no hay ninguna razón para pensar que sea más probable que las averías se produzcan en un sitio u otro de la carretera, ¿Cuál sería la función de distribución de `\(X\)`? <br> .center[ ![](imagenes/coche-averiado.jpg) ] --- Para determinar la forma de `\(F(x)\)` podemos considerar que: * El primer coche en averiarse en este tramo se parará entre el km 0 y el km 6; así pues, `\(X \in [0,6]\)` y por tanto: + `\(F(0) = P(X\le 0) =0\)` + `\(F(6) = P(X\le 6)=1\)` -- * Como las averías son equiprobables en cualquier lugar de la carretera, podemos razonar que: + La probabilidad de que se produzca la avería antes del km 3 es la mitad: `\(P(X\le 3)=\frac{1}{2}\)` -- + La probabilidad de que se produzca la avería antes del km 2 (tercera parte del tramo) es `\(P(X\le 2)=\frac{1}{3}\)` -- + En general, la probabilidad de que se produzca antes del km `\(k\)` es: `\(P(X\le k)=\frac{k}{6}\)` -- Por tanto: `$$\large{F\left(x\right)=\begin{cases} 0 & x<0\\ \frac{x}{6} & 0\le x\le6\\ 1 & x>6 \end{cases}}$$` --- ## Propiedades de la función de distribución de una variable aleatoria. Sea `\(X\)` una variable aleatoria con función de distribución de probabilidad `\(F\left(t\right)\)` <br> La función `\(F\left(t\right)=P\left[X\leq t\right]\)` verifica las siguientes propiedades: -- * `\(\underset{t\rightarrow-\infty}{Lim}F\left(t\right)=0\)` * `\(\underset{t\rightarrow\infty}{Lim}F\left(t\right)=1\)` -- * `\(F\left(t\right)\)` es una función .red[ __no decreciente__ ] --- ## Propiedades de la función de distribución de una variable aleatoria. ¿Cómo podemos calcular la probabilidad siguiente? `$$P\left[a<X\leq b\right]$$` -- Tengamos en cuenta que: * `\(\left\{ X\leq b\right\} =\left\{ X\leq a\right\} \cup\left\{ a<X\leq b\right\}\)` -- * `\(\left\{ X\leq a\right\} \cap\left\{ a<X\leq b\right\} =\textrm{Ø}\)` -- Por tanto: `$$P\left[X\leq b\right]=P\left[X\leq a\right]+P\left[a<X\leq b\right]$$` -- `$$F\left(b\right)=F\left(a\right)+P\left[a<X\leq b\right]$$` -- .resalta[ `$$\Large{P\left[a<X\leq b\right]=F\left(b\right)-F\left(a\right)}$$` ] --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/azar.jpg) background-size: cover background-position: 15% 45% class: inverse, top, left # 3. Clasificación de variables aleatorias --- ## Variables aleatorias discretas. Una variable aleatoria `\(X\)` se dice .red[ __discreta__ ] cuando el conjunto de valores que puede tomar es finito o numerable. -- ### .blue[Ejemplos:] * El resultado del lanzamiento de un dado -- * La suma de resultados de dos lanzamientos sucesivos de un dado -- * El número de nidos de tortuga en una playa -- * El número de borrascas que ocurren durante un tiempo `\(t\)` en una región oceánica. --- ## Variables aleatorias discretas. Llamamos .red[ __función de probabilidad__] de una variable aleatoria discreta `\(X\)` a la función: `$$\large{p(t)=P(X=t)\;:\;\;t\in T}$$` siendo `\(T\)` el conjunto de valores que puede tomar la variable aleatoria `\(X\)`. La función de probabilidad cumple que: -- .resalta[ `$$\large{\underset{t\in T}{\sum}P\left(X=t\right)=1}$$` ] -- Además: `$$\large{P\left(a<X\le b\right)=F\left(b\right)-F\left(a\right)=\sum_{a<t\le b}P\left(X=t\right)}$$` --- ## Variables aleatorias continuas. Una variable aleatoria `\(X\)` se dice .red[ __continua__ ] si y solo si su función de distribución `\(F\left(t\right)\)` es continua. Ello implica que `\(X\)` toma valores en un rango continuo. -- ### .blue[Ejemplos:] * La __duración__ de una borrasca. -- * La __distancia entre nidos de tortuga__ en una playa. -- * El __peso__ total de las capturas de atunes realizada por un barco durante una jornada de pesca. -- * El __lugar__ en una carretera en que se produce la avería de un coche. --- ## Distribuciones de probabilidad continuas La función de distribución de una variable aleatoria continua es __no decreciente__ (la función de probabilidad `\(F(x)=P(X\leq x)\)` es acumulativa y por tanto no puede decrecer). -- ###.blue[Ejemplo:] <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-4-1.png" style="display: block; margin: auto;" /> --- ## Distribuciones de probabilidad continuas En muchas aplicaciones prácticas `\(F(x)\)` es una función "suave": <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-5-1.png" style="display: block; margin: auto;" /> -- En general para las distribuciones continuas: .resalta[ `$$P\left[X=a\right]= 0$$` ] --- ## Distribuciones de probabilidad continuas Recordemos que (tanto si la variable es discreta como si es continua): `$$P\left(a<X\le b\right)=F\left(b\right)-F\left(a\right)$$` -- En el ejemplo anterior: `$$P\left(5<X\le9\right)=F\left(9\right)-F\left(5\right)=\left(1-e^{-(9/8)^{2}}\right)-\left(1-e^{-(5/8)^{2}}\right)=0.7179-0.3234= 0.3945$$` <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-6-1.png" style="display: block; margin: auto;" /> --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/azar.jpg) background-size: cover background-position: 15% 45% class: inverse, top, left # 4. Función de densidad de probabilidad de una variable aleatoria continua. --- # Función de densidad de probabilidad Recordemos nuevamente que: `$$P\left(a<X\le b\right)=F\left(b\right)-F\left(a\right)$$` -- Entonces, para un valor `\(h\)` cualquiera: `$$P\left(a<X\le a+h\right)=F\left(a+h\right)-F\left(a\right)$$` -- Si dividimos por `\(h\)` obtenemos la _cantidad de probabilidad en un entorno de a de amplitud h_: `$$\frac{P\left(a<X\le a+h\right)}{h}=\frac{F\left(a+h\right)-F\left(a\right)}{h}$$` -- y tomando límite cuando `\(h\)` tiende a 0, obtenemos la __densidad de probabilidad__ en el punto `\(a\)`: `$$f(a)= \underset{h\rightarrow0}{lim}\frac{P\left(a<X\le a+h\right)}{h}=\underset{h\rightarrow0}{lim}\frac{F\left(a+h\right)-F\left(a\right)}{h}=F'\left(a\right)$$` --- # Función de densidad de probabilidad Por tanto: .resalta[ `$$F\left(t\right)=\Pr\left(X\leq t\right)=\int_{-\infty}^{t}f\left(x\right)\cdot dx\;:\;\;t\in\mathbb{R}$$` ] -- Obviamente, la función de densidad `\(f(x)\)` habrá de ser una función __no negativa__ que cumpla: `$$\int_{-\infty}^{\infty}{f\left(t\right)\cdot dt}=1$$` ya que `$$\int_{-\infty}^{\infty}{f\left(t\right)\cdot dt}=P(-\infty \le X \le \infty)=1$$` --- ### .blue[Ejemplo:] `\(X\)`=_"Lugar donde se para un coche por avería en una carretera de 6 km"_ .pull-left[ Función de distribución: `$$F(x)=\frac{x}{6},\;\; x\in [0,6]$$` <br> <br> <br> Función de densidad: <br> `$$f\left(x\right)=\begin{cases} \frac{1}{6} & x\in\left[0,6\right]\\ 0 & x\notin\left[0,6\right] \end{cases}$$` ] .pull-right[ <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-7-1.png" style="display: block; margin: auto;" /> <br><br> <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-8-1.png" style="display: block; margin: auto;" /> ] --- ### .blue[Ejemplo:] * Función de distribución: `$$F\left(t\right)=1-e^{-\left(t/8\right)^{2}}:\,\,\forall t\geq0$$` <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-9-1.png" style="display: block; margin: auto;" /> -- * Función de densidad: `$$f\left(t\right)=\frac{t}{32}e^{-\left(t/8\right)^{2}}:\,\,\forall t\geq0$$` <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-10-1.png" style="display: block; margin: auto;" /> --- ## Propiedades de la función de densidad de probabilidad .red[[1.]] Sea `\(X\)` una variable aleatoria y sea `\(f\left(x\right)\)` su función de densidad de probabilidad. Entonces: -- .resalta[ `$$P\left(a<X\leq b\right)=\int_{a}^{b}f\left(x\right)\cdot dx$$` ] <br> -- _Demostración:_ `$$P\left(a<X\leq b\right)=F\left(b\right)-F\left(a\right)=$$` `$$=\int_{-\infty}^{b}f\left(x\right)\cdot dx-\int_{-\infty}^{a}f\left(x\right)\cdot dx=\int_{a}^{b}f\left(x\right)\cdot dx$$` --- ## Propiedades de la función de densidad de probabilidad .red[[1.]] Sea `\(X\)` una variable aleatoria y sea `\(f\left(x\right)\)` su función de densidad de probabilidad. Entonces: .resalta[ `$$P\left(a<X\leq b\right)=\int_{a}^{b}f\left(x\right)\cdot dx$$` ] <br> .large[ __Interpretación geométrica:__ la probabilidad de que la variable `\(\Large{X}\)` tome valores entre `\(\Large{a}\)` y `\(\Large{b}\)` es el .red[ __área bajo la función de densidad__] de `\(\Large{X}\)` entre esos dos puntos. ] --- ### .blue[Ejemplo] `$$f\left(t\right)=\frac{t}{32}e^{-\left(t/8\right)^{2}}:\,\,\forall t\geq0$$` -- `$$P\left(5<X\leq 9\right)=\int\limits _{5}^{9}f\left(t\right)\cdot dt\approx 0.3945$$` <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-11-1.png" style="display: block; margin: auto;" /> --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/azar.jpg) background-size: cover background-position: 15% 45% class: inverse, top, left # 5. Características de las distribuciones de probabilidad --- ### Características de las distribuciones de probabilidad En esta sección describiremos una serie de medidas que tienen como objetivo .red[ __resumir__] las características principales de la distribución de una variable aleatoria: -- .pull-left[ ![](tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-12-1.png)<!-- --> ] .pull-right[ <br> * .red[Valor central:] esperanza. * .red[Dispersión:] varianza y desviación típica. * .red[Posición:] cuantiles. ] --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/darkGaussianBlur.jpg) background-size: cover class: inverse, center, middle # Valor central: Esperanza --- ## Esperanza matemática __Objetivo:__ Resumir la variable aleatoria `\(X\)` en un valor .red[ __central__] representativo de la totalidad de su distribución de probabilidad. -- .pull-left[ #### .blue[Ejemplo:] <table> <thead> <tr> <th style="text-align:right;"> X </th> <th style="text-align:right;"> Probabilidad </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.15 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.25 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 0.40 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 0.20 </td> </tr> </tbody> </table> ] .pull-right[ <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-14-1.png" style="display: block; margin: auto;" /> ] --- ## Esperanza matemática __Objetivo:__ Resumir la variable aleatoria `\(X\)` en un valor .red[ __central__] representativo de la totalidad de su distribución de probabilidad. .pull-left[ #### .blue[Ejemplo:] <table> <thead> <tr> <th style="text-align:right;"> X </th> <th style="text-align:right;"> Probabilidad </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 0.15 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 0.25 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 0.40 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 0.20 </td> </tr> </tbody> </table> ] .pull-right[ <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-16-1.png" style="display: block; margin: auto;" /> ] Usando la analogía entre probabilidad y masa, la .red[ __esperanza__] `\(\large{\mu=E[X]}\)` de una variable aleatoria se corresponde con el .red[ __centro de gravedad__ ] de su distribu- ción de probabilidad: -- `$$\large{E\left[X\right]=1\cdot0.15+2\cdot0.25+3\cdot0.4+4\cdot0.2=2.65}$$` --- ### Esperanza matemática Sea `\(X\)` una variable aleatoria __discreta__. Se define la esperanza de `\(X\)` como: .resalta[ `$$\Large{E\left[X\right]=\sum\nolimits _{t}t\cdot\Pr\left(X=t\right)}$$` ] --- .large[ .blue[Ejemplo:]] suma de resultados de dos lanzamientos sucesivos de un dado <br> .pull-left[ <table class="table" style="font-size: 13px; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:center;"> X </th> <th style="text-align:center;"> Probabilidad </th> </tr> </thead> <tbody> <tr> <td style="text-align:center;"> 2 </td> <td style="text-align:center;"> 1/36 </td> </tr> <tr> <td style="text-align:center;"> 3 </td> <td style="text-align:center;"> 2/36 </td> </tr> <tr> <td style="text-align:center;"> 4 </td> <td style="text-align:center;"> 3/36 </td> </tr> <tr> <td style="text-align:center;"> 5 </td> <td style="text-align:center;"> 4/36 </td> </tr> <tr> <td style="text-align:center;"> 6 </td> <td style="text-align:center;"> 5/36 </td> </tr> <tr> <td style="text-align:center;"> 7 </td> <td style="text-align:center;"> 6/36 </td> </tr> <tr> <td style="text-align:center;"> 8 </td> <td style="text-align:center;"> 5/36 </td> </tr> <tr> <td style="text-align:center;"> 9 </td> <td style="text-align:center;"> 4/36 </td> </tr> <tr> <td style="text-align:center;"> 10 </td> <td style="text-align:center;"> 3/36 </td> </tr> <tr> <td style="text-align:center;"> 11 </td> <td style="text-align:center;"> 2/36 </td> </tr> <tr> <td style="text-align:center;"> 12 </td> <td style="text-align:center;"> 1/36 </td> </tr> </tbody> </table> ] .pull-right[ ![](tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-18-1.png)<!-- --> ] --- .large[.blue[Ejemplo:]] suma de resultados de dos lanzamientos sucesivos de un dado <br> .pull-left[ <table class="table" style="font-size: 13px; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:center;"> X </th> <th style="text-align:center;"> Probabilidad </th> </tr> </thead> <tbody> <tr> <td style="text-align:center;"> 2 </td> <td style="text-align:center;"> 1/36 </td> </tr> <tr> <td style="text-align:center;"> 3 </td> <td style="text-align:center;"> 2/36 </td> </tr> <tr> <td style="text-align:center;"> 4 </td> <td style="text-align:center;"> 3/36 </td> </tr> <tr> <td style="text-align:center;"> 5 </td> <td style="text-align:center;"> 4/36 </td> </tr> <tr> <td style="text-align:center;"> 6 </td> <td style="text-align:center;"> 5/36 </td> </tr> <tr> <td style="text-align:center;"> 7 </td> <td style="text-align:center;"> 6/36 </td> </tr> <tr> <td style="text-align:center;"> 8 </td> <td style="text-align:center;"> 5/36 </td> </tr> <tr> <td style="text-align:center;"> 9 </td> <td style="text-align:center;"> 4/36 </td> </tr> <tr> <td style="text-align:center;"> 10 </td> <td style="text-align:center;"> 3/36 </td> </tr> <tr> <td style="text-align:center;"> 11 </td> <td style="text-align:center;"> 2/36 </td> </tr> <tr> <td style="text-align:center;"> 12 </td> <td style="text-align:center;"> 1/36 </td> </tr> </tbody> </table> ] .pull-right[ ![](tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-20-1.png)<!-- --> ] -- `$$E\left[X\right]=2\cdot\frac{1}{36}+3\cdot\frac{2}{36}+4\cdot\frac{3}{36}+5\cdot\frac{4}{36}+6\cdot\frac{5}{36}+$$` `$$+7\cdot\frac{6}{36}+8\cdot\frac{5}{36}+9\cdot\frac{4}{36}+10\cdot\frac{3}{36}+11\cdot\frac{2}{36}+12\cdot\frac{1}{36}=7$$` --- ### Esperanza matemática Sea `\(X\)` una variable aleatoria __continua__. Se define la esperanza de `\(X\)` como: .resalta[ `$$\Large{E\left[X\right]=\int_{-\infty}^{\infty}tf\left(t\right)dt}$$` ] --- ### .blue[Ejemplo] * El __lugar__ en una carretera en que se produce la avería de un coche. .pull-left[ <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-21-1.png" style="display: block; margin: auto;" /> ] .pull-right[ <br><br> `$$f\left(x\right)=\frac{1}{6}\,\,\,0\leq x\leq6$$`] --- ### .blue[Ejemplo] * El __lugar__ en una carretera en que se produce la avería de un coche. .pull-left[ <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-22-1.png" style="display: block; margin: auto;" /> ] .pull-right[ <br><br> `$$f\left(x\right)=\frac{1}{6}\,\,\,0\leq x\leq6$$`] `$$E\left[X\right]=\int_{0}^{6}t\frac{1}{6}dt=\left.\frac{t^{2}}{2\cdot6}\right]_{0}^{6}=\frac{6^{2}}{2\cdot6}=3$$` --- ### .blue[Ejemplo:] Una empresa de software ha desarrollado un programa para generar fondos de pantalla animados. Uno de los modelos de fondo consiste en la generación de círculos de radio y color aleatorios que se van moviendo al azar por la pantalla. El radio `\(X\)` de cada círculo es una variable aleatoria que toma valores entre 1 y 5 cm con función de densidad: `$$f\left(x\right)=\begin{cases} \lambda x\left(1-x\right)\left(x-5\right) & 1\le x\le5\\ 0 & \textrm{en otro caso} \end{cases}$$` 1. Calcula la probabilidad de que el programa genere un círculo de radio mayor que 3 cm. 2. Calcula `\(E[X]\)` (valor esperado del radio de un círculo generado al azar por el programa) --- ### .blue[Ejemplo:] <br> En primer lugar hemos de calcular el valor de `\(\lambda\)` de tal forma que la probabilidad total de que el radio de un círculo elegido al azar esté entre 1 y 5 cm. sea 1: -- `$$\int_{1}^{5}f\left(x\right)dx=1\Rightarrow\int_{1}^{5}\lambda x\left(1-x\right)\left(x-5\right)dx=1\Rightarrow\lambda\int_{1}^{5}\left(-x^{3}+6x^{2}-5x\right)dx=1$$` -- `$$\Rightarrow\lambda\left[-\frac{x^{4}}{4}+\frac{6x^{3}}{3}-\frac{5x^{2}}{2}\right]_{1}^{5}=1\Rightarrow\lambda\left[\frac{375}{12}-\left(-\frac{9}{12}\right)\right]=1\Rightarrow\lambda\cdot32=1\Rightarrow\lambda=\frac{1}{32}$$` --- ### .blue[Ejemplo:] 1. Calcula la probabilidad de que el programa genere un círculo de radio mayor que 3 cm. -- `$$P\left(X>3\right)=P\left(3\le X\le5\right)=\int_{3}^{5}\frac{1}{32}x\left(1-x\right)\left(x-5\right)dx=$$` -- `$$=\frac{1}{32}\left[-\frac{x^{4}}{4}+\frac{6x^{3}}{3}-\frac{5x^{2}}{2}\right]_{3}^{5}=\frac{1}{32}\left[\frac{375}{12}-\frac{135}{12}\right]=\frac{20}{32}=\frac{5}{8}=0.625$$` --- ### .blue[Ejemplo:] Gráficamente: <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-23-1.png" style="display: block; margin: auto;" /> `$$f\left(x\right)=\begin{cases} \frac{1}{32} x\left(1-x\right)\left(x-5\right) & 1\le x\le5\\ 0 & \textrm{en otro caso} \end{cases}$$` --- ### .blue[Ejemplo:] `2.` Calcula `\(E[X]\)` (valor esperado del radio de un círculo generado al azar por el programa) -- Se tiene: `$$E\left[X\right]=\int_{1}^{5}xf\left(x\right)dx=\int_{1}^{5}\frac{1}{32}x^{2}\left(1-x\right)\left(x-5\right)dx=\frac{1}{32}\int_{1}^{5}\left(-x^{4}+6x^{3}-5x^{2}\right)dx=$$` -- `$$=\frac{1}{32}\left[-\frac{x^{5}}{5}+\frac{6x^{4}}{4}-\frac{5x^{3}}{3}\right]_{1}^{5}=\frac{49}{15}=3.26667\,\,cm$$` <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-24-1.png" style="display: block; margin: auto;" /> --- ### Primera propiedad de linealidad de la esperanza Sea `\(\lambda\)` una constante y `\(X\)` una variable aleatoria. Entonces .resalta[ `$$\large{E\left[\lambda\cdot X\right]=\lambda\cdot E\left[X\right]}$$` ] -- <br> .blue[ _Demostración_]. (caso discreto) `$$E\left[\lambda X\right]=\sum_{t}\lambda t\cdot\Pr\left(X=t\right)=\lambda\sum_{t}t\cdot\Pr\left(X=t\right)=\lambda E\left[X\right]$$` -- .blue[ _Demostración_]. (caso continuo) `$$E\left[\lambda X\right]=\int_{t}\lambda t\cdot f\left(t\right)=\lambda\int_{t}t\cdot f\left(t\right)=\lambda E\left[X\right]$$` --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/darkGaussianBlur.jpg) background-size: cover class: inverse, center, middle # Dispersion: Varianza y Desviación típica --- ## Dispersión de variables aleatorias (Varianza) Para una variable aleatoria `\(X\)` con esperanza `\(\mu\)`, la varianza `\(\sigma^2\)` se define como: .resalta[ `$$\sigma^2=\textrm{var}\left(X\right)=E\left[\left(X-\mu\right)^{2}\right]$$` ] -- <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-25-1.png" style="display: block; margin: auto;" /> --- ## Dispersión de variables aleatorias (Varianza) Para una variable aleatoria `\(X\)` con esperanza `\(\mu\)`, la varianza `\(\sigma^2\)` se define como: .resalta[ `$$\sigma^2=\textrm{var}\left(X\right)=E\left[\left(X-\mu\right)^{2}\right]$$` ] <br> Por tanto: * Cuanto mayor sea la varianza __más dispersos__ (alejados del centro de gravedad o esperanza) se encuentran los valores que puede tomar la variable aleatoria. * Una menor varianza supone una __mayor concentración__ de la distribución alrededor de su centro de gravedad. --- .large[.blue[Ejemplo:]] suma de resultados de dos lanzamientos sucesivos de un dado <br> .pull-left[ <table class="table" style="font-size: 11px; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:center;"> X </th> <th style="text-align:center;"> Probabilidad </th> </tr> </thead> <tbody> <tr> <td style="text-align:center;"> 2 </td> <td style="text-align:center;"> 1/36 </td> </tr> <tr> <td style="text-align:center;"> 3 </td> <td style="text-align:center;"> 2/36 </td> </tr> <tr> <td style="text-align:center;"> 4 </td> <td style="text-align:center;"> 3/36 </td> </tr> <tr> <td style="text-align:center;"> 5 </td> <td style="text-align:center;"> 4/36 </td> </tr> <tr> <td style="text-align:center;"> 6 </td> <td style="text-align:center;"> 5/36 </td> </tr> <tr> <td style="text-align:center;"> 7 </td> <td style="text-align:center;"> 6/36 </td> </tr> <tr> <td style="text-align:center;"> 8 </td> <td style="text-align:center;"> 5/36 </td> </tr> <tr> <td style="text-align:center;"> 9 </td> <td style="text-align:center;"> 4/36 </td> </tr> <tr> <td style="text-align:center;"> 10 </td> <td style="text-align:center;"> 3/36 </td> </tr> <tr> <td style="text-align:center;"> 11 </td> <td style="text-align:center;"> 2/36 </td> </tr> <tr> <td style="text-align:center;"> 12 </td> <td style="text-align:center;"> 1/36 </td> </tr> </tbody> </table> ] .pull-right[ ![](tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-27-1.png)<!-- --> ] -- `$$Var\left(X\right)=E\left[\left(X-\mu\right)^{2}\right]=\sum_{k=2}^{12}\left(x-\mu\right)^{2}P\left(X=x\right)=$$` -- `$$=\left(2-7\right)^{2}\frac{1}{36}+\left(3-7\right)^{2}\frac{2}{36}+\left(4-7\right)^{2}\frac{3}{36}+\left(5-7\right)^{2}\frac{4}{36}+\left(6-7\right)^{2}\frac{5}{36}+\left(7-7\right)^{2}\frac{6}{36}+$$` $$+\left(8-7\right)^{2}\frac{5}{36}+\left(9-7\right)^{2}\frac{4}{36}+\left(10-7\right)^{2}\frac{3}{36}+\left(11-7\right)^{2}\frac{2}{36}+\left(12-7\right)^{2}\frac{1}{36}=5.833 $$ --- .large[.blue[Ejemplo:]] Lugar de una carretera en que se produce la avería de un coche. <br> .pull-left[ <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-28-1.png" style="display: block; margin: auto;" /> ] .pull-right[ <br><br> `$$f\left(x\right)=\frac{1}{6}\,\,\,0\leq x\leq6$$`] -- `$$Var\left(X\right)=E\left[\left(X-\mu\right)^{2}\right]=\int_{0}^{6}(x-\mu)^{2}f\left(x\right)dx=\int_{0}^{6}\left(x-3\right)^{2}\frac{1}{6}dx=$$` -- `$$=\frac{1}{6}\left[\frac{\left(x-3\right)^{3}}{3}\right]_{0}^{6}=\frac{1}{6}\left[\frac{\left(6-3\right)^{3}}{3}-\frac{\left(0-3\right)^{3}}{3}\right]=\frac{1}{6}\left(3^{2}+3^{2}\right)=3$$` --- <br> ## Desviación Típica La desviación típica se define como: .resalta[ `$$\large{\sigma=\textrm{sd}\left(X\right)=\sqrt{\textrm{var}\left(X\right)}}$$` ] <br> Como medida de dispersión, `\(\sigma\)` tiene la ventaja de que se mide en la misma escala (mismas unidades de medida) que la variable `\(X\)`. --- ### Interpretación de la Varianza: Desigualdad de Chebyshev .pull-left[ .center[ ![](imagenes/Chebyshev.jpg) ] .center[ [Pafnuty Chebyshev (1821-1894)](https://en.wikipedia.org/wiki/Pafnuty_Chebyshev)] <br> ] .pull-right[ <div class=resalta>$$\large{P\left(\left|X-\mu\right|\le k\sigma\right)\ge1-\frac{1}{k^{2}}}$$</div><br> Esta desigualdad indica que la probabilidad de que la variable _X_ tome valores entre su esperanza `\(\mu\)` y _k_ veces su desviación típica `\(\sigma\)` es al menos `\(1-1/k^2\)`. En particular: `$$P\left(\left|X-\mu\right|\le 2\sigma\right)\ge 0.75$$` `$$P\left(\left|X-\mu\right|\le 3\sigma\right)\ge 0.8889$$` `$$P\left(\left|X-\mu\right|\le 4\sigma\right)\ge 0.9375$$` ] Así, conocidas `\(\mu\)` y `\(\sigma\)` esta desigualdad nos da una idea del rango en que se mueven los valores más probables de la variable aleatoria `\(X\)`. [Demostración de la desigualdad de Chebyshev](Demostraciones.html#Chebyshev) --- ### Propiedades de la Varianza .resalta[ `$$\large{\textrm{var}\left(\lambda X\right)=\lambda^{2}\textrm{var}\left(X\right)}$$` ] -- <br> .blue[ _Demostración_]: Llamando `\(\mu=E\left[X\right]\)`, por la propiedad de linealidad de la esperanza, se tiene que `\(E\left[\lambda X\right]=\lambda\mu\)`. Utilizando entonces la definición de varianza: `$$\textrm{var}\left(\lambda X\right)=E\left[\left(\lambda X-E[\lambda X]\right)^{2}\right]= E\left[\left(\lambda X-\lambda\mu\right)^{2}\right] =$$` -- $$ =E\left[\lambda^{2}\left(X-\mu\right)^{2}\right]=\lambda^{2}E\left[\left(X-\mu\right)^{2}\right]=$$ -- `$$=\lambda^{2}\textrm{var}\left(X\right)$$` --- ### Propiedades de la Varianza .resalta[ `$$\large{\textrm{var}\left(X\right)=E\left[X^{2}\right]-E\left[X\right]^{2}}=E[X^2]-\mu^2$$` ] -- <br> .blue[ _Demostración_]: `$$\textrm{var}\left(X\right)=E\left[\left(X-\mu\right)^{2}\right]=E\left[X^{2}-2\mu X+\mu^{2}\right]$$` -- * En el caso discreto: `$$E\left[X^{2}-2\mu X+\mu^{2}\right]=\sum_{x}\left(x^{2}-2\mu x+\mu^{2}\right)P\left(X=x\right)=$$` -- `$$=\sum_{x}x^{2}P\left(X=x\right)-2\mu\sum_{x}xP\left(X=x\right)+\mu^{2}\sum_{x}P\left(X=x\right)=$$` -- `$$E\left[X^{2}\right]-2\mu^{2}+\mu^{2}=E\left[X^{2}\right]-\mu^{2}$$` --- ### Propiedades de la Varianza .resalta[ `$$\large{\textrm{var}\left(X\right)=E\left[X^{2}\right]-E\left[X\right]^{2}}=E[X^2]-\mu^2$$` ] <br> .blue[ _Demostración_]: `$$\textrm{var}\left(X\right)=E\left[\left(X-\mu\right)^{2}\right]=E\left[X^{2}-2\mu X+\mu^{2}\right]$$` -- * En el caso continuo: `$$E\left[X^{2}-2\mu X+\mu^{2}\right]=\int_{x}\left(x^{2}-2\mu x+\mu^{2}\right)f\left(x\right)dx=$$` -- `$$=\int_{x}x^{2}f\left(x\right)dx-2\mu\int_{x}xf\left(x\right)dx+\mu^{2}\int_{x}f\left(x\right)dx$$` -- `$$=E\left[X^{2}\right]-2\mu E\left[X\right]+\mu^{2}=E\left[X^{2}\right]-\mu^{2}$$` --- ### .blue[Ejemplo:] Recordemos que en el problema del programa generador de círculos de radio aleatorio, el radio `\(X\)` de cada círculo es una variable aleatoria con función de densidad: `$$f\left(x\right)=\begin{cases} \frac{1}{32} x\left(1-x\right)\left(x-5\right) & 1\le x\le5\\ 0 & \textrm{en otro caso} \end{cases}$$` Entonces: -- `$$E\left[X^{2}\right]=\int_{1}^{5}x^{2}f\left(x\right)dx=\int_{1}^{5}\frac{1}{32}x^{3}\left(1-x\right)\left(x-5\right)dx=\frac{1}{32}\int_{1}^{5}\left(-x^{5}+6x^{4}-5x^{3}\right)dx$$` -- `$$=\frac{1}{32}\left[-\frac{x^{6}}{6}+\frac{6x^{5}}{5}-\frac{5x^{4}}{4}\right]_{1}^{5}=\frac{1}{32}\left[5^{4}\left(-\frac{5^{2}}{6}+6-\frac{5}{4}\right)-\left(-\frac{1}{6}+\frac{6}{5}-\frac{5}{4}\right)\right]=$$` -- `$$=\frac{1}{32}\left[5^{4}\left(\frac{-250+360-75}{60}\right)-\left(\frac{-10+72-75}{60}\right)\right]= \frac{21888}{32\cdot60}=\frac{684}{60}=\frac{57}{5}=11.4$$` -- Por tanto: `$$Var(X)=E[X^2]-E[X]^2 = \frac{57}{5}-\left(\frac{49}{15}\right)^{2}=\frac{45\cdot57-49^{2}}{225}=\frac{164}{225}=0.7289$$` --- background-image: url(http://estadistica-dma.ulpgc.es/estadFCM/imagenes/darkGaussianBlur.jpg) background-size: cover class: inverse, center, middle # Posición: Cuantiles --- ## Cuantiles El `\(\large{\alpha}\)`-ésimo cuantil de una variable aleatoria `\(\large{X}\)` es el valor `\(\large{q_\alpha}\)` que verifica: .resalta[ `$$F(q_\alpha) =P(X\leq q_\alpha) =\alpha$$` ] siempre y cuando esta ecuación tenga solución. -- <img src="tema2_Variables_Aleatorias_files/figure-html/unnamed-chunk-29-1.png" style="display: block; margin: auto;" /> --- ## Cuantiles <br> Algunos cuantiles de uso muy extendido son los siguientes: <br> -- * `\(\large{q_{0.5}}\)`: se denomina __mediana__ de la distribución de probabilidad. -- * `\(\large{q_{0.25}}\)`: __Primer cuartil__ -- * `\(\large{q_{0.75}}\)`: __Tercer cuartil__ -- * `\(\large{q_{0.01}, q_{0.02}, q_{0.03}, \dots, q_{0.98}, q_{0.99}}\)` son los __percentiles__ de la distribución