Distribuciones continuas
Distribución Normal
Una variable aleatoria continua X, sigue una distribución normal de media μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las siguientes condiciones:
-
- La variable puede tomar cualquier valor: (-∞, +∞)
- La función de densidad, es la expresión en términos de ecuación matemática de la curva de Gauss:$$ f(x) = \frac {1} {\sigma \sqrt {2 \pi }} e^{-\frac{1}{2} {\left ( \frac{x- \mu} {\sigma} \right )^2 }}$$
Tiene una gráfica en forma de campana
-
-
- toma cualquier valor real entre (-∞, +∞)
- es simétrica con respecto a la media μ
- tiene un máximo en la media μ
- crece hasta la media μ y decrece a partir de ella
- en los puntos μ – σ y μ + σ presenta puntos de inflexión
- en los puntos μ – 2σ y μ + 2σ también presenta puntos de inflexión
- el eje de las abscisas es una asíntota de la curva
- el área dentro de la curva, en términos de probabilidad es igual a la unidad
- al ser simétrica respecto a μ se presenta un área igual a 0.5 a la izquierda de μ y 0.5 a la derecha de μ
- se cumplen las siguientes probabilidades:
-
$$ p(\mu – \sigma \le X \le \mu + \sigma ) = 0.6826 = 68.26 \% $$
$$ p(\mu – 2\sigma \le X \le \mu + 2\sigma ) = 0.954 = 95.4 \% $$
$$ p(\mu – 3\sigma \le X \le \mu + 3\sigma ) = 0.997 = 99.7 \% $$
Los parámetros que definen una distribución normal son la media (μ) y la desiviación estándar (σ). Es decir N(μ, σ) define a cualquier distribución normal. Existen n distribuciones normales, dependiendo de los parámetros que la definan. Para calcular la probabilidad tendríamos que resolve en cada caso la ecuación de la distribución normal que ya definimos arriba.
Una alternativa es calcular el área bajo la curva (o probabilidad) de solo una curva normal y luego estandarizar cualquier otra a esta para el cálculo de la probabilidad. Esta nueva curva normal estandarizada es la que tiene media igual a 0 y desviación estándar igual a 1, es decir N(0, 1)
Distribución Normal Estándar
Con estas nuevas condiciones simplificamos la ecuación original quedando como
$$ f(x) = \frac {1} {\sqrt {2 \pi }} e^{-\frac{x^2}{2}}$$
que se denomina función de densidad de probabilidad para la curva normal estándar. La curva de esta distribución es:
El área sombreada corresponde a la probabilidad de la variable x. Normalmente se recurre a una tabla para conocer esta probabilidad. Estas tablas las encuentras en las secciones 2.6 y 2.7 de este libro.
Para poder utilizar las tablas de las secciones 2.6 y 2.7 primero hay que transformar la variable X, que sigue una distribución N(μ, σ) en otra que siga la distribución N(0,1). Esta variable transformada se conoce como Z.
$$ Z = \frac {X – \mu} {\sigma}$$
Las tablas 2.6 y 2.7 son las más comunes encontradas en la literatura. Ambas tienen la misma información solo que de forma diferente.
En esta tabla (la 2.6) tenemos los valores de área bajo la curva de la parte sombreada. Es decir de
$$-\infty \qquad a \qquad z$$
Recuerda que z es la variable X estandarizada. El área bajo la curva representa la probabilidad.
Ejemplos:
Sea X una variable aleatoria que se distribuye normalmente con μ = 10 y σ = 2.
Calcule la probabilidad P(x ≤ 5)
Primero, tenemos que estandarizar la variable x
$$ z = \frac {5 – 10} {2} = -2.5 $$
Nota que el resultado es negativo. Quiere decir que en la curva normal estándar el valor de z está del lado izquierdo de la curva. Nota también que estamos calculando la probabilidad de cualquier valor menor de 5. Gráficamente
o en términos de z
Ahora, buscamos en la tabla 2.6 el valor de 2.5
Y el valor corresponde a 0.9938. Pero hay que notar cuál es la área que nos da la tabla. La tabla es simétrica, por lo que si la giramos, vemos que el valor que obtenemos es el complemento al que estamos buscando. Como también sabemos que el área total bajo la curva es de 1, podemos restar el valor obtenido (0.9938) y así tenemos la probabilidad que estamos buscando. En este caso, 0.0062 o 0.62%
Entonces, la P(x ≤ 5) = 0.62%
Calcular la P(x>12)
Estandarizamos la variable
$$ z = \frac {11 – 10} {2} = 0.5 $$
buscamos en la tabla el valor de z=0.5 y es 0.6915
Otra vez, el valor que estamos calculando (en la tabla 2.6) es el complemento del área que estamos buscando, por lo que deberemos restar 1 a la probabilidad encontrada. El valor de la probabilidad buscada es 0.3085 o 30.85%
Si utilizáramos la tabla 2.7 el valor de z=0.5 encontrado es 0.1915. En este caso, recordemos qué area estamos calculando. Gráficamente
Por lo que en este caso, deberemos restar 0.5 al valor obtenido: (0.5-0.1915)=0.3085 o 30.85%
Ojo: calculamos el valor de x=11 por estar buscando la P(x>12)
Calcular la probabilidad P(6<x<11)
Para este ejercicio, lo mejor es primero ver gráficamente que área estamos buscando
Estandarizamos las variables
$$ z = \frac {11 – 10} {2} = 0.5 $$ y $$ z = \frac {6 – 10} {2} = -2 $$
Utilizamos la tabla II (sección 2.7) y vemos que cuando z=0.5 la probabilidad es 0.1915 y cuando z=-2 la probabilidad es 0.4772
Esta tabla da los valores de 0 a z que son las áreas que estamos buscando, por lo que solo tendremos que sumar las probabilidades, por lo que el valor que buscamos es (0.1915 + 0.4772)=0.6687 o 66.87%
Te invito a que calcules las probabilidades utilizando la tabla I.
Calcular la probabilidad P(x=8)
Esta probabilidad te la dejo de tarea para que la discutamos en el foro.
Ejemplo
Los pesos de los individuos de una población se distribuyen normalmente, con media 70 kg y desviación de 6 kg. De una población de 2,000 personas, calcula cuántas personas tendrán un peso mayor a 64 kg,.
Solución
Se trata de una distribución normal con μ=70 y σ=6, N(70.6)
Como primer paso, veamos en un gráfico lo que buscamos:
buscamos p(x ≥ 64).
Normalizamos la variable
$$p(x\ge 64) = p(z \ge \left ( \frac {64-70}{6} \right ) = p(-1 \ge z)$$
El signo negativo nos avisa que estamos del lado izquierdo de la curva (como se ve en el gráfico). Utilizamos la tabla I de la distribución normal donde vemos que la lectura es directa y buscamos el valor para z=1 (recuerda que la curva es simétrica). El valor de z=0.8413 0 84.13% de los 2,000 tienen un peso mayor a 64 kg. Esto es 1682.6 personas.
Distribución exponencial
La distribución exponencial es una distribución de probabilidad para una variable continua que se define por el parámetro λ > 0 cuya función de densidad es
f(x) = P(x) = \begin{cases}
e^{- \lambda x} & \mbox{para }0 \leq x < \infty \\
0 & \mbox{de otro modo}
\end{cases}
En esta distribución, la $$\mu= \frac{1}{\lambda}$$ y $$\sigma= \frac{1}{\lambda^2}$$
Ejemplos típicos de esta situación son el tiempo que un medico dedica a una exploración, el tiempo de servir una medicina en una farmacia, o el tiempo de atender a una urgencia. Esta distribución también se utiliza para calcular la probabilidad de vida útil de objetos.
El uso de la distribución exponencial supone que los tiempos de servicio son aleatorios, es decir, que un tiempo de servicio determinado no depende de otro servicio realizado anteriormente ni de la posible cola que pueda estar formándose.
Otra característica de este tipo de distribución es que no tienen “edad” o en otras palabras, “memoria”.
Por ejemplo. Supongamos que el tiempo de atención de un paciente en una sala quirúrgica sigue una distribución exponencial. Si el paciente ya lleva 5 horas siendo operado, la probabilidad de que esté una hora más es la misma que si hubiera estado 2 horas, o 10 horas o las que sea. Esto es debido a que la distribución exponencial supone que los tiempos de servicio tienen una gran variabilidad. A lo mejor el próximo paciente operado tarda 1 hora porque su cirugía era mucho más simple que la anterior.
La gráfica de la función de densidad de esta distribución depende del parámetro λ. Nota que es una función recíproca $$\frac{1}{\lambda}$$ y que al ser exponencial, disminuye rápidamente a valores de x bajos y a valores de x altos disminuye lentamente.
Ejemplo
Una batería alcalina funciona de forma efectiva hasta que falla. Esto se distribuye según el modelo exponencial. Una marca determinada afirma que sus pilas duran en promedio 360 días.
a) ¿qué probabilidad hay de que el tiempo de falla sea mayor a 400 días?
Sea x=el tiempo que trabaja la batería hasta que falle. El tiempo promedio de falla es de 360 días. Entonces
$$ x \sim Exp (\lambda=\frac{1}{360}) $$
por tanto, la probabilidad $$ P(X>400) = e^{- {\frac{400}{360}}} $$ = 0.329 o 32.9%
b) ¿qué probabilidad hay de que la falla se presente antes de 400 días?
Esto lo resolvemos más fácil, ya que sabemos que la probabilidad de que la falla sea mayor a 400 días es de 0.329, la probabilidad de que falle antes de 400 días será (1 – 0.329) = 0.671 (recuerdas el teorema de la probabilidad total?).