bullet2 3.7 Distribución normal de probabilidad y aproximación a la binomial.

Ir al Inicio de la Página

VII. 3.  Distribución Normal

La distribución normal nació el 12 de noviembre de 1933, mediante un pequeño trabajo que publicó el matemático francés Abraham De Moivre (1667 - 1754), como medio de evaluar aproximadamente la función de distribución Binomial para valores grandes de n. Su pensamiento fue desde el histograma hasta la curva continua, para encontrar finalmente la ecuación de la curva normal.

            De Moivre fue expulsado de Francia por ser hugonote y fue a vivir a Inglaterra, donde daba asesoramiento sobre los juegos de azar. Sin embargo, los juegos de azar no ganaron nada con el conocimiento de la distribución normal y en esa época no se encontraron aplicaciones prácticas a esta distribución, por lo que curva y ecuación cayeron en el olvido.

No fue sino hasta finales del siglo XVIII y principios de XIX, en que apareció un problema práctico que requirió la distribución normal para su solución. Los astrónomos siempre se encontraban ante la difícil situación de que los resultados de sus medidas eran diferentes, lo cual era originado por la imperfección de los aparatos que utilizaban. Sin embargo, tenían que averiguar la forma de encontrar el valor correcto más probable ante una gran cantidad de resultados.

Gauss (1777–1855) introdujo la distribución normal para la solución de este problema, apareciendo su primera referencia impresa en 1809. Él observó que la distribución de frecuencias de los resultados de las medidas se aproximaba a una distribución normal, por lo que a la curva se le llamó Curva de Errores de Gauss y a la distribución correspondiente se le conoció incorrectamente como Distribución Gaussiana.

No obstante que haya sido Gauss quien dio a conocer esta distribución, la realidad es que fue Adolphe Lambert Quételet, eminente en todos los campos de la ciencia, quien hizo la entrada triunfal de esta distribución al mostrar su enorme importancia en la solución de una amplia gama de problemas.

            Durante el siglo XIX se realizaron diversos intentos tratando de establecerle a esta distribución la ley probabilística base de todas las variables continuas y debido a esto se utilizó el término normal. Al parecer Quételet fue el primero que habló de “Distribución Normal”.

VII. 3. 1. Importancia de la Distribución Normal

La distribución normal es sin lugar a dudas la más importante y la de mayor uso de todas las distribuciones continuas de probabilidad. Su aplicación abarca prácticamente todas las áreas de la ciencia, gran parte de los fenómenos naturales y proporciona una representación adecuada, al menos en una primera aproximación, de gran cantidad de variables físicas. Así, su uso comprende problemas relativos a la ingeniería, economía, sociología, agricultura, medicina, biología, finanzas, meteorología, geofísica, mediciones de partes manufacturadas, errores de instrumentos de medición, etc. Puntualizando podemos decir que:

1.    Son muchas las variables aleatorias que están distribuidas normalmente cuando se realizan experimentos u observaciones empíricas y hay otras más que están distribuidas en forma aproximadamente normal.

2.    Ciertas distribuciones se pueden aproximar mediante la distribución normal. Esto se cumple, por ejemplo, para la distribución binomial.

3.    Ciertas variables que son básicas para justificar pruebas estadísticas están distribuidas en forma normal, como las distribuciones muestrales de muestras grandes, intervalos de confianza, pruebas de hipótesis, el teorema del límite central, etc.

VII. 3. 2. Propiedades de la distribución normal.

            Las principales características de esta distribución son:

1.        La distribución tiene 2 parámetros: media (m) y desviación estándar (s) y queda perfectamente determinada por ellos. Debido a esto es que la notación abreviada que se usa para representar la distribución es N(m, s)

2.        La moda (el valor más frecuente), la mediana (el valor central) y la media tienen el mismo valor.

3.        El área total bajo la curva y el eje de las x es la unidad.

4.        La curva tiene forma de campana, por lo que se le llama curva acampanada o campana de Gauss

5.        La distribución es simétrica respecto a la media, es decir, el 50% del área está a la izquierda de la media y el otro 50% a la derecha.

6.        El punto de inflexión de la curva (el punto donde la curva deja de ser cóncava hacia abajo y empieza a ser cóncava hacia arriba), se encuentra a una distancia de una desviación estándar (+s y -s) respecto al eje de las y, e invariablemente la tangente en este punto de inflexión corta al eje de las x a una distancia de 2 desviaciones estándar (+2s y -2s).

7.        La curva se extiende en ambas direcciones y tiende gradualmente a unirse al eje de las x (se hace asintótica al eje de las x), por lo que solamente se juntan en menos infinito (-¥) y en mas infinito (+¥), aunque en la práctica la curva se corta en +4s y -4s.

VII. 3. 3. Función de Densidad

Definición. Se dice que una variable aleatoria X tiene distribución normal, si su función de densidad de probabilidad (f d p) está dad por:

            La gráfica de la función es la siguiente:

            En ella se puede apreciar su forma acampanada y que es simétrica alrededor del valor x = m (media) y también que el valor máximo de f(x) corresponde a la media.

VII. 3. 4.  Función de Distribución Acumulada

Por su parte para la función de distribución acumulada tenemos:


Definición. La función de distribución acumulada de la distribución normal es:


            Desafortunadamente no existe una solución exacta para la integral, por lo que su evaluación solamente puede obtenerse utilizando métodos de aproximación (numéricos), y aún así la evaluación tendría que realizarse para cada par (m, s).

            Tomando en cuenta lo anterior y que y que las medidas a las que se aplica la distribución normal son de índoles muy diversas, como comportamiento de pesos, estaturas, longitudes, coeficiente de inteligencia, sueldos, producciones, vida de productos, etc., la solución para cada par de datos sería muy laboriosa y complicada.

            Para que todos los conceptos se puedan reducir a un solo esquema, es necesario que la media y desviación estándar de la distribución normal estén fijos, de modo que la distribución permanezca invariable. Esto se logra mediante un cambio de escala, transformando los valores reales de la distribución (x) a valores de desviación estándar, los cuales reciben el nombre de valores estandarizados.

VII. 3. 5.  Estandarización de Valores

            Supongamos que una variable aleatoria que se distribuye normalmente tenga media m = 35 y desviación estándar s = 5. Un valor específico de la variable, digamos x = 45, resulta ser 10 unidades superior a la media, o en unidades de desviación estándar es 2 desviaciones estándar superior a la media. En general, cuando un valor x se divide entre su desviación estándar, entonces se dice que la variable aleatoria X se ha estandarizado y se representa con la letra Z. El modelo matemático que representa este concepto es . Si sustituimos los valores anteriores en la ecuación tenemos que .

            Este procedimiento permite hacer evaluaciones en forma genérica, sin que en el cálculo intervengan la media y la desviación estándar, los cuales ya fueron tomados en cuenta al evaluar el valor de Z.

            Es obvio que si ahora la unidad de medida es la desviación estándar, ésta debe valer uno, esto es, s = 1 y la media x = m valdrá , por lo que ahora la distribución normal estandarizada se representa por N(0, 1). El que la media estandarizada valga cero es de gran utilidad, ya que a partir del cero se manifiesta más claramente las desviaciones hacia arriba y hacia abajo y a cada desviación positiva le corresponde una negativa de igual magnitud debido a la simetría que tiene la distribución.

            En el apéndice de tablas aparece la tabla de la distribución normal estandarizada. Las áreas registradas se rigen por las leyes de la función de distribución acumula, por lo que el origen es -¥ y están reportadas para diferentes valores de Z, en donde Z, como ya vimos, es el valor de la variable aleatoria estandarizada, esto es, está en unidades de desviación estándar. En la tabla se registran los valores de f(-Z), f(Z) y D(Z), representaciones que corresponden, respectivamente, a áreas bajo la curva desde -¥ hasta valores negativos de Z, valores positivos de Z y valores simétricos de Z respecto a la media, los cuales están comprendidos entre -3.79 y 3.79.

            Existen dos tablas. La primera se titula Función acumulada, distribución Normal Estándar, la cual proporciona el área bajo la curva hasta el valor de Z de interés y la segunda, titulada Tabla de porcentajes, distribución Normal Estándar, reporta el valor de Z para un área específica, expresada en porcentaje.


            Los siguientes ejemplos servirán para explicar el uso de las tablas de áreas bajo la función de densidad normal estandarizada, donde las áreas sombreadas de las figuras representan los casos planteados.

Ejemplo. Sea Z una variable aleatoria normal con media 0 y desviación estándar 1.  Calcular y representar gráficamente las siguientes probabilidades:


1. P(Z £ 2.41) = f(2.41) = 0.9920

2. P(Z £ -1.37) = f(-1.37) = 0.0853

3. P(Z ³ -2.76) = 1 - f(-2.76) = 1 - 0.0029 = 0.9971

4. P(Z <- 1.84) = f(-1.84) = 0.0029

5. P(-2.19 £ Z £ 2.19) = D(2.19) = 0.9715

6. P( -3.0 £ Z £ 2.68) = f(2.68) - f(-3.0) = 0.9963 - 0.0013  = 0.9950

7. P(1.09 £ Z £ 2.62) = f(2.62) - f(1.09) = 0.9956 - 0.8621 = 0.1335

8. P(- 2.97 £ Z £ - 0.14) = f(- 0.14) - f(- 2.97) = 0.4443 - 0.0015 = 0.4428

Los siguientes ejemplos sirven para explicar el uso de las tablas de porcentajes de la función de densidad normal estandarizada.

Ejemplo. Sea Z una variable aleatoria normal con media 0 y desviación estándar 1. Determine el valor de la constante c para la cual se satisface estas probabilidades.

1.    P(Z ³ c) = 0.10

Como P(Z ³ c) = 1 - P(Z < c) = 1 - f(c),  entonces  f(c) = 0.90 = 90%. Consultando la tabla de porcentajes obtenemos que c = 1.2816

2.    P(Z £ c) = 0.05

Sabemos que P(Z £ c) = f(c) = 0.05 = 5%.  Mediante la tabla de porcentajes vemos que c=-1.6449

3.    P(- c £ Z £ c) = 0.99

Esto corresponde a un intervalo simétrico, por lo que P(-c £ Z £ c) = D(c) = 0.99 = 99%. En las tablas de porcentajes obtenemos  c = 2.5758

Ejemplo. Sea Y una variable aleatoria distribuida Normalmente con media m = 40 y desviación estándar s = 6. Encuentrar:

1.    P( Y £ 32) = P(Z £ () = P(Z £ -1.33) = f( - 1.33) = 0.0918

2.    P( Y ³ 27) = P(Z ³ () = P(Z ³ -2.17 = 1 - f( -2.17) = 1 – 0.0150 = 0.9850

3.    P(42 £ Y £ 51) = P [£ Z £ ]  = P[0.33 £ Z £ 1.83] =

=f(1.83) - f(0.33) = 0.9664 - 0.6293  = 0.3371

4.        El punto para el cual el 45% del área bajo la curva Normal se encuentra a la izquierda.

P[ Z £ ] = 0.45 = 45%. Consultando la tabla de porcentajes obtenemos Z(45%) = -0.1257. Sustituyendo este valor en la ecuación Z = -0.1257 =  y resolviendo para Y se tiene Y = 40 - 0.1257(6) = 39.2458

5.    El punto para el cual el 13% del área bajo la curva Normal se encuentra a la derecha.

P[Z ³ ] = 13%, entonces P[Z ³ ] = 0.13 = 1 - P[Z < ]. Despejando se tiene P[Z < ] = 1 – 0.13 = 87%. Consultando la tabla de porcentajes obtenemos Z(87%) = 1.1264. Sustituyendo este valor en la ecuación: Z = 1.1264 =  =  y resolviendo para Y se tiene: Y = 40 +1.1264(6) = 46.7584

Ejemplo. Una máquina despachadora de café está regulada para que descargue en promedio 207 mililitros por vaso. Si la cantidad de líquido está distribuida en forma Normal con una desviación estándar igual a 15 mililitros:

a).   ¿Qué porcentaje de los vasos contendrá más de 231 mililitros?.

Sea Y la variable aleatoria que representa la cantidad de líquido descargada por la máquina. Entonces:

P(Y > 231) = P[ Z > ] = P( Z > 1.6) = 1 -f( 1.6) = 0.0548

b).   ¿Cuál es la probabilidad de que un vaso contenga entre 198 y 216 mililitros?

P(198 £ Y £ 216) = P[£ Z £ ] = P( -0.6 £ Z  £ 0.6) = D(0.6) = 0.4515

c).   Si se usan vasos con capacidad de 237 mililitros, ¿Cuántos de 1000 vasos servidos se derramarán?.

1000 P(Y > 237) = 1000 P[Z > ] = 1000 P(Z > 2) = 1000 (1 - P(Z £ 2) = 1000(1 - f( 2) = 1 - 0.9770 = 0.0228) @ 23 vasos

d).   ¿Para que valor de la variable Y se tienen el 25% de los vasos con menor contenido?.

Sea Y el valor de la variable y el punto que satisface esta condición. Entonces:

P(Y £ y ) = P[ -Z £ ] = 25%. Consultando las tablas de porcentajes obtenemos que Z(25%) = - 0.6745. Sustituyendo este valor en la ecuación: -0.6745 =  y resolviendo se obtiene y = 207 - 0.6745(15) = 196.8825 mililitros

VII.4.   Aproximación de la Distribución Binomial mediante la Distribución Normal

La distribución Normal se puede utilizar para aproximar las probabilidades de algunas variables aleatorias discretas, cuando es difícil calcular las probabilidades exactas cuando el tamaño de n es grande.

Supongamos tenemos una variable aleatoria Y que tiene una distribución binomial. Se realizan n pruebas y la probabilidad de tener éxito en cualquier prueba se denota por  p. Si se desea calcular P(Y £ b), entonces podemos utilizar la función Binomial para calcular la probabilidad de todos los valores que sean menores o iguales a b y sumar estas probabilidades.

Ya vimos que existen tablas para ciertos valores de p y de n, pero el cálculo directo para valores grandes de n o de p que no existan en las tablas es laborioso.

Como una opción se puede usar el siguiente teorema.

VII.4.1. Teorema del Límite de DeMoivre - Laplace

Sea 0 <p< 1. Entonces, para n grande, la distribución Binomial se puede aproximar por medio de la distribución Normal con media m y variancia s2, donde:

m = np             y          s2 = np(1 - p) = npq

Sabemos que en la distribución Binomial se cumple que:

Podemos establecer que          f(Y) » f*(Y)  para Y = 0, 1, 2, . . . ,n

donde el símbolo » se lee asintóticamente igual y significa que la razón f(Y) » f*(Y) se aproxima a uno cuando n crece indefinidamente. Por lo tanto:

donde                         

Además tenemos que:

La experiencia indica que la aproximación es adecuada cuando el producto np > 5 cuando p £ 0.5 o bien cuando nq < 5 para p > 0.5

VII.4.2. Factor de Corrección para Poblaciones Finitas

            Como la distribución Binomial es discreta y la Normal es continua, es común en la práctica utilizar la corrección de medio intervalo o corrección de continuidad. En realidad, esto es necesario al calcular la probabilidad puntual P(X = x). Un procedimiento usual es moverse media unidad a ambos lados del entero x, dependiendo del intervalo de interés. A continuación se muestran los casos posibles.

Planteamiento en la

Distribución  Binomial

Planteamiento con corrección

Por continuidad

P(X = x)

P(x-1/2£ X £ x+1/2)

P(X £ x)

P(X £ x+1/2)

P(X < x)

P(X £ x-1/2)

P(X ³ x)

P(X ³ x-1/2)

P(X > x)

P(X ³ x+1/2)

P(a £ X £ b)

P(a-1/2 £ X £ b+1/2)

Por lo que para la ecuación antes señalada se tiene que:

Ejemplo. Un fabricante sabe que el 20% de las máquinas de lavar que fabrica necesitaran reparación dentro de los 60 días después de su venta. Si se venden 1000 máquinas, ¿Cuál es la probabilidad de que entre 170 y 185 de las máquinas vendidas requieran reparación?.

En este caso  p = 0.20, q = 1-p = 0.80  y  n = 1000.

Entonces  np = 1000(0.20) = 200. Como p < 0.5 y np>5, la aproximación mediante la distribución Normal es adecuada para la distribución Binomial.