Binomial y Normal

26
Captulo 11 Variables estadsticas unidimensionales: la Binomial y la Normal La Estadstica es la rama de las MatemÆticas que se ocupa del estudio de los procedimientos y los mØtodos para trabajar con datos, con el n de obtener informacin relacionada con ellos. Podemos distinguir entre dos grandes bloques dentro de la Estadstica. z La Estadstica Descriptiva, que se encarga de la recogida de datos, su representacin y elaboracin de tablas para su posterior estudio. z La Estadstica Inferencial, que se ocupa del diseæo de mØtodos o modelos con el objetivo de obtener informacin acerca de ciertos parÆmetros que nos interesan. Ambas partes trabajan con algunos conceptos generales que repasamos a continuacin. I Poblacin (o universo ): es el conjunto formado por todos los elementos que son objeto del estudio estadstico. I Individuo: es cada uno de los elementos de la poblacin. I Muestra: es cualquier subconjunto de la poblacin. I Tamaæo: es el nœmero de individuos de la muestra. Volveremos a repasar estos conceptos en el captulo §12. 31

description

Matematicas

Transcript of Binomial y Normal

Page 1: Binomial y Normal

Capítulo 11

Variables estadísticasunidimensionales: la Binomial y laNormal

La Estadística es la rama de las Matemáticas que se ocupa del estudio de los procedimientosy los métodos para trabajar con datos, con el �n de obtener información relacionada con ellos.

Podemos distinguir entre dos grandes bloques dentro de la Estadística.

z La Estadística Descriptiva, que se encarga de la recogida de datos, su representación yelaboración de tablas para su posterior estudio.

z La Estadística Inferencial, que se ocupa del diseño de métodos o modelos con el objetivode obtener información acerca de ciertos parámetros que nos interesan.

Ambas partes trabajan con algunos conceptos generales que repasamos a continuación.

I Población (o universo): es el conjunto formado por todos los elementos que son objeto delestudio estadístico.

I Individuo: es cada uno de los elementos de la población.

I Muestra: es cualquier subconjunto de la población.

I Tamaño: es el número de individuos de la muestra.

Volveremos a repasar estos conceptos en el capítulo §12.

31

Page 2: Binomial y Normal

32 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

11.1. Variables estadísticas

Llamaremos variable estadística (o carácter) a cualquier cualidad que tienen todos losindividuos de la población a estudiar. A los distintos valores que puede tomar una variable los

llamaremos modalidades. Las variables estadísticas se clasi�can en cualitativas (sus modal-idades no son numéricas; por ejemplo, el color de ojos toma los valores marrón, azul, verde,

negro, etc.) y cuantitativas (sus modalidades son numéricas; por ejemplo, el peso o la estaturade las personas). En este estudio sólo trabajaremos este último tipo de variables.

Las variables estadísticas cuantitativas (a las que, a partir de ahora, llamaremos simplemente

variables ya que son las únicas que nos interesan) se dividen a su vez en:

� Discretas, si sólo pueden tomar un número �nito de modalidades distintas (a veces se admiteque sea in�nito numerable). Por ejemplo, el número de hermanos.

� Continuas, si pueden tomar, al menos teóricamente, todos los valores comprendidos en unintervalo. Por ejemplo, el peso o la estatura de una persona.

En lo que sigue, y dado que el presente curso sólo pretende hacer una introducción somera

a la Estadística, desarrollaremos la teoría principalmente para variables discretas. No obstante,

utilizando marcas de clase de intervalos, todo se puede generalizar a variables continuas.

11.1.1. Tabla de frecuencias

En lo que sigue, sea X una variable estadística (cuantitativa) discreta que toma un número

�nito de valores distintos. Representaremos por fx1; x2; : : : ; xkg a las distintas modalidades quepuede tomar X; si fuese continua, las agruparíamos en intervalos

f [x1; x2[ ; [x2; x3[ ; : : : ; [xk�2; xk�1[ ; [xk�1; xk] g ;

y trabajaríamos con la marca de clase (el punto medio de cada intervalo) como lo haremos

a continuación con cada modalidad xi. Supongamos que cada modalidad xi se repite en la

población (o en la muestra) un número ni de veces, al que llamaremos frecuencia absoluta dela modalidad xi. Llamemos N = n1 + n2 + : : :+ nk al tamaño total de la población estudiada.

Representaremos por fi a la frecuencia relativa de la modalidad xi, que se de�ne como fi =

A. Roldán

Page 3: Binomial y Normal

11.2. Parámetros asociados a una distribución de frecuencias 33

ni=N . Usualmente, estas frecuencias se agrupan en una tabla de frecuencias como la siguiente:

xi ni Ni fi Fi xi � ni x2i � nix1

x2...

xk N 1

N (1) 1 � xi ni (2) � x2i ni (3)

(11.1)

Las columnas Ni y Fi se denominan frecuencias absolutas (o relativas) acumuladas y sede�nen, en el caso de las primeras, como Ni = n1+n2+ : : :+ni, para cada i entre 1 y k. Como

veremos, son útiles a la hora de determinar la mediana o los distintos cuartiles y percentiles de

la distribución.

11.1.2. Representación grá�ca de una distribución

Existen diversas formas para representar una distribución cuantitativa: diagrama de puntos,

diagrama de barras, histograma, polígono de frecuencias. También para representar un cualita-

tiva: diagrama de sectores, pictograma.

### Poner ejemplos.

11.2. Parámetros asociados a una distribución de frecuencias

Los parámetros asociados a una distribución son números que indican alguna propiedad de la

misma. Podemos dividirlos enmedidas de centralización (que indican valores representativosde la distribución en algún sentido) y de dispersión (que indican cómo de unidos o separadosestá dichos valores).

11.2.1. Medidas de centralización

Son números que tratan de representar, en algún sentido, a toda la distribución, o tratan

de aportar alguna información sobre la misma. Indudablemente, la más importante es la media

aritmética.

A. Roldán

Page 4: Binomial y Normal

34 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

Media (aritmética)

Llamaremos media aritmética (o simplemente, media) de la variable X, y la representare-mos por �X o por �X (o simplemente por �), al número:

�X = �X =kXi=1

xi � fi = x1 � f1 + x2 � f2 + : : :+ xk � fk: (11.2)

Como se puede observar, el símbolo � signi�ca sumatoria, e indica la suma de todos los términos

que hay dentro cuando se varía el índice a que hace referencia (en este caso, i). Teniendo en

cuenta que fi = ni=N , la forma más usual de determinar la media es

�X =1

N

kXi=1

xi � ni; (11.3)

que se consigue dividiendo la casilla (2) entre la casilla (1) en la tabla de frecuencias (11.1). La

media aritmética es un parámetro que nos da una idea de en torno a qué valor se encuentran

concentrados los valores de la variable estadística (aunque en ocasiones no resulte un valor

demasiado representativo). Entre las propiedades más interesantes de la media destacamos las

siguientes:

Cambio de origen: si le sumamos (o restamos) una constante C a todos los valores de la

variable X, yi = xi+C, la media de la nueva variable Y = X+C es la media de la variable

anterior más la constante C.�Y = �X + C:

Cambio de escala: Si multiplicamos todos los valores de la variable X por una constante C,

yi = C � xi, la media de la nueva variable Y = CX es la media de la anterior multiplicada

por C.�Y = C � �X

La media de las desviaciones de los valores de la variable con respecto a la media aritmética

es cero.kXi=1

�xi � �X

�� ni = 0:

Moda

La moda de la variable X es el valor (o valores) que posee mayor frecuencia absoluta, es

decir, la modalidad que más se repite en la distribución. Se representa por Mo. Puede haber

varias modas en una misma distribución, por lo que se puede hablar de distribuciones bimodales,

trimodales, etc.

A. Roldán

Page 5: Binomial y Normal

11.2. Parámetros asociados a una distribución de frecuencias 35

Mediana

La mediana de la variable X es el valor numérico que deja igual número de observaciones

inferiores a él que superiores. Se representa por Me.

Percentil

Se llama percentil de orden m, y lo denotaremos por Pm, al valor numérico que deja a suizquierda un m % de valores de la distribución. Así, se habla también de cuartiles (si se dividela distribución en cuatro partes equifrecuentes) y deciles (en diez partes).

11.2.2. Medidas de dispersión

Las medidas de dispersión tratan de indicar la forma con la que se distribuyen las modalidades

sobre la recta real. Sin duda, la más importante es la varianza (y su raíz cuadrada). Aunque

comenzamos explicando un coe�ciente que da una idea clara de cómo tener una concepción

rápida de la dispersión de la variable.

Recorrido

El recorrido de una distribución se de�ne como la diferencia entre los valores mayor y menorde la variable.

recX = xm�ax � xm��n:

Este parámetro no da una idea de un valor central, sino de cómo se dispersan los valores de la

variable.

Varianza

Llamaremos varianza de la variable X, y la denotaremos por �2X o por s2X (o simplemente

por �2 o por s2 si no hace falta indicar la variable), a la media aritmética de los cuadrados de

las desviaciones de los valores de la variable con respecto a la media aritmética del colectivo, es

decir,

�2X = s2X =

kXi=1

h �xi � �X

�2 � fi i : (11.4)

A. Roldán

Page 6: Binomial y Normal

36 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

Desarrollando esta fórmula, la forma más sencilla de calcularla es la siguiente:

�2 = X2 � �X2 =1

N

kXi=1

�x2i � ni

�� �X2; (11.5)

lo cual se consigue dividiendo la casilla (3) entre la casilla (1) en la tabla de frecuencias (11.1) y

restándole el cuadrado de la media. La varianza indica la forma en la que se distribuyen los datos

alrededor de la media aritmética, de tal forma que cuanto mayor sea, más dispersos están los

datos, y cuanto más próxima está a cero, más agrupados están. Sus principales características

son las siguientes.

La varianza nunca es negativa: �2 � 0. Además, la varianza es nula si, y sólo si, la dis-

tribución es constante.

A la varianza no le afectan los cambios de origen, ya que si Y = X+C, entonces �2Y = �2X

(esto es debido a que no sólo se trasladan los datos, también lo hace la media aritmética).

Si Y = CX, entonces �2Y = C2�2X , donde C es una constante.

Desviación típica

Llamaremos desviación típica de la variable X, y la denotaremos por �X o por sX (o

simplemente por � o por s si no hace falta indicar la variable), a la raíz cuadrada (no negativa)

de la varianza.

�X =q�2X :

Para calcularla, se debe determinar primeramente la varianza con la fórmula (11.5). La desviación

típica tiene las mismas propiedades que la varianza.

La desviación típica nunca es negativa: � � 0.

A la desviación típica no le afectan los cambios de origen, ya que si Y = X +C, entonces

�Y = �X .

Si Y = CX, entonces �Y = C�X , donde C es una constante.

Pero hay una cuarta propiedad que merece la pena resaltar.

Lema 11.2.1 La desviación típica � veri�ca:

I En el intervalo��X � �; �X + �

�se encuentra, al menos, el 68% de la población.

A. Roldán

Page 7: Binomial y Normal

11.2. Parámetros asociados a una distribución de frecuencias 37

I En el intervalo��X � 2�; �X + 2�

�se encuentra, al menos, el 95% de la población.

I En el intervalo��X � 3�; �X + 3�

�se encuentra, al menos, el 99% de la población.

Cuasivarianza y cuasidesviación típica

En muchas ocasiones, la varianza interviene en cálculos complicados que pueden ser sim-

pli�cados con un parámetro casi idéntico. Llamaremos cuasivarianza de la variable X, y ladenotaremos por �2X o por s2X (o simplemente por �2 o por s2 si no hace falta indicar la vari-

able), a la varianza de la variable corregida con el factor N=(N � 1), donde N es el tamaño de

la población.

�2X =1

N � 1

kXi=1

h �xi � �X

�2 � ni i = N

N � 1 �2X : (11.6)

La corrección con este factor resuelve cálculos muy complicados. Además, como ya indicaremos,

la cuasivarianza muestral es un estimador insesgado de la varianza poblacional, lo que lo con-

vierte en el mejor estimador posible. De la misma forma, llamaremos cuasidesviación típicade la variable X a la raíz cuadrada de su cuasivarianza.

�X =q�2X : (11.7)

Coe�ciente de variación

La desviación típica permite comparar la dispersión de distribuciones cuyas medias aritméti-

cas estén próximas y vengan expresadas en las mismas unidades. Ahora bien, si las medias de

las distribuciones son muy dispares, la comparación a través de la desviación típica no es nada

representativa. Se utiliza entonces el coe�ciente de variación de la variable X, que se de�necomo el cociente entre su desviación típica y su media aritmética (si ésta no es nula).

CX =�X�X:

Desviación media

La varianza de X da una idea de cómo de próximos están los valores de la distribución de

su media aritmética. Pero tiene la desventaja de que lo hace elevando al cuadrado, de tal forma

que las unidades pueden sufrir modi�caciones. Una forma de arreglar este problema es tomar las

diferencias respecto de la media aritmética en valor absoluto, lo que da lugar a la desviaciónmedia de la variable X, que se de�ne como

Dm =

kXi=1

��� xi � �X�� � fi� = 1

N

kXi=1

��� xi � �X�� � ni� : (11.8)

A. Roldán

Page 8: Binomial y Normal

38 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

El problema que tiene este parámetro es que es mucho más laborioso de calcular, pues es in-

evitable calcular todas las desviaciones respecto de la media aritmética.

Ejercicio 19 En el instituto Acci hay 800 alumnos y alumnas, de los cuales 85 llevan unpiercing, 23 llevan dos y 7 llevan tres. Realiza un estudio completo de la variable estadística que

mide el número de piercing en el Acci.

Solución : Sea X la variable estadística que mide el número de piercing que lleva cada alumno

o alumna. Una tabla de frecuencias sencilla es la siguiente:

xi ni Ni fi Fi xi � ni x2i � ni�� xi � �X

�� � ni0 685 685 00856 00856 0 0 130015

1 85 770 00106 00962 85 85 68085

2 23 793 00029 00991 46 92 41063

3 7 800 00009 1 21 63 19067

800 1 152 240 26003

La media y la varianza son los dos coe�cientes que debemos aprender a calcular más rápidamente,

porque son los más importantes.8>><>>:�X =

152

800= 0019;

�2X =240

800� 00192 = 002639:

Entonces la desviación típica es � � 00514. Está claro que la moda es 0 piercing, al igual que lamediana. El recorrido es de 3� 0 = 3 piercing y la cuasivarianza se calcula también fácilmente:

�2X =N

N � 1 �2X =

800

799� 002639 � 00264:

El coe�ciente de variación es CX = �X= �X � 20705. La desviación media es la más laboriosa decalcular, por lo que cuesta en la tabla de frecuencias.

Dm =26003

800� 00325:

Esto acaba el estudio.

11.3. Tipi�cación de una variable

Sea X una variable estadística (cuantitativa). Denotemos por �X y por �X a su media aritmé-

tica y a su desviación típica. Como hemos visto al explicar los parámetros anteriores, si llamamos

A. Roldán

Page 9: Binomial y Normal

11.4. Variables aleatorias 39

Y = X � �X, tendremos una nueva variable cuya media es cero y de igual desviación típica que

X, es decir,�Y = �X � �X = 0; �Y = �X :

Hemos ganado que ahora su media está centrada en el cero, pero queremos hacer un proceso

para tener controlada también su desviación típica. Para ello, recurrimos a un cambio de escala

dividiendo entre �X (si este valor no es nulo, es decir, si la variable no es constante). De�nimos

así

Z =Y

�X=X � �X

�X:

Esta nueva variable tiene media cero y desviación típica uno, ya que

�Z =

�1

�XY

�=

1

�X�Y =

0

�X= 0; �Z =

1

�X�Y =

�X�X

= 1:

Este proceso se denomina tipi�cación de la variable X, y nos permite construir otra variablede media cero y desviación típica uno, íntimamente relacionada con la anterior.

X !

8<: media �X;

desv. típica �X ;) Z =

X � �X

�X!

8<: media 0;

desv. típica 1:

Este proceso sirve para comparar datos de distribuciones distintas. Otra ventaja de la tipi�cación

es que la variable Z sigue conservando el mismo tipo de distribución que X, es decir, si X sigue

una distribución normal, entonces Z también posee el mismo tipo de distribución.

11.4. Variables aleatorias

Hay ocasiones en que nos interesa estudiar probabilidades asociadas a funciones que rela-

cionan sucesos aleatorios y números (por ejemplo, la probabilidad de que un alumno, elegido

al azar, tenga tres hermanos). Necesitamos así introducir el concepto de función de�nida sobre

algunos tipos de sucesos.

De�nición 11.4.1 Sea E el espacio muestral asociado a algún experimento aleatorio. Llamare-mos variable aleatoria a cualquier ley X : E ! R que asocie un número real a cada suceso

elemental. Llamaremos recorrido de la variable aleatoria X, y lo denotaremos por recX o

por X (E), al conjunto de valores reales que forman sus imágenes.

Esta de�nición es parecida a la de función de probabilidad p : S ! R, pero tiene dos difer-encias importantes: en primer lugar, la función de probabilidad se puede aplicar a cualquier

suceso del espacio de sucesos, mientras que la variable aleatoria sólo se puede aplicar a sucesos

elementales. En este sentido, es más restrictiva. Sin embargo, la función de probabilidad está

acotada entre cero y uno, mientras que la variable aleatoria puede tomar cualquier valor real.

A. Roldán

Page 10: Binomial y Normal

40 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

Ejemplo 11.4.2 Sea E = f1; 2; 3; 4; 5; 6g el espacio muestral asociado al lanzamiento de undado. Entonces podemos de�nir la variable aleatoria que a cada resultado le asocia su triple, es

decir, X (fxg) = 3x. Entonces la variable X puede tomar valores entre 3 y 18. Obsérvese que

no tiene sentido aplicar la variable X al suceso f2; 5g.

Ejemplo 11.4.3 Sea E el conjunto de alumnos y alumnas del instituto Acci. Podemos de�niruna variable X que a cada alumno/a le asocia su número de hermanos y hermanas (sin contarse

a sí mismo/a). Entonces X toma valores naturales entre cero y, quizá, como mucho, diez (¿habrá

algún caso?). No tiene sentido aplicarle X a dos alumnos a la vez, porque no sabríamos qué

número asociarles.

11.4.1. Función de distribución de una variable aleatoria

Una de las primeras necesidades que nos planteamos es la de traducir probabilidades sobre

un espacio de sucesos a conjuntos de números reales. Por ejemplo, nos interesa la probabilidad

de que, al lanzar cuatro monedas aparezcan exactamente dos cruces, o menos de dos cruces, o

al menos dos cruces, o no aparezcan dos cruces. Esta necesidad de hacer intervenir los números

reales relacionándolos con probabilidades justi�ca las siguientes de�niciones.

De�nición 11.4.4 Sea (E;S; p) un espacio de probabilidad y sea X : E ! R una variable

aleatoria. Dado cualquier subconjunto de números reales A � R, llamaremos probabilidadde que X pertenezca al conjunto A, y la denotaremos por p (A) o por p (X 2 A), a laprobabilidad del suceso aleatorio formado por todos los sucesos elementales de E cuyas imágenes

por X pertenecen al conjunto A, es decir,

p (A) = p (X 2 A) = p (f ! 2 E / X (!) 2 Ag) :

Llamaremos función de distribución asociada a la variable aleatoria X, y la deno-taremos por FX (o, abreviadamente, por F ), a la función FX : R! R (real de variable real) quea cada número x 2 R le asocia la probabilidad de que la variable X tome valores en el intervalo

cerrado no acotado (�1; x].

FX (x) = p (X � x) = p (X 2 (�1; x]) = p (f ! 2 E / X (!) � xg) : (11.9)

La función de distribución caracteriza completamente a la variable aleatoria, de tal forma

que es equivalente conocer su acción a conocer su función de distribución.

Ejemplo 11.4.5 Consideremos el espacio de probabilidad asociado al lanzamiento de un dado(no trucado), donde cada cara tiene probabilidad 1=6 de salir, y la variable aleatoria X (fxg) = 3x

A. Roldán

Page 11: Binomial y Normal

11.5. Variable aleatoria discreta: la distribución binomial 41

de�nida en el ejemplo 11.4.2. Calculemos algunos valores de su función de distribución:

� F (5) = p (X � 5) = p (X 2 f3g) = p (f3g) = 1

6:

� F (6) = p (X � 6) = p (X 2 f3; 6g) = p (f3; 6g) = 2

6=1

3:

� F (15) = p (X � 15) = p (X 2 f3; 6; 9; 12; 15g) = p (f3; 6; 9; 12; 15g) = 5

6:

� F (30) = p (X � 30) = p (X 2 f3; 6; 9; 12; 15; 18g) = p (E) = 1:

� F (�2) = p (X � �2) = p (X 2 ?) = p (?) = 0:

11.4.2. Clasi�cación de variables aleatorias

Al igual que las variables estadísticas, las variables aleatorias de clasi�can en discretas ocontinuas según si el número de valores que pueden tomar es �nito (o incluso in�nito numerable)o bien pueden tomar, al menos teóricamente, todos los valores de un intervalo real. En el primer

caso está la variable que mide el número de hermanos de una persona, el número de tornillos

defectuosos que fabrica una máquina en un día, el número del calzado que utiliza, etc. En el

segundo grupo tenemos la variable aleatoria que mide el peso o la estatura de una persona, el

tiempo que tarda en llegar al trabajo, la energía que gasta una máquina para calentar un litro

de leche, etc.

El ejemplo más conocido de variable aleatoria discreta es el caso de la variable binomial, y elde variable continua es el de variable normal. Dedicamos el resto del capítulo a familiarizarnoscon estas distribuciones de probabilidad, que serán de gran importancia en lo que resta del

temario.

11.5. Variable aleatoria discreta: la distribución binomial

Sea (E;S; p) un espacio de probabilidad y sea X : E ! R una variable aleatoria discreta.

Denotemos por recX = fx1; x2; : : : ; xkg � R a su recorrido. Llamaremos función de densidad(o distribución de probabilidad) de X a la función real de variable real que a cada número

le asocia la probabilidad de que la variable X tome dicho valor.

fX : R! R; fX (x) = p (X = x) :

Como suponemos que X sólo toma un número �nito de valores distintos, su función de densidad

es siempre nula salvo en los propios valores que puede tomar, en los que vale:

pi = fX (xi) = p (X = xi) ; 8i 2 f1; 2; : : : ; kg :

A. Roldán

Page 12: Binomial y Normal

42 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

Evidentemente,

p1 + p2 + : : :+ pk = p (X 2 fx1; x2; : : : ; xkg) = p (X 2 E) = p (E) = 1:

Llamaremos media (o esperanza matemática) de la variable X, y la denotaremos por �X (o

por �X o por E (X)), al número real

�X =

kXi=1

xi � pi = x1 � p1 + x2 � p2 + : : :+ xk � pk: (11.10)

Se trata de la misma de�nición que en (11.2) cambiando las frecuencias relativas por probabili-

dades. De la misma forma, llamaremos varianza de la variable X al valor

�2X = s2X =

kXi=1

h�xi � �X

�2 � pii ; (11.11)

que, más fácilmente, se calcula como:

�2 = X2 � �X2 =

kXi=1

�x2i � pi

�� �X2: (11.12)

La desviación típica de la variable aleatoria X es la raíz cuadrada no negativa de la varianza:

� =p�2: (11.13)

De forma análoga podemos de�nir la cuasivarianza y los demás parámetros estadísticos.

11.5.1. La distribución binomial

Consideremos un experimento aleatorio en el que sólo pueden ocurrir dos posibilidades: o

bien ocurre un suceso A con probabilidad p o bien ocurre su complementario, �A, con probabilidad

q = 1 � p. En lo sucesivo, llamaremos al suceso A éxito y a su complementario �A, fracaso.Supongamos que podemos repetir el experimento n veces de manera independiente, es decir,

de tal forma que un resultado no in�uya para nada en el siguiente, o dicho de otra manera, la

probabilidad de éxito p debe mantenerse constante a lo largo de todas las repeticiones.

Llamemos X a la variable aleatoria que mide el número de éxitos que se obtienen al realizar

n veces el experimento (de forma independiente). Diremos entonces que la variable X presenta

una distribución binomial de parámetros n (el número de repeticiones independientes) y p(la probabilidad de éxito, constante a lo largo de las repeticiones), y lo denotaremos por

X ,! B (n; p) :

A. Roldán

Page 13: Binomial y Normal

11.5. Variable aleatoria discreta: la distribución binomial 43

Es claro que X toma valores naturales entre 0 y n, pues no se pueden obtener menos de cero

éxitos ni más de n éxitos. Por tanto,

recX = f0; 1; 2; : : : ; ng :

Aunque no vamos a demostrarlo, la probabilidad de que X tome cualquiera de estos valores es

exactamente

pk = p (X = k) =

�n

k

�� pk � qn�k; 8k 2 f0; 1; 2; : : : ; ng (11.14)

(y vale cero en todos los demás números reales), donde�nk

�representa las combinaciones de n

elementos tomadas de k en k, es decir,�n

k

�=

n!

k! (n� k)! :

Lema 11.5.1 Si X ,! B (n; p), entonces su media y su desviación típica son:

�X = n � p y �X =pn � p � q

Ejercicio 20 Ana ha estudiado 12 de los 20 temas que componen el temario de una asignatura.Si realiza 5 exámenes sobre el temario, calcula la probabilidad de:

(a) aprobar exactamente dos exámenes;

(b) aprobar más de dos exámenes;

(c) no aprobar ningún examen;

(d) aprobar algún examen.

Solución : Llamemos A al suceso �seleccionado un tema al azar, Ana lo sabe�. Es claro que A es

el suceso éxito, pues en este caso Ana aprueba el examen. La probabilidad de que Ana se sepa

el tema del examen es

p = p (A) =12

20=3

5= 006;

por lo que la probabilidad de fracaso es q = 1 � p = 2=5. Si repetimos cinco veces el examen

de manera independiente, podemos llamar X al número de exámenes aprobados por Ana, es

decir, al número de éxitos que se presentan en cinco repeticiones. Claramente, por de�nición,

X ,! B (5; 006). Entonces la probabilidad de aprobar exactamente dos exámenes es:

p (X = 2) =

�5

2

�� 0062 � 0043 = 00230 4 � 23 %:

A. Roldán

Page 14: Binomial y Normal

44 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

La probabilidad de que apruebe más de dos exámenes es

p (X > 2) = p (X � 3) = p (X = 3) + p (X = 4) + p (X = 5) =

=

�5

3

�� 0063 � 0042 +

�5

4

�� 0064 � 0041 +

�5

5

�� 0065 � 0040 =

= 00345 6 + 00259 2 + 00077 76 = 00682 5 � 68 %:

La probabilidad de que no apruebe ningún examen es:

p (X = 0) =

�5

0

�� 0060 � 0045 = 00010 24 � 1 %:

Finalmente, la probabilidad de que apruebe algún examen, que podríamos calcularla como:

p (X � 1) = p (X = 1) + p (X = 2) + p (X = 3) + p (X = 4) + p (X = 5) ;

preferimos calcularla mediante el paso al complementario, es decir,

p (X � 1) = 1� p (X < 1) = 1� p (X = 0) = 1� 0001024 = 0098976 � 99 %:

Ejercicio 21 Calcula la media y la desviación típica de una variable X ,! B (3; 007) haciendotodos los cálculos necesarios.

Solución : Como X ,! B (3; 007), esta variable sólo puede tomar cuatro valores, f0; 1; 2; 3g.Calculamos cada probabilidad.

p0 = p (X = 0) =

�3

0

�� 0070 � 0033 = 00027; p1 = p (X = 1) =

�3

1

�� 0071 � 0032 = 00189;

p2 = p (X = 2) =

�3

2

�� 0072 � 0031 = 00441; p3 = p (X = 3) =

�3

3

�� 0073 � 0030 = 00343:

Agrupamos estas probabilidades en una tabla de frecuencias, y calculamos la media y la desviación

típica de X:

xi pi xi � pi x2i � ni0 00027 0 0

1 00189 00189 00189

2 00441 00882 10764

3 00343 10027 30087

1 201 5004

8>><>>:�X =

201

1= 201;

�X =p5004� 2012 =

p0063 :

Obsérvese cómo se cumple que �X = n�p = 3�007 = 201 y que �X =pn � p � q =

p3 � 007 � 003 =p

0063 .

A. Roldán

Page 15: Binomial y Normal

11.5. Variable aleatoria discreta: la distribución binomial 45

Esquema de las fuentes

Hemos podido calcular en el ejercicio 21 todas las probabilidades asociadas a la variable

porque n es un número relativamente pequeño. En este caso, quizá convenga aplicar la fórmula

(11.14). Pero hay un proceso en cascada que quizá sea también factible. Supongamos que X ,!B (n; 006) y vamos a calcular las distintas probabilidades según sea n. Si n = 0, entendemos quep (X = 0) = 1. Si n = 1, la probabilidad de obtener un éxito es 006, y la de un fracaso, 004. Es

como si el 100 % del agua de una fuente que está desequilibrada cayese por los dos lados: en

uno se recoge el 60 % y en otro, el 40 %, como en el siguiente esquema.

1 n = 060 %.

40 %&

006 004 n = 1

Éxito Fracaso

Pero la fuente puede continuar hacia abajo, teniendo en cuenta que por la izquierda cae el 60 %

del agua (y se añade un éxito) y por la derecha el 40 % (y se añade un fracaso).

1 n = 0

. &006 004 n = 1

. 1E & . 1F &0036 0048 0016 n = 2

2 E 1E1F 2F

Debajo de cada número se indica el número de éxitos y fracasos; por ejemplo, 1E1F signi�ca un

éxito y un fracaso. Obsérvese también cómo a la fuente central le cae agua (probabilidad) de las

dos posiciones superiores, por lo que acumula: 006 � 004 + 004 � 006 = 0048. Y la tabla seguiría:

1 n = 0

. &006 004 n = 1

. 1E & . 1F &0036 0048 0016 n = 2

. 2 E & . 1E1F & . 2F &00216 00432 00288 00064 n = 3

. 3E & . 2E1F & . 1E2F & . 3F &001296 003456 003456 001536 000256

4E 3E1F & . 2E2F & . 1E3F 4F

003456 002304

3E2F 2E3F

A. Roldán

Page 16: Binomial y Normal

46 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

En la tabla anterior se observa que si X ,! B (3; 006), entonces p (X = 2) = 00432, porque se

conseguirían dos éxitos.

11.6. Variable aleatoria continua: la distribución normal

Una variable aleatoria (cuantitativa) se dice continua si puede tomar, al menos de forma

teórica, todos los valores de un intervalo. Como en éste hay una cantidad de números in�nita

no numerable, no es posible que la probabilidad de que la variable tome los valores del intervalo

sea positiva, pues entonces una suma no numerable de números estrictamente positivos nunca

está acotada superiormente. Por eso, la probabilidad de que una variable continua tome un valor

concreto es cero. Realmente, no debería ser cero, porque podría ocurrir que la estatura de un

determinado alumno fuese de 1�65 m, pero como no tenemos un instrumento de medida lo

su�cientemente sutil como para a�rmarlo de forma tajante (podremos sacar 20 decimales a su

altura, pero no 300), preferimos hablar de la probabilidad de que la altura del alumno esté en

el intervalo ]106499; 106501[.

Esto modi�ca sustancialmente la forma que tenemos de calcular probabilidades con una

variable continua, pues debemos hacer una de�nición con integrales (quizá no sea el objetivo de

este curso saber calcular las siguientes integrales; si es así, pásate a la sección §11.6.1).

De�nición 11.6.1 Sea (E;S; p) un espacio de probabilidad y sea X : E ! R una variable

aleatoria. Diremos que X es una variable continua si existe una función integrable fX : R! R,llamada función de densidad de X, de manera que la probabilidad de que la variable aleatoriaX tome valores en un intervalo I es la integral (de�nida o no) de fX en I, es decir,

p (X 2 I) =ZIfX (x) dx; 8I � R; I intervalo: (11.15)

En el caso de que I = ]a; b[, se denota

p (a < X < b) =

Z b

afX (x) dx:

De acuerdo con esta de�nición, la probabilidad de que la variable tome un valor puntual es nula,

ya que

p (X = a) = p (X 2 [a; a]) =Z a

afX (x) dx = 0:

Por ello, es lo mismo considerar intervalos abiertos que cerrados (o semiabiertos o semicerra-

dos). La condición (11.15) impone varias restricciones sobre la posible función de densidad fX .

Esencialmente, esta función debe ser no negativa (fX � 0) y su integral (impropia) en R debevaler uno. Z

RfX (x) dx = p (�1 < X < +1) = p (E) = 1:

A. Roldán

Page 17: Binomial y Normal

11.6. Variable aleatoria continua: la distribución normal 47

Utilizando esta función de densidad (que, si existe, es única c.p.d.), es posible de�nir los prin-

cipales parámetros de la variable X. Por ejemplo, llamaremosmedia (o esperanza matemáti-ca) de la variable X, y la denotaremos por �X (o por �X o por E (X)), al valor real:

�X =

ZR[x fX (x)] dx:

Igualmente, llamaremos varianza de la variable X al valor

�2X = s2X =

ZR

h�x� �X

�2fX (x)

idx;

que, más fácilmente, se calcula como:

�2 = X2 � �X2 =

ZR

�x2f (x)

�dx� �X2:

La desviación típica de la variable aleatoria X es la raíz cuadrada no negativa de la varianza:

� =p�2:

De forma análoga podemos de�nir los demás parámetros estadísticos.

11.6.1. La distribución normal

¿Existe una variable aleatoria que tenga cualquier media � (real) y cualquier desviación típica

� (no negativa)? Si � = 0, la variable es constantemente igual a la media, y hemos acabado.

Este caso es trivial y no nos interesa en lo sucesivo. ¿Y si � > 0? La respuesta es positiva y

se puede conseguir con la distribución normal, que tiene una función de densidad ciertamente

peculiar. A partir de ahora, supondremos que las variables que intervengan no son constantes,

es decir, � > 0.

De�nición 11.6.2 Sea � 2 R cualquier número real y sea � 2 R+ cualquier número positivo.Denotaremos por f�;� a la función f�;� : R! R (real de variable real) de�nida por

f�;� (x) =1

�p2�

e�12(

x��� )

2

; 8x 2 R:

Esta función cumple las siguientes propiedades:

1. Es una función positiva (f�;� > 0) y continua en R.

2. Posee un único máximo, que es absoluto y está en el punto de abscisa x = �.

3. Posee dos puntos de in�exión, cuyas abscisas son x = �� �.

A. Roldán

Page 18: Binomial y Normal

48 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

4. Es creciente en ]�1; �[ y decreciente en ]�;+1[.

5. Es una función simétrica par respecto de la asíntota vertical x = �.

6. El eje de abscisas es asíntota horizontal de f�;� a ambos lados.

7. El área total encerrada entre f�;� y el eje de abscisas es la unidad (independientemente de

� y de �), es decir, ZRf�;� (x) dx = 1:

Con todos estos datos, es posible dibujarla de la siguiente manera.

x

y

µ x

y

El caso más interesante ocurre cuando � = 0 y � = 1. La función f0;1 está dibujada a la derecha

manteniendo la escala de los ejes; el área determinada por la función f0;1 con el eje de abscisas

es la misma que la del cuadrado unidad.

De�nición 11.6.3 Diremos que una variable aleatoria X sigue una distribución normal deparámetros � y �, y lo denotaremos por X ,! N (�; �), si es una variable continua cuya

función de densidad es f�;�. En el caso particular de que una variable Z siga una distribución

N (0; 1), diremos que posee una distribución normal estándar.

En tal caso, la probabilidad de que la variable X tome valores en un intervalo ]a; b[ coincide

con el área delimitada por la función f�;� y el eje de abscisas entre las rectas verticales x = a y

x = b, como en la siguiente �gura.

a b x

y

Los parámetros � y � están íntimamente relacionados con la media y la desviación típica de X.

A. Roldán

Page 19: Binomial y Normal

11.6. Variable aleatoria continua: la distribución normal 49

Teorema 11.6.4 Si X ,! N (�; �), entonces la media de X es � y su desviación típica es �.

�X = �; �X = �:

Siempre es posible pasar de una distribución N (�; �) a una distribución normal estándar

mediante el proceso de tipi�cación que estudiamos en la sección §11.3. Esto quiere decir que

X ,! N (�; �) ) Z =X � ��

,! N (0; 1) (11.16)

Esto nos permite calcular probabilidades normales en cualquier distribución con sólo utilizar la

tabla de la distribución normal estándar. Es lo que haremos a continuación.

Cálculo de probabilidades con la tabla de la distribución normal estándar

Es posible demostrar que la función x 2 R 7! e�x2es continua y positiva en R, de tal

forma que sabemos que es localmente integrable. Por eso, posee alguna primitiva en todo R. Sinembargo, no es posible expresar dicha primitiva en términos de las funciones elementales que

manejamos. De esta forma, no podemos calcular una integral del tipo

p (a < X < b) =1

�p2�

Z b

ae�

12(

x��� )

2

dx

directamente integrando cuando X ,! N (�; �). Nos vemos obligados a utilizar tablas con pro-

babilidades que han sido calculadas por aproximación. Pero, ¿podemos reducirlas todas a una

sola? La respuesta es que sí: si tipi�camos cada variable, sólo nos hará falta la tabla de la dis-

tribución normal estándar. Existen diferentes tipos de tablas. Nosotros vamos a utilizar en lo

sucesivo tablas de colas a la izquierda, es decir, que nos dan las probabilidades de que unavariable normal estándar tome valores menores o iguales que un número no negativo.

x x

y

FZ (x) = p (Z � x) =1p2�

Z x

�1e�

t2

2 dt:

A continuación escribimos algunas probabilidades normales utilizando la tabla de colas a la

izquierda. Las calculamos teniendo en cuenta principalmente las siguientes propiedades:

p (Z < �a) = p (Z > a) = 1� p (Z � a) :p (a � Z � b) = p (Z � b)� p (Z � a) :

p (�b � Z � �a) = p (a � Z � b)

A. Roldán

Page 20: Binomial y Normal

50 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

En lo que sigue, si escribimos 000198 = �000197 queremos indicar lo siguiente: la primeraaproximación, 000198, ha sido calculada con la tabla de la normal estándar, y la segunda aproxi-

mación, 000197, ha sido calculada con el ordenador. Si no se escribe nada, es porque ambas

coinciden.

p (Z � a) ; p (Z < 0055) = 007088:

a > 0 p (Z � 1012) = 008686:

p (Z � 2039) = 009916:

p (Z � a) ; p (Z � 1098) = 1� p (Z � 1098) = 1� 009761 = 000239:

a > 0 p (Z � 0025) = 1� p (Z � 0025) = 1� 005987 = 004013:

p (Z � 0076) = 1� p (Z � 0076) = 1� 007764 = 002236:

p (Z � a) ; p (Z < �003) = p (Z > 003) = 1� p (Z � 003) = 1� 006179 = 003821:

a < 0 p (Z � �205) = p (Z > 205) = 1� p (Z � 205) = 1� 009938 = 000062:

p (Z < �1048) = p (Z > 1048) = 1� p (Z � 1048) = 1� 009306 = 000694:

p (Z � a) ; p (Z > �104) = p (Z � 104) = 009192:

a < 0 p (Z � �0058) = p (Z � 0058) = 007190:

p (Z > �3005) = p (Z � 3005) = 009989:

p (a � Z � b) p (001 < Z � 1005) = p (Z � 1005)� p (Z � 001) = 008531� 005398 =

a; b > 0 = 003133:

p (2003 � Z � 2098) = p (Z � 2098)� p (Z � 2003) = 009986� 009788 =

= 000198 = �000197:

p (0039 < Z < 2017) = p (Z � 2017)� p (Z � 0039) = 009850� 006517 =

= 003133:

A. Roldán

Page 21: Binomial y Normal

11.6. Variable aleatoria continua: la distribución normal 51

p (a � Z � b) p (�1031 � Z � �0054) = p (0054 � Z � 1031) =

a; b < 0 = p (Z � 1031)� p (Z � 0054) = 009049� 007054 = 001995:

p (�1 < Z � �0037) = p (0037 � Z � 1) =

= p (Z � 1)� p (Z � 0037) = 008413� 006443 = 00197:

p (�2048 � Z < �1059) = p (1059 � Z � 2048) =

= p (Z � 2048)� p (Z � 1059) = 009934� 009441 = 000493:

�a < 0 < b; p (�a � Z � b) = p (Z � b)� p (Z � �a) = p (Z � b)� p (Z � a) == p (Z � b)� [1� p (Z � a)] = p (Z � a) + p (Z � b)� 1:

p (a � Z � b) p (�1048 � Z � 0059) = p (Z � 0059)� p (Z � �1048) =

a < 0 < b = p (Z � 0059)� p (Z > 1048) = p (Z � 0059)� [1� p (Z � 1048)] =

= p (Z � 0059) + p (Z � 1048)� 1 = 007224 + 009306� 1 = 00653:

p (�0053 � Z � 1043) = p (Z � 1043)� p (Z � �0053) =

= p (Z � 1043)� p (Z > 0053) = p (Z � 1043)� [1� p (Z � 0053)] =

= p (Z � 1043) + p (Z � 0053)� 1 = 009236 + 007019� 1 = 006255 =

= �006256:

p (�0098 < Z < 1034) = p (Z � 1034)� p (Z � �0098) =

= p (Z � 1034)� p (Z > 0098) = p (Z � 1034)� [1� p (Z � 0098)] =

= p (Z � 1034) + p (Z � 0098)� 1 = 009099 + 008365� 1 = 007464 =

= �007463:

Calculamos ahora probabilidades con distribuciones normales cualesquiera, tipi�cando en

todo momento. Conviene aprender (y entender) el siguiente razonamiento sobre tipi�cación. En

la práctica, aplicaremos todo el tiempo el siguiente enunciado.

Lema 11.6.5 Si X ,! N (�; �) y a; b 2 R, a � b, entonces

p (a � X � b) = p�a� ��

� X � ��

� b� ��

�(11.17)

donde Z =X � ��

,! N (0; 1).

Demostración : Es claro que las desigualdades con números reales se conservan si restamos a

A. Roldán

Page 22: Binomial y Normal

52 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

todos los términos la media � y después dividimos entre el número positivo �. Así,

a � X � b , a� � � X � � � b� � ,

, a� ��

� X � ��

� b� ��

, a� ��

� Z � b� ��

:

Es lo que utilizamos en los siguientes ejercicios.

Ejercicio 22 Si X ,! N (3; 008), calcula p (X � 305), p (X < 207) y p (2 < X < 304).

Solución : Si X ,! N (3; 008), la variable

Z =X � 3008

,! N (0; 1)

es una variable normal estándar. De esta forma,

p�X � 305

�= p

�X � 3008

� 305� 3008

�= p

�Z � 0063

�= 007357 = �007340:

Igualmente,

p�X < 207

�= p

�X � 3008

� 207� 3008

�= p

�Z � �0037

�= p

�Z � �0037

�=

= 1� p�Z � 0037

�= 1� 006443 = 003557 = �003538:

Finalmente, calculamos:

p�2 < X < 304

�= p

�2� 3008

� X � 3008

� 304� 3008

�� p

��1025 � Z � 005

�=

= p�Z � 005

�+ p

�Z � 1025

�� 1 = 006915 + 008944� 1 =

= 005859 = �005859:

Ejercicio 23 Si X ,! N (�3025; 8), calcula p (X < 0), p (X � �4) y p (�4012 � X < �2025).

Solución : Por un lado:

p (X < 0) = p

�X � (�3025)

8� 0� (�3025)

8

�= p

�Z < 0041

�= 006591 = �006577:

A. Roldán

Page 23: Binomial y Normal

11.6. Variable aleatoria continua: la distribución normal 53

De la misma forma:

p (X � �4) = p�X � (�3025)

8� �4� (�3025)

8

�= p

�Z < �0009

�=

= 1� p�Z < 0009

�= 1� 005359 = 004641 = �004626:

Y repitiendo el proceso:

p��4012 � X < �2025

�= p

��4012� (�3025)

8� X � (�3025)

8� �4� (�3025)

8

�=

= p��0011 � Z � 0013

�= p

�Z � 0013

�+ p

�Z � 0011

�� 1 =

= 005517 + 005438� 1 = 000955 = �0009304

Ejercicio 24 Si X ,! N (1204; 1027), calcula p (8056 < X � 14026) y p (11 � X < 13).

Solución : Razonamos exactamente igual que antes:

p�8056 < X � 14026

�= p

�8056� 12041027

� X � 12041027

� 14026� 12041027

�=

= p��3002 � Z � 1046

�= p

�Z � 1046

�+ p

�Z � 3002

�� 1 =

= 009279 + 009987� 1 = 009266 = �009272:

Y lo repetimos todo igual:

p (11 � X < 13) = p

�11� 12041027

� X � 12041027

� 13� 12041027

�=

= p��1010 � Z � 0047

�= p

�Z � 0047

�+ p

�Z � 1010

�� 1 =

= 006808 + 008643� 1 = 005451 = �005465:

Justi�camos a continuación el lema 11.2.1 de la página 36 en el caso de la distribución normal,

pero precisando aún más.

Lema 11.6.6 Si X ,! N (�; �), entonces:

I En el intervalo��X � �; �X + �

�se encuentra, aproximadamente, el 68�26% de la población.

A. Roldán

Page 24: Binomial y Normal

54 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

I En el intervalo��X � 2�; �X + 2�

�se encuentra, aproximadamente, el 95�45% de la población.

I En el intervalo��X � 3�; �X + 3�

�se encuentra, aproximadamente, el 99�73% de la población.

Demostración : Tipi�cando se obtiene lo siguiente:

p��X � � < X < �X + �

�= p

��� < X � �X < �

�= p

��1 < X � �X

�< 1

�= p (�1 < Z < 1) =

= p (Z � 1)� p (Z � �1) = p (Z � 1)� p (Z � 1) =

= p (Z � 1)� [1� p (Z � 1)] = 2 � p (Z � 1)� 1 =

= 2 � 008413� 1 = 006826:

Igualmente,

p��X � 2� < X < �X + 2�

�= p (�2 < Z < 2) = 2 � p (Z � 2)� 1 =

= 2 � 009772� 1 = 009544 = �009545;

y también

p��X � 3� < X < �X + 3�

�= p (�3 < Z < 3) = 2 � p (Z � 3)� 1 =

= 2 � 009987� 1 = 009974 = �009973;

11.7. Aproximación de distribuciones binomiales

En muchas ocasiones no es sencillo calcular probabilidades asociadas a una distribución

binomial, pues las fórmulas son bastante complicadas, y además es posible que tengamos que

hacer muchas sumas. Por ejemplo, si X ,! B (20; 007), entonces

p (X � 12) = p (X = 12) + p (X = 13) + : : :+ p (X = 20) =

=

�20

12

�� 00712 � 0038 +

�20

13

�� 00713 � 0037 + : : :+

�20

20

�� 00720 � 0030:

Estos ocho sumandos no son nada fáciles de calcular, y menos aún su suma. ¿Es imprescindible

calcularlos para conocer p (X � 12)? La respuesta es negativa: si podemos aproximar X por

una variable normal, estas probabilidades serán mucho más sencillas de calcular, pero siempre

teniendo en cuenta que se trata de una aproximación. Es el caso del siguiente teorema.

A. Roldán

Page 25: Binomial y Normal

11.7. Aproximación de distribuciones binomiales 55

Teorema 11.7.1 (de De Moivre) Si X ,! B (n; p) y se tiene que

n � p � 5 y n � q � 5;

(siendo q = 1� p) entonces la variable X se puede aproximar por una variable aleatoria normal~X que posee su misma media y su misma desviación típica.

X � ~X ,! N�n � p;pn � p � q

�Es importante aprender a interpretar este teorema. Lo que quiere decir es que, como p y q

están acotadas entre cero y uno, una distribución binomial es tanto más parecida a una normal

cuanto mayor es el número n de repeticiones del experimento. De hecho, la aproximación es

buena si n �p; n � q � 3, y es casi perfecta si n �p; n � q � 5. A medida que n crece, la aproximaciónes cada vez mejor (volveremos sobre esta idea en el teorema central de límite §12.2.1).

¿Cómo es esto posible si X es discreta y ~X es continua? La variable X acumula su pro-

babilidad en puntos concretos, pero la probabilidad de que ~X tome un valor concreto es nula.

Realmente, en este caso, debemos tomar el intervalo adecuado:

p (X = k) = p�k � 005 � ~X � k + 005

�Ejercicio 25 Si X ,! B (15; 004), calcula p (X = 8) con la fórmula de la binomial y aproximan-

do.

Solución : Por un lado,

p (X = 8) =

�15

8

�� 0048 � 0067 � 0011806:

Si aproximamos con una variable

~X ,! N (n � p;pn � p � q) = N�6;p306�� N

�6; 10897

�;

tendremos el valor

p�705 � ~X � 805

�= p

705� 610897

�~X � 610897

� 805� 610897

!= p

�0079 � Z � 1032

�=

= p�Z � 1032

�� p

�Z � 0079

�= 009066� 007852 = 001214 = �001208:

Esta aproximación comete un error relativo del 2�32%.

Ejercicio 26 Supongamos que X ,! B (40; 007). Calcula las siguientes probabilidades, aproxi-mando si es necesario:

p (X = 20) ; p (X � 25) ; p (20 � X � 30) :

A. Roldán

Page 26: Binomial y Normal

56 CAPÍTULO 11. VARIABLES UNIDIMENSIONALES

Solución : La primera probabilidad se puede calcular con la fórmula (11.14):

p (X = 20) =

�40

20

�� 00720 � 00320 = 00003835 14;

pero tiene bastantes cuentas. Como n � p = 40 � 007 = 28 � 5 y n � q = 40 � 003 = 12 � 5, vamos aintentar aproximar X con una variable ~X con distribución

~X ,! N (n � p;pn � p � q) = N�28;p804�� N

�28; 20898

�:

Aproximamos el suceso X = 20 con el suceso 1905 � ~X � 2005, de manera que obtenemos:

p�1905 � ~X � 2005

�= p

1905� 2820898

�~X � 2820898

� 2005� 2820898

!� p

��2093 � Z � �2059

�=

= p�2059 � Z � 2093

�= p

�Z � 2093

�� p

�Z � 2059

�=

= 009983� 009952 = 00031:

Esta aproximación de p (X = 20) es bastante mala. Ello se debe a que estamos intentando

aproximar un valor puntual de la binomial. Veamos cómo con un intervalo nos va mucho mejor.

La segunda probabilidad es:

p (X � 25) =40Xk=25

p (X = k) =40Xk=25

��40

k

�� 007k � 00340�k

�� 00884853;

que se aproxima con:

p�~X � 2405

�= p

~X � 2820898

� 2405� 2820898

!= p

�Z � �1021

�= p

�Z � 1021

�= 008869:

Esta aproximación en un intervalo es mucho mejor que la anterior, y cuesta mucho menos trabajo

que calcular la sumatoria anterior (que se ha hecho con ordenador). Igualmente,

p (20 � X � 30) =30Xk=20

p (X = k) =30Xk=20

��40

k

�� 007k � 00340�k

�� 00801655;

y, por otro lado,

p�1905 � ~X � 3005

�= p

1905� 2820898

�~X � 2820898

� 3005� 2820898

!� p

��2093 � Z � 0086

�=

= p�Z � 0086

�+ p

�Z � 2093

�� 1 = 008051 + 009983� 1 = 008034:

Esta aproximación también es muy buena, y elimina un montón de tediosos cálculos.

A. Roldán