CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS...

22
Capítulo 15 Los Estadísticos y sus Distribuciones | 365 CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONES LAS DISTRIBUCIONES MUESTRALES15.1 Introducción Recordemos que una población la hemos definido como el conjunto de objetos de los cuales se toma una muestra aleatoria. Para una población de observaciones de interés, pensamos en un valor numérico asignado a las unidades particulares de observación como un valor de una variable aleatoria; cuya distribución es la distribución de la población que tiene una media ߤy una varianza ߪy otros parámetros que caracterizan a la distribución; y podemos visualizar aen la distribución de la población como una distribución de frecuencia basada en un gran número finito de casos. Tales distribuciones fueron el objeto de estudio de los capítulos sobre la teoría de la probabilidad, particularmente en el que se dedicó a las distribuciones de probabilidad discretas y continuas y se consideran como distribuciones teóricas el proceso del muestreo aleatorio estudiado en el capítulo anterior con el remplazo de las unidades, asegura que la frecuencia relativa en el largo plazo de cualquier valor de la variable aleatoria es igual a la probabilidad de aquel valor. En este capítulo idealizaremos la distribución de la población y tratarla como si la variable aleatoria fuera continua lo cual es virtualmente imposible en las observaciones del mundo real pero asumiremos que es una aproximación al estado de sucesos de la población. Igualmente, vale recordar que los valores que caracterizan a la distribución de la población son sus parámetros de tendencia central, de dispersión de sesgo y aplanamiento y los denotamos con letras griegas minúsculas y estrictamente hablando son valores arbitrarios que entran en las funciones de probabilidad aunque el término se usa para significar cualquier valore que resume la distribución de la población: Así como los parámetros son características que sintetizan a la población, los estadísticos son medidas sumarias de las muestras y al igual que aquellos también se tienen estadísticos de tendencia central de dispersión, de sesgo y aplanamiento como se verá en este capítulo; y se denotan con letras del alfabeto español correlativas, tal como ݔҧ . Para la media y ݏpara la vaianza. En los capítulos sobre probabilidad estudiamos las distribuciones y los parámetros de las poblaciones: Como estamos interesados en la inferencia estadística de los parámetros de la población a partir de la muestra sacada aleatoriamente, debemos relacionar los estadísticos de la muestra, particularmente la media y la varianza con los parámetros media y varianza de la población bajo estudio ya que no se conocen; para lo cual necesitamos conocer la noción de distribución muestral. Más formalmente, una muestra aleatoria de tamaño es un concepto teórico que representa un conjunto de variables aleatorias independientes ܣൌ ሼ , , ,…, (15.1) Contenido en la población, antes de sacar la muestra, cuyos elementos tienen la misma función de probabilidad de la población ݔ.

Transcript of CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS...

Page 1: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 365  

CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONES ‐LAS DISTRIBUCIONES MUESTRALES‐ 

 15.1 Introducción  Recordemos que una población  la hemos definido como el conjunto de objetos de 

los  cuales  se  toma  una muestra  aleatoria.  Para  una  población  de  observaciones  de interés,  pensamos  en  un  valor  numérico  asignado  a  las  unidades    particulares  de observación    como  un  valor  de  una  variable  aleatoria;  cuya  distribución  es  la distribución  de  la  población  que  tiene  una  media    y  una  varianza    y  otros parámetros que caracterizan a la distribución; y podemos visualizar aen la distribución de la población como una distribución de frecuencia basada en un gran número finito de  casos.  Tales  distribuciones  fueron  el  objeto  de  estudio  de  los  capítulos  sobre  la teoría de la probabilidad, particularmente en el que se dedicó a  las distribuciones de probabilidad  discretas  y  continuas  y  se  consideran  como  distribuciones  teóricas  el proceso del muestreo aleatorio estudiado en el capítulo anterior   con el remplazo de las unidades, asegura que la frecuencia relativa en el largo plazo  de cualquier valor de la  variable  aleatoria  es  igual  a  la  probabilidad  de  aquel  valor.  En  este  capítulo idealizaremos  la distribución de  la población   y  tratarla  como  si  la variable aleatoria fuera continua  lo cual es virtualmente  imposible en  las observaciones del mundo real pero asumiremos que es una aproximación al estado de sucesos de la población. 

Igualmente,  vale  recordar que  los  valores que  caracterizan a  la distribución de  la población  son  sus  parámetros  de  tendencia  central,  de  dispersión  de  sesgo  y aplanamiento y los denotamos con letras griegas minúsculas y estrictamente hablando son valores arbitrarios que entran en las funciones de probabilidad aunque el término se usa para significar  cualquier valore que resume la distribución de la población: Así como los parámetros son características que sintetizan a la población, los estadísticos son medidas  sumarias  de  las muestras  y  al  igual  que  aquellos  también  se  tienen estadísticos de tendencia central de dispersión, de sesgo y aplanamiento como se verá en este capítulo; y se denotan con letras del alfabeto español correlativas, tal como  . Para la media y   para la vaianza. 

En  los capítulos sobre probabilidad estudiamos  las distribuciones y  los parámetros de  las  poblaciones:  Como  estamos  interesados  en  la  inferencia  estadística  de  los parámetros de  la población  a partir de  la muestra  sacada aleatoriamente, debemos relacionar los estadísticos de la muestra, particularmente la media y la varianza con los parámetros media y varianza de la población bajo estudio ya que no se conocen; para lo cual necesitamos conocer la noción de distribución muestral.      

 Más formalmente, una muestra aleatoria de tamaño   es un concepto teórico que 

representa un conjunto de   variables aleatorias independientes  

, , , … ,                  (15.1)  Contenido en  la población, antes de  sacar  la muestra,  cuyos elementos  tienen  la 

misma función de probabilidad de la población  .   

Page 2: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

366 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

15.2 Los estadísticos y los estimadores  Un estadístico es cualquier  función que depende solamente de  los valores de una 

muestra  aleatoria  y  que  no  contiene  ningún  parámetro  desconocido;  así,  si  , , , … ,  es una muestra aleatoria de  tamaño    sacada de  la población bajo 

estudio, entonces    , , , … ,                (15.2) 

 es un estadístico. Más aún, como  los estadísticos son funciones de  las muestras aleatorias, entonces 

los  estadísticos  son  variables  aleatorias  y  tienen  todas  las  propiedades  de  las distribuciones de probabilidad que se estudiaron en  los   capítulos 9 a 13, por  lo que podemos  hablar  de  las  distribuciones  de  probabilidad  de  los  estadísticos,  conocidas comúnmente  como  las  distribuciones  muestrales,  del  valor  esperado,  la  media,  la varianza y así. 

Por otro  lado, un estadístico que se usa para estimar el parámetro de  la población se  llama estimador del parámetro, y un valor específico del estadístico calculado con los  datos  de  una muestra  particular  se  conoce  como  estimado  del  parámetro.  Un capítulo posterior lo dedicaremos a estudiar la teoría de la estimación.  

 Ejemplo 15.1 Si deseamos estimar  la media de  la población    ‐recuérdese que  la 

media  de  la  población  es  un  parámetro  y  que  éstos  se  denotan  con  letras  griegas minúsculas‐ comúnmente se utiliza el estadístico media que se define como 

   … 15.3  

 Obsérvese por un lado que la notación cambia a letras del abecedario español y por 

tratarse variables aleatorias se utilizan  las  letras mayúsculas; o por otro que  la media  es  efectivamente  una  función  de  la muestra  aleatoria  que  no  contiene  parámetros como debe suceder con todos los estimadores.  

Con este estadístico calculamos un estimado de la media  con base en los datos de  una muestra que se extrae aleatoriamente de ella   ‐obsérvese que la notación es con la minúscula correspondiente del estimador‐; como  se bosqueja en  la  figura 14.1,  la media de  la muestra 1 es  , para  la muestra aleatoria 2 se tendrá    ; para  la muestra  3  su media  es      y  así  sucesivamente.  En  lo  general,  como  las muestras  se  extraen  aleatoriamente  de  la  población  las  medias  serán  diferentes, aunque cabe la remota posibilidad de que algunas de ellas sean iguales.  

    

Page 3: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 367  

n

n

n

233,sx

1x

211, sx

222 , sx

2x 3x

21s

22s2

3s

)(xf

x

2Xs

)( 2Xsf

POBLACIÓN f(µ,σ)

muestras

23 3,x s

 Figura 14.1 Distribuciones Muestrales de la media y la Varianza 

 Conviene  reiterar  que  es  estadístico media  ‐ ‐  es  una  función  de  una muestra 

aleatoria o  conjunto de  variables  aleatorias,  con  cuyos  valores particulares de estas variables aleatorias que se obtienen al momento de sacar  la muestra, se calculan  los estimados.  En este caso   es un estimador del parámetro  .  

Para  las  tres muestras    de  la  figura  14.1  se  tienen  tres  estimados  del  estimador  : , , ; es decir, tres valores de la variable aleatoria   que se llama el estadístico 

media.  En  resumen,  los estadísticos  son variables aleatorias porque  son  funciones de  las 

muestras aleatorias,  los estimadores son estadísticos que se utilizan para estimar  los parámetros de la población y los estimados son valores particulares de los estimadores que se determinan con los datos de la muestra.  

  15.3 Distribuciones muestrales  Como  vimos  previamente,  los  trabajos  estadísticos  utilizan  tres  distribuciones:  la 

distribución  de  la  población,  que  se  caracteriza  con  sus  parámetros  expresados mediante  letras griegas minúsculas, por ejemplo µ y  σ  ;  la distribución muestral que son las distribuciones de los estimadores de los parámetros de la población conocidos como  estadísticos,  que  son  variables  aleatorias  al  ser  funciones  de  una  muestra aleatoria , , , … ,   y  se  representan  como  las  variables  aleatorias:  

, ó ; y  la distribución de  los datos de  la muestra o distribución de  frecuencias que es la representación  gráfica o tabular que se obtiene al clasificar, mediante ciertos criterios  los  elementos  de  la muestra,  de  la  cual  nos  ocuparemos  en  un  capítulo posterior. Esta sección se dedicará al estudio de las distribuciones muestrales. 

En los trabajos estadísticos el interés primario consiste en calcular los valores de los estadísticos tales como  la media y  la varianza cuando se ha sacado  la muestra. Antes de observar  la  información de  la muestra el estadístico es una variable aleatoria con una distribución de probabilidad particular, como sucede con el número de éxitos  de una muestra de  tamaño   de un proceso de Bernoulli es una  variable  aleatoria  ‐ ‐ estadístico antes de extraer  la nuestra y es una variable aleatoria con distribución de probabilidad binomial que se definió en el capítulo 12, y  la media de  la muestra  ‐ ‐, 

Page 4: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

368 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

antes de sacarla, también es una variable aleatoria que depende de  la población y de esquema utilizado para sacar la muestra.  

Las distribuciones muestrales de los estadísticos tales como   ,   o   tienen todas las  propiedades  de  la  probabilidad  de  las  distribuciones  que  se  estudiaron  en  los capítulos  9  a  13  y,  para  distinguirlas,  se  les  llamarán  distribuciones muestrales  las cuáles  se  definen  como  distribuciones  teóricas  de  probabilidad    que    exhiben  las relaciones entre  los posibles valores de un estadístico   y  la densidad de probabilidad asociada con cada valor del estadístico de  todas    las posibles muestras de  tamaño   que se extraen de la población bajo estudio. 

De  esta  definición  se  desprende  que  para  una muestra  de  tamaño  1  es  un estadístico  muestral  cuya  distribución  es  la  distribución  de  la  población  pero;  en general,  las distribuciones   muestrales de  los estadísticos no son  las distribuciones de de  la población; sin embargo,  las distribuciones muestrales siempre dependen de  las distribuciones de las poblaciones de donde se sacan las muestras.  

En los capítulos precedentes hemos introducido las distribuciones muestrales como  en  el  caso  de  las  distribuciones  binomiales  que  se  basan  en  dos  categorías  de  la población  –éxitos  o  fracasos‐  de  un  proceso  de  Bernoulli,  en  el  cual  se  saca  una muestra aleatoria de tamaño    de la población y se calcula el número de éxitos ‐ ‐ y tal distribución es una  función que muestra  la  relación entre  los  resultados de  cada muestra  posible  y  la  probabilidad  teórica  de  ocurrencia;  también  en  la  distribución multinomial en  la cual  la población  tiene varias categorías de eventos y al sacar una muestra aleatoria de tamaño  , y la distribución nos da  la probabilidad del número de elementos de ocurrencia de cada clase. 

En  lo general,  y particularmente para el  trabajo estadístico, es posible establecer distribuciones muestrales para cualquier característica de una muestra, correlativas a los  parámetros  generales  de  las  distribuciones  de  probabilidades  estudiados  en  el capítulo 11,  como para  la media,  la varianza,  la moda,    la mediana o  cualquier otra mediada central, de dispersión, de sesgo, aplanamiento u otras más. Estos hechos son importantes  para  la  teoría  estadística  porque  en  tales  distribuciones  se  basa  la inferencia  sobre  los  parámetros  de  la  población  que  tienen  su  raíz  en  las muestras aleatorias y en la probabilidad de que el valor del estadístico de una muestra se saque al azar de la población bajo estudio. 

Para  finalizar  se  considera  importante  remarcar  que  el  trabajo  estadístico  debe tomar  en  cuenta  las  tres  clases  de  distribuciones.  La  primera  clase  es  la  de  las distribuciones   de  la población y consiste en  las distribuciones  teóricas     que asocian  los  valores  de  la  variable  aleatoria  con  las  probabilidades  y  corresponde  a  las estudiadas  en  los  capítulos  previos;  la  segunda  clase,  es  la  de  las  distribuciones muestrales, motivo principal del presente capítulo, que son distribuciones teóricas de probabilidad  que  relacionan  los  valores  de  las  muestras  estadísticas  con  sus probabilidades de   ocurrencia sobre todas las posibles muestras; y la tercera clase es las de distribuciones de frecuencia que  las estudiaremos en el siguiente capítulo de  la estadística descriptiva.     

 15.3.1  Distribución muestral del estadístico media  ‐ ‐  Por extensión,  si  la media de  la distribución de  la población   es     y, debido a  la 

aleatoriedad  de  la  extracción  de  las muestras,  si  de  la misma  población  se  sacan 

Page 5: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 369  

muestras  de  tamaño  ,  se  mide  numéricamente  a  cada  elemento  de  la  misma podemos calcular el estimado de la media de cada muestra  ; entonces la distribución teórica  que  relaciona  los  posibles  valores  de  las  medias  de  las  muestras  con  la densidad de probabilidad sobre todas  las posibles muestras de tamaño  ; se  llama  la distribución muestral del estadístico media o de la media.   

Si   es cualquier estadístico, o sea cualquier variable aleatoria, si ésta es discreta ya sabemos que su valor esperado o la  media de su distribución es  

 ∑                    (15.4) 

 Y si el estadístico es continuo ya sabemos que   

                                             (15.5)  También sabemos que la distribución muestral de   tiene varianza   

                                                            (15.6)  La cual nos da una medida de la dispersión de de los valores particulares de   ‐los 

estimados  ‐  con  respecto    su  valor  promedio  para  todas  las  posibles muestras  de tamaño  .   

Es de suma importancia notar que la desviación estándar de la distribución muestral ‐ ‐ refleja el grado al cual  los valores de  las muestras del estadístico  tienden a ser improbables de su valor esperado  ‐a alejarse de su media‐ o a estar en error; por  lo que se  le  llama el error estándar de estadístico   en  lugar de  la desviación estándar. Cuando  nos  referimos  al  error  estándar  de  la media  de  la muestra  aludimos  a  la desviación estándar de la distribución de las posibles medias de la muestra de todas las posibles muestras aleatorias de tamaño   que se pueden extraer de la población bajo estudio.  Este  concepto  de  error  estándar  es  aplicable  a  todas  las  distribuciones muestrales. 

 Como  indicamos  en  la  expresión  15.3,  Si  el  estadístico  general    se particulariza 

para la media, antes de que  se saque la muestra, se tiene   

∑                   (15.3’) 

 Donde  los  valores  de  la  muestra  y  de  la  media  de  la  muestra  son  variables 

aleatorias.  Aplicando el operador   valor esperado a  la variable aleatoria media y sus reglas ya 

vistas,  tenemos  

∑ ∑ ∑       (15.7) 

 Más aún, como cada   es una observación elegida aleatoriamente de la población 

bajo estudio, su distribución es  la de  la población porque aún no se saca  la muestra, por lo tanto 

Page 6: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

370 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

                                                          (15.8)   Para toda   . Sustituyendo (15.8) en (15.7) se tiene  

∑             

  (15.9)  Lo que significa que el valor esperado de la distribución muestral de la media ‐ ‐ es 

igual a  la media de  la población, pero este  resultado no  implica   que  la distribución muestral de  la media sea  igual a  la distribución de  la población porque generalmente son muy diferentes y dependen del tamaño de la muestra hasta el límite en el cual la muestra fuera un censo que abarcara a todos los elementos de la población. 

Si ahora aplicamos el operador varianza estudiado en el capítulo 11 a  la expresión 15.3’ y tomando en cuenta sus reglas tenemos 

 ∑ ∑ ∑        (15.10) 

 Pero como cada   es una observación elegida aleatoriamente de la población bajo 

estudio, su distribución es la de la población porque aún no se saca la muestra, por lo tanto 

                                                          (15.11)  Para toda   . Sustituyendo (15.11) en (15.10) se tiene  

∑              (15.12) 

 Lo que indica que la varianza de la distribución muestral de la media   es igual a la 

varianza de la población dividida entre el tamaño de la muestra. Y el error estándar de esta distribución muestral de   es   

√                 (15.13) 

 Con  base  en  la  expresión  anterior,  es  importante  observar  que  a  medida  que 

aumenta el tamaño de la muestra se tienen estimadores más precisos de la media de la población; si  1 el error estándar de  la distribución es  igual a  la varianza de  la población  y  a  medida  que  el  tamaño  de  la  muestra  aumenta  este  error  va disminuyendo, hasta el caso  límite en el que dicho tamaño es  infinito o abarca todos los elementos de  la población –se hace un censo‐ en cuyo caso el error estándar es cero y  la media de  la muestra es  igual a  la de  la población. Por  lo anterior podemos concluir  que,  a mayor  tamaño  de  la muestra,  es más  probable  que  la media  de  la muestra se acerque más a la media de la población, lo cual es consistente con la ley de los grandes números y el teorema de Chebyshev que estudiamos previamente.  

Puesto que el estadístico media es una variable aleatoria, entonces podemos hacer la transformación a la forma estandarizada usando la regla ya estudiada utilizando las expresiones 15.9 y 15.13.  

Page 7: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 371  

 

√                                                                                                        (15.14) 

  

Ejemplo 15.2 Si  la distribución de  la población de  la edad de  los académicos de  la Facultad de  Ingeniería  tiene una media de 45 años y una desviación estándar de 15, para  una  muestra  aleatoria  de  25  académicos,  se  tiene  que  45  y 

9.  Si  al  sacar  la muestra  esta  tiene  una media  48  años,  el correspondiente valor estandarizado es 

 

  √

1.  Si  aumentamos  la muestra  a  625  académicos  y  resulta  también 

48, el nuevo valor estandarizado será  

5.  

 En  ambos  casos    la media  de  la muestra  está  3  años  alejada  de  la media  de  la 

población  ‐48 45 3‐  pero  al  aumentar  la muestra  el  valor  estandarizado  esta mucho más alejado de 0, lo que sorprende observar esta diferencia cuando la muestra es grande. Como hasta ahora solo conocemos la media y la varianza de la distribución muestral  de  la  media,  con  la  desigualdad  de  Chebyshev  podemos  estimar  la probabilidad de este evento. 

 

| | 3 1 1 . 0.96   O sea que la probabilidad de que la diferencia | | 3 sea  0.96 , así,  48 

años es un evento inusual. Este tipo de razonamientos son muy útiles cuando se hacen inferencias de la media de la población.  

    15.3.1.1 El teorema del límite central  En  los trabajos estadísticos, se desea que  la población que se está estudiando sea 

normal o se asume que es normal, pero debemos conocerla con certeza para que  los razonamientos y las técnicas que se utilicen sean apropiados. Si un estudio económico está  interesado  en  los  ingresos  de  cierta  población,  la  distribución  de  estos  es marcadamente  sesgada  positivamente  y  la  suposición  de  normalidad  desvirtuaría sensiblemente el estudio ya que sabemos que  la distribución normal es simétrica. El conocimiento de la distribución de la población puede tenerse de la evidencia empírica o por procedimientos teóricos. 

En  las  inferencias  sobre  la  media  de  la  población  es  indispensable  tener  un conocimiento cabal  la distribución muestral de  la media, no nada más su media y su varianza como hasta ahora. 

Una primera propiedad que podemos establecer consiste en que  cuando la media de una muestra   aleatoria de  tamaño    se  saca de una población que  se distribuye 

Page 8: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

372 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

normalmente  con  parámetros    y      ,  la  distribución  de      también  se  distribuye normalmente con parámetros      y  

√ . 

 Ejemplo 15.3 En estudios de ingeniería mecatrónica la interface hombre‐máquina es 

importante. Los botones de  los sistemas que   controla el operador deben colocarse a distancias  tales que   no  le produzcan esfuerzos ni posiciones extremas e  incómodas, para  lo cual se utilizan medidas antropométricas para determinar  las distancias entre los  tableros de  control y  los operadores;  sobre  todo en  lugares donde el espacio es reducido  como  sucede  en  las  cabinas  de  los  aviones.  Una  de  estas medidas  es  el alcance máximo. 

Las  investigaciones  sobre  antropometría  reportan  que  el  alcance máximo  de  los operadores  se  distribuye  normalmente    con  media  82.12   y  desviación estándar   4.14 , si aplican los siguientes fractiles: 

 Fractil  Z (en cm)   

(en cm)      1  ‐5.9182  72.39 5  ‐4.1656  75.438 50  0  82.042 95  4.1656  88.9 99  5.9182  91.694 

 Si las especificaciones de diseño solicitan que un tablero de control se coloque para 

el 95% de los operadores puedan alcanzarlo sin agacharse, entonces debe localizarse a 88.9 cm del respaldo. 

Puesto que  se conocen  los parámetros de  la población, ya no se  requiere que un investigador recolecte una muestra sobre el alcance máximo, puesto que esta se saca solamente si se desconocen los parámetros de la población; pero esta población puede usarse para ilustrar la distribución muestral de  . 

Puesto que la distribución de la población es normal, la distribución muestral de la media también es normal con parámetros  82.12   y 

√ . Obsérvese 

que la varianza de esta distribución muestral depende del parámetro particular   que identifica  al miembro  particular  de  la  familia  de  las  distribuciones muestrales  de  la 

media que es de interés, por ejemplo, si  10 tenemos  ~ 82.12, .√

1.31 ;  si  50  tenemos  que  la  distribución  de  interés  es  ~ 82.12,.

√0.5855 ;  y  si  100  ,  ~ 82.12, .

√0.4140   que  son  3 

miembros de  la distribución muestral de  la media que se distribuyen   conforme a  la normal, con  la misma media pero diferentes varianzas en  las que se puede observar que a medida que aumenta el tamaño de la muestra el error estándar disminuye como ya  lo  habíamos  anticipado  y  como  se  ilustra  en  la  figura  15.2,  La  curva  con más dispersión  corresponde  a  la  de  la  población  y  las  tres  siguientes  son  las  de  las distribuciones  muestrales  que  muestran  la  disminución  del  error  estándar  ‐las diferencias    disminuyen‐  a medida que aumenta el tamaño de la muestra.   

 

Page 9: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 373  

 

 En resumen, para una población que se distribuye normalmente, el error estándar 

de   determina  la cercanía de  la media de  la muestra calculada  ‐ , el estimado‐ a  la media  de  la  población,  y  una muestra  con  pequeño  error  estándar  proporciona  un estimado    que representa más fidedignamente la media de la población; los factores determinantes del error estándar  son  la  varianza de  la población  y el  tamaño de  la muestra ‐ ‐ como se desprende de la ecuación 15.13. 

 Ejemplo 15.4 En el centro de Instrumentación y Registro Sísmico ‐CIRES‐se prueban 

los  diseños  de  los  amplificadores  de  los  radios  que  transmiten  las  señales  sísmicas desde  la brecha de Guerrero hasta  la ciudad de México y  los prototipos   determinan cuáles  están  libres  de  distorsión  a  las  altas  frecuencias  que  se  utilizan;  las especificaciones establecen que media  la máxima distorsión de  frecuencias debe  ser 50 kHz con una desviación estándar de 5 kHz. El ingeniero de diseño  desconoce media de la máxima distorsión de frecuencias del diseño que propondrá para la producción ‐‐ y solo lo recomendará si una muestra de  100 pruebas registran lecturas arriba 

de  50  kHz.  Si  el  nuevo  amplificador  es  mejor  que  el  que  se  está  utilizando  y  el verdadero nivel de   es 51 kHz podemos calcular la probabilidad de la   calculada sea tan atípicamente pequeña que falle el diseño de esta prueba como sigue. 

  Como  los  parámetros  de  la  población  se  desconocen,  se  toma  la  desviación estándar  de  diseño  5  y  suponiendo  que  la  población  de  las  frecuencias  de  máxima distorsión se distribuye normalmente, entonces 

√0.5   y   50| 51

.0.0228 

Puesto que la desviación estándar de la población debe ser mayos, por ejemplo 10 

kHz,  la probabilidad de que el amplificador diseñado falle  la prueba   es   √

1  y  50| 51 0.1587 Como  ya  se  vio,  a mayor    se  tiene mayor  error  estándar  y  esto  incrementa  la 

oportunidad de un resultado erróneo de la prueba.    

Mean,Std. dev82.12,4.1482.12,1.3182.12,0.58582.12,0.414

Figura 15.2 Distribuciones de la población y de las medias

x

f(x) y

f(x'

)

72 77 82 87 920

0.2

0.4

0.6

0.8

1

Page 10: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

374 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

Ya vimos que si la población de la población es normal la distribución muestral de   también es normal con la misma media de la población – ‐ pero con  desviación estándar  diferente  ‐

√ ‐.  Esta  propiedad  también  puede  aplicarse  de manera 

aproximada   si  la distribución de  la población NO ES NORMAL gracias al teorema del Límite Central  según  el  cual    si una población  con parámetros  generales media    y desviación  estándar    y    representa  la  media  de    observaciones  aleatorias independientes,  entonces  la  distribución  muestral  de    tiende  a  una  distribución normal con parámetros 

√ cuando   tiende a infinito. 

El  teorema  del  Límite  Central  es  una  estupenda  herramienta  para  aproximar  la distribución muestral de   a  la distribución normal  independientemente de  la  forma de la distribución de la población como se ilustra en la figura 15.3. 

  

 

 

 Figura 15.3 Ilustración del teorema del Límite Central que muestra la tendencia a la 

normalidad de    

Lower limit,Up0,2

Distribución de la población

x

f(x)

0 0.5 1 1.5 20

0.6

1.2

n=2

Distribución trianguilar

x

f(x)

0 0.4 0.8 1.2 1.6 20

0.2

0.4

0.6

0.8

1

n=35

Distribución Normal

x

f(x)

-10 -6 -2 2 6 100

0.04

0.08

0.12

0.16

0.2

Page 11: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 375  

La  distribución  superior  representa  la  de  la  población  que  es  una  distribución uniforme,  si  2    la  distribución muestral  de    adquiere  la  forma  triangular  y, cuando  35 dicha distribución puede considerarse normal. 

 Ejemplo  15.5  El  tiempo  de  vida  de  los  componentes  electrónicos  de  los 

amplificadores  mencionados  en  el  ejemplo  anterior,  como  ya  vimos,  tienen  una distribución exponencial  ‐ver capítulo 13‐. Para uno de ellos el Tiempo Medio   Entre Fallas  ‐MTBF o TMEF‐ es desconocido pero dentro de la gama de valores que puede tomar  consideremos  que  0.01  componentes/día  y  con  este  valor  se  tienen  los 

parámetros  de  la  población     .

100 días  y   .

100  días.  Con  la distribución de   con una muestra de 100 componentes calculemos la probabilidad de que    esté comprendida dentro del intervalo  5 días. 

 

95 105 Φ√

Φ√

Φ 0.5 Φ 0.5   

0.6915 0.3085 0.383    

Si  0.05 se tiene  .

20  y  √

2 días, y  la probabilidad es 

 

15 25 Φ25 20

2 Φ15 20

2 Φ 2.5 Φ 2.50.9938 0.0032 0.9876 

 15.3.1.2 Muestreo de poblaciones pequeñas   

√                    (15.15) 

  Como regla el factor de corrección se usa cuando el tamaño de la muestra excede el 

10% de tamaño de la población.  Ejemplo 15. 6 Si en la Facultad de Ingeniería se graduaron 175 ingenieros petroleros 

en  el  año  2009,  de  ellos  solamente  100  entrarán  a  trabajar  en  la  industria petrolera, de  los cuáles a  10  se  les convocará para estimar el salario  inicial que percibirán  todos  los  ingenieros  de  esta  especialidad.  Si  la  desviación  estándar  de  la población es $5,000, el error estándar  es 

 

 √

$ ,√

$1,507.56 

 Y  la  probabilidad  de  que    esté  comprendida  dentro  del  intervalo  de  $2,000  de 

$6,000 es   

Page 12: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

376 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

6,000 2,000 6,000 2,000 Φ8,000

1,507.56 Φ 4,000

1,507.56Φ 5.30 Φ 2.65 1 0.0040 0.9960 

  15.3.2  Distribución muestral de la diferencia de medias  ‐ ‐  Existen  situaciones  en  las  que  el  trabajo  estadístico  consiste    en  estudiar  la 

diferencia entre dos medias; por ejemplo cuando se analiza  la diferencia en  las tasas de producción de dos procesos industriales, la diferencia en la operación de dos tipos de seguros,  la diferencia en  la aprobación de  los alumnos de dos grupos escolares o bien la diferencia en las condiciones de salud de pacientes que se tratan con placebos y con cierta droga. La comparación de las dos poblaciones frecuentemente es más útil que  el  estudio  de  una  sola  y  el  interés  primario  es  el  estudio  de  las medias  de  las poblaciones. 

Sean las poblaciones de interés la 1 y la 2 de las cuáles se sacan muestras aleatorias de  tamaños    no  necesariamente  del  mismo  tamaño,  respectivamente;    y nuestro  interés se centra en  la diferencia  . Si que continuamos sacando pares de muestras  independientes   de sendas poblaciones, podemos derivar  la distribución muestral de la diferencia entre las dos medias como sigue. 

La diferencia entre las medias sacadas de muestras aleatorias independientes es la combinación  lineal  1  que, al aplicarle el operador valor esperado y  los resultados de la sección previa, se tiene  

    1   

  (15.16)  Donde    y    son  las medias  de  las  poblaciones  1  y  2,  respectivamente.  Al 

aplicarle el operador Varianza a la combinación lineal tenemos  

1 1 1     (15.17)  Y conforme  los conceptos de  la sección anterior, el error estándar de  la diferencia 

es  

             (15.8) 

 Donde   y   son las varianzas de las poblaciones 1 y 2, respectivamente. Las expresiones de  la media y el error estándar de  la diferencia entre medias son 

válidas independientemente de las poblaciones madre; y, si las distribuciones de estas poblaciones  son  normales,  entonces,  la  forma  de  la  distribución  muestral  de  la diferencia de medias es también normal. Más aún, si no  lo son, conforme al teorema del Límite Central puede decirse que si los tamaños de las muestras    tienden a infinito,  la  distribución  muestral  de  la  diferencia  de  medias  se  aproxima  a  la distribución normal independientemente de las formas de las distribuciones madre.     

Page 13: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 377  

Con esta base, si estamos trabajando con dos muestras muy grandes,  la  forma de las  distribuciones  de  las  poblaciones  es  irrelevante  y  podemos  aproximar  la distribución muestral de la diferencia de medias a la distribución normal. 

Existe  un  caso  particular  cuando  las  varianzas  de  las  poblaciones  son  iguales;  es decir,    ‐o equivalentemente,  las desviaciones estándar  ‐ en cuyo caso  

 

          (15.9) 

 Hasta aquí hemos considerado que se conocen las varianzas de las poblaciones con 

las cuáles podemos calcular el error estándar de la diferencia aplicando las expresiones  (15.8) o (15.9); sin embargo si no es el caso debemos estimarlas con  las varianzas de las muestras como se verá en el capítulo dedicado a la estimación. 

   15.3.3  Distribución muestral del estadístico  proporción  ‐ ‐  En  investigaciones que  involucran poblaciones con datos cualitativos, el parámetro 

de interés principal de la población es la proporción   de las unidades experimentales que exhiben un atributo particular. Como hicimos con   para generalizar acerca de  , lo mismo hacemos con el estadístico   para hacer generalizaciones  respecto a  .  

La proporción de  la muestra de un atributo se encuentra dividiendo el número de elementos de la muestra que poseen el atributo que se desea estudiar entre el tamaño de la muestra. 

 

                     (15.10) 

  Cuando  el  muestreo  es  aleatorio  e  independiente,      tiene  una  distribución 

binomial  que  se  aplica  cuando  los  resultados  de  la muestra    vienen  de  un  proceso continuo o el muestreo se hace con remplazo, pero si se hace   con remplazo   de una  población  finita  se  aplica  la  distribución  hipergeométrica; no  obstante,  en  cualquier caso conviene  aproximar dichas distribuciones a la distribución normal cuando    está cercano a 0.5. 

Nuevamente  podemos  utilizar  el  teorema  del  Límite  Central    para  decir  que  la distribución  normal  es  apropiada  para  el  estadístico  .  Si  el muestro  satisface  las condiciones  de  un  proceso  de  Bernoulli  en  el  que  cada  observación  puede representarse por una variable dicotómica la cual toma el valor de  0 si no tiene la característica bajo estudio, o  1  si  la observación  si  satisface dicho criterio; y  las probabilidades correspondientes de la observación serán 1  y    respectivamente, con lo cual cada observación   satisface la distribución de Bernoulli y;  como ya vimos en el capítulo 12,  la suma de   observaciones de   Bernoulli se comportan como una distribución Binomial, y la proporción de éxitos   ‐el estadístico‐ es igual a la media de  de todas las observaciones. En el capítulo 12 mostramos como encontrar probabilidades binomiales usando las 

tablas correspondientes usando el tamaño de  la muestra   y en número de éxitos   

Page 14: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

378 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

contenidos  en  ella,  e  introducimos  la  aproximación  a  la  normal  que  se  usa comúnmente en los trabajos estadísticos que involucran proporciones. 

Así  pues,  de  la  distribución  Binomial  de      se  derivan  los  parámetros  generales media y error estándar del estadístico . 

                      (15.11) 

 

                   (15.12) 

 Cabe  recordar  que  las  desviaciones  estándar  de  las  distribuciones muestrales  se 

llaman errores estándar. Aplicando el la corrección para la continuidad de 0.5 ‐como se vio en el capítulo 12‐ para calcular las probabilidades acumuladas con la aproximación a la distribución normal, se tiene 

 

Φ . ⁄                  (15.13) 

 Ejemplo 15. 7  Si la fabricación de los microcircuitos utilizados en los receptores de 

CIRES  tienen  5%  de  defectos  y  se  toma  una  muestra  de  30,  calculemos  la probabilidad de  que la proporción de la muestra sea menor o igual a 0.10. 

Para el cálculo de la probabilidad primero necesitamos calcular el error estándar de   utilizando la fórmula (15.12) para lo cual   0.05 y  30.  

. . 0.0398  

 Utilizando  la expresión  (15.13) considerando que  0.10 30 3 microcircuitos 

defectuosos, tenemos  

0.10 Φ . ⁄ . .

 Φ 1.675 0.9530    Cuando se muestrea de poblaciones pequeñas de tamaño  , también puede usarse 

la aproximación a la normal ajustando el error estándar     con el factor de corrección por poblaciones, que puede ignorarse si el tamaño de la población es grande. 

 

                 (15.14) 

  15.3.4  Distribución muestral del estadístico Varianza  ‐ ‐                En  los  trabajos estadísticos el  interés primario está centrado en hacer  inferencias 

sobre  la(s) media(s) de  la(s) población(es)  y  aunque  se  calcula    la  varianza  con  la(s) muestra(s), no se hacen inferencias a cerca de la varianza de la población; sin embargo existen  problemas  en  los  cuáles  es  necesario  enfocarse  al  comportamiento  de  la variabilidad  de  la(s)  variable(s);  es  decir,    en  el  valor  de    de  la  población  ‐o  la 

Page 15: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 379  

desviación estándar  ‐ y la tendencia central pasa a un segundo plano; por ejemplo  en un análisis químico en el que un método tiene tiempos de reacción consistentes puede ser más  deseable  que  otro  que  en  promedio  sea más  rápido  pero  sus  tiempos  de reacción  sean más  variables;  tales métodos  necesitan  someterse  al  estudio  de  las variaciones  de los respectivos tiempos de respuesta  de las poblaciones; o bien, si los clientes  están  consientes    del  tiempo  de  espera  en  las  colas    que  hacen  en  las ventanillas del banco, pueden disgustarse más por  la  impredecibilidad del periodo de tiempo que tendrán que esperar para que se les atienda. En tales casos, la variabilidad 

 es de más interés que la  .   Así como con los valores de los estadísticos     y    se hacen inferencias  respecto a 

los parámetros   y   de  las poblaciones; Ahora veremos como con  los valores de  la varianza    se hacen para  la varianza de  la población  , a partir de  su distribución muestral. 

Conviene recordar que un estadístico o estimador es una  función de una muestra aleatoria  que  no  contiene  parámetros;  con  esto  en mente  definimos  al  estadístico varianza, que se denota con   como 

 ∑

                    (15.15) 

 Es  importante hacer notar que en  lugar de  la expresión anterior, muchos  libros de 

estadística la definen de la siguiente forma  

∑                    (15.16) 

  Sin aclarar que esta última expresión corresponde a la varianza insesgada como lo 

demostraremos en el capítulo dedicado a la teoría de la estimación estadística.  Antes de derivar  la distribución muestral del estadístico  varianza, es  conveniente 

establecer otra forma más sencilla de calcularla, sin omitir que a partir de los datos de la muestra  las calculadoras o computadoras arrojan  los valores de éste y muchísimos estadísticos más; sin embargo, como se habrá observado y se observará a lo largo del libro, mi anhelo es que sea de utilidad para los estudiantes de cualquier licenciatura en la  que  la  probabilidad  y  estadística  es  indispensable  para  contribuir  a  su  sólida formación profesional, y puedan  interpretar apropiadamente  los valores que arrojan las computadoras o calculadoras cuando se alimentan con los datos.  Como les digo a mis alumnos, hay personas que usan la cabeza y hay quienes usan la computadora; mi interés  consiste  en  saber  como  bailan  los  enanitos  que  están  dentro  de  las computadoras para hacer un análisis correcto de los resultados. He tenido experiencias en  las  cuáles  los  resultados de  las  computadoras arrojan probabilidades negativas o mayores que 1, y las personas dicen “este fue el resultado que me dio la computadora” sin tener las bases para saber que estos resultados son absurdos. 

Derivemos  la otra  forma de  calcular  la  varianza  a partir de  la expresión    (15.15),  primero  desarrollando  el  binomio  y  después  aplicando  el  operador  sumatoria  y efectuando el cociente. 

 2   

 

Page 16: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

380 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

 ∑ 2 ∑ 2 ∑ ∑    

∑ ∑ ∑ ∑ 2 ; con lo cual  

 ∑

                  (15.16) 

  Esta nueva expresión de  la varianza nos permite calcularla de manera más sencilla 

y, como puede observarse es análoga a la varianza de las variables aleatorias estudiada en el capítulo 11.   

Para  derivar  la  distribución muestral  del  estadístico  varianza  suponiendo  que  la población  de  la  cual  sacamos  las  muestras  tiene  una  distribución  normal  y  que conocemos el valor de la media  . Considerando una sola desviación de   tenemos 

   

 Elevando al cuadrado esta desviación y desarrollándolo    

  

2   Sumado todas las desviaciones de la media y aplicando el operador sumatoria  

2  

 Como   es constante   

2  

 Y, además   

2 2 2 0  Se tiene                        ∑ ∑   Su ahora dividimos entre    ∑ ∑

                 (15.17) 

 Trabajando con el término del lado izquierdo de la expresión anterior 

Page 17: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 381  

 ∑ ∑ ∑              (15.18) 

 En efecto, la suma de   variables aleatorias estandarizadas tiene una distribución de 

probabilidad     como se estableció en el capítulo 13 y en este caso  los grados de libertad equivalen al número de elementos    de la muestra. 

Con esta misma base para el miembro derecho de  la parte derecha de  (15.17) se tiene 

 

√⁄             (15.19) 

 Sustituyendo las expresiones (15.18) y (15.19) en (15.17) se tiene   

∑ 

 Por la propiedad de aditividad de la distribución Chi‐cuadrada se tiene   ∑

                 (15.20) 

 Finalmente,  si  de  la  definición  de  varianza  establecida  en  la  expresión    (15.15) 

despejamos ∑   y la sustituimos en la anterior te obtiene que   

                     (15.21) 

 Por  lo  que  hemos  demostrado  que  si    y      devienen  de  una  población  que  se 

distribuye  normalmente,  entonces  la  relación    se  distribuye  conforme  una 

distribución Chi‐cuadrada con  1 grados de libertad.  Si en  lugar de utilizar   utilizamos el estimador  insesgado   ‐ que se calcula con 

las expresiones (15.15) y  (15.16)‐ se obtiene   

                   (15.22) 

 Las  distribuciones  muestrales  de  las  varianzas    y    son  realmente  las 

distribuciones de  

                       (15.23) 

y  

                     (15.24) 

 Pero  usualmente  en  los  trabajos  estadísticos  sobre  inferencias  se  utilizan  los 

cocientes  dados  por  las  expresiones    (15.21)  y  (15.22)  porque  son  variables  Chi‐

Page 18: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

382 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

cuadradas  que  se  encuentran  directamente  en  las  tablas  correspondientes  de  estas variables aleatorias, que se vieron  en el capítulo 13.  

 Ejemplo  15.8  Con  relación  al  ejemplo  15.3  en  el  cual  se  utilizan  medidas 

antropométricas  para  determinar  el  alcance  entre  los  tableros  de  control  y  los operadores,  si  se  toma  una  muestra  de  25   operadores  sentados    de  una población normal y se les mide la distancia efectiva, aunque la varianza de la población se desconoce,  los registros de  las  investigaciones previas sugieren que    la varianza de la población es de    4 16 . La probabilidad de que  la varianza de  la muestra exceda 20  , usando la expresión  (15.22), es  

 

20| 16 p1 20 25 1

16 30  De  la tablas de  la distribución Chi‐cuadrada, para    25, se tienen  25 1

24 g. de l. con lo cual la probabilidad está dentro del intervalo     0.10 20 0.20   Usualmente,  los  investigadores  están más  interesados  en  la  desviación  estándar 

que en la varianza, por lo que en lugar de tratar con la distribución muestral del error estándar, las probabilidades de   se obtienen aplicando la distribución Chi‐cuadrada en la evaluación del evento correspondiente de  ; así  3 es equivalente a    9 y 

5 es equivalente a   25.  Ejemplo 15.9 Un criterio usado en espectrometría basada en rayos infrarrojos, es la 

densidad  de  dislocación  del  cristal  del  laser.  Si  interesa más  la  consistencia  en    la densidad de dislocación   de cristal a cristal que en nivel medio absoluto, para  lo cual  se  desarrolló  un    experimento  con 15   cristales  cuyo  desplazamiento  dio  por resultado  530   y  90.  Para  hacer  comparaciones  a  un  cristal  cuya desviación  estándar  se  estimó  en  150   y  se  supuso  que  la  desviación estándar ‐o la varianza‐ de la población es la misma para los cristales experimentales; la probabilidad de haber obtenido estos resultados extremos, aplicando    la expresión  (15.22), es   

 

90| 150 p 5.04   

 Consultando  las  tablas  de  la  distribución  Chi‐cuadrada,  para    15,  se  tienen 

15 1 14 g. de l. se tiene que el valor de 5.04 queda comprendido entre 4.660 y 5.368 que corresponden a los valores  0.99 0.98  de la cola derecha, como la  probabilidad  solicitada  es  la  de  la  cola  izquierda,  aplican  las  probabilidades  complementarias y la probabilidad solicitada estará dentro del rango 

       0.01 90| 150 0.02     

Page 19: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 383  

En el estudio de la distribución Chi‐Cuadrada vimos que los grados de libertad eran igual al número de  las variables aleatorias estandarizas, o sea  , pero ahora que estudiamos los estadísticos de las varianzas  sesgada e insesgada demostramos que los grados  de  libertad  son  1.  Conviene  recordar  que  el  concepto  de  sesgo  se estudiará en el capítulo de estimación.     Una regla práctica para encontrar  los grados de  libertad consiste en restar al tamaño de  la muestra el número de parámetros que aparecen en la relación que liga al estimador con la variable aleatoria que se necesita para  calcular  las  probabilidades, NO  con  la  expresión  que  se  utiliza  para  calcular  el estimador; puesto que como vimos, ésta no contiene parámetros. 

Así, en  las expresiones   (15.23) y (15.24) aparece el parámetro   de    la población por  lo que  los grados de  libertad son  1, y en el cálculo de  las probabilidades del estadístico    se utilizará la distribución Chi‐Cuadrada con parámetros  

 1 2 1  

 Con los cuáles es posible hacer la aproximación de la distribución Chi‐Cuadrada a la 

distribución  normal  usando  la  relación  de  transformación  a  la  variable  aleatoria estandarizada 

 

                  (15.25) 

 Cuando el tamaño de  la muestra  30 puede usarse  la distribución normal para 

aproximar la distribución Chi‐Cuadrada.  Ejemplo  15.18 Con  relación  al  ejemplo  15.8,  si  se  toma  una muestra de  50  

operadores  sentados   de una población normal y  se  les mide el alcance efectivo,  se puede utilizar la aproximación a la normal puesto que la muestra es mayor que 30 con  

50 1 49 g. de l. para calcular la probabilidad solicitada.  

20| 16 p1 20 49

16 61.25  

 Cabe observar que este valor no se encuentra en las tablas, por lo tanto usamos la 

aproximación a la distribución normal  con la ecuación (15.25)  

20| 16 61.25 49

2 491.237 1 Φ 1.237

1 0.8907 0.1093    Aunque la varianza de la población se desconoce, los registros de las investigaciones 

previas sugieren que    la varianza de  la población es de    4 16 . La probabilidad de que  la  varianza de  la muestra  exceda  20  , usando  la  expresión  (15.22), es  

 

Page 20: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

384 | C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s      

20| 16 p1 20 25 1

16 30  De  la tablas de  la distribución Chi‐cuadrada, para    25, se tienen  25 1

24 g. de l. con lo cual la probabilidad está dentro del intervalo     0.10 20 0.20   Cabe  observar  que  en  este  capítulo  hemos  considerado  que  se  conocen  los 

parámetros  de  la  población,  lo  cual  generalmente  no  ocurre  por  lo  tanto  debemos estimarlos y, buscar  las expresiones para calcular  las probabilidades que es el objeto de la teoría de la estimación que se estudiara en un capítulo posterior. 

 

15.3.5  Distribución muestral del estadístico cociente de dos Varianzas  ‐  ‐ 

Si  se  muestrea  de  dos  poblaciones  etiquetadas  con  1  y  2    que  se  distribuyen normalmente con varianzas   , cuyos tamaños de las muestras son   y   no necesariamente del mismo  tamaño  respectivamente,  y  calculamos  el  cociente de  la ecuación (15.22) que contiene el  estadístico varianza, se tiene  

 1

1 ,  

 Este cociente es igual al cociente de dos variables aleatorias  , que corresponde  a 

la  definición  de  la  variable  aleatoria    con      1    y  1  grados  de libertad en el numerador y en el denominador, respectivamente; que estudiamos en el capítulo  de  las  distribuciones  aleatorias  continuas.  Por  lo  tanto,  al  cociente  de  los estadísticos varianza se le llama  estadístico   .  

 Ejemplo  15.19  Si  Para  estudiar  dos  tratamientos  diferentes  que  se  aplican  a  los 

pacientes de cierta enfermedad, se dividen   a  los pacientes en    las poblaciones 1,  los que  reciben el  tratamiento 1   y 2, a  los que  se  les aplica el  tratamiento 2. Si de  las poblaciones se sacan muestras de tamaños   16 y  11, los g. de l. asociados a las  varianzas  son  16 1 15    y  11 1 10,  y  el  cociente      tiene 

15 g. de l. en el numerador y    10 g. de l. en el denominador; si el valor del estadístico  fuese  3.25, consultando  las  tablas de  la distribución      se  tiene que dicho valor está comprendido entre los fractiles 0.95 ‐para el cual  2.85‐  y 0.975 ‐donde  3.52‐,  lo que significa que el valor de    3.25 se encuentra en el rango 0.05   a  0.025 de la cola derecha de la distribución.  

 Cabe  observar  que  en  este  capítulo  hemos  considerado  que  se  conocen  los 

parámetros de la población, pero como generalmente no ocurre en las investigaciones estadísticas, debemos estimar estos parámetros a partir de los datos de las muestras y 

Page 21: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

C a p í t u l o   1 5     L o s   E s t a d í s t i c o s   y   s u s   D i s t r i b u c i o n e s    | 385  

buscar  las expresiones para calcular  las probabilidades necesarias; y este es el objeto de la teoría de la estimación que se estudiara en un capítulo posterior. 

 15.4 Bibliografía y referencias  Lapin  L.  (1983)  PROBABILITY  AND  STATISTICS  FOR  MODERN  ENGINEERING, 

Brooks/Cole Engineering Division Monterey California USA.  Winkler R. & Hays W.  (1975), Statistics, PROBABILITY,  INFERENCE, AND DECISION, 

HOLT, RINEHART AND WINSTON, Second Edition, USA. Johnson N. Leone F. (1977), Statistics and Experimental design,  in Engineering and 

Physical Sciences, Vol. I, Second Edition, John Wiley &. USA.  Hines W. Montgomery D.  (1980),  PROBABILITY  AND  STATISTICS  IN  ENGINEERING 

AND MANAGEMENT SCIENCE, 2nd. ED., John Wiley & Sons, Canadá.      

Page 22: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONESdcb.fi-c.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf · teórica que relaciona los posibles valores de las medias de

Nombre de archivo:  CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONES.docx Directorio:  C:\Documents and Settings\bfc\Mis documentos\g‐1) 

Capítulos de mi libro de Probabilidad y estadística 2007‐2009 Plantilla:  C:\Documents and Settings\bfc\Datos de 

programa\Microsoft\Plantillas\Normal.dotm Título:   Asunto:   Autor:  fACULTAD DE INGENIERÍA Palabras clave:   Comentarios:   Fecha de creación:  05/01/2010 21:35:00 Cambio número:  42 Guardado el:  25/06/2010 20:10:00 Guardado por:  FACULTAD DE INGENIERÍA Tiempo de edición:  1,978 minutos Impreso el:  30/08/2010 13:09:00 Última impresión completa   Número de páginas:  21   Número de palabras:  7,562 (aprox.)   Número de caracteres:  41,591 (aprox.)