INFERENCIA ESTADÍSTICA MAT - 322

138
5/10/2018 INFERENCIAESTADSTICAMAT-322-slidepdf.com http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 1/138

Transcript of INFERENCIA ESTADÍSTICA MAT - 322

Page 1: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 1/138

Page 2: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 2/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.1

CUADERNO DE APUNTES DEL ESTUDIANTE

Inferencia Estadística

«Tampoco es inescrutable el azar, también está regido por un orden».

PRESENTACIÓN

Este cuaderno corresponde al módulo “Inferencia estadística”, que debe llevar al estudiante a ser capaz de:

Realizar pruebas de hipótesis estadísticas en el ámbito de los fenómenos económicos, financieros, comerciales, administrativosy sociales, demostrando capacidad para analizar e interpretar resultados numéricos estadísticos en contextos específicos.

El cuaderno está organizado en 14 CLASES. En cada una de ella se trata un tema relevante del programa y por eso, todas se

inician con la descripción de los aprendizajes esperados que debe lograr el estudiante.

Cada se clase se estructura en las siguientes secciones:

1º: Síntesis: es un resumen de los conceptos centrales involucrados en los aprendizajes de la clase. Asimismo, seencuentran las principales fórmulas y relaciones numéricas que sustentan la Estadística.

2º: Ejercicios resueltos: en esta sección se plantean ejercicios, problemas y casos representativos de la clase y seresuelven en detalle.

3º: Ejercicios propuestos: se plantean problemas aplicados en forma de preguntas de selección múltiple. A final de cadaclase se encuentran las claves correctas. Esta sección le permitirá al estudiante ejercitar los aprendizajes de la clase ypodrá autoevaluar su desempeño.

4º: Fuentes complementarias: en esta parte se sugieren fuentes de información alternativos, donde el estudiante podráencontrar información y ejercicios. En esta misma, además, se sugieren actividades de aprendizaje complementariaspara quienes se interesen.

Problemas de recapitulación :

Al final del cuaderno se presentan una colección de casos para su resolución, orientados a la preparación del examen demódulo.

Uso de calculadora:

Para trabajar con el presente cuaderno, el o la estudiante debe usar calculadora científica. En este apunte se considera unacalculadora Casio fx-350MS, cuyo uso debe serle familiar.

Inferencia estadística:

Inferir es sacar una conclusión a partir de algunas premisas iniciales. Por eso es posible distinguir dos clases de inferencia; ladeductiva, que va desde lo general a lo particular y la inductiva, que procede desde lo particular a lo general. Como la inferenciaestadística se concretiza a través de hacer afirmaciones acerca de una población a partir de datos de una muestra, estaconstituye, en concreto, un caso de inferencia inductiva.

En una inferencia inductiva, la conclusión se apoya en las premisas obtenidas de casos particulares, pero éstas, en el mejor delos casos, solo la hacen probable. De aquí que la teoría de la probabilidad se erija en el pilar de la inferencia estadística. Por este motivo, en este cuaderno, primero se establecen las bases del cálculo de probabilidades y luego, en una segunda unidad,se desarrollan las aplicaciones básicas de los métodos de inferencia más usuales en la estadística.

Page 3: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 3/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.2

Índice

PROGRAMA 3

CLASE 1: Introducción al cálculo de probabilidades 5

CLASE 2: Probabilidad de sucesos condicionales 16

CLASE 3: El modelo de probabilidad binomial 25

CLASE 4: El modelo de probabilidad de Poisson 31

CLASE 5: El modelo de probabilidad normal 37

CLASE 6: Conceptos básicos de inferencia estadística 47

CLASE 7: Intervalos de confianza para la media 55

CLASE 8: Intervalos de confianza para la proporción 63

CLASE 9: Cálculo del tamaño de la muestra 71

CLASE 10: Introducción al contraste de hipótesis 80

CLASE 11: Contraste de hipótesis de proporciones 89

CLASE 12: Contraste de la diferencia de proporciones 98

CLASE 13: Contraste de hipótesis de la media 107

CLASE 14: Contraste de la diferencia de medias 118

PROBLEMAS DE RECAPITULACIÓN 127

TABLA 1: Probabilidad inferior en distribución Z 133

TABLA 2: Probabilidad superior en distribución Z 134

TABLA 3: Percentil de distribución t 135

TABLA 4: Probabilidad superior de distribución t 136

Page 4: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 4/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.3

I: IDENTIFICACIÓN

NOMBRE DEL MÓDULO:  INFERENCIA ESTADÍSTICA

UNIDAD DE COMPETENCIA: Al finalizar el módulo los participantes serán capaces de: Realizar pruebas de hipótesis estadísticas en el ámbito de los fenómenoseconómicos, financieros, comerciales, administrativos y sociales, demostrandocapacidad para analizar e interpretar resultados numéricos estadísticos encontextos específicos.

DURACIÓN: 72 horas pedagógicas

II: DESCRIPCIÓN POR ÁREA DE FORMACIÓN Y PRERREQUISITOÁrea de formación: general diferenciadaUbicación: depende de la carreraPrerrequisito: depende de la carrera

III: UNIDADES DE APRENDIZAJE1ª UNIDAD: Fundamentos del cálculo de probabilidades 

DURACIÓN: 24 horas pedagógicas

Aprendizajes Esperados  Contenidos

-Explican el concepto de probabilidad y suceso aleatorio.-Aplican la definición clásica de probabilidad al cálculo de probabilidadsimple en casos sencillos.-Identifican los axiomas y teoremas básicos de las probabilidades.-Traducen eventos del lenguaje corriente al lenguaje algebraico yviceversa, en el contexto de problemas de aplicación.-Resuelven problemas que involucran el cálculo de probabilidad simple.-Resuelven problemas que involucran el cálculo de probabilidad desucesos contrarios.-Resuelven problemas que involucran el cálculo de probabilidad desucesos mutuamente excluyentes.-Resuelven problemas que involucran el cálculo de probabilidad desucesos independientes.-Resuelven problemas que involucran el cálculo de probabilidad desucesos condicionales.-Calculan el valor esperado y la varianza de una distribución deprobabilidad.-Identifican el modelo de probabilidad binomial y los parámetros que lodefinen.-Resuelven problemas que involucran operar con el modelo deprobabilidad binomial.-Identifican el modelo de probabilidad de Poisson y los parámetros quelo definen.

-Resuelven problemas que involucran operar con el modelo de Poisson.-Identifican el modelo de probabilidad normal y los parámetros que lodefinen.- Identifican el modelo de probabilidad normal estándar y los parámetrosque lo definen.-Calculan área bajo la curva normal utilizando tablas de la curva normalestándar.-Calculan percentiles de la distribución normal estándar mediante tabla.

-Sucesos aleatorios y concepto deprobabilidad-Definición clásica de la probabilidad-Axiomática de probabilidades-Álgebra de eventos-Cálculo de probabilidad de sucesos:

• simples

• contrarios• mutuamente excluyentes

• independientes• condicionales

-Concepto de valor esperado y varianza.

-Modelos de probabilidad discreta:• binomial

• Poisson.

-Modelos de probabilidad continua:

• curva normal.• curva normal estándar.

-Cálculo de probabilidades y percentilescon la curva normal estándar.

Page 5: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 5/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.4

2ª UNIDAD: Teoría elemental de muestreo e intervalos de confianza DURACIÓN: 16 horas pedagógicas

Aprendizajes Esperados  Contenidos

-Explican el concepto de muestreo.-Identifican distribución muestral de medias y su relación con la normal.

-Explican el concepto de error y confianza.-Explican el concepto de error muestral.-Identifican el concepto de estimación, demostrando conocimiento delos distintos parámetros y sus respectivos estadígrafos.-Calculan el error estándar para la media con datos muestrales dados.-Explican la influencia del tamaño de la muestra en el error.-Calculan intervalos de confianza para la media con varianza conocida.

-Calculan el error estándar de proporciones con datos muestralesdados.-Calculan intervalos de confianza para la proporción poblacional conmuestra grande.-Calculan el tamaño de muestra para un intervalo de confianza con errordado.

-Concepto de muestreo y los estadísticosmuestrales como variable aleatoria.

-Concepto de confianza y error.-Concepto de error muestral o estándar.-Concepto de estimación y de estimaciónpor intervalos.-Cálculo del error muestral para la mediacon varianza conocida.-Cálculo de intervalos de confianza para lamedia con varianza conocida.-Cálculo del error muestral para unaproporción.-Cálculo de intervalos de confianza parauna proporción.-Tamaño de la muestra

3ª UNIDAD: Dócimas de hipótesis DURACIÓN: 32 horas pedagógicas

Aprendizajes Esperados  Contenidos

-Identifican concepto de hipótesis estadística.-Explican los errores de tipo I y de tipo II presentes en una decisión.-Identifican hipótesis nula y alternativa en casos dados.-Plantean correctamente hipótesis estadísticas (H0 y H1).-Identifican los pasos de la metodología clásica de docimasia dehipótesis.-Identifican ensayos de cola izquierda, cola derecha y de dos colas ensituaciones dadas.-Realizan pruebas de hipótesis para proporciones.-Analizan e interpretan los resultados de la dócimas de hipótesis deproporciones en el contexto de casos dados.-Realizan pruebas de hipótesis para la diferencia de proporciones.-Analizan e interpretan los resultados de la dócimas de hipótesis dediferencia de proporciones en el contexto de casos dados.-Realizan pruebas de hipótesis para la media con varianza conocida.-Realizan pruebas de hipótesis para la media con varianza desconocida.-Analizan e interpretan los resultados de la dócimas de hipótesis demedias en el contexto de casos dados.-Realizan pruebas de hipótesis para la diferencia media con varianzasiguales y desconocidas.-Analizan e interpretan los resultados de la dócimas de hipótesis para ladiferencia media con varianzas iguales y desconocidas en el contextode casos dados.

-Hipótesis.-Error tipo I y tipo II.-Concepto de nivel de significación.-Planteamiento de hipótesis estadísticas-Metodología general para la prueba dehipótesis.

-Pruebas de hipótesis para proporciones.-Pruebas de hipótesis para la diferencia deproporciones.-Prueba de hipótesis para la media convarianza conocida.-Prueba de hipótesis para la media convarianza desconocida.-Prueba de hipótesis para la diferenciamedia con varianzas iguales ydesconocidas.

IV: BIBLIOGRAFÍA-Mendenhall/Beaver/Beaver. Introducción a la probabilidad y estadística. Edit. Thomson, 2002. ISBN: 970-686-195-5.-Ross, Sheldon M. Introducción a la estadística. Reverté, 2007. ISBN: 8429150390.

Page 6: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 6/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.5

1ª UNIDAD: FUNDAMENTOS DEL CÁLCULO DE PROBABILIDADES CLASE 1

Introducción al cálculo de probabilidades

«Dios juega a los dados y...

¡Además los tiene trucados!».

I. Prigogine1 

APRENDIZAJES ESPERADOS CONTENIDOS

-Explican el concepto de probabilidad y suceso aleatorio.-Aplican la definición clásica de probabilidad al cálculo de probabilidad simple en casos sencillos.-Identifican los axiomas y teoremas básicos de las probabilidades.-Traducen eventos del lenguaje corriente al lenguaje algebraico y viceversa, en el contexto deproblemas de aplicación.

-Resuelven problemas que involucran el cálculo de probabilidad simple.-Resuelven problemas que involucran el cálculo de probabilidad de sucesos contrarios.-Resuelven problemas que involucran el cálculo de probabilidad de sucesos mutuamenteexcluyentes.-Resuelven problemas que involucran el cálculo de probabilidad de sucesos independientes.

-Sucesos aleatorios y concepto deprobabilidad-Definición clásica de laprobabilidad-Axiomática de probabilidades

-Álgebra de eventos-Probabilidad simple-Cálculo de probabilidad desucesos:

•  simples

•  contrarios

•  mutuamente excluyentes

•  independientes

II. DESARROLLO

1. Concepto de probabilidad

1.1. Probablemente:

Según Max Black2, la palabra “ probablemente” implica “posiblemente” y excluye “seguramente”. Lo que esprobable ni esseguro, ni imposible. Todo el que dice que “probablemente extraerá una bola negra de una urna”, implica que es posible que seextraiga tal bola y también que no es seguro que vaya a ser así.

1.2. Probabilidad:

Es el grado de verosimilitud que se le atribuye a un enunciado, o el grado de certeza o confianza que pueden tener nuestrascreencias acerca de sucesos futuros. La probabilidad también puede expresarse mediante un valor numérico y, en ese caso, laprobabilidad es una medida de la posibilidad de un acontecimiento, expresada mediante un número real que va entre cero y uno.

2. Experimento aleatorio

Un experimento aleatorio es una acción que da origen a un fenómeno en cuyos resultados interviene el azar. En estosfenómenos, se pueden conocer todos los resultados posibles, pero no se puede predecir cuál de ellos ocurrirá. Un experimentoaleatorio se puede repetir todas las veces que se desee, pero sus resultados particulares no se pueden predecir. Losexperimentos aleatorios suele representarse por la letra E.

1 Con esta frase, Ilya Prigogine, premio Nóbel de química 1977, responde a Einstein la célebre frase “Dios no juega a los dados”. La idea deEinstein es dar a entender que el azar y la incertidumbre del mundo, no es sino prueba de la limitación del hombre para comprender el mundo

natural regido por leyes inflexibles. Prigogine, sin embargo, aboga por la concepción de un mundo azaroso, movedizo, impredecible. Sus ideas

han sido centrales en la elaboración de la llamada Teoría del Caos.2 Inducción y probabilidad, Cátedra, Madrid 1984.

Page 7: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 7/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.6

Por ejemplo, en el lanzamiento de un dado para observar qué número resulta, se puede determinar el conjunto de resultadosposibles (1, 2, 3, 4, 5, 6), pero no es posible predecir cuál de ellos resultará en determinado lanzamiento.

3. Espacio muestral (Ω)

Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa por la letra griega Ω.

Ejemplo: Experimento: E = lanzamiento de un dado

Espacio muestral: Ω = {1, 2, 3, 4, 5, 6}

4. Suceso aleatorio

Un suceso o evento es cualquier subconjunto del espacio muestral Ω. Generalmente se representan mediante las primerasletras mayúsculas: A, B, C, etc.

Ejemplo:

Experimento: E = lanzamiento de un dado.

Espacio muestral: Ω = {1, 2, 3, 4, 5, 6}

Suceso A: A = se obtiene número par.

A = {2, 4, 6}

5. Tipos de sucesos

5.1. Sucesos simples y compuestos:

  Sucesos simples: Cuando un evento puede ocurrir de una sola forma.

  Sucesos compuestos: Cuando un suceso puede ocurrir de diversas formas. Un suceso compuesto, a su vez, puededividirse en varios eventos simples.

Ejemplo: Lanzar un dado y observar si “resulta un número par”:

Este suceso está compuesto por los siguientes sucesos simples: Resulta el 2. Resulta el 4. Resulta el 6.

Entonces:

Resulta número par = Resulta el 2 o resulta el 4 o resulta el 6.

5.2. Suceso seguro:

Es aquel quesiempre se verifica como resultado de un experimento aleatorio.

A = Obtener un número entero del 1 al 6 al lanzar un dado normal.

A es un suceso seguro.

5.3. Suceso imposible:

Es aquel quenunca se verifica como resultado de un experimento aleatorio.

A = Obtener un número mayor que 6 al lanzar un dado normal.

A es un suceso imposible.

5.4. Suceso complementario o cont rario:

Dos sucesos son contrarios si uno es la negación lógica del otro.

A = Obtener Nº6 al lanzar un dado.

B = No obtener Nº6 al lanzar un dado.

Ay B son sucesos contrarios. Suelen representarse por A y A’, respectivamente.

Page 8: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 8/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.7

3.5. Sucesos mu tuamente excluyentes:

Dos o más sucesos son mutuamente excluyentes si no pueden ocurrir en forma simultánea.

A = Se obtiene Nº3 al lanzar un dado.

B = Se obtiene Nº4 al lanzar un dado.

A y B son sucesos mutuamente excluyentes. No pueden ocurrir ambos a la vez en el mismo experimento.

OBSERVACIÓN: Los sucesos contrarios son mutuamente excluyentes, pero, no todos los sucesos mutuamenteexcluyentes son contrarios.

5.6. Sucesos independientes:

Dos o más sucesos son independientes si la ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro.

A = Se obtiene Nº3 al lanzar un dado.

B = Se obtiene sello al lanzar una moneda.

A y B son sucesos independientes.

5.7. Sucesos condi cionales:

Dos sucesos A y B son condicionales si la probabilidad de ocurrencia del suceso B está condicionada a la ocurrencia de unsuceso anterior A.

6. Probabilidad de sucesos

6.1. Probabilidad de Laplace:

La probabilidad de que ocurra un suceso A se cuantifica a través de la razón entre el número de casos favorables al suceso A yel número total de casos posibles. Numéricamente puede expresarse como fracción, como decimal o como tanto por ciento.

posibles casos de N 

Asuceso al favorables casos de N  )A( P 

°°

=  

6.2. Enfoque de la probabilidad a prior i:

Consiste en determinar la probabilidad de un suceso que aún no ha sucedido.

Ejemplo: ¿Cuál es la probabilidad de obtener un número impar al lanzar una vez un dado normal?

Casos favorables: 3.

Casos totales: 6.

Entonces, aplicando la fórmula de Laplace:

P(Nº impar) =

2

1

6

3= .

6.3. Enfoque de la p robabilidad empírica:

Consiste en determinar la probabilidad de un suceso con los datos históricos de casos sucedidos. Es decir, se cuenta conantecedentes empíricos.

Page 9: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 9/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.8

Ejemplo: Se han lanzado dos monedas 25 veces, registrando los siguientes resultados:

Suceso Nº de observaciones

Cara – Cara

Sello – Cara

Cara – SelloSello – Sello

4

7

86

Total 25

¿Cuál es la probabilidad de obtener dos sellos?

Casos favorables: 6

Casos totales: 25

Entonces, aplicando la fórmula de Laplace:

P(2 sellos) =25

6= 0,24.

7. Álgebra de sucesos

7.1. Notación:

Si A y B son sucesos en el espacio muestral Ω. Entonces, hay sucesos básicos cuya representación algebraica es la que sepresenta en el siguiente cuadro.

Suceso Significado

A Ocurre el suceso A.

A’ No ocurre A.

(A o B) Ocurre A o B.(A y B) Ocurren A y B, ambos.

(A – B) Ocurre A y no ocurre B.

(B / A) Ocurre B, dado que ocurrió A

7.2. Diagramas de sucesos:

Si A y B son sucesos en el espacio muestral Ω, con el espacio muestral representado por un rectángulo y los sucesos por círculos. Entonces, la representación gráfica de los sucesos básicos es:

Lo sombreado Significado

A Ocurre el suceso A.

Ω  

A

Page 10: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 10/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.9

7. Axiomas y teoremas de la probabilidad

Si A y B son sucesos en el espacio muestral Ω y P(A) y P(B) sus respectivas probabilidades, entonces se verifican los siguientesaxiomas y propiedades:

7.1. Valores extremos de P:

10 ≤≤ )A( P   

La probabilidad de un suceso es un número real con un valor entre cero y 1, ambos valores inclusive.

7.2. Probabilidad del suceso imposible y del suceso seguro: 

P(A) = 0 ⇔ A = suceso imposible

P(A) = 1 ⇔ A = suceso seguro

•  Mientas más cercana a 1 es la probabilidad de un suceso, mayor grado de confianza de que ocurrirá.

•  Mientas más cercana a 0 es la probabilidad de un suceso, mayor grado de confianza de que NO ocurrirá.

7.3. Probabilidad de dos sucesos contrarios: 

Si A y A’ son sucesos contrarios, entonces:

P(A')= 1 – P(A) ⇒ P(A) + P(A') = 1

Lo sombreado Significado

A’ NO ocurre el suceso A.

Lo sombreado Significado

A o B Ocurre el suceso A o el B

Lo sombreado Significado

A y BOcurren A y B, ambos.

Lo sombreado Significado

A - B Ocurre A, pero no ocurre B

B

Ω  

BA B

Ω  

A

B

Ω  

BA B

B

Ω  

BA BA

Page 11: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 11/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.10

Se suele llamar p a la probabilidad de un suceso y q a la probabilidad del suceso contrario, entonces:

q = 1 – p ⇒ p + q = 1

Ejemplo: Cierto día, la probabilidad de que llueva es 0,35. Por lo tanto, la probabilidad de que no llueva es:

P(No lluvia) = 1 – P(Lluvia) = 1 – 0,35 = 0,65.

Si:

p = probabilidad de lluvia; q = probabilidad de NO lluvia.

p = 0,35; q = 0,65; p + q = 0,35 + 0,65 = 1

7.4. Probabilidad de sucesos mutuamente excluyentes:

P(A o B) = p(A) + p(B) ⇒ A y B son sucesos mutuamente excluyentes.

Esta propiedad es llamada también “regla de la suma de probabilidades”. Solo es válida para sucesos mutuamente excluyentes.

Esta regla se aplica cuando entre los sucesos hay un conectivo “o”.

Ejemplo: En una empresa trabajan 3 ejecutivos, 4 administrativos y 6 operarios. Si se selecciona una persona al azar, laprobabilidad de que sea un operario o un administrativo es:

Si O = selecciona un operario y A = selecciona un administrativo. Entonces:

P(O o A) = p(O) + P(A) =13

6+

13

4=

13

10= 0,7692

7.5. Probabilidad de su cesos independientes:

P(A y B) = P(A) · P(B) ⇒ A y B son sucesos independientes.

Esta propiedad es llamada también “regla del producto de probabilidades”. Solo es válida para sucesos independientes.

Esta regla se aplica cuando entre los sucesos hay un conectivo “y”.

Ejemplo: Si la probabilidad de lluvia es P(Ll) = 0,4 y la probabilidad de que corra viento es P(V) = 0,15, entonces, si ambosfenómenos son independientes, la probabilidad de que llueva con viento es:

P(V y Ll) = 0,15 · 0,4 = 0,06.

7.6. Probabilidad de diferencia de sucesos:

P(A – B) = P(A) – P(A y B)

Lo siguiente es equivalente:

P(A – B) = P(A y B’). Luego: P(A y B’) = P(A) – P(A y B)

Ejemplo: Si la probabilidad de lluvia es P(Ll) = 0,4 y la probabilidad de que corra viento es P(V) = 0,15, entonces, si ambosfenómenos son independientes, ¿cuál es la probabilidad de que llueva, pero no corra viento?

P(Ll – V) = P(Ll) – P(Ll y V) = 0,4 – 0,06 = 0,34

Page 12: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 12/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.11

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Trabajo y estudio 

Interesa estudiar la actividad de los jóvenes egresados de Educación Media, en cuanto su estudio y su trabajo. Se definen lossucesos E y T como:

E = estudia; T = trabaja.

1.1. Indique en lenguaje corriente el significado del suceso: (T – E)

1.2. Escriba algebraicamente el suceso: “trabaja, dado que no estudia”.

1.3. Dibuje un diagrama para el suceso: “Ni trabaja, ni estudia”.

1.4. Indique, en lenguaje corriente y en lenguaje algebraico el suceso representado en el diagrama siguiente:

Solución:

1.1. Del diagrama de álgebra de sucesos, se deduce que:

(T – E) = trabaja, pero no estudia. También es: trabaja y no estudia.

1.2. Del cuadro de álgebra de sucesos, se deduce que:

“Trabaja, dado que no estudia” = (T / E’)

1.3. Diagrama para el suceso: “Ni trabaja, ni estudia”.

1.4. Lo sombreado corresponde a:

(E – T) = Estudia, pero no trabaja.

O bien:

(E y T’) = Estudia y no trabaja.

2. Accidentes laborales

Para el estudio de ciertos accidentes laborales, se han definido los sucesos siguientes:

A = el accidente se produce por Acción insegura por parte del trabajador.

C = el accidente se produce por Condición insegura en el lugar de trabajo.

Se sabe que: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12

B

Ω  

BE T

Ω  

T EE

Page 13: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 13/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.12

2.1. Calcule P(A – C)

2.2. Calcule la probabilidad de accidente por Condición insegura, pero no por Acción insegura.

2.3. ¿Cuál es la probabilidad de que ocurra solo una de estas dos causas?

Solución:

Es conveniente trazar un diagrama, con las cantidades dadas:

2.1. P(A – C)

Esta es la probabilidad de accidente por Acción insegura, pero no por Condición insegura. En el diagrama esta probabilidad es0,44.

Aplicando el teorema correspondiente:

P(A – C) = P(A) – P(A y C)P(A – C) = 0,56 – 0,12 = 0,44

2.2. P(C – A)

Aplicando el teorema correspondiente:

P(C – A) = P(C) – P(A y C) = 0,48 – 0,12 = 0,36

Este resultado es consistente con la cifra del diagrama.

2.3. P(solo una de las causas)P(solo una de las causas) = P(solo A o solo C)

En el diagrama, la probabilidad de “solo A” es 0,44, mientras que de “solo C” es 0,36.

Como los sucesos son mutuamente excluyentes, entonces la probabilidad:

P(solo una de las causas) = 0,44 + 0,36 = 0,8.

3. Medicamento

Se sabe que de los clientes que entran a una farmacia a consultar por cierto medicamento, el 70% lo compra.

3.1. Si 3 clientes, independientes unos de otros, preguntan por el medicamento, ¿cuál es la probabilidad de que los tres locompren?

3.2. Si 2 clientes, independientes entre sí, preguntan por el medicamento, ¿cuál es la probabilidad que solo uno de ellos locompre?

3.3. Si 4 clientes, independientes unos de otros, entran a preguntar por el medicamento, ¿cuál es la probabilidad de que solo elcuarto lo compre?

B

Ω

0,120,44

0,36

AC

0,08

Page 14: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 14/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.13

Solución:

Sea: C = compra el medicamento; P(C) = 0,7. Luego, P(C’) = 0,3

3.1. Debe ocurrir el siguiente suceso: C y C y C

Aplicando la regla del producto, tenemos que:

P(los 3 compran) = 0,7 x 0,7 x 0,7 = 0,343

3.2. Debe ocurrir el siguiente suceso: C y C’ o C’ y C

Aplicando la regla del producto y de la suma, tenemos que:

P(solo uno compra) = 0,7 x 0,3 + 0,3 x 0,7 = 0,42

3.3. Debe ocurrir el siguiente suceso: C’ y C’ y C’ y C

Aplicando la regla del producto, tenemos:

P(solo el 4º compra) = 0,3 x 0,3 x 0,3 x 0,7 = 0,0189

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Virus informático

Se ha constatado que el 32% de los computadores PC están infectados con virus del tipo Spyware y que el 14% tiene virus deltipo Troyano, pero sin Spyware. Estas dos infecciones son independientes una de otra. Si S representa el suceso “TieneSpyware” y T el suceso “Tiene Troyano”, entonces:

1.1. Calcule P(T – S) =

A) 0,14 B) 0,18 C) 0,46 D) 0,54 E) 0,72

1.2. La probabilidad de que un computador no tenga ninguno de estos dos tipos de virus es:

A) 0,86 B) 0,54 C) 0,14 D) 0,46 E) 0, 68

1.3. La probabilidad de que un computador esté infectado de Troyano, pero no de Spyware, se escribe:

A) P(T’ y S’) B) P(T – S’) C) P(S y T’) D) P(T y S’) E) P(T o S’)

2. Venta de automóvilesEn la tabla adjunta, la variable aleatoria X = Nº de automóviles mensuales vendidos por vendedor (con x >2) y P(x) suprobabilidad:

X 3 4 5 6 7 8 o más

P(x) 0,07 0,21 p 0,19 0,11 0,09

2.1. La probabilidad de que un vendedor venda más de 4 automóviles en un mes es:

A) 0,33 B) 0,72 C) 0,28 D) 0,39 E) Faltan datos

Page 15: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 15/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.14

2.2. ¿Cuál es la probabilidad de que un vendedor venta en un mes, a lo más 4 automóviles?

A) 0,72 B) 0,39 C) 0,28 D) 0,21 E) 0,07

3. Sistema product ivo

Cierto sistema productivo del rubro alimentos, funciona con 2 motores independientes entre sí. La probabilidad de falla en cadauno de los motores es 0,05. El sistema funciona correctamente siempre y cuando haya, al menos, un motor funcionando.

3.1. ¿Cuál es la probabilidad de que solo uno de los motores funcione?

A) 0,0425 B) 0, 0475 C) 0,2815 D) 0,95 E) 0,095

3.2. ¿Cuál es la probabilidad de que el sistema funcione?

A) 0, 9975 B) 0, 9025 C) 0,4275 D) 0,095 E) 0,0475

4. Accidentes laborales mortales  

Se han investigado 1.476 accidentes laborales mortales, que, clasificados según sector de la actividad económica y sexo delafectado, se distribuyen de acuerdo a la siguiente tabla:

Accidentes laborales mortales según sector de actividad económica.

Sector de actividad Nº de casos Hombre Mujer

Servicios 331 187 144

Agrario 136 112 24

Industria 325 213 112

Construcción 684 668 16

TOTAL 1.476 1.180 296

4.1. De acuerdo a la tabla, en la muestra estudiada ¿cuál es la probabilidad de accidente mortal en el sector agrario?

A) 0,824 B) 0,4561 C) 0,1765 D) 0,0949 E) 0,0921

4.2. De acuerdo a la tabla, en la muestra estudiada, ¿cuál es la probabilidad de que la víctima sea mujer del sector servicio oagrario?

A) 0,1765 B) 0,4350 C) 0,5676 D) 0,1138 E) 0,3164

4.3. En la muestra estudiada, ¿cuál es la probabilidad de que la víctima sea un hombre del sector construcción?

A) 0,9766 B) 0,5661 C) 0,4526 D) 0,4634 E) 0,3721

Solución a problemas propuestos:1.1. A 1.2. B 1.3. D

2.1. B 2.2. C

3.1. E 3.2. A

4.1. E 4.2. D 4.3. C

Page 16: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 16/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.15

V. RECURSOS COMPLEMENTARIOS

1. Bibliografía para conceptos básicos de probabilidad:

-Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I.

2. Sitio Web: AULAFACILhttp://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htmCLASE 16. Cálculo de probabilidades CLASE 17. Probabilidad de sucesos 

3. Sitio Web: SECTOR MATEMÁTICAhttp://www.sectormatematica.cl/educmedia.htm Para descargar teoría y ejercicios de Probabilidades

Page 17: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 17/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.16

1ª UNIDAD: FUNDAMENTOS DEL CÁLCULO DE PROBABILIDADES CLASE 2

Probabilidad de sucesos condicionales

«El hombre tiene mil planes para sí mismo.

El azar, sólo uno para cada uno».

Mencio

APRENDIZAJES ESPERADOS CONTENIDOS

-Resuelven problemas que involucran el cálculo de probabilidad de sucesos condicionales. -Cálculo de probabilidad de sucesoscondicionales

II. DESARROLLO

1. Sucesos independientes

Si A y B son sucesos en el espacio muestral Ω y P(A) y P(B) sus respectivas probabilidades, entonces se pueden definir lossiguientes conceptos:

Se dice que el suceso A es independiente de suceso B, si

P(A / B) = P(A)

Esto es, que la probabilidad de que ocurra A, dado que ocurrió B, es simplemente P(A). En otras palabras, la ocurrencia de B noafecta, no interviene en la probabilidad de ocurrencia de A.

En otro caso, se dirá que A y B son condicionales o dependientes.

Para dos sucesos A y B, independientes, se verifica que:

P(A y B) = P(A) · P(B) (Ver teorema y ejemplos en la clase 1).

2. Probabilidad de sucesos condicionales

Sean A y B dos sucesos en el espacio muestral Ω y P(A) y P(B) sus respectivas probabilidades. Si la ocurrencia de A estácondicionada a la ocurrencia del suceso B, entonces, la probabilidad de que ocurra B, dado que ocurrió A está dada por:

P(B / A) =)(

)(

AP

ByAP(1)

De la relación (1), despejando, se obtiene que:

(P y B) = P(A) ⋅ P(B/A). (2)

Page 18: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 18/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.17

Ejemplo: Si P(A) = 0,4; P(B) = 0,3 y P(A y B) = 0,14; entonces:

P(A / B) =30

140

,

,= 0,4667

P(B / A) =40

140

,

,= 0,35

3. Teorema de la probabilidad total

Si un suceso A debe resultar en uno de los sucesos mutuamente excluyentes 1A , 2A , etc, entonces, la probabilidad de A es

igual a:

P(A) = P( 1A ) · P(A / 1A ) + P( 2A ) · P(A / 2A ) + … = )/(· )( ii AAPAPΣ ; con i = 1, 2, …

Este es el llamado teorema de la probabilidad total. 

4. Teorema de Bayes

De la relación de la probabilidad condicional (1):

P(B / A) =)(

)(

AP

ByAP 

Es posible hacerse la pregunta:

¿Cuál es la probabilidad de que haya ocurrido A, dado que ya ocurrió B?

Esta probabilidad está dado por:

P(A / B) =)(

)/(· )(

BP

ABPAP 

Este es el caso particular del teorema de Bayes, para dos sucesos.

Caso general:

Si 1A , 2A , etc, son sucesos mutuamente excluyentes cuya unión es el espacio muestral Ω , entonces, si B es cualquier 

suceso, es posible calcular la probabilidad de los sucesos 1A , 2A , etc, que pueden causar la ocurrencia de B, mediante:

P(i

A / B) =)/(· )(

)/(· )(

AiBPAP

ABPAP

i

ii

Σ; con i = 1, 2, …

Este es el llamado teorema de Bayes.3 

3 El teorema de Bayes, es un método adecuado para calcular la probabilidad de las hipótesis que se confirman mediante la inducción. Este teorema

fundamenta una predicción o generalización basada en la observación de hechos, mediante el cálculo de probabilidades. Se da también el nombre

de bayesiana a la decisión racional de maximizar la utilidad esperada o el valor estimado. Por este motivo, el teorema de Bayes tiene frecuentes

aplicaciones en la teoría de las decisiones.

Page 19: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 19/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.18

5. Diagrama de árbol

Un diagrama de árbol es un esquema gráfico que ayuda a analizar una situación de probabilidad condicional, cuando se debenproducir dos o más sucesos, uno después del otro. En este caso se muestran solo dos.

Este diagrama se desarrolla de izquierda a derecha (árbol horizontal), siguiendo las siguientes directrices:

1º: Cada suceso se representa por una rama, con bifurcaciones señaladas por las distintas posibilidades del suceso.En el diagrama, se definen dos ramas, pero pueden ser más.

2º: Cada rama parcial lleva especificada su respectiva probabilidad. En cada suceso, la suma de las probabilidades desus ramas es 1. En el esquema, P(A) + P(B) = 1; P(C) + P(D) = 1; etc.

3º: El final de cada rama parcial se constituye en un nudo del cual parten nuevas ramas, según las posibilidades delsiguiente suceso.

4º: Cada secuencia de ramas constituye un suceso. Su probabilidad está dada por la regla del producto.5º: La suma de las probabilidades al final de cada secuencia de ramas es 1 (probabilidad total). En el diagrama, P(A yC) + P(A y D) + (B y E) + P(B y F)= 1

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Accidentes laborales:

Para el estudio de ciertos accidentes laborales, se definen los sucesos siguientes:

A = el accidente se produce por acción insegura por parte del trabajador.

C = el accidente se produce por condición insegura en el lugar de trabajo.

Se sabe que: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12

1.1. Calcule P(A / C)

1.2. Calcule la probabilidad de accidente por Condición insegura, dado que hubo Acción insegura.

1.3. ¿Son A y C, sucesos independientes?

A

C

D

B

E

F

P(A)

P(B)

P(C)

P(D)

P(E)

P(F)

P(A y C) = P(A) · P(C/A)

P(B y E) = P(B) · P(E/B)

P(A y D) = P(A) · P(D/A)

P(B y F) = P(B) · P(F/B)

SUCESO 1 SUCESO 2

Page 20: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 20/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.19

Solución:

1.1. P(A / C). Esta es la probabilidad de accidente por Acción insegura, dado que hubo Condición insegura.

Aplicando el teorema correspondiente:

P(A / C) =

)(

)(

CP

CyAP=

480

120

,

,= 0,25

1.2. P(C / A): Esta es la probabilidad de accidente por Condición insegura, dado que hubo Acción insegura.

Aplicando el teorema correspondiente:

P(C / A) =)(

)(

AP

CyAP=

560

120

,

,= 0,2143

1.3. Para que A y C sean independientes debe verificarse lo siguiente:

P(A) · P(C) = P(A y C)

Remplazando los valores dados: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12

0,56 · 0,48 = 0,12

≠26880, 0,12

Por lo tanto, A y C no son independientes.

2. Muestreo sin reposici ón

En una urna hay 4 fichas blancas y 5 negras de igual peso y tamaño. De esta caja, se extrae al azar y sin reposición, dos fichas.

¿Cuál es la probabilidad de que ambas resulten negras?

Solución:

Método 1:

Se trata de una situación de sucesos condicionales. Al no haber reposición, una vez que se extrae la primera ficha, para lasegunda extracción el espacio muestral se ha modificado, dependiendo del resultado de la primera.

En la primera extracción hay 5 negras de un total de 9. Por lo tanto:

P( 1N  ) =9

Para la segunda extracción hay solo 8 fichas (ya se extrajo una), de las cuales 4 son negras (ya salió una negra en la primera

extracción). Entonces:P( 2N  / 1N  ) =

8

4=

2

Para que ocurran ambos sucesos, se usa la regla del producto:

P( 1N  y 2N  / 1N  ) =9

2

1=

18

5= 0,2778

Page 21: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 21/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.20

Método 2:

Extraer una a una dos fichas sin reposición, es igual a extraer dos fichas simultáneamente. Entonces, es posible aplicar elconcepto de combinatoria4.

Las dos fichas negras se pueden combinar de )(2

5maneras distintas, de un total de )(

2

9casos posibles.

Aplicando la ecuación de Laplace:

)2

9(

)2

5(

negras)P(2 = = 0,2778

3. Faltas a la calidad

Una empresa que arma lavadoras automáticas tiene dos plantas A y B, que producen el 40% y el 60% de estos artefactos,respectivamente. Suponga que el 8% de los artefactos de la planta A y el 12% de los de la planta B presentan la misma falta decalidad (falla). Si se está frente a una lavadora con esta falla, interesa calcular la probabilidad de que el artefacto haya sidoarmado en la planta B.

3.1. ¿Cuál es la probabilidad de que esta empresa produzca artefactos con falla?3.2. Si se está frente a una lavadora con esta falla, ¿cuál es la probabilidad de que el artefacto haya sido armado en la planta B?

Solución:

Para comprender mejor la situación, de realizará un diagrama de árbol.

3.1. Se pide P(F):

Sumando los resultados del diagrama de árbol, de las secuencias que terminan en (1) y (3::

P(F) = 0,032 + 0,072 = 0,104 (Esto es, el 10,4% de los artefactos).

Aplicando directamente el teorema de la probabilidad total:

P(F) = P(A)· P(F/A) + P(B)· P(F/B) = 0,4 · 0,08 + 0,6 · 0,12 = 0,104

4 Ver al final de la clase, actividades complementarias.

A = Planta A

F = Con falla

F’ =Sin falla

B = Planta B

F =Con falla

F’ =Sin falla

0,4

0,6

0,08

0,92

0,12

0,88

P(F/A) = 0,4 · 0,08 = 0,032

P(F/B) = 0,6 · 0,12 = 0,072

P(F’/A) = 0,4 · 0,92 = 0,368

P(F’/B) = 0,6· 0,88 = 0,528

(1)

(2)

(3)

(4)

Page 22: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 22/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.21

3.2. Si se está frente a una lavadora con esta falla, ¿cuál es la probabilidad de que el artefacto haya sido armado en la planta B?

Se pide determinar: P(B / F)

Aplicando el teorema de la probabilidad condicional, y sacando los valores de las respectivas ramas del árbol y el resultadoanterior:

P(B / F) =P(F)

F)yP(B=

0,104

0,072= 0,6923

Aplicando directamente el teorema de Bayes:

P(B / F) =)(

)/(· )(

FP

BFPBP=

0,104

0,12·0,6= 0,6923

4. Casados, urbanos y rurales

En cierta región, el 35% de los hombres mayores de 18 años vive en zonas rurales y el 65% en zonas urbanas. En las zonasrurales, el 80% de los hombres mayores de 18 años está casado, mientras que en las zonas urbanas ese % es solo del 60%.

4.1. ¿Cuál es la probabilidad de que en esta región un hombre de esta población esté casado?

4.2. Si se encuentra en esta población un hombre casado, ¿cuál es la probabilidad de que provenga de la zona rural?

Solución:

Sean los siguientes sucesos:

R = hombre mayor de 18 años de zonas rurales.

U = hombre mayor de 18 años de zonas urbanas.

Nótese que, tal como está planteado el problema, U y R son complementarios.

C/R = casado, dado que es de zona ruralC/U = casado, dado que es de zona urbana

C = hombre de la región, mayor de 18 años, casado.

Nótese que el suceso C es condicional, ya que este estado civil depende de la zona U o R de donde provenga el hombre.

Trasladando los datos dados en %, a probabilidad, se tiene:

P(R) = 0,35 y P(U) = 0,65

P(C/R) = 0,8 y P(C/U) = 0,6

Para una mejor comprensión y cálculo, es posible trazar un diagrama de árbol como el siguiente:

Rural y Casado =

Urbana

RuralCasado / R

NO casado / R

Casado / U

NO casado / U

0,35

0,65

0,8

0,2

0,6

0,4

⇒ Urbano y Casado =

0,35 x 0,8 = 0,28

0,65 x 0,6 = 0,39

Page 23: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 23/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.22

3.1. Los casados pueden ser de la zona R o de la zona U, siendo aplicable la regla de la suma de probabilidades:

Entonces, con los datos del diagrama:

P(C) = P(C/R) + P(C/U) = 0,28 + 0,39 = 0,67.

También puede ser calculada esta probabilidad, aplicando directamente el teorema de la probabilidad total.

3.2. Se pide: P(R / C’) =

Desarrollando, con los datos del diagrama: P(R / C’) =)P(C'

)CyP(R '=

0,67-1

0,2·0,35= 0,2121

También puede ser calculada esta probabilidad, aplicando directamente el teorema de Bayes.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Agricultores

En cierto sector agrícola, el 60% de los agricultores siembra trigo. De estos, el 75% usa semilla seleccionada. Si se selecciona alazar un agricultor de este sector, ¿cuál es la probabilidad de que haya sembrado trigo sin semilla seleccionada?

A) 0,125 B) 0,15 C) 0,25 D) 0,40 E) 0,45

2. Gripe

En una comuna donde el 60% de sus habitantes son mujeres, se produce una epidemia de gripe que afecta al 15% de loshombres y al 5% de las mujeres.

¿Cuál es la probabilidad de que un habitante de esta comuna tenga gripe?

A) 0,40 B) 0,20 C) 0,24 D) 0,09 E) 0,06

3. Estudio del mercado de refrescos

Según un estudio, se prueban tres sabores de refresco A, B y C, entre hombres (H) y mujeres (M).

El estudio permitió construir la siguiente tabla de probabilidades de preferencias:

REFRESCOSEXO

A B C

HOMBRE 0,1 0,05 0,25

MUJER 0,15 0,3 0,15

De acuerdo a estos datos:

3.1. Calcule P(B o C)

A) 0,75 B) 0,4 C) 0,35 D) 0,3 E) 0,25

3.2. La probabilidad P(H – A’) =

A) 0,4 B) 0,3 C) 0,2 D) 0,05 E) 0,1

Page 24: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 24/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.23

3.3. Calcule P(B / H) =

A) 0,4 B) 0,125 C) 0,05 D) 0,15 E) 0,25

3.4. Si se selecciona a una persona que gusta del refresco B, ¿cuál es la probabilidad de que sea mujer?

A) 0,35 B) 0,3 C) 0,857 D) 0,782 E) 0,627

4. Parceleros

Se ha comprobado que en la región de Aysén, el 75% de los parceleros son propietarios de las tierras que habitan. De ellos, el60% son mujeres. Entre los no propietarios, el 55% son hombres. Si esto es así:

4.1. La probabilidad de que un parcelero de esta región sea mujer es:

A) 0,5625 B) 0,525 C) 0,6 D) 0,135 E) 0,45

4.2. La probabilidad de que un parcelero de esta región sea hombre y propietario, es:

A) 0,125 B) 0,47 C) 0,135 D) 0,3 E) 0,45

4.3. ¿Cuál es la probabilidad de que un parcelero de esta región sea propietario, dado que es mujer?

A) 0,75 B) 0,45 C) 0,656 D) 0,812 E) 0,8

4.4. ¿Cuál es la probabilidad de que un parcelero de esta región sea hombre, dado que es no es propietario?

A) 0,435 B) 0,565 C) 0,55 D) 0,75 E) 0,25

Solución a problemas propuestos:1. B 2. D

3.1. A 3.2. E 3.3. B 3.4. C

4.1. A 4.4. D 4.3. E 4.4. C

V. RECURSOS COMPLEMENTARIOS1. Bibliografía para conceptos básicos de probabilidad:

-Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I.

2. Sitio Web: AULAFACILhttp://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htmCLASE 24. Teorema de la probabilidad total CLASE 25. Teorema de Bayes 

3. Sitio Web: SECTOR MATEMÁTICAhttp://www.sectormatematica.cl/educmedia.htm Para descargar teoría y ejercicios de Combinatoria

4. Combinator ia 

Los distintos grupos que se generan al seleccionar r elementos desde un conjunto de n elementos (con r  ≤ n), está dado por lacombinatoria:

Page 25: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 25/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.24

)!·(!

!)(

r nr 

n

nnCr 

−==  

Siendo n! el factorial de n.

Ejemplo: De un curso de 32 estudiantes se debe elegir una comisión de 5 estudiantes. ¿Cuántas distintas comisiones podrían

formarse?

Esto corresponde a la combinatoria 32C5, que también se puede escribir como )(5

32y se lee “32 sobre 5”.

Ingresando los valores a la calculadora:

32 nCr 5 =

201376

Ejercicios complementarios:

Ejercicio 1: Calcule)(

)(

3

83

5

=

Ejercicio 2: Calcule

)(

)(· )(

5

92

4

3

5

=

Ejercicio 3: Calcule de cuántas maneras diferentes pueden elegirse al azar 3 personas desde un grupo de 7.

Ejercicio 4: ¿Cuántas combinaciones son posibles en un juego de azar El Loto?

Page 26: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 26/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.25

1ª UNIDAD: FUNDAMENTOS DEL CÁLCULO DE PROBABILIDADES CLASE 3

El modelo de probabilidad binomial

«Los dioses nos dan muchas sorpresas:

lo esperado no se cumple y para lo inesperado un dios abre la puerta».

Eurípides

APRENDIZAJES ESPERADOS CONTENIDOS

-Identifican el modelo de probabilidad binomial y los parámetros que lo definen.-Calculan el valor esperado y la varianza de una distribución de probabilidad binomial.-Resuelven problemas que involucran operar con el modelo de probabilidad binomial.

-Concepto de valor esperado yvarianza.-Modelos de probabilidad discreta:

•  binomial

II. DESARROLLO

1. El experimento

El experimento binomial es el siguiente:

Se tiene una población grande en la cual se conoce la probabilidad p  de un suceso A, o de encontrar un individuo con una

característica A.5 

Se extrae desde esta población una muestra aleatoria de tamaño n .

Interesa saber cuál es la probabilidad de que resulten 0, 1, 2, ... n  sujetos con la característica A en la muestra.

2. El modelo b inomial

Esta probabilidad está dada por la función:

xnx qpx

nxP −= · · )()( ; con x = 0, 1, 2,...n

Siendo:

=n  tamaño de la muestra

=p  probabilidad en la población; p q  −= 1  

=x  Número de éxitos en la muestra=)( xP Probabilidad de obtener x éxitos en la muestra de tamaño n.

Importante:

•  Como el dominio de la función son solo números enteros, esta es una función de probabilidad discreta.

•  La probabilidad de un valor x cualquiera está dada por el valor de la función para esa x.

•  1Pi =Σ . La suma de todas probabilidades parciales es 1.

5 Se le llama binomial a una población en la cual un experimento solo puede ocurrir de dos maneras mutuamente excluyentes.

Page 27: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 27/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.26

Ejemplo: En la empresa Alka S. A., el 12,7% de las ausencias de trabajadores tiene como causa accidentes de trayecto. Si seextrae una muestra de 25 trabajadores ausentes de esta empresa, ¿cuál es la probabilidad de que en 10 de ellos haya sido por accidente de trayecto?

En este caso se dan las condiciones para aplicar el modelo binomial:

p = 0,127 es la probabilidad conocida en la población.

=n  25. Es la muestra

X = Nº de ausencias por accidente de trayecto, con x = 0, 1, 2, …, 25.

3. Parámetros del modelo binomial

Los parámetros que definen el modelo son n y p.

En el ejemplo anterior: n = 25 y p = 0,32

Entonces, para el ejemplo, la función de probabilidad queda definida por:

x25x 87301270x25xP −= ,· ,· )()( ; con x = 0, 1, 2,...25

Siendo X = número de ausencias por accidente de trayecto en una muestra de 25.

Vale decir, que solamente se requieren n y p para establecer un modelo binomial, siempre y cuando se cumplan las condicionesespecificadas.

4. Características del modelo binomial

Valor esperado: E(x) = n · p

Varianza: V(x) = n · p · q

Desviación estándar: qpnx · · )( =σ  

En el caso de ejemplo dado:

Valor esperado: E(x) = 25 · 0,32 = 8

Varianza: V(x) = 25 · 0,32 · 0,68 = 5,44

Desviación estándar: 445x ,)( =σ = 2,3324

5. Supuestos, aplicaciones y requisit os del modelo

•  Se trata de una población binomial.•  Se conoce el valor poblacional p . Esta p  es constante.

•  El muestreo se hace con reposición o desde una población muy grande.

•  La muestra es independiente.

•  El modelo funciona muy bien para p  cercano a 0,5.

•  El modelo no funciona bien para <p  0,1 o para >p  0,9.

•  No es necesario conocer el tamaño de la población.

Page 28: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 28/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.27

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Empresa de turismo

Una empresa de turismo sabe que el 26% de los adultos pensionados está dispuestos a realizar un viaje de placer. Estaempresa visita a estos clientes potenciales, seleccionándolos en forma aleatoria.

1.1. Si un vendedor visita a 12 pensionados, independientes unos de otros, ¿cuál es la probabilidad de que 5 de ellos esténdispuestos a realizar un viaje de placer?

1.2. Si un vendedor visita a 10 pensionados, ¿cuál es la probabilidad de que 3 o 4 de ellos estén dispuestos a realizar un viajede placer?

1.3. Si un vendedor visita a 6 pensionados, ¿cuál es la probabilidad de que a lo menos uno de ellos esté dispuestos a realizar unviaje de placer?

Solución:

Es una situación modelable a través del modelo binomial.

1.1. n = 12; p = 0,26 y x = 5

El modelo es el siguiente:

x12x 740260x

12xP −= ,· ,· )()( ; con x = 0, 1, 2,...12

Valorando la función para x = 5:

5125 7402605

125xP −== ,· ,· )()( = 0,1143

1.2. n = 10; p = 0,26 y x = 3 o 4

El modelo es el siguiente:

x10x 740260x

10xP −= ,· ,· )()( ; con x = 0, 1, 2,...10

Valorando la función para x = 3 y para x = 4:

73 7402603

103xP ,· ,· )()( == = 0,2563

64

7402604

10

4xP ,· ,· )()( == = 0,1576

)( 4ó3P = 0,2563 + 0,1576 = 0,4139

Page 29: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 29/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.28

1.3. n = 6; p = 0,26 y x ≥ 1

)(...)()()( 6xP2xP1xP1xp =++=+==≥  

En este caso es preferible calcular la probabilidad del suceso contrario:

)()( 0xP11xp =−=≥  

60 7402600

60xP ,· ,· )()( == = 0,1642

1642011xp ,)( −=≥ = 0,8358

2. Reclamos

Una empresa de servicios ha detectado que el 57% de los e-mails recibidos es por reclamos del servicio que prestan. Se realizaun estudio especial con 40 correos seleccionadas al azar de entre todos los recibidos.

2.1. Indique el modelo de probabilidad para el número de correos de reclamo en la muestra de 40.2.2. Calcule el valor esperado y desviación estándar de las correos de reclamo.

2.3. Calcule la probabilidad de que hayan 25 correos de reclamo en los 40 seleccionados.

Solución:

2.1. El modelo de probabilidad binomial es:

x40x 430570x

40xP −= ,· ,· )()( ; x = 0, 1, 2, 3... 40

Con X = número de correos de reclamo en la muestra de tamaño 40.

2.2. Valor esperado = 40 · 0,57 = 22,8 correos de reclamoDesviación estándar = 13343057040 ,,· ,·  = correos de reclamo

2.3. 1525 43057025

4025xP ,· ,· )()( == = 0, 1008

R: La probabilidad es 0, 1008. Corresponde al 10,08%.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Función de probabilidad:Se tiene la función de probabilidad siguiente:

x30x 4060x

30xP −= ,· ,· )()( ; con x = 0, 1, 2, 3...

1.1. El mayor valor que puede tomar x es:

A) 5 B) 24 C) 30 D) 100 E) ∞  

Page 30: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 30/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.29

1.2. Calcular P(x = 13)

A) 0,0269 B) 0,2654 C) 0,8451 D) 0,1245 E) 0,1478

1.3. El valor esperado y la desviación estándar de la distribución es, respectivamente:

A) 12 y 0,24 B) 12 y 7,2 C) 18 y 0,24 D) 18 y 7,2 E) 18 y 2,68

2. Modelo binomial

Acerca del modelo binomial se afirma que:

I: Está definido por dos parámetros solamente

II: Se puede aplicar efectivamente con cualquier valor de p

III: Se puede usar aun si se desconoce el tamaño de la población

Es (son) correcta(s):

A) Solo I B) Solo I y II C) Solo II y III D) Solo I y III E) I, II y III

3. Compra-venta de automóviles

Se ha constatado que en 3 de cada 5 ventas de automóviles a matrimonios, la decisión de compra es de la mujer. En unaselección de 10 ventas a matrimonios tomadas al azar se desea saber la probabilidad de que en 7 de ellas la decisión de comprahaya sido de la mujer.

3.1. Si se aplica el modelo binomial el parámetro p es igual a:

A) 0,3 B) 0,4 C) 0,5 D) 0,6 E) 0,7

3.2. Si se aplica el modelo binomial el parámetro n es igual a:

A) 15 B) 10 C) 7 D) 5 E) 3

3.3. Si se aplica el modelo binomial el valor de x es igual a:

A) 3 B) 5 C) 7 D) 8 E) 10

4. Servicio de Internet

Una empresa de servicios de información y comunicaciones ha diagnosticado que en cierto sector residencial, solo 4 de cada 25hogares tiene conexión a Internet.

4.1. Si se visita un hogar al azar, la probabilidad de que no tenga conexión a Internet es:

A) 0,16 B) 0,32 C) 0,64 D) 0,72 E) 0,84

4.2. Si se visitan 8 hogares al azar, ¿cuál es la probabilidad de que 5 no tengan conexión a Internet?

A) 0,0959 B) 0,1681 C) 0,6250 D) 0,0721 E) 0,0840

4.3. Si se visitan 6 hogares al azar, ¿cuál es la probabilidad de que ninguno de ellos tenga conexión a Internet?

A) 0,1651 B) 0,3513 C) 0,3281 D) 0,4172 E) 0,2184

Page 31: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 31/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.30

Solución a problemas propuestos:1.1. C 1.2. A 1.3. E

2.1. D

3.1. D 3.2. B 3.3. C

4.1. E 4.2. A 4.3. B

V. RECURSOS COMPLEMENTARIOS1. Sitio Web: AULAFACILhttp://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htmCLASE 28. Distribuciones discretas: Binomial 

2. Aula virtual de Bioestadística: ver modelos de probabilidad

http://e-stadistica.bio.ucm.es/index.html 

Page 32: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 32/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.31

1ª UNIDAD: FUNDAMENTOS DEL CÁLCULO DE PROBABILIDADES CLASE 4

El modelo de probabilidad de Poisson

«Son distintas las aguas que cubren a los que entran en el mismo río.

Heráclito.

APRENDIZAJES ESPERADOS CONTENIDOS

-Identifican el modelo de probabilidad de Poisson y los parámetros que lo definen.-Calculan el valor esperado y la varianza de una distribución de probabilidad de Poisson.-Resuelven problemas que involucran operar con el modelo de Poisson.

-Concepto de valor esperado yvarianza.-Modelos de probabilidad discreta:

•  Poisson.

II. DESARROLLO

1. El experimento

Se tiene una población en la que se conoce el promedio de ocurrencia de un suceso por unidad de espacio, o de tiempo,volumen, etc. Si X representa el número de ocurrencias del suceso (0, 1, 2, …), e interesa saber cuál es probabilidad de queeste resulte 0, 1, 2, ... veces, es aplicable el modelo de Poisson.

2. El modelo de Poisson

Esta probabilidad está dada por la función de Poisson:

!

· )(

x

exP

xλ=

λ−

; con x = 0, 1, 2, ...

Siendo:

λ = promedio de éxitos por unidad de medida ( 0>λ ).

=)( xP Probabilidad de que se produzcan x éxitos.

X = número de éxitos por unidad de medida.

Además: e  = 2,71828...6 

Ejemplo de situaciones donde es aplicable el modelo de Poisson:

•  El número de llamadas telefónicas que entran a una central telefónica es de 12 por minuto.

•  Un promedio de 6,5 pacientes llegan a una central de urgencia, por cada hora.

•  Llegan 3,4 clientes a un cajero automático, por cada 10 minutos.

•  Se da un promedio de 2,5 fallas en la tela por cada 100 metros de tela.

En cada uno de estos casos existe un promedio de ocurrencia por cierta unidad de tiempo, espacio, volumen, etc. Este promedioes el parámetro λ de la función de Poisson.

6 Este e es un número irracional que surge de la expresiónx

x11 )( + cuando x tiende a infinito. Es, además, la base de los logaritmos naturales.

Page 33: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 33/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.32

Importante:

•  Como el dominio de la función son enteros, esta es una función de probabilidad discreta.

•  La probabilidad de un valor x cualquiera está dada por el valor de la función para esa x.

•  1Pi =Σ . La suma de todas probabilidades parciales es 1.

Ejemplo: Una empresa comercial del rubro retail ha constatado que, en promedio, 3,4 clientes de cada 10, pagan con dinero enefectivo.

En este caso se dan las condiciones para aplicar el modelo binomial:

λ = 3,4 clientes de cada 10.

X = Nº de clientes que pagan con efectivo.

3. Parámetros del modelo binomial

El parámetro que define el modelo de Poisson es solamente λ .

En el ejemplo: λ = 3,4

Entonces, para el ejemplo, la función de probabilidad queda definida por:

!

,· )(

,

x

43exP

x43−

= ; con x = 0, 1, 2, ...

Siendo X: número de clientes que pagan en efectivo, por cada 10 clientes.

Vale decir, que solamente se requiere λ para establecer un modelo de Poisson, siempre y cuando se cumplan las condicionesdefinidas.

4. Características del modelo de Poisson

Valor esperado: E(x) = λ  Varianza: V(x) = λ  

Desviación estándar: λ=σ )x (   

En el caso del ejemplo:

Valor esperado: E(x) = 3,4 clientes/por cada 10

Varianza: V(x) = 3,4

Desviación estándar: 43, )x (  =σ = 1,8439 clientes/por cada 10

5. Relación entre el modelo binomial y el modelo de Poisson

Es posible probar que entre el parámetro λ que caracteriza al modelo de Poisson, y los parámetros n y p de la binomial sepuede establecer la relación:

pn· =λ  

Esto hace que ambos modelos tengan cosas en común, pero también diferencias:

En el modelo Poisson, la probabilidad p es pequeña (menor que 0,1). Tanto es así, que el modelo es frecuentemente

identificado como el modelo de los sucesos extraños (poco frecuentes).

Page 34: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 34/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.33

6. Supuestos, aplicaciones y requisit os del modelo

•  Se conoce el valor poblacional λ o se tienen datos para calcularlo. Esta λ es constante.

•  El modelo funciona bien para λ entre 0,1 y 7.

•  El modelo funciona muy bien cuando <p  0,1, es decir, para “casos extraños” y n > 50.

•  El modelo funciona bien para p muy pequeño y n grande, tales que n· p < 7.

•  Una vez establecido el modelo, no se requiere conocer el tamaño de la muestra.

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Cajero automático

El número de personas que llegan cada 5 minutos a un cajero automático está dado por la función de probabilidad:

!

,· )(

,

x

64exf 

x64−

= , con x = 0, 1, 2, …

1.1. Calcule la probabilidad de que en el lapso de 5 minutos lleguen 7 personas a ese cajero.

1.2. Calcule la probabilidad de que en el lapso de 5 minutos lleguen 2 o 3 personas a ese cajero.

1.3. Calcule la probabilidad de que en el lapso de 4 minutos lleguen 6 personas a ese cajero.

Solución:

1.1. Calculando f(x=7) en la función:

!

,· )(

,

7

64e7xf 

764−

== = 0,0869

1.2. La probabilidad f(2 o 3) = f(x=2) + f(x=3), por la propiedad de la suma de sucesos mutuamente excluyentes.

!

,· )(

,

2

64e2xf 

264−

== = 0,1063

!

,· )(

,

3

64e3xf 

364−

== = 0,1631

Entonces:

f(2 o 3) = 0,1063 + 0,1631 = 0,2694

1.3. Primero hay que transformar el parámetro λ , desde clientes cada 5 minutos a clientes cada 4 minutos.

Aplicando proporciones:

utos4

clientes

utos5

clientes64

minmin

, λ=  

Despejando: λ = 3,68 clientes por cada 4 minutos.

Page 35: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 35/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.34

Ahora sí se puede proceder a valorar la función para x = 6.

!

,· )(

,

6

683e6xf 

6683−

== = 0,0670

2. Servicio de GPS

Una empresa de servicio de GPS tiene instalados 1.560 equipos en los vehículos de carga de cierta empresa. La probabilidad deque cualquiera de los equipos falle durante un mes es 0,003:

2.1. Plantee el modelo de probabilidad para el número de equipos que falla al mes.

2.2. Determine la probabilidad de que 4 equipos GPS fallen durante un mes;

2.3. Calcule la probabilidad de que más de un equipo falle durante un mes.

2.4. Calcule el valor esperado y desviación estándar de los equipos que fallan durante un mes.

Solución:

2.1. Se dan las condiciones para aplicar el modelo de Poisson:n = 1.560 equipos

p = 0,003; probabilidad de que un equipo falle durante un mes.

λ = n · p = 1.560 x 0,003 = 4,68 equipos, en promedio, fallan en un mes.

Es decir, se cumple un n grande y un p pequeño, tales que n · p < 5

Entonces, el modelo es:

!

,)(

,

x

684exf 

x684−−

= , con x = 0, 1, 2, …, 1.560.

X = número de equipos que pueden fallar en un mes, x = 0, 1, 2, 3,....,1.560 equipos.

2.2.!

,)(

,

4

684e4xf 

4684−

== = 0,1855

2.3. )()( 1xf 12xf  ≤−=≥ = 1 – [f(x = 0) + f(x = 1)]

f(x ≥ 2) = 1 – (!

,,

0

684e 0684−

+!

,,

1

684e 1684−

) = 1- (0,009279 + 0,04343) = 0,9473

2.4.

E(x) = λ = 4,68 equipos

σ (x) = 684,=λ = 2,16 equipos

Page 36: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 36/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.35

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Servidor 

Cierto servidor se “cae”, en promedio, 2,4 veces por cada 500 horas de funcionamiento continuado.

1.1. La probabilidad de que este servidor se caiga 2 veces en 500 horas de funcionamiento continuado es igual a:A) 0,3512 B) 0,4322 C) 0,1673 D) 0,2831 E) 0,2613

1.2. La probabilidad de que el servidor no se caiga en ese lapso de tiempo, es igual a:

A) 0,0 B) 0,0122 C) 0,0907 D) 0,2003 E) 0,1027

1.3. La probabilidad de que este servidor se caiga a lo más 2 veces en 500 horas, es:

A) 0,2613 B) 0,5697 C) 0,3917 D) 0,4790 E) 0,2177

1.4. El valor esperado y la varianza de esta distribución de probabilidades, respectivamente, son:

A) 2,4 y 2,4 B) 2,4 y 242, C) 2,4 y 42, D) 42, y 2,4 E) 42, y 242,  

2. Proceso industrial

Cierto proceso industrial produce una falla con probabilidad 0,0035 por cada hora de trabajo. Este proceso funciona las 24 horasdel día, todos los días, sin detención.

2.1. ¿Cuál es el valor del parámetro de Poisson, para las fallas en una semana de funcionamiento de este proceso?

A) 0,0035 B) 0,0245 C) 0,0840 D) 0,5880 E) 0,6542

2.2. ¿Cuál es la probabilidad de que el proceso genere 3 fallas en 4 semanas de funcionamiento?

A) 0,2352 B) 0,2064 C) 0,3764 D) 0,1329 E) 0,0349

3. Obras viales

En ciertas faenas de obras viales, la probabilidad de accidente laboral por mes sigue una distribución de Poisson con parámetro1,8.

3.1. La probabilidad de que en un mes no se produzcan accidentes laborales es:

A) 0,18 B) 0,6049 C) 0,1653 D) 0,3365 E) 0,1347

3.2. La probabilidad de que en un mes se produzca al menos 1 accidente laboral, es:

A) 0,2138 B) 0,4567 C) 0,5653 D) 0,8347 E) 0,7070

3.3. La probabilidad de que en un mes se produzca más de un accidente laboral es:

A) 0,2975 B) 0,4628 C) 0,8347 D) 0,7025 E) 0,5372

3.4. La probabilidad de que en un mes se produzcan 2 o 3 accidentes laborales es:

A) 0,4285 B) 0,2678 C) 0,1607 D) 0,2523 E) 0, 7227

Page 37: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 37/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.36

Solución a problemas propuestos:1.1. E 1.2. C 1.3. B 1.4. A

2.1. D 2.2. B

3.1. C 3.2. D 3.3. E 3.4. A

V. RECURSOS COMPLEMENTARIOS1. Bibliografía para conceptos básicos de probabilidad:

-Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I.

2. Sitio Web: AULAFACILhttp://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htmCLASE 29. Distribuciones discretas: Poisson 

3. Aula virtual de Bioestadística: ver modelos de probabilidad

http://e-stadistica.bio.ucm.es/index.html 

Page 38: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 38/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.37

1ª UNIDAD: FUNDAMENTOS DEL CÁLCULO DE PROBABILIDADES CLASE 5

El modelo de probabilidad normal

«Por perder un clavo, el caballo perdió la herradura, el jinete perdió al caballo,el jinete no combatió, la batalla se perdió, y con ella perdimos el reino ».

(Efecto mariposa)

APRENDIZAJES ESPERADOS CONTENIDOS

-Identifican el modelo de probabilidad normal y los parámetros que lo definen.- Identifican el modelo de probabilidad normal estándar y los parámetros que lo definen.

-Calculan área bajo la curva normal utilizando tablas de la curva normal estándar.

-Calculan percentiles de la distribución normal estándar mediante tabla.

-Modelos de probabilidad continua:

•  curva normal.

•  curva normal estándar.-Cálculo de probabilidades ypercentiles con la curva normalestándar.

II. DESARROLLO

1. El modelo no rmal

Si X es una variable normal, entonces su función de densidad de probabilidad está dada por:

2x21

e

2

1xf 

)()( σ

μ−−

πσ

= ; con +∞<<∞− x  

En esta función, x es variable aleatoria, que puede tomar cualquier valor real entre menos infinito e infinito. Este es, por lo tanto,un modelo de probabilidad continua.

2. Parámetros del modelo

Los parámetros del modelo son los valores μ y σ :

Media aritmética: μ  

Desviación estándar: σ  

Por esto, cada curva normal queda definida por su μ y su σ .

El gráfico típico de esta curva es el de una campana.

Si una variable se distribuye normalmente con media μ y varianza 2σ , se escribe de la siguiente manera:

X ~ N(μ ; 2σ )

Fig 5.1: Curva normal

x

Page 39: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 39/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.38

3. Principales propiedades de la curva normal

La curva normal tiene interesantes propiedades matemáticas. Sin embargo, para fines prácticos, las principales son:

•  La curva es asintótica respecto del eje x. Esto es, la curva no llega a intersectar al eje x por más que se prolongue.

•  La curva es simétrica respecto de la media μ .

•  El área total bajo la curva equivale al 100% de n.

•  Casi el 100% del área bajo la curva se halla entre comprendida en el intervalo: σ− 3x y σ+ 3x . Ver figura 5.2.•  La probabilidad en un punto x cualquiera es cero7.

•  La probabilidad entre dos valores de x es igual al área bajo la curva entre esos dos valores. Ver figura 5.3.

4. LA CURVA NORMAL ESTÁNDAR

Si en una distribución de probabilidad X, normal con media μ y desviación estándar σ , a cada valor de x se le resta la media

y se divide el resultado por la desviación estándar, se obtiene una nueva variable Z.

σμ−

=x

Z  

•  Cuando x es mayor que la media, z es positivo

•  Cuando x es menor que la media, z es negativo

•  Cuando x es igual a la media, z es cero

Este puntaje Z, describe la distancia, medida en unidades σ, a que se encuentra un valor x respecto de la media.

Por ejemplo, Z = -2,3 indica, por el signo -, que x se ubica a 2,3σ por debajo de la media.

Un puntaje Z = 1,6 indica, por el signo +, que x está a 1,6 σ sobre la media.

Esta variable Z, llamada también puntaje estándar, tiene muy interesantes propiedades.•  Es una variable aleatoria

•  Se distribuye normalmente

•  Tiene media aritmética cero

•  Su desviación estándar es 1

•  No tiene unidades

7 En una función de probabilidad discreta, el valor de la probabilidad en un punto es igual al valor de la función en ese punto.

X ~ N(25;24 )

Normal con media 25 y desv. St 4

x

13 17 21 25 29 33 37

%100≈

Fig 5.2: 

Probabilidad en la curva normal

xa b

P(a ≤ x ≤ b)

Fig 5.3: 

Page 40: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 40/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.39

Además, conserva las propiedades de toda curva normal:

•  Es simétrica respecto del cero

•  El área total bajo la curva es 1.

•  Prácticamente el total del área bajo la curva se halla entre z = -3 y z = 3.

5. Uso de la tabla Z

5.1. La tabla Z

El área bajo la curva normal se encuentra tabulada. Ver Tabla z en el anexo 1.

La tabla es cuestión:

•  Sirve para calcular el área bajo la curva desde ∞− hasta cualquier valor positivo de z. Tal como lo indica el áreaachurada del esquema gráfico. Por tal motivo esta tabla es denominada de “probabilidad inferior” o de “integralinferior”. Figura 5.5.

•  Los valores de z se expresan con 2 decimales.

•  La columna z indica el valor del entero, más 1 decimal.

•  El segundo decimal (centésima) se busca en la primera fila.

Z 0 0,01 0,02 0,03 0,04 …

1,6 0,9452 0,9463 0,9474 0,9484 0,9495

Por ejemplo, para calcular la probabilidad de que z ≤ 1,63:

1º: Se busca en la primera columna el valor 1,6.

2º: Se busca en la primera fila el valor 0,03, que corresponde al segundo decimal de 1,63.

3º: En el cruce de la fila con la columna está la probabilidad buscada.

P (z ≤ 1,63) = 0,9484

Nota: Para efectuar estos cálculos es conveniente trazar un esquema gráfico como el de la figura 5.6.

0 631,Z

Curva normal estándar

( 0=μ y σ = 1)

Z

-3 -2 -1 0 1 2 3

Fig 5.4:

0i z 

Z

Fig 5.5:

Fig 5.6:

Page 41: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 41/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.40

5.2. Cálculo de probabili dades en la normal estándar 

El cálculo de probabilidades en la normal se reduce al cálculo de áreas bajo la curva. Para ello es fundamental la tabla Z.

Ejemplo: Calcular P( z ≥ 1,72)

Esta probabilidad corresponde al área bajo la curva desde z = 1,72 hasta infinito. Ver región achurada en esquema.

De acuerdo a la tabla, el área bajo la curva situado en la cola inferior o a la izquierda de 1,72, es 0,9573.Por lo tanto, lo que está en la cola superior es igual a:

1 – 0,9573 = 0,0427; que es la probabilidad pedida.

Entonces: P( z ≥ 1,72) = 0,0427

5.3. Cálculo del percentil de Z

Consiste en calcular el valor de Z que deja bajo él, cierta probabilidad dada.

Ejemplo: Calcular  850,Z  

El percentil 85 de Z es un valor de Z que está sobre el 85% del área. Esto corresponde a una probabilidad 0,85.

1º: Se busca en la tabla Z, la probabilidad más cercana a 0,85. En este caso es 0,8508.

2º: En esa fila, en la columna Z, está el valor de z con un decimal. En este caso 1,0

3º: En la columna donde está el 0,8508 está el segundo decimal de Z. En este caso, 4.

Entonces, 850,Z = 1,04

Z 0,02 0,03 0,04 0,050,9 0,8212 0,8238 0,8264 0,8289

1,0 0,8461 0,8485 0,8508 0,8531

0 1,72 

Z

0,9573 

0,0427

0 Z=?Z

0,85

Fig 5.7:

Fig 5.8:

Page 42: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 42/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.41

6. Estandarización

Se llamaestandarizar una variable x normal, el convertir sus valores x por valores Z, aplicando la transformaciónσ

μ−=

xZ .

Esta operación tiene variadas aplicaciones, de las cuales en este apunte se verán solo algunas.

Ejemplo:

Se ha determinado que el ingreso mensual per cápita de los hogares de cierto barrio se distribuye normalmente con media$58.820 y desviación estándar $14.250.

Si esto es así, ¿cuál sería la ubicación relativa de un hogar con un ingreso mensual per cápita de $50 mil?

Solución:

1º: estandarizando medianteσ

μ−=

xZ

25014

8205800050Z

.

.. −= = -0,62

2º: Se calcula, con la tabla Z, la probabilidad: P(z ≥ -0,62)

P(z ≥ -0,62) = 0,7324

Respuesta: El ingreso de este hogar se ubica sobre el 26,76% de su población y por debajo el 73,24% de la misma.

Fig 5.9: Curva normal y normal estándar

Xσ−μ 3   σ−μ 2   σ−μ 1   μ   σ+μ 1   σ+μ 2   σ+μ 3  

-3 -2 -1 0 1 2 3Z

50000 

X($)

26,76%

58820

73,24%Fig 5.10:

Page 43: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 43/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.42

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Calcular P( z ≤ -0,78)

Solución:

Esta probabilidad corresponde al área bajo la curva desde z = -0,78, hasta ∞− . Ver región achurada en esquema.

Como la tabla no tiene áreas para Z negativos, se debe aprovechar la propiedad de simetría de la curva normal. Esto significaque para valores negativos de Z se cumple lo mismo que para valores positivos.

Según tabla Z, la probabilidad por debajo de Z = 0,78 es 0,7823.

Por lo tanto, P( z ≤ -0,78) = 0,2177

2. Calcular P(-1,43≤ z ≤ 0,81)

Solución:

Para los efectos, es conveniente trazar primero un esquema gráfico.

Según tabla, P(Z≥ 0,81) = 1 – 0,7910 = 0,2090

Y, además: P(Z≤ -1,43) = 1 – 0,9236 = 0,0764

Ya determinado el valor de las dos colas, que suman 0,2854, se determina el valor de la probabilidad pedida, correspondiente ala región achurada en el gráfico. Como el área total de la curva es 1, entonces:

P(-1,43≤ z ≤ 0,81) = 1 - 0,2854 = 0,7146

0Z

0,0764

0,2090

-1,43 0,81

0-0,78

¿? 

Z

0 0,78 

Z

0,7823 

0,2177

Fig 5.11:

Fig 5.12:

Fig 5.13:

Page 44: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 44/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.43

3. Calcular el valor del percentil 35 de Z.

Solución:

Para facilitar la resolución, se realiza un esquema gráfico de la situación:

Observando el esquema de la figura 5.14, se puede establecer que el Z es negativo.

Además, en la tabla no aparecerá la probabilidad p = 0,3500, ya que es una tabla que solo da los valores para z positivo.

Se aprovecha, entonces, la propiedad simétrica de la curva normal, buscando el valor para p = 0,65.

Buscando en la tabla el valor p = 0,65.

El valor más cercano es 0,6517, que corresponde a Z = 0,39.

Como Z buscado es negativo, entonces 350,Z = -0,39.

4. Consumo de electricidad

Se ha verificado que en cierto barrio, el consumo mensual de electricidad por hogar sigue una curva normal con media $19.820 ydesviación estándar $4.250.

¿Qué % de los hogares consumen más de $25 mil al mes en electricidad?

Solución:

Primero se esquematizará la situación en el siguiente gráfico:

En segundo lugar, se estandarizará el consumo de $25.000, medianteσ

μ−=

xZ .

25048201900025

Z.

.. −= = 1,22

Con esto, el problema se reduce al cálculo de la probabilidad sobre Z = 1,22.

Tercero: se calcula el valor de la probabilidad, mediante la tabla z.

P(z ≥ 1,22) = 0,1112

Finalmente, se convierte esta probabilidad en %. P = 11,12%.

Respuesta: el 11,12% de los hogares consumen más de $25 mil al mes en electricidad.

25000 

X($)

%?

19820 

1,22 

Z

p?

0Z

35% 

Z

Fig 5.14:

Fig 5.15:

Fig 5.16:

Page 45: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 45/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.44

5. Precio de mercado

Una empresa desea entrar al mercado con un producto cuyo precio en el mercado sigue una curva normal con media $8.400 ydesviación estándar $1.250.

Si la empresa se desea ubicar sobre el 25% de los precios de mercado, ¿En cuánto tendría que fijar el precio de su producto?

Solución:

Primero se esquematizará la situación en el siguiente gráfico (Fig 5.17):

En segundo lugar, se determinará el percentil 25 de Z.

Mediante tabla, se obtiene que 250,Z = -0,67

En tercer lugar se plantea que:σ

μ−=

xZ =-0,67

Reemplazando los valores:

6702501

4008x,

.

.−=

− 

Despejando x:

25016704008x .· ,. −=−  

58374008x ,. −=−  

58374008x ,. −=  

5647x .$=  Por lo tanto, si esta empresa desea ubicarse sobre al 25% de los precios de mercado, debería fijar su producto en $7.564.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Uso de tabla Z

1.1. Calcular P(-2 ≤ Z ≤ -1)

A) 0,9772 B) 0,8413 C) 0,1587 D) 0,0228 E) 0,1359

1.2. El valor aproximado de 120Z , es:

A) 1,19 B) 1,38 C) 1,62 D) -1,18 E) -3,03

2. Variable aleatoria normal

Se tiene una variable aleatoria X que se distribuye normalmente, con media 15 y desviación estándar 4.

2.1. La probabilidad de que X < 10 es:

A) 0,1056 B) 0,1524 C) 0,3944 D) 0,4256 E) 0,8944

x

X($)

25%

8400 

Fig 5.17:

Page 46: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 46/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.45

2.2. ¿Cuál es el valor del percentil 97,5 de X?

A) 7,2 B) 22,8 C) 15,6 D) 18,2 E) 2,5

3. Estudio de mercado

Un estudio de mercado determinó que la edad de los televidentes de cierto programa de TV se distribuye normalmente, conmedia 42 años y desviación estándar 5 años.

3.1. ¿Cuál es la probabilidad de que un televidente del programa tenga más de 40 años?

A) 0,1554 B) 0,3346 C) 0,6554 D) 0,7228 E) 0,8446

3.2. ¿Qué % de los televidentes de este programa tiene menos de 30 años?

A) Menos del 1%

B) Entre el 1% y el 2%

C) Aproximadamente el 5%

D) Aproximadamente el 8%

E) Más del 10%

3.3. ¿Cuál es la edad mínima que tiene el segmento del 15% de televidentes de este programa de mayor edad?

A) 43 años B) 44 años C) 45 años D) 47 años E) 49 años

4. Duración de repuesto

Una empresa provee un repuesto para un equipo audiovisual, especificando una duración que se distribuye normalmente conmedia de 480 horas de uso y desviación estándar 60 horas.

4.1. ¿Qué % de los repuestos dura menos de 400 horas de uso?

A) 5,1% B) 7,4% C) 9,2% D) 11,8% E) 13,6%

4.2. ¿Cuánto dura, como mínimo, el segmento del 25% de los repuestos de mayor duración?

A) 420 horas B) 440 horas C) 500 horas D) 515 horas E) 520 horas

4.3. ¿Cuál es la probabilidad de que un repuesto dure más de 500 horas de uso?

A) 0,1293 B) 0,3707 C) 0,3944 D) 0,3333 E) 0,6293

Solución a problemas propuestos:

1.1. E 1.2. D2.1. A 2.2. B

3.1. C 3.2. A 3.3. D

4.1. C 4.2. E 4.3. B

Page 47: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 47/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.46

V. RECURSOS COMPLEMENTARIOS

1. Bibliografía para conceptos básicos de probabilidad:

-Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I.

2. Sitio Web: AULAFACILhttp://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htmCLASE 34. Distribuciones continuas: Normal (I) CLASE 35. Distribuciones continuas: Normal (II) CLASE 36. Distribuciones continuas: Normal (III): Ejercicios CLASE 37. Distribuciones continuas: Normal (IV): Ejercicios 

3. Sitio Web: Fisterra. Metodología de la investigaciónhttp://www.fisterra.com/mbe/investiga/index.asp 

La Distribución Normal 

Page 48: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 48/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.47

2ª UNIDAD: TEORÍA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 6

Conceptos básicos de inferencia estadística

«Todo conocimiento conlleva el riesgo del error y de la ilusión».

E. Morin.

APRENDIZAJES ESPERADOS CONTENIDOS

-Explican el concepto de muestreo.-Identifican distribución muestral de medias y su relación con la normal.-Explican el concepto de error muestral.-Identifican el concepto de estimación, demostrando conocimiento de los distintos parámetros ysus respectivos estadígrafos.

-Concepto de muestreo y losestadísticos muestrales comovariable aleatoria.-Concepto de error muestral oestándar.

II. DESARROLLO

1. Inferencia estadística

1.1. Concepto de i nferencia

Inferir es sacar una conclusión a partir de algunas premisas iniciales. Por eso, es posible distinguir dos clases de inferencia; ladeductiva, que va desde lo general a lo particular y la inductiva, que procede desde lo particular a lo general. Como la inferenciaestadística consiste en hacer afirmaciones acerca de una población a partir de los datos de una muestra, esta constituye un casode inferencia inductiva. Ver esquema de la figura 6.1.

Por ejemplo, sobre la base de una encuesta telefónica aplicada a 845 clientes, un banco comercial puede obtener unaestimación del % de sus clientes que no está satisfecho con los servicios del banco.

Población

muestra

RESULTADOS

MUESTRALES

INFERENCIA

Fig 6.1: Esquema del proceso inferencial

Page 49: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 49/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.48

1.2. Estadígrafos y parámetros

Una de las formas de caracterizar y describir una muestra es a través de estadígrafos como el rango, la media, la desviaciónestándar, la mediana, etc. Todos estos son resultados muestrales y tienen también un valor en la población. Esto significa queexiste una media poblacional, una varianza poblacional, etc. Algunos ejemplos son los siguientes:

MEDIDA Estadígrafo

(muestral)

Parámetro

(poblacional)Media x   μ  

Varianza 2S   2σ  

Desviación estándar  S σ  

•  Estadígrafo: es una medida muestral

•  Parámetro: es una medida poblacional

Como los parámetros son desconocidos, se recurre a los estadígrafos para inferir sobre aquellos.

1.3. Dos clases de in ferencia 

Ya planteado el problema central de la inferencia estadística, esto es, cómo hacer afirmaciones acerca de los parámetros a partir de resultados muestrales, se pueden distinguir dos trabajos que enfrentan los métodos estadísticos de inferencia:

•  Estimación de parámetros: a partir de los resultados de la muestra se puede establecer el valor numérico de losparámetros.

Ejemplo: a partir de los datos de una muestra, se desea saber qué % de las empresas chilenas tienen deudas morosascon bancos.

•  Contraste de hipótesis: a partir de los resultados de la muestra se puede establecer si ciertas hipótesis acerca de los

parámetros poblacionales son verdaderos o no.Ejemplo: a partir de los datos de una muestra, se desea saber si el ingreso mensual promedio de los trabajadoreschilenos es o no menor a $215.000.

2. Muestreo

2.1. Concepto de muestreo:

Se denomina muestreo a la operación de seleccionar la muestra de la población a investigar. El principio fundamenta que guía elmuestreo estadístico es que todos los sujetos de la población tengan la misma probabilidad de salir seleccionados. De estemodo se logra una muestra estadística, que es la que funda la posibilidad de hacer inferencias válidas.

2.2. Trabajo con muestras:

2.2.1. Algunas ventajas de trabajar con muestras:

•  Es más rápido, ya que se estudian menos sujetos.

•  Es más barato, ya que al ser menos sujetos en estudio se requieren menos recursos.

•  Si la muestra es representativa, se obtienen resultados muy cercanos a la realidad poblacional.

•  Al ser menos los objetos de estudio, se les puede estudiar detalladamente.

Page 50: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 50/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.49

2.2.2. Algunas desventajas de trabajar con muestras:

•  Todo trabajo con muestras está sujeto a incertidumbre (error). Es imposible escapar de este fenómeno.

•  El trabajo con muestras requiere personal especializado.

•  Si la muestra no está bien seleccionada, se puede llegar a resultados erróneos.

•  El trabajo con muestras requiere técnicas estadísticas muy especializadas.

2.3. Importancia del muestreo:

Para los efectos de inferencia, es imprescindible que la muestra sea aleatoria, de otra manera no hay posibilidad de inferir enforma válida. Dicho de otro modo, solo es posible realizar inferencias válidas sobre la base de muestras aleatorias. Este tipo demuestra también se suele llamar muestra estadística.

Esta exigencia se debe a que todo el proceso de inferencia está basado en el cálculo de probabilidades.

2.4. Algunos tipos de muestreo:

Ejemplo: se ha de estudiar un total de 15 mujeres y 25 hombres que trabajan en cinco departamentos distintos de una empresa

de exportaciones. Para los efectos, se requiere seleccionar al azar un grupo de 8 personas.

2.4.1. Muestreo aleatorio simple: Consiste en asignar una identidad, generalmente un número, a cada uno de loselementos de la población. Se sortean los seleccionados mediante un mecanismo aleatorio, es decir, a través de unmétodo independiente del operador.

En el caso planteado:

A: Se puede colocar el nombre de cada uno de ellos en papelitos en una caja y luego extraer 8 papelitos.

B: También puede otorgarse un número entero del 1 al 40 a cada uno de ellos. Los seleccionados se pueden obtener depapelitos dentro de una caja, con una tómbola o empleando números al azar originados en una calculadora o programacomputacional.

2.4.2. Muestreo estratificado: consiste en seleccionar la muestra con una composición referida a una característicaconocida en la población. En el caso anterior, se puede estratificar respecto del género.Como los hombres representan el 62,5% del total, se calcula la proporción de la muestra que les corresponde. En estecaso, el 62,5% de 8 es 5. Por lo tanto, se seleccionarían 5 hombres y 3 mujeres.

2.4.3. Muestreo po r conglomerados: cuando los elementos a seleccionar están distribuidos en grupos más o menoshomogéneos (conglomerados), se puede seleccionar a algunos de ellos y luego elegir la muestra solo de losconglomerados seleccionados.

En este caso se pueden seleccionar aleatoriamente algunos de los cinco departamentos, por ejemplo, tres. Luego seselecciona dentro de ellos a los ocho trabajadores requeridos, en forma proporcional al tamaño de cada conglomerado,independiente del género.

2.5. Empleo de números aleatorios en la calculadoraLas calculadoras científicas tienen una función denominada RANDOM, que genera números al azar. La calculadora Casio fx-350MS (y similares) entrega número aleatorios que fluctúan entre 0,000 y 0,999.

Operación Resultado

SHIFT Ran# 0,561

Este número 0,569 es aleatorio. Se puede usar la primera décima (el 5) o los dos últimos (el 61), etc. según las necesidades.

Page 51: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 51/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.50

Hay una forma más elegante de obtener números aleatorios según requerimientos. Por ejemplo, para generar tres númerosaleatorios del 1 al 10, se opera así:

10 SHIFT Ran# + 1

La multiplicación por 10 convierte al número aleatorio en cifras que van del 0,00 al 9,99. Al sumarle 1 se convierten en númerosaleatorios del 1,00 al 10,99. Para los tres números requeridos se usa solo la parte entera de los números que resulten.

Operación Resultado

10 SHIFT Ran# + 1

= 5,43

= 2,76

= 1,33

Etc.

De los resultados, se toman los enteros: el 5, el 2 y el 1.

Nota: 

1) Cuando el estudiante realice esta operación, lo más probable es que resulten otros números.

2) Si se requieren números del 1 al 50 se hace: 50 SHIFT Ran# + 1, etc.

3. Distribución muestral de medias

3.1. El experimento:

Se tiene una población con una variable numérica X, con media μ y varianza 2σ .

Se extraen muestras de tamaño 1n , 2n , 3n ,… etc.

En cada una de las muestras se calcula la media aritmética: 1x , 2x , 3x ,… etc.

El sentido común dice que estas medias no tienen por qué ser iguales, aunque provengan de la misma población. En efecto, sise extraen todas las muestras posibles de una población, se verifica que las medias muestrales son diferentes. Entonces, esposible establecer lo siguiente:

•  Las medias muestrales constituyen unavariable.

•  Las medias muestrales constituyen unavariable aleatoria.

•  Como la media muestral es una variable aleatoria entonces tiene un valor esperado y una varianza.

3.2. Distribución de medias muestrales:

Las medias muestrales se distribuyen normalmente. Esto último puede resultar inesperado, pero el teorema central del límite asílo establece:

En una población con una variable numérica X, con media μ y varianza 2σ :

Las medias muestrales se distribuyen normalmente, con media μ y varianzan

2σ.

Page 52: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 52/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.51

Es decir:

•  La media de todas las medias muestrales es igual a la media poblacional μ de la variable X.

•  La varianza es la ene-ésima parte de la varianza de la variable X.

3.3. Error muestral o estándar de la media:Se llama error estándar oerror muestral a la desviación estándar de la distribución de medias muestrales y se simboliza xσ .

xσ =n

2σ. Este error estándar se suele expresar así:

xσ =n

σ(1)

3.4. Significado del error estándar de la media:

Como la media muestral es una variable, el error estándar corresponde a la variabilidad de la media. Esto significa que al extraer la media de una sola muestra, ese valor  x estará más o menos lejos del valor real μ . No se sabe cuánto, pero es posible

establecer ciertos márgenes de confianza a través del cálculo de probabilidades.

El significado más profundo que deja el concepto de error muestral, es que, a partir de una muestra, es imposible determinar conexactitud el valor de la media poblacional. Toda estimación estará afecta a un error o incertidumbre, de lo cual no podemosescapar.

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Se tiene una variable numérica X, que se distribuye normalmente con desviación estándar 10,8 Kg. Una muestra aleatoria detamaño 158 dio una media aritmética 32 Kg.

1.1. Calcule el error estándar de la media muestral:

1.2. ¿Cómo se distribuye la media muestral en esta variable?

Solución:

1.1. El error muestral de la media es igual a: xσ =n

σ.

Reemplazando:

Fig 6.2: Distribución

muestral de medias

μ x

Page 53: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 53/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.52

xσ =158

810,= 0,8592

El error muestral de la media es igual a 0,8592 Kg. Nótese que el error muestral conserva las unidades de la variable original.

1.2. La distribución muestral de la media siempre se distribuye normalmente. En este caso se distribuye normalmente con media31 Kg y desviación estándar 0,8592 Kg.

2. ¿Por qué se dice que la inferencia estadística es inductiva?

Solución:

Es inductiva porque aplica un razonamiento que va desde lo particular (lo que ocurre en una muestra) hacia lo general (lo queocurre en la población).

3. ¿Cuál es la diferencia entre un estadígrafo y un parámetro?

Solución:

El estadígrafo es el valor muestral, mientras que el parámetro es su valor poblacional.

4. ¿Cuál es la importancia del muestreo para la inferencia estadística?

Solución:

Si el muestreo es aleatorio, las inferencias son válidas.

5. ¿Cuál es la condición fundamental para obtener una muestra estadística?

Solución:

Que todos los elementos de la población tengan la misma probabilidad de salir seleccionados, a través de métodosindependientes de la voluntad del investigador.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Respecto de la inferencia estadística, se afirma que:

I: Es un proceso que va de lo general a lo particular 

II: Entrega resultados exactos de lo que ocurre en la población

III: Toma como referencia resultados de una muestra

Es (son) correcta(s):

A) Solo II B) Solo III C) Solo I y II D) Solo II y III E) Solo I y III

2. Según el texto, los métodos de inferencia estadística tienen por objeto:

A) Establecer la verdad de lo que ocurre en la población

B) Conocer en detalle las características de la muestra

C) Seleccionar las mejores muestras que sea posible

D) Hacer afirmaciones acerca de los parámetros en la población

E) Elegir entre los mejores parámetros poblacionales

Page 54: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 54/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.53

3. En estadística, el trabajo con muestras de una población, en vez de trabajar con toda la población, se fundamenta en que:

I: Muchas veces es imposible acceder a toda la población

II: Se desconoce lo que ocurre en la población

III: El trabajo con muestras tiene un menor costo

Es (son) correcta(s):A) Solo III B) Solo I y II C) Solo II y III D) Solo I y III E) I, II y III

4. De los siguientes, es (son) trabajo(s) de la inferencia estadística:

I: Decidir si ciertas hipótesis son verdaderas o no.

II: Hacer una estimación del valor de un parámetro

III: Organizar censos para determinar el valor de los parámetros

A) Solo I B) Solo II C) Solo I y II D) Solo II y III E) Solo I y III

5. El llamado teorema central del límite, en términos generales establece que:

A) Es imposible determinar el valor numérico de la media muestralB) La varianza poblacional jamás podrá ser conocida

C) Los parámetros poblacionales son difíciles de determinar 

D) Las medias son variables aleatorias

E) Las medias muestrales se distribuyen normalmente

6. Si una variable numérica tiene en la población media μ y varianza 2σ , entonces el error muestral de la distribución de

medias muestrales:

I: Se distribuye normalmente. II: Tiene media aritmética μ . III: Tiene varianzan

2σ 

Es (son) correcta(s):A) Ninguna B) Solo I y II C) Solo II y III D) Solo I y III E) Solo I, II y III

7. Tiempo de rehabilitación

El tiempo de rehabilitación de una muestra de trabajadores accidentados se distribuye normalmente con varianza 67 2días .Investigando una muestra aleatoria de 71 casos dio un tiempo medio de rehabilitación de 23 días.

7.1. La desviación estándar poblacional del tiempo de rehabilitación es igual a:

A) 8,19 B) 67 C) 23 D) 71 E) No se puede saber 

7.2. La media aritmética de la distribución de medias muestrales es igual a:

A) 71 B) 67 C) 23 D) 8,2 E) No se puede saber 

7.3. El error muestral de la distribución de medias muestrales es igual a:

A) 0,971 B) 2,73 C) 7,95 D) 1,71 E) 0,884

Page 55: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 55/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.54

8. La existencia del error estándar de la media muestral deja de manifiesto que:

A) Es posible determinar con exactitud la media poblacional a partir de una muestra

B) Los métodos de inferencia estadística son erróneos

C) No se deben utilizar muestras en los métodos estadísticos de inferencia

D) Es probable que la muestra no se haya elegido aleatoriamente

E) La media poblacional se puede conocer, pero con cierto grado de incertidumbre

Solución a problemas propuestos:1. B 2. D 3. D 4. C 5. E

6. B 7.1. A 7.2. C 7.3. A 8. E

V. RECURSOS COMPLEMENTARIOS

1. Teoría del muestreo

http://www.uaq.mx/matematicas/estadisticas/xstad02.html Unidad 6. Teoría de Muestreo Tamaño y obtención de muestras, el teorema central del límite, errores, estimaciones, variación muestral e intervalo deconfianza.

2. Teoría del muestreohttp://www.bioestadistica.freeservers.com/temas.html Tema 10. Teoría de muestras: Introducción. Muestras aleatorias y no aleatorias. Aplicaciones en Medicina. Distribuciones deprobabilidad en el muestreo: medias, proporciones, diferencia de dos medias y de dos proporciones. Ejemplos de aplicación.

3. Teoría del muestreohttp://ftp.medprev.uma.es/libro/html.htm 7.4 Técnicas de muestreo sobre una población 

4. AULAFACILhttp://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htmCLASE 38. Teorema Central del Límite CLASE 39. Teorema Central del Límite: Ejercicios (I) 

Page 56: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 56/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.55

2ª UNIDAD: TEORÍA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 7

Intervalos de confianza para la media

«Todo conocimiento conlleva el riesgo del error y de la ilusión».

E. Morin.

APRENDIZAJES ESPERADOS CONTENIDOS

-Calculan el error estándar para la media con datos muestrales dados.-Explican la influencia del tamaño de la muestra en el error.-Calculan intervalos de confianza para la media con varianza conocida.

-Concepto de estimación y deestimación por intervalos.-Cálculo del error muestral para lamedia con varianza conocida.-Cálculo de intervalos de confianzapara la media con varianzaconocida.

II. DESARROLLO

1. Fundamentos de la estimación

La estimación de parámetros es uno de los objetivos de la inferencia estadística. En el caso de la media, consiste en estimar elvalor numérico de la media poblacional a partir de los resultados muestrales.

El método más confiable es aquel que hace la estimación de un intervalo de confianza, dentro del cual se puede encontrar lamedia poblacional, con cierta probabilidad conocida.

Como la media muestral se distribuye normalmente con media μ y desviación estándar (error estándar)

n

σ, es posible usar el

modelo normal para establecer un intervalo de confianza (IC), dentro del cual se encuentre la media poblacional.

2. Confianza y signifi cación

2.1. Nivel de significación ( α ):

El nivel de significaciónα es el riesgo de error que asume el investigador para hacer una inferencia. Este error es laincertidumbre que está presente en toda investigación.

Los niveles de significación usuales son 0,10; 0,05 y 0,01, lo que en porcentaje corresponde al 10%, al 5% y al 1%,respectivamente.

% Confianza

μ x

 

Fig 7.1: Intervalo de

confianza para la media

Page 57: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 57/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.56

2.2. Nivel de confianza ( α−1 ):

Es el grado de certidumbre o confianza que el investigador quiere dar a su estimación. Se expresa en probabilidad o enporcentaje.

Son usuales en investigación:

( α−1 ) = 0,90 o 90%

( α−1 ) = 0,95 o 95%( α−1 ) = 0,99 o 99%

En la figura, la confianza ( α−1 ) está dada por el área achurada bajo la curva, mientras que la significación se divide en partesiguales en la cola superior e inferior de la curva normal. El intervalo de confianza está dado por los valores de la variable quequedan en el centro de la distribución, +/- cierto margen “e”, cuya longitud depende de la confianza que decide el investigador ydel error estándar de la media.

Nótese lo siguiente en el gráfico:

•  Al disminuir la confianza el intervalo se hace más preciso (menor longitud), pero aumenta la probabilidad de error  α .Se tiene más precisión, pero menos confianza.

•  Al aumentar a confianza, el intervalo se hace menos preciso (mayor longitud), pero disminuye la probabilidad de error α . Se tiene más confianza, pero menos precisión.

Como se verá más adelante, la única manera de aumentar la precisión sin disminuir la confianza es aumentando el tamaño de la

muestra.

3. Cálculo del intervalo de confianza para la media

3.1. Intervalo de confianza (IC):

El método consiste en determinar la media muestral y obtener un intervalo de confianza, sumándole y restándole a la media uncierto margen denominado error “e”, también llamado “error de investigación”.

ex±=μ  

Este error e está presente en toda investigación. El investigador fija este error como parte de su diseño de investigación.

El error de investigación “e” depende de dos factores:

1) La confianza que se desea tener (90%, 95%, 99%); y

2) El error muestral de la media ( xσ )

De este modo, se tiene que: 21Ze /α−= · xσ  

Reemplazando, se obtiene que el intervalo de confianza para la media poblacional está dado por:

x21Zx σ±=μ α− · / (1)

% Confianza

μ x

 

Fig 7.2: Intervalo de

confianza (1- α ) de la media

2α  

Page 58: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 58/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.57

De acuerdo a la relación (1), para determinar un intervalo de confianza (IC) se requiere:

:α−1 El nivel de confianza que se da el investigador.

:x La media muestral, que se calcula con los datos de la muestra.

21Z /α− : Es el percentil de la distribución Z, que depende de la confianza elegida.

xσ : El error estándar o muestral, que se calcula con los valores muestrales.

3.2. Niveles de confianza usuales:

Los niveles de confianza más usuales son 90%, 95% y 99%.

Valores usuales de 21Z /α− :

•  Para un intervalo de confianza del 90%: 21Z /α− = 1,645

•  Para un intervalo de confianza del 95%: 21Z /α− = 1,96

•  Para un intervalo de confianza del 99%: 21Z /α− = 2,58

3.3. Varianza conocida o desconocida:La varianza de la distribución de medias muestrales 2σ es importante para calcular el error estándar.

3.3.1. Cuando se conoce 2σ :

Cuando se conoce el parámetro σ , se usa el siguiente error estándar:

xσ =n

σ;

Donde σ es la desviación estándar de la población.

3.3.2. Cuando se desconoce 2σ :

Cuando se desconoce el parámetro σ , se puede usar la siguiente estimación:

xσ =1n

S

−;

Donde S es la desviación estándar de la muestra. (En la calculadora, nxσ ).

3.4. Error estándar y tamaño de la muestra:

Como ya se ha visto, la variabilidad de las medias muestrales se refleja en el error muestral:

xσ =n

σ;

De este modo, por aparecer el tamaño de muestra en el denominador, se deduce que:

•  A menor tamaño de muestra, mayor es el error estándar.

•  A mayor tamaño de muestra, menor es el error estándar.

Consecuencias:

La única manera de disminuir el error es aumentando el tamaño de la muestra.

Este error nunca va a desaparecer, por grande o chica que sea la muestra, siempre estará en la fórmula.

Page 59: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 59/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.58

4. Condiciones para determinar el IC de la media

El cálculo de un intervalo de confianza para la media poblacional μ mediante la fórmula (1) requiere que se cumplan algunas

condiciones:

•  Cuando se conoce la varianza poblacional y la variable X es normal, se puede usar la fórmula, sin importar el tamañode la muestra.

•  Cuando se desconoce la varianza poblacional y la variable X es normal, se puede usar la fórmula, para un tamaño demuestra n > 30, haciendo la estimación de la varianza poblacional a partir de la muestral, tal como se especifica.

•  Cuando se desconoce la varianza poblacional y la variable X es aproximadamente normal, se puede usar la fórmula,para muestras con n > 30, haciendo la estimación de la varianza poblacional a partir de la muestral, tal como seespecifica.

•  Cuando se desconoce la varianza poblacional y la muestra es chica (n < 30) no se puede usar esta fórmula, ya que sebasa en el modelo de la normal Z. En rigor, se debe usar el modelo de la t de Student, caso que está fuera del alcancede este curso.

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Tiempo de rescateSe sabe que el tiempo de llegada de una unidad de rescate hasta el lugar de un accidente se distribuye normalmente condesviación estándar 3,5 minutos.

Un muestra de 18 llamados dio una media aritmética de 8,2 minutos.

Con estos datos:

1.1. Calcule el error muestral de la media.

1.2. Calcule un intervalo de confianza del 95% para la media poblacional del tiempo de llegada.

1.3. ¿Qué significa este intervalo de confianza?

1.4. ¿Por qué es posible usar el modelo con el estadístico Z en este caso?

1.5. ¿Cuál es la probabilidad de que el tiempo medio poblacional sea de más de 9 minutos?

Solución:

1.1. Error muestral:

En este caso la desviación estándar poblacional es conocida:

Por lo tanto:

xσ =n

σ 

xσ =18

53,= 0,825 minutos.

1.2. Intervalo de confianza:

=α−1 95%

=x 8,2 minutos

9750Z , = 1,96 (es el valor de Z para un 95% de confianza).

xσ = 0,825 minutos

Por lo tanto:

x21Zx σ±=μ α− · /  

825096128 ,· ,, ±=μ  

Page 60: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 60/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.59

617128 ,, ±=μ , con un 95% de confianza.

Sumando y restando el error e, queda:

6,58 ≤μ≤ 9,82 minutos, con un 95% de probabilidades.

R: El tiempo medio poblacional de llegada está entre 6,58 y 9,82 minutos, con un 95% de probabilidades.

1.3. Significado:

Este IC significa que media aritmética poblacional se encuentra entre 6,58 y 9,82 minutos, con un 95% de probabilidades.

Implica que, de cada 100 muestras, 95 medias caen dentro de este intervalo. En 5 casos la media muestral quedaría fuera. Estees el riesgo de error que debe enfrentar y asumir toda investigación.

1.4. Modelo

En este caso se puede usar el modelo con la normal Z porque, aunque la muestra es chica, se conoce la varianza poblacional.

Está dada, y es (3,5 minutos) 2 .

1.5. Tenemos que:

=μ 8,2 minutos; =σ x 0,825 minutos

=ix 9 minutos

Estandarizando8:

8250

289Z

,

,−= = 0,97

Calculando, en la tabla z, la probabilidad P(Z≥ 0,97) = 0,1660

R: la probabilidad de que el tiempo medio poblacional sea de más de 9 minutos es de 0,1660, lo que equivale al 16,6%.

2. Horas extra 

La siguiente tabla muestra las horas extra realizadas por trabajadores en una empresa en un mes:

Horas Nº de casos10 – 2020 – 3030 – 40

40 – 50

92318

3

2.1. Calcule las horas extra promedio en esta muestra.

2.2. Calcule el error muestral de la media.

2.3. Calcule un intervalo de confianza del 99% para las horas extra poblacional.

2.4. Calcule la probabilidad de que el promedio poblacional de horas extra por trabajador sea mayor a 30 horas al mes.

8 Para estandarizar se usa, en este caso, la distribución Z. El uso del modelo normal estándar es posible debido a que se conoce el valor de la

desviación estándar poblacional.

Page 61: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 61/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.60

Solución:

Ingresando los datos a la calculadora, se obtiene:

53n= ; 8327x ,= horas; =σnx 8,10 horas.

2.1. Media

8327x ,= horasR: El promedio de horas extra al mes es de 27,83 horas por trabajador.

2.2. Error muestral

Como se desconoce la desviación estándar poblacional, se usa la muestral:

xσ =1n

S

−;

xσ =153

18

,= 1,123 horas

R: El error estándar de la media es 1,123 horas extra al mes.

2.3. Intervalo de confianza:

=α−1 99%

=x 27,8 horas

9950Z , = 2,58 (es el valor de z para un 99% de confianza)9.

xσ = 1,123 horas

Entonces, el intervalo de confianza es igual a:

1231582827 ,· ,, ±=μ  

92827 ,, ±=μ , con un 99% de confianza.

Sumando y restando el error e, queda:

24,9 ≤μ≤ 30,7 horas, con un 99% de probabilidades.

R: La media poblacional de horas extra se encuentra entre 24,9 y 30,7 horas por trabajador, con un 99% de probabilidades.

2.4. Estandarizando10:

1231

82730Z

,

,−= = 1,96

Calculando, en la tabla z, la probabilidad P(Z≥ 1,96) = 0,0250.

R: La probabilidad de que la media poblacional de horas extra sea más de 30 horas al mes es 0,025, lo que equivale al 2,5%.

9 En términos rigurosos, no es propio usar la distribución Z, ya que se desconoce la varianza poblacional. Pero cuando n > 30 el uso de la Z daexcelentes aproximaciones. Cuando se desconoce la varianza poblacional se debe usar la distribución t de Student, en especial cuando se trata de

muestra chica (n < 30).10 Para estandarizar se usó la distribución Z. El uso del modelo normal estándar es posible debido a que no se conoce el valor de la desviación

estándar poblacional, pero n > 30.

Page 62: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 62/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.61

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Velocidad de infilt ración

Se mide en forma experimental la velocidad de infiltración del agua en un terreno arcilloso, obteniendo en un total de 43mediciones las siguientes velocidades, en metros/hora.

Vel (m/hr) Nº de casos6 – 77 – 88 – 99 – 1010 – 11

5111593

1.1. La velocidad media de infiltración del agua en este terreno es:

A) 8, 50 m/hr. B) 8,41m/hr. C) 8, 36 m/hr. D) 7,83 m/hr. E) 7,58 m/hr.

1.2. El error estándar de la media es igual a:A) 1,682 m/hr. B) 0,168 m/hr. C) 0,166 m/hr. D) 0,183 m/hr. E) 0,153 m/hr.

1.3. El intervalo del 95% de confianza para la velocidad media de infiltración del terreno, en m/hr. es igual a:

A) 8,4 – 8,9 B) 8,3 – 8,8 C) 8,2 – 8,6 D) 8,1 – 8,9 E) 8,0 – 8,7

2. Ventas diarias

Las ventas diarias de una empresa forestal se distribuyen normalmente. Una muestra de ventas correspondientes a 40 días,alcanzó una media de 67,5 $millones, con desviación estándar 16,1 $millones.

2.1. El error estándar de la media, en $millones, es igual a:A) 2,58 B) 2,53 C) 2,46 D) 2,41 E) 2,33

2.2. Un intervalo de confianza del 90% para las ventas medias de la empresa, en $millones, tiene como límite superior:

A) 74,9 B) 73,2 C) 72,1 D) 71,7 E) 71,1

2.3. La aplicación del modelo normal para tratar este caso se justifica porque:

I: Las ventas diarias se distribuyen normalmente

II: Las medias muestrales de las ventas diarias se distribuyen normalmente

III: El tamaño de la muestra es adecuada para el modelo

Es (son) correcta(s):

A) Solo I B) Solo I y II C) Solo I y III D) Solo I y III E) I, II y III

3. Pérdidas po r detenciones

Una empresa textil ha investigado las pérdidas de material en una muestra de 122 detenciones de cierto proceso productivo. Sellegó a establecer, con un 95% de confianza, que las pérdidas medias oscilan entre 22,8 y 42,4 $mil pesos por detención. Seencontró, además, una distribución normal de las pérdidas.

Page 63: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 63/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.62

3.1. La media muestral de las pérdidas alcanzó a:

A) 32,6 $mil B) 33,4 $mil C) 33,7 $mil D) 34,4 $mil E) 35,6 $mil

3.2. El error de investigación de las pérdidas por detención alcanzó a:

A) 8,8 $mil B) 9,8 $mil C) 10,1 $mil D) 10,4 $mil D) 11,2 $mil

3.3. El error estándar de la media de las pérdidas alcanzó a:

A) 4,5 $mil B) 4,8 $mil C) 5 $mil D) 6 $mil E) 6,5 $mil

3.4. Para mejorar la precisión de esta estimación manteniendo la confianza, se debe:

A) Hacer todo el estudio de nuevo, desechando lo que ya está hecho

B) Aumentar el tamaño de la muestra, agregando más casos a los ya estudiados

C) Elegir un nivel de significación más pequeño, por ejemplo, el 1%

D) Optando por un nivel de significación más grande, por ejemplo, el 10%

E) Lo que más conviene es hacer un estudio censal

Solución a problemas propuestos:1.1. C 1.2. B 1.3. E

2.1. A 2.2. D 2.3. E

3.1. A 3.2. B 3.3. C 3.4. B

V. RECURSOS COMPLEMENTARIOS1. Teoría del muestreo

http://www.uaq.mx/matematicas/estadisticas/xstad02.html 

Unidad 6. Teoría de Muestreo Tamaño y obtención de muestras, el teorema central del límite, errores, estimaciones, variación muestral e intervalo deconfianza.

2. Teoría y problemas de estimación

http://ftp.medprev.uma.es/libro/html.htm 

8. Estimación confidencial 

3. Intervalos de confianza para la media

http://ftp.medprev.uma.es/libro/html.htm 

8.4 Intervalos de confianza para la distribución normal 

Page 64: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 64/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.63

2ª UNIDAD: TEORÍA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 8

Intervalos de confianza para la proporción

«Mi optimismo se funda en lo improbable».

E. Morin

APRENDIZAJES ESPERADOS CONTENIDOS

-Calculan el error estándar de proporciones con datos muestrales dados.-Calculan intervalos de confianza para la proporción poblacional con muestra grande.

-Cálculo del error muestral para unaproporción.-Cálculo de intervalos de confianzapara una proporción.

II. DESARROLLO

1. Distribución muestral de las proporciones

1.1. El experimento

Se tiene una población binomial en la cual hay una probabilidad pde que ocurra un suceso y una probabilidad p1q −= de que

no ocurra.

Se extraen de esta población, muestras aleatorias de tamaños 1n , 2n , 3n ,… etc.

En cada una de las muestras se calcula la proporción muestral: 1P , 2P , 3P ,… etc.

Entonces, se da que la proporción muestral iP es una variable.La variable iP es aleatoria y, por lo tanto, tiene un valor esperado y una varianza.

1.2. El teorema central del límite:

El teorema central del límite establece que:

•  La distribución de proporciones muestrales se distribuye normalmente;

•  La media o valor esperado de esta distribución es pn·  ; y:

•  La varianza de esta distribución esn

qp· .

La desviación estándar de esta distribución es el error estándar de la proporción y está dado por:

n

qpp

· =σ (1)

Page 65: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 65/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.64

2. Cálculo del intervalo de confianza para la proporci ón

Para calcular un intervalo de confianza (1 - α ) para la media se aplica lo siguiente:

ePp ±=  

Siendo: p = proporción poblacional.

P = proporción muestral.

e = error (de investigación)

El error “e”, es igual a: p21Ze σ= α− · /  

Por lo tanto, el intervalo de confianza (1 - α ) de la proporción poblacional es igual a:

±= Pp p21Z σα− · / (2)

En donde:

P=

n

xΣ, es la proporción muestral, siendo xΣ los casos favorables y n el tamaño de la muestra.

=α− 21Z / Percentil de la distribución Z, dado por el nivel de confianza elegido.

=σp Es el error estándar muestral de la proporción.

Para calcular un IC para la proporción poblacional se requiere, por lo tanto:

:α−1 El nivel de confianza que se da el investigador.

:P La proporción muestral, que se calcula con los datos de la muestra.

21Z /α− : Es el percentil de la distribución Z, que depende de la confianza elegida.

pσ : Es el error estándar o muestral, que se calcula con los valores de la muestra.

Valores de Z:

Confianza Percentil Valor de Z

99% 9950Z ,   2,58

95% 9750Z ,   1,96

90% 950Z ,   1,645

% Confianza

p x

Fig 8.1: Intervalo de confianza

para la proporción

Page 66: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 66/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.65

Ejemplo:

Se investiga una muestra aleatoria de 247 microempresas, encontrando que 57 de ellas han incorporado las TIC’s a su gestión.

Con estos datos:

1. Calcule el error muestral de la proporción.

2. Calcule un intervalo de confianza del 90% para la proporción poblacional de microempresas que han incorporado las TIC’s asu gestión.

Solución:

1. Error muestral:

247n= ; 57x =Σ .

Entonces: 2310247

57P ,== ; siendo q = 1 – 0,231 = 0,769

El error estándar es igual a:n

qpp

· =σ  

24776902310p ,· ,=σ = 0,0268

R: El error muestral es 0,0268, que equivale a un 2,68%.

2. Intervalo de confianza:

=α−1 90%

=P 0,231

950Z , = 1,645

pσ = 0,0268

Por lo tanto:

0268064512310p ,· ,, ±=  

04402310p ,, ±= , con un 90% de confianza.

Sumando y restando el error, queda:

0,187 ≤≤ p 0,275, con un 90% de probabilidades.

R: De acuerdo a los datos entre el 18,7% y el 27,5% de las microempresas han incorporado las TIC’s a su gestión, con un 90%de probabilidades.

Fig 8.2: Intervalo de confianza para la

proporción

90 % Confianza

23,1p

27,518,7

5%5%

Page 67: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 67/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.66

3. Consideraciones generales 

•  La muestra es independiente, y proviene de una población binomial.

•  El modelo funciona muy bien para tamaños de muestra con n > 100.

•  Para muestras de tamaño entre 30 y 100 el modelo funciona, pero con un error mayor. Poca precisión.

•  El modelo no es aplicable para muestra chica (n < 30).

•  El modelo funciona muy bien para p cercano a 0,5.•  El modelo no es aplicable para p menor que 0,1 o mayor que 0,9.

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Discriminación de género

En una muestra de 865 mujeres trabajadoras, 179 declararon haber sido víctimas de discriminación de género en su lugar detrabajo en el curso de los últimos 6 meses.

1.1. Calcular un intervalo de confianza del 95% para la proporción poblacional de mujeres que habría sufrido tal discriminación.

1.2. Calcular la probabilidad de que la proporción poblacional de mujeres discriminadas en su lugar de trabajo supere el 23%.

Solución:

1.1. Intervalo de confianza

Cálculo de p muestral:

865

179p = = 0,207

Cálculo del error muestral:

86579302070

p,· ,=σ = 0,0138

Cálculo del intervalo de confianza del 95%:

El valor de z  para un IC del 95% es 1,96. Ver en tabla Z el valor de 9750,z  .

Entonces el intervalo para p es igual a:

013809612070p ,· ,, ±=  

02702070p ,, ±= , con un 95% de confianza.

Sumando y restando el error y transformando a %, este intervalo se expresa como:

%,%, 423p018 ≤≤ , con un 95% de confianza.

O bien:

[ ]%,;, 423018p= , con un 95% de confianza.

Page 68: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 68/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.67

Esto significa que en la población hay un 95% de probabilidades de que la proporción de mujeres que sufren discriminación degénero esté entre el 18% y el 23,4%. Esto es que, en 95 de cada 100 muestras de esta población, la proporción de mujeres quesufren discriminación de género se ubicará entre el 18,0% y el 23,4%.

Comentario: por lo general se usa una sola muestra para determinar la proporción por intervalo. Debe dejarse de manifiesto queexiste una cierta probabilidad de que la proporción sea otra. En el ejemplo, tenemos un 95% de probabilidades de que la

proporción de mujeres que sufren discriminación de género esté en el intervalo señalado, pero también tenemos un 5% deprobabilidades de que no sea así.

1.2. Probabilidad de que la proporción poblacional de mujeres discriminadas en su lugar de trabajo supere el 23%.

Por el cálculo anterior, se tiene:

=p 0,207; y, además: pσ = 0,0138

El 23% se expresa como probabilidad ip = 0,23

Estandarizando:

01380

2070230Z

,

,, −= = 1,67

Según la tabla Z, la probabilidad P(Z >1,67) = 0,0475

R: La probabilidad de que la proporción poblacional de mujeres discriminadas en su lugar de trabajo supere el 23% es igual a0,0475.

2. Victimización en Mendoza

Un estudio de realizado en Argentina declaró la siguiente ficha técnica de investigación:

Respecto de los errores de investigación:

2.1. Si esta ficha técnica no declaró el nivel de confianza, con los datos dados, ¿es posible estimarla?

Solución:

Sí, es posible estimar el nivel de confianza, aplicando la definición de error  e .

TIPO DE INVESTIGACIÓN: Encuesta por Muestreo.

UNIVERSO: Población general residente en la Ciudad de Mendoza y Gran Mendoza, mayor de 15

años.

DISEÑO DE LA MUESTRA: Probabilística, con selección de la unidad final de acuerdo a cuotas

de sexo y edad.

CUESTIONARIO: Semi-estructurado y pre-codificado. Realización además de preguntas abiertas

para cuestiones de interés cualitativo y de análisis de contenido. Aplicación domiciliaria.

TAMAÑO DISTRIBUCIÓN DE LA MUESTRA: 799 casos.

Distrito Cantidad de casos Error de investigaciónMendoza Capital 141 +/-8,4%

Godoy Cruz 223 +/-6,7%

Guaymallén 255 +/-6,3%Las Heras 180 +/-7,5%

Total 799 +/-3,5%

Page 69: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 69/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.68

Por definición:

pZe σ= ·   

En esta igualdad se conoce el error del total de la investigación: 0350e ,=  

Se puede determinar, además, pσ , ya quen

qpp

· =σ  

Como no se conoce p, se toma el máximo p = 0,5. Entonces:

799

5050p

,· ,=σ = 0,0177

Entonces, como: pZe σ= ·   

Reemplazando: 01770Z0350 ,· , =  

Despejando Z:

01770

0350Z

,

,= = 1,98

Este Z es cercano a 1,96, que es el Z usado para un 95% de confianza.

R: Considerando las aproximaciones de la ficha técnica, el nivel de confianza utilizado por el estudio en cuestión es del 95%.

En ciertos estudios se emplea para el 95% de confianza el valor Z = 2, que es un modo de simplificar los cálculos, que aseguraun 95% de confianza. Tal es este caso, en que lo más probable es que el error 3,5% haya sido calculado con Z = 2.

En efecto, si se calcula el valor del error:799

50502e

,· ,· = = 0,035

3. Proporciones

3.1. ¿Qué es una población binomial?

3.2. ¿Cuál es la diferencia entre incidencia y prevalencia?

3.3. ¿Cuál es la diferencia entre un estadístico y un parámetro?

Solución:

3.1: Unapoblación binomial es una población en la cual se define un suceso que tiene solo dos resultados posibles, mutuamenteexcluyentes.

3.2: Se conoce comoprevalencia a la proporción de sujetos de una población, que en un momento dado, presenta cierta

característica en estudio. Por ejemplo el % de trabajadores que en este momento trabajan por cuenta propia.La incidencia, por su parte, es la proporción de sujetos que, en el curso de un período de tiempo, presenta cierta característicaen estudio. Por ejemplo, el % de trabajadores que durante el año 2009 optaron por trabajar por cuenta propia.

La diferencia es, por lo tanto, el tiempo. La prevalencia se da en el presente, mientras que la incidencia son los nuevos casosque se producen en un período.

3.3: Un estadístico es un valor muestral de una característica en estudio, mientras que el parámetro es el valor poblacional. Ladiferencia es, entonces, que el estadístico es muestral y el parámetro es poblacional.

Page 70: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 70/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.69

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

Caso 1: Impacto de la crisis económica en la empresa

Se realiza un estudio con 285 empresarios para determinar el nivel de impacto de la recesión económica en su empresa. Losresultados se muestran en la tabla siguiente:

¿Cuál ha sido el nivel de impacto de la crisis económica en su empresa?

Nivel de impacto Nº casosMuy afectadaMedianamente afectadaPoco afectadaNada afectada

831105339

TOTAL 285

1.1. La variable en estudio está medida en una escala de tipo:

A) Continua B) Discreta C) Ordinal D) Multinomial E) Dicotómica

1.2. La probabilidad de que en la muestra un empresario se sienta Poco afectado o Nada afectado por la crisis económica es:A) 0,137 B) 0,186 C) 0,291 D) 0,323 E) 0,677

1.3. El error estándar de la proporción poblacional de empresarios que se sienten Muy afectado por la recesión económica esigual a:

A) 0,0245 B) 0,0269 C) 0,0288 D) 0,0527 E) 0,0532

1.4. Un intervalo de confianza del 90% para la proporción de empresas que se siente Medianamente o Muy afectada por larecesión económica es:

A) 58,5%–68,2% B) 59,1%–70,3% C) 60,7%–70,7% D) 61,3%–71,3% E) 63,1%-72,3%

2. Caso ELECCIONESA causa de cierto proceso eleccionario presidencial que se acerca, se realiza una encuesta para conocer la intención de voto enuna muestra de 750 votantes, respecto de los dos únicos candidatos, construyéndose la siguiente tabla de resultados.

SexoVOTARÍA:

Hombres MujeresTOTAL

Por candidato A 148 194 342

Por candidato B 168 159 327

Nulo o en blanco 14 67 81

TOTAL 330 420 750

Sobre la base de estos datos:

2.1. Haga una estimación por intervalo del % poblacional de votación Nulo o en blanco, con una confianza del 95%.A) Entre el 8,1 y el 12,4%B) Entre el 8,6 y el 13,0%C) Entre el 9,4 y el 13,8%D) Entre el 9,6 y el 14,3%E) Entre el 11,2 y el 14,7%

Page 71: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 71/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.70

2.2. Construya un intervalo de confianza del 90% para la proporción poblacional de mujeres que votaría por el candidato A.A) Entre 42,2 y el 50,2%B) Entre 43,1 y el 51,3%C) Entre 44,3 y el 50,4%D) Entre 45,2 y el 52,5%E) Entre 46,2 y el 56,2%

2.3. En la población de votantes del candidato B, calcule un intervalo de confianza del 95% para la proporción de hombres.A) Entre el 44,0 y el 54,0%B) Entre el 45,3 y el 56,3%C) Entre el 46,0 y el 56,8%D) Entre el 47,1 y el 55,7%E) Entre el 48,0 y el 56,0%

3. Satisfacción con el lugar de trabajoLa empresa Alka-SA, que se dedica a hacer investigación en el ámbito de la economía en el trabajo, está interesada endeterminar qué % de trabajadoras y trabajadores chilenos se encuentra satisfecho o muy satisfecho en su lugar de trabajo. Conuna muestra de tamaño 400, estimó, con un 95% de confianza, que la proporción poblacional en esta situación fluctuaba entre el59,3 y 68,7%.

Con estos datos, determine:

3.1. La proporción muestral de trabajadoras y trabajadores chilenos que se encuentra satisfecho o muy satisfecho con su lugar de trabajo es igual a:

A) 5% B) 9,4% C) 59,3% D) 64,0% E) 68,7%

3.2. El error muestral en esta investigación, en %, alcanza al:

A) 9,4% B) 6,2% C) 4,8% D) 4,7% E) 2,4%

3.3. El error de investigación llegó al:

A) 4,7% B) 5,0% C) 2,4% D) 9,4% E) 6,4%

Solución a problemas propuestos:1.1. C 1.2. D 1.3. B 1.4. E

2.1. B 2.2. A 2.3. C3.1. D 3.2. E 3.3. A

V. RECURSOS COMPLEMENTARIOS1. Teoría y problemas de estimaciónhttp://www.bioestadistica.freeservers.com/temas.html 

Tema 11. Teoría de la inferencia estadística: Introducción. Estimas por puntos y por intervalos. Intervalos de medias, deproporciones, del desvío estándar y de la varianza. Propiedades de un estimador. Intervalos para dos muestras. Intervalos parael cociente de dos proporciones. Ejemplos.

2. Teoría y problemas de estimaciónhttp://ftp.medprev.uma.es/libro/html.htm 8. Estimación confidencial 

3. Intervalos de confianza para la proporciónhttp://ftp.medprev.uma.es/libro/html.htm 8.6 Intervalos de confianza para variables dicotómicas 

Page 72: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 72/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.71

2ª UNIDAD: TEORÍA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 9

Cálculo del tamaño de la muestra

« Es el azar, no la prudencia lo que rige la vida».

Cicerón

APRENDIZAJES ESPERADOS CONTENIDOS

-Calculan el tamaño de muestra para un intervalo de confianza con error dado. -Tamaño de la muestra

II. DESARROLLO

1. Tamaño de la muestra para proporc iones

1.1. La sit uación

Como ya vimos, un intervalo de confianza para la proporción poblacional se obtiene sumando y restando a la proporciónmuestral un cierto error e .

Esto es: ePp ±=  

Este error  e  depende de la confianza ( α−1 ) adoptada por el investigador y del error estándar  p σ . El error e se expresa como:

pZe σ= ·   

El error estándar  p σ depende, a su vez, de p y n, ya que:

n

qpZe

· · = (1)

Aquí participan 4 variables, p ,Z ,e  y n  . El valor de q no interviene directamente, ya que q = 1 - p.

Elevando al cuadrado la igualdad (1):

n

qp

Ze22 · 

· =  

Despejando n:

2

2

e

qpZn

· · = (2)

Esta es la expresión general del tamaño de la muestra para estudios con proporciones. El investigador fija z  (fijando laconfianza) y e  (fijando el error que está dispuesto a aceptar). Solo falta el valor de p.

Page 73: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 73/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.72

Todo estudio en el que intervienen proporciones, debe comenzar fijando el error e  que el investigador (o su cliente) estádispuesto a aceptar y del cual no puede prescindir. Generalmente ese error es menor al 10%, pudiendo ser, 1%, 2%, 2,5%, etc.Obviamente, cuanto menor sea este error, más preciso será el estudio, pero necesitará un tamaño de muestra mayor. Esto no estrivial, puesto que en una investigación hay implicados costos, tiempo, dificultades técnicas, climáticas, geográficas, etc. Por esose debe utilizar siempre el número mínimo de muestras.

1.2. Tamaño de la muestra para proporc iones cuando p es conocidoSi se conoce p, se fija e y z. De la relación (2) se llega que el tamaño de la muestra es igual a:

2

2··

e

q p Z n =  

Este tamaño muestral se usa cuando se tiene algún dato del valor de p.

Nota: el error e debe estar expresado como probabilidad.

Ejemplo: se desea hacer un estudio con un 95% de confianza para saber qué % de la población cree realmente en los noticieros

de la TV. Se tiene como dato, por un estudio previo, que ese % llega al 67,8% ¿Cuál es el tamaño más adecuado de la muestrapara este estudio, si se desea un error de no más del 8%?

Solución: Se tiene:

Z = 1,96 (valor de z para un 95% de confianza).

P = 0,678 y q = 0,322

=e 0,08

Reemplazando:

2

2

080

32206780961n

,

,· ,· ,= = 131,0 ≈ 131 sujetos.

R: se requiere una muestra de tamaño 131.

1.3. Tamaño de la muestra para p desconocido

Si se fija Z y e, pero se desconoce p, el tamaño de la muestra es igual a:

2

2

e

250Zn

,· =  

Este tamaño muestral se usa cuando no se tiene ningún dato del valor de p. Esta forma asume que p = 0,5 y que q = 0,5.Nota: el error e debe estar expresado como probabilidad.

Ejemplo: se desea hacer un estudio exploratorio para saber, con un 95% de confianza, qué % de la población cree realmente enlos noticieros de la TV. ¿Cuál es el tamaño más adecuado para la muestra para un error de no más del 8%?

Solución: Se tiene:

Z = 1,96 (valor de z para un 95% de confianza).

=e 0,08

Page 74: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 74/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.73

Reemplazando:

2

2

080

250961n

,

,· ,= = 150,1 ≈ 151 sujetos.

R: se requiere una muestra de tamaño 151.

1.4. Tamaño de la muestra conociendo solo el error e

Si se fija solamente el error de investigación e , el tamaño de la muestra es igual a:

2e

1n=  

Este tamaño muestral asegura al menos un 95% de confianza y asume que p = 0,5.

Nota: el error e debe estar expresado como probabilidad.

Ejemplo: se desea hacer un estudio exploratorio para saber, qué % de la población cree realmente en los noticieros de la TV.¿Cuál es el tamaño más adecuado para la muestra para un error de no más del 8%?

Solución: Como no se especifican datos de confianza ni se conoce p:

2080

1n

,= = 156,25 ≈ 157 sujetos.

R: se requiere un tamaño de muestra igual a 157, tamaño que segura al menos un 95% de confianza en la estimación.

1.5. Tamaño de la muestra cuando se conoce el tamaño de la población

1º: Se calcula el tamaño 1n  según casos anteriores.

2º: Se multiplica este tamaño por un factor de corrección k.

N

1n1

1k

1 −+

=  

Siendo N = tamaño de la población y 1n  tamaño de la muestra sin corrección.

Ejemplo: En la comuna de Quilleco, con un universo de 5.422 votantes, un candidato a Alcalde encarga una encuesta paradeterminar, con una confianza del 95% y un error no superior al 4%, el porcentaje de votantes que apoyan su candidatura. Unestudio exploratorio indicó que esa cifra llega al 28,5%.

¿Cuál es el tamaño adecuado de la muestra?

Solución:

N = 5.422

IC(95%) ⇒ =975,0 Z  1,96

Page 75: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 75/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.74

=e  4% ⇒ e = 0,04

= p  0,285 ⇒ q = 0,715

2

2

1040

71502850961n

,

,· ,· ,= = 489, 3 ≈ 490

Factor de corrección:

5422

4891

1k

+= = 0,9173

Entonces, finalmente:

=n  490 · 0,9173 = 450 personas

R: el estudio requiere una muestra aleatoria de 450 personas.

1.6. Tamaño de la muestra para encontrar al menos un caso favorable

En ocasiones se requiere una muestra que asegure con cierta confianza (1 - α  ), obtener al menos un sujeto con unacaracterística especial, cuya probabilidad  p  se conoce en la población.

El tamaño de la muestra es:

)log(

)(log

p1n

−α

= o bien:)ln(

)(ln

p1n

−α

=  

Siendo:α 

= 1 – confianza, expresado como probabilidad.

Ejemplo: En cierto sector industrial, el 18,5% de las empresas tienen sus cotizaciones provisionales impagas. Se deseaseleccionar una muestra aleatoria de esta población para tener, con una confianza del 99%, al menos una empresa en estasituación. ¿Cuál será el tamaño adecuado de la muestra?

Solución:

Confianza del 99% ⇒ =α  1 – 0,99 = 0,01

=p 0,185 ⇒ =−p1 0,815

Luego:8150010n

,log,log= = 22,5 ≈ 23 empresas seleccionadas al azar.

R: se tiene un 99% de probabilidades de que resulte al menos una empresa con cotizaciones impagas, en una muestra aleatoriade tamaño 23.

Page 76: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 76/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.75

2. Tamaño de la muestra para medias

2.1. La sit uación

Un intervalo de confianza para la media poblacional se obtiene sumando y restando a la media muestral un cierto error e .

Esto es: ex±=μ  

Este error  e , llamado también error de investigación, depende de la confianza ( α−1 ) adoptada por el investigador y del error muestral xσ . El error e se expresa como:

xZe σ= ·   

El error estándar  xσ depende, a su vez, de σ y n, ya que xσ =n

σ. Entonces:

nZe

σ= ·  (1)

Elevando al cuadrado la igualdad (1):

nZe

222 σ

= ·   

Despejando n:

2

22

e

Zn

σ=

· (2.1)

O bien:2

e

Zn ⎟

 ⎠

 ⎞⎜⎝ 

⎛  σ=

· (2.2)

Si se desconoce σ , se estima a partir de la muestra, utilizando S. (En la calculadora: 1nx −σ ).

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Reforma laboral 

Un estudio realizado con 385 trabajadores dependientes reveló 258 a favor de cierta reforma laboral.

1.1. ¿Cuál es el error muestral en este estudio?

1.2. ¿Cuál es la probabilidad de que la proporción de personas que opinan así sea mayor al 70%?

1.3. Calcule un intervalo de confianza del 95% para la proporción poblacional de trabajadores a favor de la reforma laboral.

1.4. Si se quiere un intervalo de confianza del 99% para la proporción poblacional de trabajadores a favor de la reforma laboralcon un error inferior al 3%, ¿cuál debería ser el tamaño adecuado de la muestra?

Solución:

Es un problema de proporciones, con n = 385 y xΣ = 258.

1.1. Error muestral: 

La proporción muestral es: p = 258/385 = 0,670

Page 77: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 77/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.76

El error muestral es: pσ =385

330670 ,, ⋅= 0,0240.

R: El error muestral en este estudio es 0,024, lo que equivale al 2,4%.

1.2. Probabilidad: Estandarizando: z =

024067070

,

,, −= 1,25

Según tabla z: p(z ≥ 1,25) = 0,1057.

R: La probabilidad de que los trabajadores que piensan así sean más del 70% es 0,1057.

1.3. Intervalo de confianza:

Tenemos que: pσ = 0,024 y que: z0,975 = 1,96

Entonces: IC(95) p = 0,67 ± 1,96 · 0,024 = 0,67 ± 0,047

R: la proporción poblacional está entre el 62,3 y el 71,7%, con un 95% de probabilidades.

1.4. Tamaño de la muestra: 

De los resultados anteriores se tiene: p = 0,67.

Para un 99% de confianza se requiere =995,0 z 2,58

Entonces:

2

2

030

330670582n

,

,· ,· ,= = 1.635 trabajadores

R: El tamaño de la muestra tendría que ser de 1.635 trabajadores.

2: Mobbing

Se desea estudiar la proporción de la población de trabajadores que ha sido objeto de mobbing en el curso del último año.

2.1. Señale el tamaño de la muestra para un error no superior al 6%. Indique las condiciones en que se daría ese error.

2.2. Calcule el tamaño de la muestra para un 95% de confianza con un error no superior al 4%.

Solución:

2.1. Se tiene como dato que e = 0,06. Entonces:

2060

1

,n = = 277,7 ≈ 278 trabajadores.

Con esta muestra se lograría una confianza de al menos 95%, asumiendo que p = 0,5.

Page 78: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 78/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.77

2.2. Se tiene como dato que e = 0,04 y que z = 1,96. Entonces:

2

2

040

250961

,

,· ,n = = 600,25 ≈ 601 trabajadores.

3. Precio de acciones

Se estableció con una muestra de tamaño 40, que el precio medio de ciertas acciones en el mercado es de $1.640, condesviación estándar $100.

A partir de esta información se desea establecer, con un 99% de confianza, un intervalo para el precio medio poblacional, con unerror de no más de $35. ¿Cuál es el tamaño adecuado de la muestra?

Solución:

El tamaño de muestra está dado por:2

22

e

Zn

σ=

·  

Para este caso: Z = 2,58; σ = 100 y 35e= .

Entonces:2

22

35

100582n

· ,= = 54,3 ≈ 55 muestras.

R: Se requiere una muestra de tamaño 55.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Accidentes laborales

Una investigación exploratoria con una muestra aleatoria de 282 accidentes laborales dio origen a la siguiente tabla:

Actividad económica CasosMineríaIndustriaConstrucciónComercioTransporteServicios

213586167351

Total 282

1.1. Se desea establecer, con un 90% de confianza, el porcentaje de accidentes laborales que se producen en el sector construcción. Para este caso, el error de investigación, en %, alcanza a:

A) 2,74% B) 4,51% C) 4,63% D) 5,37% E) 5,48%

1.2. Si se desea calcular, con una confianza del 95%, con un error del 4%, la proporción poblacional de accidentes laborales enel sector transporte, el tamaño mínimo de la muestra deber ser:

A) 236 B) 254 C) 366 D) 413 E) 461

1.3. Si se desea calcular, con una confianza del 99%, con un error del 3%, la proporción poblacional de accidentes laborales enel sector Servicios, el tamaño mínimo de la muestra deber ser:

A) 13 B) 33 C) 425 D) 1.097 E) 1.112

Page 79: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 79/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.78

2. Estudio de mercado

Se desea saber qué % de la población C2-C3 se interesa por contratar un seguro de vida. Para los efectos se debe determinar eltamaño de la muestra.

2.1. Si no se tiene ningún dato, el tamaño de la muestra que asegure, a lo más un 2,5% de error, sería:

A) 7 B) 16 C) 40 D) 1.250 E) 1.600

2.2. Si se quiere un error no superior al 4% y una confianza del 99%, el tamaño de la muestra sería:

A) 166 B) 840 C) 1.040 D) 1.250 E) 4.160

2.3. Si se sabe que, aproximadamente el 12% de esta población estaría interesada en un seguro de vida, se quiere un error nosuperior al 4% y un nivel de confianza del 95%, el tamaño mínimo de la muestra sería:

A) 254 B) 285 C) 324 D) 400 E) 1.250

2.4. Si se cuenta con recursos para encuestar una muestra de solo 800 personas de la población y no se tiene ningún otro dato,este tamaño de muestra, con un 95% de confianza asegura un error de no más de:

A) 2,54% B) 3,46% C) 4,32% D) 4,68% E) 5,16%

3. Transporte escolar 

De una población de 34.565 estudiantes de EGB de los primeros niveles en colegios de cierta comuna, se desea extraer unamuestra aleatoria para determinar el % de la población que usa transporte escolar pagado, con un error no mayor al 4%.

3.1. Si no se tienen otros datos al respecto, se requiere una muestra de un mínimo de:

A) 400 B) 546 C) 614 D) 625 E)

3.2. Si, además, se requiere un 99% de confianza, se requiere una muestra de un tamaño mínimo de:

A) 1.010 B) 1.250 C) 1.312 D) 1.401 E) 1.521

4. Espesor de la madera

Una industria de muebles de madera sabe que el espesor de las piezas de madera (tablas) que utiliza como insumo, sedistribuye normalmente con desviación estándar 5 mm.

Esta empresa quiere establecer un intervalo de confianza del 99% para el espesor medio de este insumo, con un error que novaya más allá de 2 mm. El tamaño mínimo de la muestra adecuado es:

A) 7 B) 17 C) 25 D) 42 E) 50

Solución a problemas propuestos:1.1. B 1.2. E 1.3. D

2.1. E 2.2. C 2.3. A 2.4. B3.1. C 3.2. A

4. D

V. RECURSOS COMPLEMENTARIOS1. Tamaño de la muestra

Fisterra: Metodología de la investigación

http://www.fisterra.com/mbe/investiga/index.asp 

Determinación del tamaño muestral 

Page 80: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 80/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.79

2. Teoría del muestreo

http://www.uaq.mx/matematicas/estadisticas/xstad02.html Unidad 6. Teoría de Muestreo 

Tamaño y obtención de muestras, el teorema central del límite, errores, estimaciones, variación muestral e intervalo deconfianza.

Page 81: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 81/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.80

3ª UNIDAD: DÓCIMAS DE HIPÓTESIS CLASE 10

Introducción al contraste de hipótesis

«El mayor error sería subestimar el problema del error;la mayor ilusión sería subestimar el problema de la ilusión».

E. Morin.

APRENDIZAJES ESPERADOS CONTENIDOS

-Identifican concepto de hipótesis estadística.-Explican los errores de tipo I y de tipo II presentes en una decisión.-Identifican hipótesis nula y alternativa en casos dados.-Plantean correctamente hipótesis estadísticas (H0 y H1).-Identifican los pasos de la metodología clásica de docimasia de hipótesis.

-Identifican ensayos de cola izquierda, cola derecha y de dos colas en situaciones dadas.

-Hipótesis.-Error tipo I y tipo II.-Concepto de nivel de significación.-Planteamiento de hipótesisestadísticas

-Metodología general para laprueba de hipótesis.

II. DESARROLLO

1. Conceptos básicos de dócimas de hipótesis

1.1. Hipótesis

Afirmación acerca del mundo sensible, posible de verificar empíricamente.

Ejemplos:

•  “En Santiago de Chile, el agua hierve a 97ºC”

•  “A mayor satisfacción laboral, mayor productividad”.

1.2. Hipótesis estadística

Afirmación acerca de los parámetros de una población, fundada en una distribución de frecuencias obtenida de una muestra(observaciones).

1.3. Dócima de hipó tesis

Docimar, probar, testear o contrastar una hipótesis estadística, consiste en someterla a un mecanismo estadístico para decidir sise rechaza o no se rechaza.

1.4. Posibilidad de error 

Cada vez que se decide acerca del rechazo o no de una hipótesis, existe el riesgo de error.1.4.1. Error de tipo I: es aquel que se comete al rechazar una hipótesis (como si fuese falsa) siendo que en realidad esverdadera.

1.4.2. Error de tipo II: es el error que se comete cuando no se rechaza una hipótesis (como si fuese verdadera) siendoque en realidad es falsa.

Ejemplo:

Hipótesis: El 18% de las prendas de vestir del mercado, están mal etiquetadas.

Error de tipo I: Rechazar que el 18% de las prendas de vestir del mercado están mal etiquetadas, siendo que es verdadero.

Error de tipo II: No rechazar que el 18% de las prendas de vestir del mercado están mal etiquetadas, siendo que es falso.

Page 82: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 82/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.81

1.5. Error y decisión estadística

La hipótesis es:

Decisión Verdadera Falsa

Rechazar Error tipo I decisión correcta

No-rechazar decisión correcta Error tipo II

Los errores I y II están relacionados inversamente. Al disminuir uno, aumenta el otro.

La única manera de disminuirlos es aumentando la cantidad de datos, aumentando el tamaño de la muestra.

Ejemplo:

•  “Hoy va a llover, por lo tanto, llevo paraguas.”

Si llueve: la decisión de llevar paraguas es acertada.

Si no llueve: se comete error de tipo II, al aceptar una hipótesis que resultó ser falsa.

•  “Hoy no va a llover, por lo tanto, no llevo paraguas.”

Si no llueve: la decisión es acertada.

Si llueve: se comete error de tipo I, al rechazar la hipótesis de lluvia, que resultó ser verdadera.

Consideraciones interesantes:

-Para disminuir el error de tipo I, se podría llevar paraguas todos los días. En efecto, con esto disminuye el error de tipo I, peroaumenta el error de tipo II. Por lo tanto, esa no es una buena medida.

-Para disminuir el error de tipo II, mejor sería no llevar nunca paraguas. Con esta medida disminuye, en efecto, el error de tipo II,pero aumenta el error de tipo I. Por lo tanto, tampoco es una buena medida.

-No hay manera de escapar a estos dos tipos de errores.

-No es lo mismo cometer error de tipo I que cometer error de tipo II, porque tiene distintos efectos.

1.6. Nivel de signif icación (α )

Es el riesgo de cometer error del tipo I, que el investigador asume para tomar una decisión acerca de una hipótesis. Este error serepresenta con la letra α y se expresa como probabilidad o como tanto por ciento.

Los niveles de significación más usuales son:

α = 0,1 (10%);

α = 0,05 (5%); y

α = 0,01 (1%)

En rigor, el nivel de significación lo declara el investigador antes de comenzar su investigación.

2. Contrastes de hipó tesis

Las hipótesis estadísticas a contrastar consisten, principalmente, en afirmaciones acerca de los parámetros de una población.

Un parámetro es una medida que caracteriza a una población. Por ejemplo, la media aritmética poblacional. Generalmente losparámetros son desconocidos y se estiman a través de los estadígrafos, que son los valores muestrales. Por ejemplo, la mediapoblacional μ , se estima a través de la media muestral x . La proporción poblacional p , a través de la proporción muestral P.

Y así sucesivamente.

En este apunte se verán las hipótesis relacionadas con μ , py las diferencias entre esos parámetros.

Page 83: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 83/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.82

2.1. Hipótesis usuales:

Las hipótesis estadísticas más usuales son las siguientes:

2.1.1. Hipótesis de la media: 0μ=μ .

Esto es, que la media poblacional tiene un valor determinado 0μ .

Ejemplo: En promedio, un obrero gana $2.845 por hora de trabajo.

Hipótesis: 8452.=μ  

2.1.2. Hipótesis de la diferencia de medias:   BA μ−μ  

Esto es, que la diferencia de medias poblacionales entre A y B tiene un valor determinado.

Ejemplo: El monto promedio de ventas de las vendedoras mujeres es mayor que el de los vendedores hombres.

Hipótesis: >μ−μ HM 0

2.1.3. Hipótesis de la propor ción:  0pp =  

Esto es, que la proporción poblacional tiene un valor determinado 0p .

Ejemplo: El 4,5% de los trabajadores chilenos está sindicalizado.Hipótesis: 54p ,= %

2.1.4. Hipótesis de la diferencia de propo rciones: BA pp −  

Se plantea la hipótesis de que la diferencia de proporciones poblacionales tiene un valor determinado.

Ejemplo: El % de mujeres que votó por el candidato A es menor que el de hombres.

Hipótesis: 0pp HM <−  

2.2. Hipótesis nu la y alternativa:

Para realizar una dócima de hipótesis se plantean dos tipos de hipótesis:

2.2.1. Hipótesis Nula (H0)

Esta es una hipótesis instrumental, que se plantea como oposición o complemento a la hipótesis que interesa.

2.2.2. Hipótesis alternativa (H1):

Es la hipótesis que se desea someter a contraste. Esta está respaldada por datos empíricos.

Por ejemplo, si se desea contrastar la hipótesis de que “más del 15% de los estudiantes ha consumido alguna droga prohibidaen el curso del último año”, se plantean las hipótesis siguientes:

H0: El 15% de los estudiantes ha consumido alguna droga prohibida en el curso del último año”.

Versus la hipótesis alternativa:H1: Más del 15% de los estudiantes ha consumido alguna droga prohibida en el curso del último año”

Utilizando simbología estadística, este contraste se expresa así:

H0: p = 0,15

H1: p > 0,15

En este caso los porcentajes se plantean como probabilidad.

Page 84: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 84/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.83

3. Mecanismo de un cont raste de hipótesis

El esquema general de un contraste de hipótesis se resume a continuación. Sin embargo hay que aclarar que los distintos tiposde contrastes de hipótesis obedecen a un mismo esquema general, dándose diferencias en los modelos de probabilidad quesirven de base.

1º: Se elije un nivel de significación α .

El nivel de significación es elegido por el investigador, basándose en los siguientes criterios generales:

En investigación social, que se centra en aspectos cualitativos, es usual elegir, preferentemente, entre el 5%y el 10%. Son frecuentes en este tipo de estudios, las variables cualitativas. Por ese motivo se puede aceptar un % de probabilidad de error mayor.

En investigación con variables numéricas (cuantitativas), se elige, preferentemente, entre el 1% y el 5%. Por tratarse de variables numéricas, se puede aceptar una probabilidad de error menor.

2º: Se plantea la hipótesis nula y su hipótesis alternativa, según contexto de la investigación.

La hipótesis nula es central en todo el procedimiento. El método se basa en el supuesto de que esta hipótesises VERDADERA y que está fundada en un modelo de probabilidad conocido, por ejemplo, en el modelonormal.

3º: Se generan los datos empíricos y se calcula un estadístico de prueba, que sirve para decidir si la hipótesis nula hade ser rechazada o no.

Los datos empíricos dan origen a un estadístico (número) de prueba. El método consiste en COMPARAReste estadístico, que está respaldado con los datos, con el modelo teórico.

4º: Se toma la decisión de rechazar o no la hipótesis nula, sobre la base de los resultados numéricos.

Si el modelo teórico se ajusta a los datos empíricos representado por el estadístico de prueba, entonces seconfirma que la hipótesis nula es verdadera y no se podría rechazar. Si el estadístico de prueba no se ajustaa lo ideal, entonces la hipótesis nula es falsa y habría que rechazarla.

5º: Se analiza y se construye una conclusión acerca de la hipótesis planteada, cerrando así en círculo del proceso.

La conclusión debe apuntar a validar o no la afirmación (hipótesis) que dio origen al estudio.

4. Planteamiento de hi pótesis estadísticas

4.1. Planteamiento algebraico

Sea θ un parámetro, y 0θ el valor que se postula como el valor poblacional. Entonces, se pueden dar tres situaciones en el

planteamiento de hipótesis estadísticas:

Caso 1: Caso 2: Caso 3:

Nótese que la hipótesis nula se caracteriza por el signo igual.

4.2. Tipos de cont raste, pruebas o ensayos

Dependiendo de la hipótesis alternativa que se elija, se producen tres tipos de ensayo o de prueba. Nótese los signos >, <, ≠ ,que caracterizan a las hipótesis alternativas.

H0: θ = 0θ  

01 :H θ≠θ  

H0: θ = 0θ  

01 :H θ>θ  

H0: θ = 0θ  

01 :H θ<θ  

Page 85: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 85/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.84

Caso 1:

Para 01 θ>θ:H   ⇒ Prueba de cola derecha:

En este tipo de ensayo, toda la probabilidad de error tipo I queda en la cola superior de la curva de probabilidad usadacomo modelo. Figura 10.1.

Caso 2:

Para 01 θ<θ:H   ⇒ Prueba de cola izquierda:

En el ensayo de cola izquierda, toda la probabilidad de error tipo I queda en la cola inferior de la curva de probabilidadusada como modelo. Figura 10.2.

Caso 3:

Para 01 θ≠θ:H   ⇒ Prueba bilateral o de dos colas:

En el ensayo de dos colas, la probabilidad de error tipo I queda repartida en la cola inferior y superior de la curva deprobabilidad usada como modelo. Figura 10.3.

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Sexo e ingreso

Se realiza un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una población de trabajadoresdependientes, del sector comercio, con similares condiciones de trabajo, jerarquía, edad, ciudad y estado civil.

Las interrogantes que el estudio desea esclarecer, con un 5% de significación, tienen que ver con las siguientes afirmaciones:

A) Los hombres de esta población representan el 60%.

B) El sueldo promedio de las mujeres de esta población es $250.000 al mes.

1.1. Para la afirmación A, plantee en lenguaje corriente la hipótesis nula y sus correspondientes alternativas de cola derecha,cola izquierda y de dos colas.

1.2. Para la afirmación B, plantee en lenguaje algebraico la hipótesis nula y sus correspondientes alternativas de cola derecha,cola izquierda y de dos colas.

Solución:

1.1. Afirmación A. Se trata de una hipótesis de proporciones.

H0: Los hombres de esta población representan el 60%.

H1: Los hombres de esta población representan más del 60%. (ensayo de cola derecha).

H1: Los hombres de esta población representan menos del 60%. (ensayo de cola izquierda).

H1: Los hombres de esta población no representan el 60%. (ensayo de dos colas).

α

α

2 / α 2 / α

Fig 10.1:

Fig 10.2:

Fig 10.3:

Page 86: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 86/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.85

1.2. Afirmación B. Se trata de una hipótesis de media.

H0: El sueldo promedio de las mujeres de esta población es $250.000 al mes.

H1: El sueldo promedio de las mujeres de esta población es más $250.000 al mes. (ensayo de cola derecha).

H1: El sueldo promedio de las mujeres de esta población es menos de $250.000 al mes. (ensayo de cola izquierda).

H1: El sueldo promedio de las mujeres de esta población no es $250.000 al mes. (ensayo de dos colas).

Algebraicamente esto se escribe:

000250H0 .$: =μ  

000250H1 .$: >μ  

000250H1 .$: <μ  

000250H1 .$: ≠μ  

2. Ingreso y género

Un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una población de trabajadores del sector frutícola,con similares condiciones de trabajo, jerarquía, edad, ciudad y estado civil, llegó a la siguiente conclusión, a un nivel designificación del 1%:

“En este sector laboral, los hombres, en promedio, ganan más que las mujeres”.

2.1. Exprese, en lenguaje corriente, cuál es la hipótesis nula en este caso.

2.2. Identifique el tipo de ensayo en este contraste.

2.3. ¿Cuál es la probabilidad de cometer error de tipo I en este estudio?

2.4. En qué consiste el error de tipo II en el contexto de este caso?

Solución:

2.1. En estos casos, la hipótesis nula se reconoce por el signo igual. Por lo tanto, es:

H0: “En este sector laboral, los hombres, en promedio, ganan igual que las mujeres”.

2.2. Si H representa a los hombres y M a las mujeres y se plantea la hipótesis nula como MH μ−μ = 0, entonces el ensayo

debe ser de cola derecha, ya que: H1: BH μ−μ > 0.

Si H representa a los hombres y M a las mujeres y se plantea la hipótesis nula como HM μ−μ = 0, entonces el ensayo debería

ser de cola izquierda, ya que: H1: HM μ−μ < 0.

2.3. De acuerdo al enunciado del problema, la probabilidad de error de tipo I es el 1%, ya que corresponde al nivel designificación.

2.4. El error de tipo II es no rechazar la hipótesis (nula) siendo que es falsa. En este caso, el error de tipo II consiste en norechazar que los hombres ganan igual que las mujeres, siendo que es falso.

Page 87: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 87/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.86

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Accidentes laborales

Se presenta la siguiente afirmación, en el ámbito de la prevención de riesgos:

“Más del 23% de los accidentes laborales se producen por condiciones inseguras de los ambientes de trabajo”

1.1. La expresión algebraica de la hipótesis nula es:

A) %: 23H0 =μ B) %: 23pH0 > C) %: 23pH0 < D) %: 23pH0 ≠ E) %: 23pH0 =  

1.2. La expresión algebraica de la hipótesis alternativa es:

E) %: 23pH0 = B) %: 23pH0 > C) %: 23pH0 < D) %: 23pH0 ≠ E) %: 0pH0 =  

1.3. El error de tipo I en esta hipótesis consiste en:

A) Aceptar que más del 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es verdadero.

B) Aceptar que menos del 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es falso.

C) Rechazar que el 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es verdadero.D) Rechazar que el 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es falso.

E) Rechazar que más del 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es verdadero.

1.4. Respecto de la hipótesis nula:

I: Se asume que es verdadera

II: Se basa en un modelo de probabilidad conocido

III: Su aceptación o rechazo está afecta a error 

Es (son) correcta(s):

A Solo I B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

2. Licencias médicas en hombres y mujeres 

En cierta empresa se desea comprobar si los trabajadores hombres tienen, en promedio, menor número de días de licenciamédica en el curso de un año que los trabajadores mujeres, excluyendo los pre y pos natales..

2.1. La hipótesis nula es, en este caso:

A) Hombres y mujeres tienen, en promedio, iguales días de licencia médica en el curso de un año.

B) Los hombres tienen, en promedio, más días de licencia médica que las mujeres en el curso de un año.

C) Las mujeres tienen, en promedio, más días de licencia médica que los hombres en el curso de un año.

D) Las mujeres tienen, en promedio, distintos días de licencia médica que los hombres en el curso de un año.

E) El problema planteado no es traducible a la forma de hipótesis estadística en lenguaje corriente

2.2. Algebraicamente, con M = mujer y H = hombre, la hipótesis alternativa se escribe:

A) 0MH =μ−μ  

B) 0MH >μ−μ  

C) 0MH <μ−μ  

D) 0MH ≠μ−μ  

E) El problema no es traducible algebraicamente

Page 88: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 88/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.87

2.3. En el marco del caso, cometer error de tipo II en esta hipótesis consiste en:

A) Aceptar que, en promedio, las mujeres tienen más días de licencia que los hombres, dado que es falso.

B) Aceptar que, en promedio, las mujeres tienen más días de licencia que los hombres, dado que es verdadero.

C) Aceptar que, en promedio, hombres y mujeres tienen igual días de licencia, dado que es verdadero.

D) Aceptar que, en promedio, hombres y mujeres tienen igual días de licencia, dado que es falso.

E) Rechazar que, en promedio, hombres y mujeres tienen igual días de licencia, dado que es verdadero.

3. Hipótesis, error y significación 

3.1. Según el texto de esta clase, una hipótesis estadística:

I: Es un enunciado que afirma algo verificable

II: Es una afirmación que siempre es verdadera

III: Se sustenta en las observaciones empíricas

Es (son) correcta(s):

A) Solo I B) Solo III C) Solo I y II D) Solo I y III E) Solo II y III

3.2. En un contraste de hipótesis, respecto del error de tipo II se afirma que:

I: Se hace cero cuando se aumenta el tamaño de la muestra

II: Se relaciona inversamente con el error de tipo I

III: Siempre está presente

Es (son) correcta(s):

A) Solo I y III B) Solo II y III C) Solo I y II D) Solo II E) Solo III

3.3. En un contraste de hipótesis, el nivel de significación:I: Corresponde al error de tipo I

II: Lo elige el investigador 

III: Más usual es el 1%, el 5% y el 10%

Es (son) correcta(s):

A) I, II y III B) Solo I y III C) Solo II y III D) Solo II y III E) Solo III

Solución a problemas propuestos:1.1. E 1.2. B 1.3. C 1.4. E

2.1. A 2.2. C 2.3. D3.1. D 3.2. B 5. A

V. RECURSOS COMPLEMENTARIOS1. Test de hipótesis

http://www.bioestadistica.freeservers.com/temas.html 

Sitio muy completo, que presenta desde los métodos estadísticos básicos hasta los métodos de inferencia más complejos.También incluye una gran variedad de Tablas estadísticas usuales.

Page 89: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 89/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.88

2. Test de hipótesis

Tema 12. Teoría de la decisión estadística: Hipótesis estadísticas. Validaciones estadísticas: uso del test de hipótesis. Modelode Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones demedias y proporciones. Intervalos de confianza versus tests de hipótesis. Ejemplos.

3. Introducción al contraste de hipótesis

http://ftp.medprev.uma.es/libro/html.htm 

9. Contrastes de hipótesis 

9.2 Introducción 

9.2.0.1 Ejemplo 

9.2.2 Observaciones 

Page 90: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 90/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.89

3ª UNIDAD: DÓCIMAS DE HIPÓTESIS CLASE 11

Contraste de hipótesis de proporc iones

«Sólo el azar está en el origen de toda novedad, de toda creación en la biosfera».

J. Monod.

APRENDIZAJES ESPERADOS CONTENIDOS

-Realizan pruebas de hipótesis para proporciones.

-Analizan e interpretan los resultados de la dócimas de hipótesis de proporciones en el contextode casos dados.

-Pruebas de hipótesis paraproporciones.

II. DESARROLLO

1. La situación

Cuando se afirma o conjetura que en la población hay un cierto % de elementos que presenta cierta característica o atributo, seestá haciendo una afirmación de un valor de una proporción poblacional. Estas se constituyen o dan pie a auténticas hipótesisestadísticas. Por ejemplo:

•  El 45% de los consumidores de bebidas gaseosas prefiere marcas alternativas.

•  La proporción de trabajadores que sufren acoso laboral en Chile, ¿alcanza al 20%?

Como toda hipótesis estadística, estas deben contrastarse o ponerse a prueba a través de un procedimiento válido en el mundo

de las ciencias. Para este caso hablamos de “contraste de la proporción”.

Empíricamente se tiene:

:n Una muestra aleatoria

:xΣ Casos favorables

n

xP

Σ= : proporción muestral

2. Hipótesis

2.1. Hipótesis nula:

:0H 0 p  p =  Esta hipótesis indica que la proporción poblacional es una cantidad 0 p  , siendo 0 p  un número real. Es usual expresar este

número como probabilidad, aunque también puede expresarse en %.

2.2. Hipótesis alternativas:

Dependiendo de la situación, se pueden plantear tres tipos de hipótesis alternativas:

:1H 0p p > . Conduce a un ensayo de cola derecha.

Esta hipótesis expresa que la proporción poblacional es mayor que el valor que se postula en la hipótesis nula.

Page 91: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 91/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.90

:1H 0p p < . Conduce a un ensayo de cola izquierda.

Esta hipótesis expresa que la proporción poblacional es menor que el valor que se postula en la hipótesis nula.

:1H 0p p ≠ . Conduce a un ensayo de 2 colas.

Esta hipótesis expresa que la proporción poblacional es distinta que el valor postulado por la hipótesis nula.

Ejemplo: Una encuesta realizada en una comuna a una muestra de 1.450 vecinos, arrojó como resultado que el 78,5% de estosse manifestaron en contra de un proyecto de modificación del plano regulador. Este hecho llevó a ciertos dirigentes sociales aafirmar que “más del 80% de los vecinos está en contra de la modificación del plano regulador ”.

Para docimar esta hipótesis, se plantea:

H0: p = 0,80

La hipótesis nula afirma que el 80% de la población está en desacuerdo con dicha modificación.

H1: p > 0,80

La hipótesis alternativa afirma que ese % es mayor a 80% y da origen a un ensayo de cola derecha.

3. Error muestral de la proporción

El error muestral de la proporción para realizar el contraste de hipótesis es igual a:

n

qp 00p0

· =σ  

Se agrega a p y q el subíndice cero para señalar que se trata de la p que postula la hipótesis nula.

4. Estadístico de pruebaPara contrastar la hipótesis se usa el estadístico:

0p

0pPZ

σ

−= ; siendo:

=P Proporción muestral

=0 p  Proporción que postula la hipótesis nula

0 p σ   = error estándar de la proporción, bajo H0 verdadera

Cuando H0 es cierta, este estadístico se comporta como una distribución Z (normal estándar).

5. Valor p de la prueba ( *α )

El criterio de decisión basado en el valor p es el método más utilizado en la actualidad para el contraste de todo tipo de hipótesis.De hecho, los programas computacionales estadísticos entregan este valor para que el operador decida respecto de lashipótesis en juego.

El valor p, llamado también p-value o simplemente *α , es la probabilidad que queda sobre el Z de prueba o bajo este segúnsea el caso. Se determina con la tabla Z.

Page 92: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 92/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.91

6. Cálculo del valor p de la prueba

Ensayo de cola derecha: =α*  P(z  > pruebaZ ) . Ver figura 11.1.

Ensayo de cola izquierda: =α*  P(z  < pruebaZ ) . Ver figura 11.2.

Ensayo de 2 colas: =α*  P(z  > pruebaZ ) + P(z  < pruebaZ− ) = 2 · =α*  P(z  > pruebaZ ) . Ver figura 11.3.

7. Criterio de decisión acerca de H0

Con un nivel de significación α :

Se rechaza H0 si α<α*   

No se rechaza H0 en caso contrario

Nota: toda decisión se refiriere exclusivamente a la hipótesis nula.

8. Conclusi ón

Sobre la base de la decisión, se construye una conclusión que debe apuntar directamente a la pregunta o conjetura planteada.La conclusión es una afirmación que suele ir acompañada por el valor p de la prueba en paréntesis, como modo de sustentar dicha afirmación.

Ejemplo: “Menos del 8% de los televidentes ve programas culturales en TV (p = 0,2341)”

En este caso, el valor p en paréntesis indica que la prueba de hipótesis dio un valor p = 0,2341 y que, por lo tanto, la hipótesisnula fue rechazada a favor de la hipótesis alternativa de cola izquierda.

9. Condici ones y restricciones de la prueba

-Población: la población en estudio debe ser planteada como binomial.

-Tamaño de la muestra: el modelo funciona muy bien para muestras mayores que 100.

-Para muestras entre 30 y 100 el método es aplicable y funciona bien cuando P es cercano a 0,5.

-Para muestras chicas (n < 30) esta prueba no es aplicable, siendo preferible utilizar el modelo de Clopper y Pearson.

-Proporción: el modelo funciona bien para P entre 0,10 y 0,90. Para valores menores a 0,1 o mayores a 0,9, es preferible utilizar otra dócima, por ejemplo, Clopper y Pearson.

9. ResumenEn resumen, para contrastar una hipótesis de proporciones se siguen los siguientes pasos:

1º: Plantear las hipótesis: esto es, traducir las hipótesis al lenguaje algebraico, planteando H0 y H1.

2º: Calcular el estadístico de prueba: esto es, calcular P muestral, el error muestral pσ y Z de prueba.

3º: Calcular el valor p: Con Z de prueba se calcula *α , según ensayo de cola izquierda, cola derecha o dos colas.

4º: Aplicar la regla de decisión: comparando *α con α , se decide rechazar o no H0 con significación α .

5º: Construir la conclusión: conectando la decisión con las hipótesis, se da respuesta a la cuestión planteada.

z

2* α

- pruebaZ0

pruebaZ

2* α

Fig 11.3:

z

* α

pruebaZ

0

Fig 11.2:Fig. 11.1:

* α

pruebaZ0

z

Page 93: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 93/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.92

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Crisis económica

Se realiza un estudio con una muestra aleatoria de 657 familias del Gran Santiago, de las cuales 278 han debido pedir préstamos para enfrentar las dificultades originadas por la crisis económica.

1.1. ¿Es suficiente esta información para asegurar con un 10% de significación que en la población del Gran Santiago, más deun 40% de las familias ha debido recurrir a préstamos para enfrentar la crisis?

1.2. En el contexto del caso, ¿en qué consiste cometer error de tipo II en el contraste anterior?

Solución:

1.1. Contraste

1º: Planteamiento de las hipótesis:

La hipótesis nula es: H0: p = 0,40

Hipótesis alternativa: H1: p > 0,40; ensayo de cola derecha.

Nótese que las hipótesis planteadas con consistentes con el enunciado del problema.

2º: Cálculos:

La proporción muestral es igual a:

657

278P= = 0,423

Si H0 es verdadera, entonces el error muestral es igual a:

657

600400p

,· ,=σ = 0,0191

Importante: Nótese que se usa p = 0,40, tal como lo expresa la hipótesis nula y no la P muestral 0,423. Esto es porque elmétodo asume que la hipótesis nula es verdadera hasta que los datos prueben lo contrario.

El estadístico de prueba es igual a:

01910

4004230z

,

,, −= = 1,20

3º: Cálculo del valor-p:

En este caso, el valor-p es la probabilidad de que Z sea mayor a 1,21. Se toma el lado “mayor que” porque el ensayo es de coladerecha.

Valor p: =α*  P(z > 1,20) = 0,1151 (según tabla)

1150,* =α

1,20 0

Z

Fig 11.4: 

Page 94: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 94/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.93

4º: Decisión:

Para decidir se compara el valor-p ( *α ) con el nivel de significación ( α )

Como >* α  0,10; NO se rechaza la hipótesis nula, al 10%.

5º: Conclusión:

De acuerdo a los datos, es posible afirmar que el % de familias del Gran Santiago que han debido recurrir a préstamos paraenfrentar la crisis no supera el 40% (p = 0,1151).

1.2. Error 

El error de tipo II es aceptar la hipótesis nula sendo que es falsa. En este caso es “aceptar” que en la población del GranSantiago el 40% de las familias ha debido recurrir a préstamos para enfrentar la crisis, siendo que es falso.

2. Estrés laboral

Se encontró, en una muestra de 136 trabajadores del nivel ejecutivo de una empresa de venta de intangibles, un total de 25 quepresentan síntomas emocionales, con ansiedad y ánimo depresivo, expresados como desánimo y hastío por el trabajo.

Los directivos de la empresa declararon, que si bien estos corresponden a síntomas de estrés laboral, el fenómeno no alcanza aafectar al 20% de sus ejecutivos, proporción considerada como “normal” para el tipo de trabajo que desarrollan.

Con una significación del 1%, ¿es posible con estos resultados refutar la declaración de los directivos de la empresa?

Solución:

Se trata de un contraste de proporciones, en donde los directivos desean probar que el fenómeno descrito afecta a menos del20% de sus ejecutivos. Como la proporción muestral es 18,4% resulta atractivo realizar dicho contraste.

1º: Hipótesis

:0H p = 0,20

:1H p < 0,20 (ensayo de cola izquierda).

2º: Datos y cálculos:

Nivel de significación: 0,01 (está dado)

Proporción muestral: P = 25/136 = 0,1838

Error muestral:136

800200p

,· ,=σ = 0,0343

Estadístico de prueba:03430

20018380Z

,

,, −= = -0,47

Cálculo del valor-p: *α = P(Z < -0,47) = 0,3192 (según tabla)

3º: Decisión:

Como *α > α , ya que 0,3192 > 0,01; entonces, no se puede rechazar H0, al 1%.

4º: Conclusión:

La proporción de afectados por los síntomas del estrés laboral no es menor al 20% (p = 0,3192).

Por lo tanto, con los datos con que se cuenta, es posible refutar la declaración de los directivos.

Page 95: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 95/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.94

Comentario:

(1) El hecho de que el % muestral (18,4%) sea menor que el planteado en la hipótesis nula (20%), no lleva necesariamente ainferir que en la población ocurre lo mismo. Como sabemos, la proporción muestral tiene cierta variabilidad (error muestral) y, por lo tanto, el 18,4% perfectamente cae dentro de los valores posibles del 20% poblacional.

(2) El método de contraste de hipótesis “protege” a la hipótesis nula. Es más, la considera verdadera hasta que los datosempíricos demuestren que la diferencia es significativa, tal que no hay más remedio que rechazarla. Esta situación se ve

reforzada por el hecho de que la probabilidad de rechazar la hipótesis nula es de solo un 1%, correspondiente al nivel designificación empleado en la prueba.

3. Televisores en el hogar 

Cierta publicación afirma que el 60% de los hogares chilenos tiene más de un televisor en casa. Para verificar esta afirmación sehace un muestreo en 340 hogares, resultando 184 que, efectivamente, tienen más de un televisor.

3.1. ¿Es suficiente este dato numérico para apoyar la afirmación de la publicación? Use un 5% de significación.

3.2. En qué consiste el error de tipo I en la dócima anterior?

Solución:

Se trata de una prueba de hipótesis de proporciones en diseño de dos colas.1º: Hipótesis

:0H p = 0,60

:1H p ≠ 0,60 (ensayo de dos colas).

2º: Datos y cálculos:

Nivel de significación: 0,10 (está dado al principio)

Proporción muestral: P = 184/340 = 0,541

Error muestral:340

400600p

,· ,=σ = 0,0266

Estadístico de prueba:02660

6005410Z

,

,, −= = -2,22

3º: Valor-p:

Cálculo del valor-p: *α = 2 · P(Z < -2,21) = 2 · 0,0132 = 0,0264

Nótese que el valor-p de una cola se multiplica por dos, porque el ensayo es bilateral (de dos colas).

4º: Decisión:

Como *α < 0,05; entonces, se rechaza H0 con un 5% de significación.

5º: Conclusión:

Al 5%, la proporción de hogares con más de un televisor NO es el 60% (p = 0,0264)

La información presentada no resulta suficiente para apoyar la afirmación publicada.

3.2. El error de tipo I es rechazar una hipótesis (nula) siendo que es verdadera.

En este caso consiste en rechazar que el 60% de los hogares chilenos tiene más de un televisor en casa, siendo que esverdadero.

Page 96: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 96/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.95

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Usuarios de Internet

Una investigación sobre los usuarios de Internet consideró dentro del estudio, la determinación de la proporción de hombres y demujeres usuarios habituales de Internet, en cualquiera de sus servicios. (H = hombres; M = mujeres)

El estudio llegó a las siguientes conclusiones:C1: La proporción de hombres usuarios habituales de los servicios de Internet supera el 30% (p = 0,0345).

C2: El 25% de las mujeres son usuarias habituales de los servicios de Internet (p = 0,0745).

1.1. Para la conclusión C1, la hipótesis nula fue:

A) Hp = 0,30 B) Hp > 0,30 C) Hp < 0,30 D) Hp ≠ 0,30 E) Hp > Mp

1.2. Para la conclusión C1, de las siguientes afirmaciones:

I: Se rechazó 0H al 1%

II: Se rechazó 0H al 5%

II: No se comete error de tipo IEs (son) correcta(s):

A) Solo I B) Solo II C) Solo I o II D) Solo II o III E)

1.3. Para la conclusión C1, de los niveles de significación siguientes:

I: 1% II: 5% III: 10%

¿Cuál(es) permite(n) llegar a la conclusión?

A) Solo I B) Solo II C) Solo I y II D) Solo II y III E) Cualquiera de los tres

1.4. De las siguientes hipótesis para la conclusión C2:

I: Mp > 0,25 II: Mp < 0,25 III: Mp ≠ 0,25 

Corresponde(n) a posible(s) hipótesis alternativa(s) para la conclusión C2:

A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

1.5. Para la conclusión C2, se afirma que:

I: La hipótesis nula fue Mp = 0,25

II: La hipótesis nula fue rechazada

III: Es posible rechazar la hipótesis nula al 10%

Es (son) correcta(s):

A) Solo I B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

Page 97: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 97/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.96

2. Estudio de mercado

Un estudio de mercado testea un nuevo producto lácteo, con una muestra aleatoria de 420 niños de ambos sexos, encontrandoque a 95 de ellos no les gustó el envase del producto.

2.1. Un intervalo de confianza del 90% de la proporción poblacional de niños que no les gusta el envase es:

A) Entre 22,6 y 26,0%

B) Entre 19,2 y 26,0%

C) Entre 18,3 y 25,1%

D) Entre 17,5 y 25,5%

E) Entre 17,0 y 25,0%

2.2. Si la empresa decide que haría modificaciones al envase si el % de rechazo de los niños(as) es mayor al 20%, ¿cuál es lahipótesis nula en la correspondiente dócima de hipótesis?

A) p = 0,20 B) p > 0,20 C) p < 0,20 D) p ≠ 0,20 E) p = 0,226

2.3. Si la empresa decide que haría modificaciones al envase si el % de rechazo de los niños(as) es mayor al 20%, ¿cuál es el

valor-p de la prueba en la correspondiente dócima de hipótesis?A) 0,1408 B) 0,8907 C) 0,050 D) 0,0214 E) 0,1020

2.4. Si la empresa afirma que haría modificaciones al envase si el % de rechazo de los niños(as) es mayor al 20%, ¿cuál ocuáles de las siguientes conclusiones son correctas al 5% de significación?

I: El rechazo del envase por parte de los niños(as) de la población es mayor al 20%.

II: No tienen que cambiar el envase, ya que no hay pruebas para afirmar que el rechazo es mayor al 20%.

III: Al 5% de significación, el rechazo del envase por parte de los niños(as) no es mayor al 20%

A) Solo I B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

3. Consumo de tranquilizantes

Ciertos estudios hacen pensar que más de un quinto de los trabajadores del sector transporte público consumen tranquilizantesen alguna de sus formas.

Con datos empíricos se contrasta la hipótesis correspondiente, al 5%, llegando a un valor-p = 0,00276.

Entonces, con un 5% de significación se puede concluir que:

A) El 20% de los trabajadores del sector transporte público consume tranquilizantes

B) Menos de un quinto de los trabajadores del sector transporte público consume tranquilizantes

C) Más de un quinto de los trabajadores del sector transporte público consume tranquilizantes

D) El 5% de los trabajadores del sector transporte público consume tranquilizantesE) Cuando más, el 20% de los trabajadores consume tranquilizantes

Solución a problemas propuestos:1.1. A 1.2. B 1.3. D 1.4. E 1.5. C

2.1. B 2.2. A 2.3. E 2.4. D

3. C

Page 98: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 98/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.97

V. RECURSOS COMPLEMENTARIOS1. Texto: capítulo 9

Mendenhall – Beaver – Beaver. Introducción a la probabilidad y estadística. Thomson Learning, 2008. ISBN-13: 978-970-686-794-0.

Ver ejercicios en capítulo 9

2. Test de hipótesis: conceptos generales.

http://www.bioestadistica.freeservers.com/temas.html 

Sitio muy completo, que presenta desde los métodos estadísticos básicos hasta los métodos de inferencia más complejos.También incluye una gran variedad de Tablas estadísticas usuales.

Tema 12. Teoría de la decisión estadística: Hipótesis estadísticas. Validaciones estadísticas: uso del test de hipótesis. Modelode Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones demedias y proporciones. Intervalos de confianza versus tests de hipótesis. Ejemplos.

3. Contraste de hipótesis de proporciones

http://ftp.medprev.uma.es/libro/html.htm 

9.6 Contrastes de una proporción 

9.6.0.1 Contraste bilateral 

9.6.0.2 Contrastes unilaterales 

Page 99: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 99/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.98

3ª UNIDAD: DÓCIMAS DE HIPÓTESIS CLASE 12

Contraste de la diferencia de proporciones 

«El sol cada día es nuevo».Heráclito.

APRENDIZAJES ESPERADOS CONTENIDOS

-Realizan pruebas de hipótesis para la diferencia de proporciones.-Analizan e interpretan los resultados de la dócimas de hipótesis de diferencia de proporciones enel contexto de casos dados.

-Pruebas de hipótesis para ladiferencia de proporciones.

II. DESARROLLO

1. La situación

En ocasiones, una investigación requiere establecer comparaciones entre las proporciones de dos segmentos. En estos casos,se debe realizar un contraste de diferencia de proporciones.

Ejemplos:

•  El % de hombres que fuman es igual al % de mujeres que fuman.

•  El % de matrimonios que se divorcian es mayor en zonas urbanas que en zonas rurales.

La situación se ilustra en el siguiente esquema.

Población AAp  

Población BBp  

AP BP

?=− BA pp

Fig 12.1: Esquema del contraste de la diferencia

de proporciones

Page 100: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 100/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.99

2. El cont raste de la diferencia de proporciones

Se tienen dos muestras de tamaños An y Bn , provenientes poblaciones binomiales A y B, con proporciones Ap y Bp ,

respectivamente. Se desea saber si las diferencias entre AP y BP son significativas o simplemente es producto de la

aleatoriedad (error) propia de los fenómenos estadísticos.

Se tiene, para cada muestra:Muestra de A: An  ; Ax Σ ; AP  

Muestra de B: B n  ; B x Σ ; BP

3. Hipótesis 

Para realizar el contraste de hipótesis se plantean las siguientes hipótesis:

3.1. Hipótesis nula:00 =− B A p p : H   

La hipótesis nula postula que las proporciones son iguales en la población A y en la B, de modo que no hay diferencia entreellas. Esto significaría que ambas muestras provienen de una misma población.

3.2. Hipótesis alternativas:

01 >− B A p p : H   

Esta hipótesis alternativa indica que la proporción es mayor en la población A que en la B, de modo que la diferencia B A p p  −  

entre ellas es mayor que cero.

01 <− B A p p : H   

Esta hipótesis alternativa indica que la proporción es mayor en la población B que en la A, de modo que la diferenciaB A

p p  −  

es menor que cero.

01 ≠− B A p p : H   

Esta hipótesis alternativa indica que la proporción es distinta en la población B que en la A, de modo que la diferencia B A p p  −  

es distinta de cero. No especifica cuál proporción es mayor.

4. Error muestral de la diferencia de propor ciones

En cada muestra se tiene lo siguiente:

An  ; Ax Σ ; Ap   

B n  ; B x Σ ; B p   

Asumiendo que la H0 es verdadera, el mejor estimador de la proporción poblacional es p:

BA

BA

nn

xxp

+

Σ+Σ=ˆ ; O bien:

BA

BBAA

nn

pnpnp

++

=· · 

ˆ  

Page 101: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 101/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.100

Es importante aclarar que, asumiendo verdadera la hipótesis nula de queno hay diferencia entre las proporciones poblacionales,ambas muestras, A y B, pertenecen a una misma población, con una misma proporción poblacional. De este modo, sumando losdatos muestrales de ambos segmentos, se tiene una muestra de mayor tamaño, lo que ayuda a minimizar el error.

El error estándar para la diferencia de proporciones muestrales es igual a:

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +=σ −

BApp n

1

n

1qp

BAˆ· ˆ  

5. Estadístico de prueba

Se usa el estadístico siguiente:

BA pp

BA PPZ

−σ

−=  

Cuando H0 es cierta, este estadístico se comporta como una distribución Z (normal estándar).

6. Valor p de la prueba

Ensayo de cola derecha: =α*  P( z  > pruebaz )

Ensayo de cola izquierda: =α*  P( z  < pruebaz )

Ensayo de 2 colas: =α*  2 · P(z  > pruebaz )

7. Criterio de decisión

A un nivel de significación α :

•  Rechazar H0 si α<α*  

•  No rechazar en caso contrario

Nota: toda decisión se refiriere exclusivamente a la hipótesis nula.

8. Condici ones y restricciones de la prueba

-Población: la población en estudio debe ser planteada como binomial para ambas muestras.

-Tamaño de la muestra: el modelo funciona muy bien cuando ambas muestras son mayores que 50.

-Para muestras chicas (n < 30) esta prueba no es aplicable.

-Las muestras deben ser independientes entre sí.

9. ResumenPara contrastar una hipótesis de diferencia de proporciones se siguen los siguientes pasos:

1º: Plantear las hipótesis: esto es, traducir las hipótesis al lenguaje algebraico, planteando H0 y H1.

2º: Calcular el estadístico de prueba: esto es, calcular los P muestrales, el error muestralBA pp −σ y Z de prueba.

3º: Calcular el valor p: Con Z de prueba, se calcula *α , según ensayo de cola izquierda, cola derecha o dos colas.

4º: Aplicar la regla de decisión: comparando *α con α , se decide rechazar o no H0 con significación α .

5º: Construir la conclusión: conectando la decisión con las hipótesis, se da respuesta a la cuestión planteada.

Page 102: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 102/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.101

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Consumo cultural

En el marco de un estudio sobre hábitos de consumo cultural, se consultó a los encuestados si escuchaban música a diario. Deun total de 425 mujeres y 560 hombres encuestados, 148 mujeres y 160 hombres declararon que sí escuchaban músicadiariamente.

La proporción de personas que escuchan música a diario, ¿es mayor en las mujeres que en los hombres? Use un 5% designificación.

Solución:

1º: Planteamiento de hipótesis:

H0: HM pp − = 0

H1: HM pp − > 0

2º: Datos muestrales:

Mujeres (M) Hombres (H) TOTAL

Muestra 425 560 985

Casos favorables 148 160 308

P muestral 148/425=0,348 160/560=0,286 308/985=0,313

Error muestral de la diferencia de proporciones:

⎟ ⎠

 ⎞⎜⎝ 

⎛ +=σ − 560

1

425

168703130

HM pp · ,· , = 0,0298

Cálculo del estadístico de prueba:

02980

28603480zobs

,

,, −= = 2,08

Nótese que en el numerado se ordenaron las proporciones muestrales tal cual lo expresa la hipótesis nula HM pp − .

3º: Valor p de la prueba:

=α*  P(z > 2,08) = 0,0188 (según tabla)

4º: Decisión: Como <α*  0,05, se rechaza H0, al 5%.

5º: Conclusión: la proporción de mujeres que diariamente escuchan música es mayor que la proporción de hombres que lohacen (p=0,0188).

Page 103: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 103/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.102

2. Nutric ión y tabaquismo en la tercera edad

En el marco de una investigación de salud y nutrición en la tercera edad, se investiga el hábito de fumar y el estado nutricionalen una muestra de 125 personas que presentan desnutrición y 250 que presentan un estado de nutrición normal.

Los datos generados permitieron construir la tabla siguiente:

FumaEstadonutricional Sí No

Total

Normal 55 195 250

Desnutrición 40 85 125

Total 95 280 375

2.1. Calcular un intervalo de confianza del 95% para la proporción de la tercera edad en estado normal de nutrición que fuma.

2.2. Contraste al 5% la hipótesis relacionada con la afirmación: “Menos del 30% de las personas de la tercera edad en estado dedesnutrición, fuman”.

2.3. Realice, al 5%, el test correspondiente para contestar la pregunta de investigación: “Las personas de la tercera edad en

estado de desnutrición ¿fuman en mayor proporción que los de estado normal de nutrición?”.2.4. ¿Cuántas personas más de la población de personas con desnutrición se requieren encuestar para trabajar con un 95% deconfianza y un error de no más del 5%?

Solución:

2.1. Con los datos de la fila “normal” de la tabla se obtiene:

=n  250; =Σx  55 fuman;250

55p= = 0,22

Entonces, el error muestral de la proporción es:

250

780220p

,· ,=σ = 0,0262

Luego, el intervalo del 95% confianza para la proporción poblacional es igual a:

P = 02620961220 ,· ,, ±  

P = 0510220 ,, ± ; con un 95% de confianza.

R: La proporción poblacional de personas de la tercera edad en estado normal de nutrición que fuma fluctúa entre el 19,9% y el27,1%, con un 95% de confianza.

2.2. Contraste: se trata de una dócima de la proporción, de cola izquierda.Planteando las hipótesis:

H0: p = 0,30

H1: p < 0,3 (ensayo de cola izquierda)

=n  125; =Σx  40 fuman;125

40p= = 0,32

Page 104: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 104/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.103

125

7030p

,· ,=σ = 0,0410

Estadístico de prueba:

04100

30320z

,

,, −= = 0,49

Valor p: =α*  P(z < 0,49) = 0,6879

No se rechaza la hipótesis nula, al 5%.

Conclusión: El % de personas de la tercera edad en estado de desnutrición que fuman no es menor al 30% (p = 0,6879)

2.3. Contraste: se trata de un test de diferencia de proporciones. El tipo de ensayo – cola derecha o cola izquierda – dependeráde cómo se plantee la hipótesis nula. 

Hipótesis:

Haciendo: D = Desnutrición; N = Normal

H0: ND pp − = 0

H0: ND pp − > 0; (conduce a un ensayo de cola derecha)

Datos muestrales:

Normal (N): =n  250; =Σx  55 fuman;250

55PN = = 0,22

Desnutrición (D): =n  125; =Σx  40 fuman; 125

40PD = = 0,32

Total (T): =n  375; =Σx  95 fuman;375

95p=ˆ = 0,253

Error muestral de la diferencia de proporciones:

⎟ ⎠

 ⎞⎜⎝ 

⎛  +=σ − 125

1

250

174702530

ND pp · ,· , = 0,0476

Cálculo del estadístico de prueba:

04760220320

,

,,

z obs 

−= = 2,10

Valor p de la prueba:

=α*  P(z > 2,08) = 0,0188 (según tabla).

Como el valor p es menor a la significación, se rechaza H0 al 5%.

Conclusión: Las personas de la tercera edad en estado de desnutrición, fuman en mayor proporción que los de estado normal denutrición (p = 0,0188).

Page 105: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 105/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.104

2.4. Tamaño de la muestra 

Para el segmento con desnutrición se tiene:125

40p = = 0,32

Para el 5% de confianza, el valor de Z: =9750Z , 1,96

El error del 5% es: e= 0,05

Entonces:

2

2

050

680320961

,

,· ,· ,n  = = 335 personas

Por lo tanto, se necesitan 335 – 125 = 207 persona más con desnutrición.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Participación económica 

Se estudia, con un 5% de significación, la tasa de participación económica en determinada región de Chile de la población de 60años y más, por sexo, teniendo como orientación inicial las siguientes preguntas de investigación:

P1: La tasa de participación económica de los hombres en este grupo etario y región, ¿es mayor al 28%?

P2: En este grupo etario y región, la tasa de participación económica de las mujeres ¿es del 40%?

P3: Los datos empíricos, ¿permiten afirmar que en esta región y segmento etario la tasa de participación económica es mayor en los hombres que en las mujeres?

Los datos empíricos generados por la investigación son los siguientes:

ParticipaciónMayores de 60 años, por participación económica y sexo.

Sí No

Mujer (M) 86 178Sexo Hombre (H) 137 189

1.1. ¿Cuál de las siguientes corresponde a la hipótesis nula en el contraste de la pregunta P1?

A) Hp = 0,28 B) Hp > 0,28 C) Hp < 0,28 D) Hp ≠ 0,28 E) Hp = Mp

1.2. Respecto de la conjetura P2, se afirma lo siguiente:

I: La probabilidad de error de tipo I en la dócima es igual al 5%

II: Conduce a un contraste de dos colas

III: La hipótesis alternativa es Mp ≠ 0,40

Es (son) correcta(s):

A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

Page 106: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 106/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.105

1.3. Respecto de la conjetura P3, se afirma que:

I: Conduce a un contraste de diferencia de proporciones

II: Se puede contrastar con un ensayo de cola izquierda o de cola derecha

III: El riesgo de error tipo II es del 5%

Es (son) correcta(s):A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

1.4. En el contraste para responder la pregunta P3, el error estándar es igual a:

A) 0,0235 B) 0,0354 C) 0,0401 D) 0,0488 E) 0,0506

1.5. En el contraste para responder la pregunta P3, el p-value es aproximadamente:

A) 0,0096 B) 0,0126 C) 0,0192 D) 0,05 E) 0,99

1.6. Una vez realizado el contraste para la pregunta P3, la conclusión, respecto de la participación económica en esta región ysegmento etario, es:

A) Hombres y mujeres trabajan por igualB) Los hombres trabajan hasta una mayor edad que las mujeres

C) Se da en mayor proporción en las mujeres que en los hombres

D) Las mujeres participan en menor proporción que los hombres

E) Hombres y mujeres participan en igual proporción

2. Fenómeno burnout

Cierta empresa multinacional, que da empleo en Chile a más de 1.400 personas de ambos sexos, está preocupada por unsupuesto crecimiento del estrés laboral en su personal.

Para evaluar la situación, la empresa encarga a un equipo de profesionales de la prevención de riesgos, administradores y

psicólogos laborales, la realización de una investigación bajo el enfoque del llamado fenómeno Burnout.Para los efectos, se le aplica a una muestra de trabajadores, mujeres y hombres, un cuestionario que permite evaluar a cadatrabajador y clasificarlo en una de tres categorías: Sano, fronterizo y burnout, siendo el segmento fronterizo, de riesgo, mientrasque los burnout se les considera realmente enfermos de cierta gravedad.

Los trabajadores encuestados son segmentados de la siguiente manera:

Por sexo: H = hombre, M = mujer 

Por segmento etario: J = joven y adulto joven; A = adulto y adulto mayor 

A continuación se mencionan dos conclusiones a las que llegó el estudio:

C1: Las mujeres se ven afectadas por el burnout en igual proporción que los hombres (p = 0,2256). 

C2: En el segmento “joven y adulto joven”, se da una mayor proporción de burnout que en el segmento “adulto y adultomayor (p = 0,0133). 

2.1. En la conclusión C1, se plantea como hipótesis nula:

A) MH pp − > 0 B) MH pp − < 0 C) MH pp −   ≠ 0 D) MH pp − = 0 E) MH pp − = 0,05

Page 107: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 107/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.106

2.2. En el contraste de la conclusión C1, el error de tipo I consiste en:

A) Rechazar que las mujeres se ven afectadas en igual % que los hombres, siendo que es falso

B) Rechazar que las mujeres se ven afectadas en igual % que los hombres, siendo que es verdadero

C) Rechazar que las mujeres se ven afectadas en menor % que los hombres, siendo que es verdadero

D) Aceptar que las mujeres se ven afectadas en igual % que los hombres, siendo que es falso

E) Aceptar que las mujeres se ven afectadas en menor % que los hombres, siendo que es falso

2.3. En el contraste de la conclusión C2, de las afirmaciones siguientes:

I: Se rechazó la hipótesis nula

II: El error de tipo II alcanza a 0,0133

III: la hipótesis alternativa es AJ pp >  

Es (son) correcta(s):A) Solo I B) Solo II C) Solo III D) Solo I y II E) Solo I y III

2.4. En el contraste de la conclusión C2, la hipótesis nula se expresa como:

A) En el segmento “joven y adulto joven”, se da un mayor % de burnout que en el segmento “adulto y adulto mayor”B) En el segmento “joven y adulto joven”, se da un menor % de burnout que en el segmento “adulto y adulto mayor”

C) En el segmento “joven y adulto joven”, se da un % igual de burnout que en el segmento “adulto y adulto mayor”

D) En el segmento “joven y adulto joven”, se da un % distinto de burnout que en el segmento “adulto y adulto mayor”

E) Hay diferencias en el % de burnout entre el “joven y adulto joven” y el “adulto y adulto mayor”

Solución a problemas propuestos:1.1. A 1.2. E 1.3. B 1.4. C 1.5. A 1.6. D

2.1. D 2.2. B 2.3. E 2.4. C

V. RECURSOS COMPLEMENTARIOS1. Test de hipótesis

http://www.bioestadistica.freeservers.com/temas.html 

Sitio muy completo, que presenta desde los métodos estadísticos básicos hasta los métodos de inferencia más complejos.También incluye una gran variedad de Tablas estadísticas usuales.

Tema 12. Teoría de la decisión estadística: Hipótesis estadísticas. Validaciones estadísticas: uso del test de hipótesis. Modelode Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones demedias y proporciones. Intervalos de confianza versus tests de hipótesis. Ejemplos.

2. Contraste de diferencia de proporciones

http://ftp.medprev.uma.es/libro/html.htm 

9.12 Contrastes sobre la diferencia de proporciones 

9.12.0.1 Contraste bilateral 

9.12.0.2 Contrastes unilaterales 

9.14 Problemas 

3. Texto: Mendenhall – Beaver – Beaver. Introducción a la probabilidad y estadística. Thomson Learning, 2008. ISBN-13: 978-970-686-794-0.

Complementar conceptos y ver ejercicios en capítulo 9.5 y 9.6. Prueba de hipótesis con muestra grande para una poblaciónbinomial y para diferencia de proporciones.

Page 108: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 108/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.107

3ª UNIDAD: DÓCIMAS DE HIPÓTESIS CLASE 13

Contraste de hipótesis de la media

«No ha de maravillarnos que el azar pueda tanto sobre nosotros,partiendo de que vivimos por azar».

Novalis.

APRENDIZAJES ESPERADOS CONTENIDOS

-Realizan pruebas de hipótesis para la media con varianza conocida.-Realizan pruebas de hipótesis para la media con varianza desconocida.-Analizan e interpretan los resultados de la dócimas de hipótesis de medias en el contexto decasos dados.

-Prueba de hipótesis para la mediacon varianza desconocida.

II. DESARROLLO

1. La situación

Cuando se afirma o conjetura que en la población hay una variable numérica que presenta un cierto promedio (media aritmética),se está haciendo una afirmación de un valor de una media poblacional. Por ejemplo:

•  Los hogares chilenos consumen mensualmente un promedio de $95.000 en mercaderías.

•  Las carreras universitarias chilenas duran, en promedio, 13,5 semestres.

Como toda hipótesis estadística, estas deben contar con un referente empírico y contrastarse o ponerse a prueba a través de unprocedimiento válido en el mundo de las ciencias. Para este caso hablamos de “contraste de la media”.

La situación es: se tiene una muestra de tamaño n, con una media x y una varianza 2S , proveniente de una población normalo aproximadamente normal, con media μ y varianza 2σ desconocida.

2. Hipótesis 

2.1. Hipótesis nula:

:0H 0μ=μ  

Esta hipótesis indica que la media poblacional es una cantidad 0μ , siendo 0μ un número real.

2.2. Hipótesis alternativas:

Dependiendo de la situación, se pueden plantear tres tipos de hipótesis alternativas:

:1H 0μ>μ . Conduce a un ensayo de cola derecha.

Esta hipótesis expresa que la media poblacional es mayor que el valor que postula la hipótesis nula.

:1H 0μ<μ . Conduce a un ensayo de cola izquierda.

Esta hipótesis expresa que la media poblacional es menor que el valor postulado por la hipótesis nula.

:1H 0μ≠μ . Conduce a un ensayo de 2 colas.

Esta hipótesis expresa que la media poblacional es distinta que el valor postulado por la hipótesis nula.

Page 109: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 109/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.108

3. Error muestral de la media

Ya se planteó en clases anteriores que el error muestral de la media es igual a:

=σ xn

σ 

En la generalidad de los casos, el valor de la desviación estándar poblacional σ es desconocido y, por lo tanto debe estimarsea partir de la desviación estándar muestral S. De este modo, el error estándar de la media es igual a:

=σ x1n

S

−;

Siendo S la desviación estándar de la muestra de tamaño n (en la calculadora: nxσ ).

También puede definirse como:

=σ xn

S;

Siendo Sla desviación estándar insesgada (en la calculadora:1n

x−

σ ).

Cualquiera de las dos últimas fórmulas entrega el mismo resultado.

4. Estadístico de prueba

Se deben separar aquí dos casos:

4.1. Para muestra grande (n ≥ 30)

El estadístico de prueba es:

x

0xZ

σ

μ−= ;

Siendo x la media muestral,0

μ es valor de la media que señala la hipótesis nula yx

σ el error muestral de la media.

El estadístico Z, cuando la hipótesis nula es verdadera, se distribuye como una Z normal estándar.

4.2. Para muestra chica (n < 30)

El estadístico de prueba es:

x

0xt

σ

μ−= ;

Siendo x la media muestral, 0μ es valor de la media que señala la hipótesis nula y xσ el error muestral de la media.

Cuando la hipótesis nula es verdadera, este estadístico t se distribuye como una t con (n – 1) grados de libertad.11 

5. Valor p de la prueba ( *α ) 

Como el criterio del valor p es el método más utilizado en la actualidad para el contraste de todo tipo de hipótesis, se aplicarápara esta dócima.

El valor p, llamado también p-value o *α , es la probabilidad que queda sobre el Z o t de prueba o bajo este, según el tipo deensayo (cola derecha, cola izquierda o dos colas). Se determina con la tabla Z o t, según corresponda.

11 Ver 11: La distribución de probabilidad t de Student

Page 110: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 110/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.109

6. Cálculo del valor p de la prueba

Para ensayo de cola derecha: =α*  P(z  > pruebaz ).

Para ensayo de cola izquierda: =α*  P(z  < pruebaz ).

Para ensayo de dos colas: =α*  2 · P(z  > pruebaz ).

Para el caso de usar t, se reemplaza pruebaz por el pruebat , con (n – 1) grados de libertad.

7. Criterio de decisión

Con un nivel de significación α :

Se rechaza H0 si α<α*   

No se rechaza H0 en caso contrario

Nota: toda decisión se refiriere exclusivamente a la hipótesis nula.

8. Conclusi ónTomando como base la decisión de rechazar o no la hipótesis nula, se construye una conclusión que debe apuntar directamentea la pregunta o conjetura planteada. La conclusión es una afirmación que suele ir acompañada por el valor p de la prueba entreparéntesis, como modo de sustentar dicha afirmación.

Ejemplo: “El promedio de años de estudio de la población es menor a 5 años (p = 0,0344)” 

En este ejemplo, el valor p entre paréntesis indica que la prueba de hipótesis dio un valor p = 0,0344. El texto de la conclusiónhace ver que la hipótesis nula fue rechazada a favor de la hipótesis alternativa de cola izquierda. En este caso el nivel designificación, que si bien no se expresa, puede ser 5% o 10%, ya que en ambos casos la H0 se rechaza, no así si fuera 1%.

9. Supuestos, condi ciones y restricc iones de la prueba

•  Población: la población en estudio debe ser una variable numérica normal o aproximadamente normal.

•  Tamaño de la muestra: el modelo Z funciona muy bien para muestras mayores que 30.

•  Para muestras menores a 30, usar el modelo de la t de Student.

•  La varianza poblacional es desconocida.

•  La muestra es aleatoria e independiente.

10. Resumen

En resumen, para contrastar una hipótesis de la media se siguen los siguientes pasos:

1º: Plantear las hipótesis: esto es, traducir las hipótesis al lenguaje algebraico, planteando H0 y H1.

2º: Calcular el estadístico de prueba: calcular Z o t de prueba.

3º: Calcular el valor p: Con Z o t de prueba se calcula *α , según ensayo de cola izquierda, cola derecha o dos colas.4º: Aplicar la regla de decisión: comparando *α con α , se decide rechazar o no H0 con significación α .

5º: Construir la conclusión: conectando la decisión con las hipótesis, se da respuesta a la cuestión planteada.

Page 111: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 111/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.110

11. La distribución de probabil idad t de Student

11.1. La distribución t:

La distribución t es una curva de probabilidad continua muy similar a la curva normal, pero más aplastada y un poco más abierta.Tiene propiedades semejantes a la normal en cuanto eje simetría en t = 0, con valores negativos y positivos, siendo el área totalbajo la curva igual a 1. Sus percentiles dependen de un parámetro llamado grados de libertad (gl), que es una función de lacantidad de datos con se cuenta. Los grados de libertad, que se simbolizan con la letra griega ν , son números enteros que van

desde 1, 2, 3, etc.

La distribución t se caracteriza por:

•  Media aritmética: μ = 0

•  Varianza:2

2

−νν

=σ ; con 2>ν  

•  Desviación Estándar:2−ν

ν=σ ; con 2>ν  

La curva t es, en realidad, una familia de curvas, cada una de las cuales depende de los grados de libertad. A medida que

aumentan los grados de libertad, la curva t se va pareciendo más a la normal Z, coincidiendo con esta cuando los grados delibertad son infinitos.

11.2. Percentiles de la dist ribución t:Los percentiles de la distribución t se escriben ν;pt , en donde p indica la probabilidad que queda bajo el valor de t y ν son los

grados de libertad, que pueden ser 1, 2, 3,… etc.

Por ejemplo: 86750t ;, indica el valor de t que deja bajo él el 67,5% de la distribución y tiene 8 gl. Use la tabla de percentiles t.

Figura 13.2.

Como la tabla indica en la fila superior el valor de p a la derecha (probabilidad superior), se debe buscar la columna con en elvalor 1 – 0,675 = 0,325 y la fila 8, que indica los grados de libertad.

ν =1

0t

ν =2

∞→ν

Fig 13.1: La distribución t

ν =8 gl

86750t ;,0

t

0,6750,325

Fig 13.2:

Page 112: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 112/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.111

Según la tabla t ese valor es: 0,471.

Entonces: 86750t ;, = 0,471

11.3. Cálculo de la probabilidad en l a tabla t

Para este caso se debe tener el valor de t y los grados de libertad. Use la tabla t de probabilidad superior.

Por ejemplo, P( ≥18pt ; 0,7) =

Esto es; ¿Cuál es la probabilidad superior de t = 0,7 con 18 grados de libertad?

Gráficamente esto es:

Con la tabla se determina que P( ≥18pt ; 0,7) = 0,246

p

gl

gl

ν =18 gl

70,  0

t

p=?

Fig 13.3:

Fig 13.4:

Fig 13.5:

Page 113: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 113/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.112

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Uso de la tabla t1.1. Calcular  15950t ;, =

1.2. Calcular  4150t ;, =

1.3. Calcular P( ≥9pt ; 1,2)1.4. Calcular P( ≤25pt ; 1,5)

1.5. Calcular P( ≤8pt ; -0,6)

Solución:

1.1. Es el valor de t con 15 grados libertad, que deja bajo él el 95% de la distribución.

Según tabla: 15950t ;, = 1,753

1.2. Es el valor de t con 4 grados libertad, que deja bajo él el 15% de la distribución.

Como es un percentil menor al 50%, significa que queda bajo el valor t = 0 y, por lo tanto, t es negativo.

De la tabla se obtiene que 4850t ;, = 1,190

Por lo tanto: 4150t ;, = –1,190

1.3. Se trata de la probabilidad superior cuando t = 1,2 con 9 gl.

Según tabla: P( ≥9pt ; 1,2) = 0,130

1.4. Corresponde a la probabilidad inferior, cuando t = 1,5 con 25 gl.

La tabla entrega una probabilidad superior igual a: 0,073.

Por lo tanto, la probabilidad inferior es 1 – 0,073 = 0,927.

Luego: P( ≤25pt ; 1,5) = 0,927.

1.5. Corresponde a la probabilidad inferior, cuando t = -0,6 con 8 gl.

Es equivalente calcular P( ≥8pt ; 0,6). La tabla entrega una probabilidad superior igual a:.

Por lo tanto, P( ≤8pt ; -0,6)= 0,283

2. Cálculo del valor p

Se han realizado una serie de pruebas de hipótesis de la media, encontrando los siguientes valores del estadístico de prueba.Complete el cuadro con e valor p de la prueba.

Nº Tipo de ensayo Valor del estadísticode prueba

n Valor p

2.1. Cola izquierda Z = -2,32 80

2.2. Dos colas Z = 1,24 40

2.3. Cola izquierda Z = 0,78 125

2.4. Cola derecha t = 1,2 7

2.5. Dos colas t = 2,1 9

Page 114: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 114/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.113

Solución:

2.1. El valor p para ensayo de cola izquierda es la probabilidad a la izquierda del Z de prueba. Ver Fig 13.6.

Luego, valor p = 0,0102

En la distribución Z no interviene el tamaño de la muestra.

2.2. El valor p para ensayo de dos colas es igual a 2 veces la probabilidad sobre el valor del estadístico de prueba. Ver Fig 13.7.

Luego, valor p = 2 x 0,1075 = 0,215

2.3. El valor p para ensayo de cola izquierda es la probabilidad a la izquierda del Z de prueba. Ver Fig 13.8.

Luego, valor p = 0,7823

2.4. El valor p para ensayo de cola derecha es la probabilidad a la derecha del t de prueba, con 7 – 1 = 6 grados de libertad. Ver Fig 13.9.

Luego, valor p = 0,138

2.5. El valor p para ensayo de dos colas es igual a 2 veces la probabilidad sobre el valor de prueba. Ver Fig 13.10. 

Luego, valor p = 2 x 0,034 = 0,068

-2,32

Z

0,0102

Fig. 13.6:

0 1,24 

Z

0,1075

Fig 13.7:

0 0,78 Z

0,7823Fig 13.8: 

0 1,2 

t

0,138

Fig 13.9: 6 gl

0 2,1 

t

0,034

Fig 13.10: 

8 gl

Page 115: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 115/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.114

3. Tiempo de ejecución

Se analiza el tiempo probable de ejecución de un total de 152 actividades de la malla PERT de un proyecto, dando un tiempomedio de 72 días por actividad, con desviación estándar 20 días.

Se adopta como supuesto que los tiempos de las actividades se distribuyen en forma aproximadamente normal.

Se desea probar al 1% la hipótesis de que el tiempo medio por actividad es menor a 70 días.

3.1. Identifique el tipo de contraste y de ensayo

3.2. Indique qué modelo de probabilidad utilizaría para el contraste. Fundamente.

3.3. Realice la dócima correspondiente y construya la conclusión.

Solución:

3.1. Se trata de un contraste de hipótesis de la media con varianza desconocida y muestra grande, a realizar con un ensayo decola izquierda.

3.2. Se utilizará el modelo Z, ya que, aunque se desconoce la varianza, la muestra es lo suficientemente grande como paraobtener una muy buena aproximación.

3.3. Contraste

Hipótesis: H0: =μ 70 versus H1: <μ 70 (ensayo de cola izquierda)

Cálculo de estadísticos:

Error muestral de la media: =σ x1n

S

−=

151

20= 1,628 días.

Estadístico de prueba:x

0xZ

σ

μ−= =

6281

7072

,

−= 1,23

Valor-p: *α = P(Z < 1,23) = 0,8907 (según tabla)

Decisión: No se rechaza Ho, al 1%.

Conclusión: El tiempo medio por actividad no es menor a 70 días (p = 0,8907).

4. Lluvia ácida

Se ha afirmado que la acidez de la lluvia en cierta ciudad llega a un peligroso promedio de pH = 4. Para estudiar el caso con unnivel de significación del 1%, se han obtenido muestras de lluvia de 8 partes distintas de una ciudad. Estas son llevadas allaboratorio en donde se les determinó su pH, dando las siguientes medidas:

muestra 1 2 3 4 5 6 7 8

pH 4,8 3,7 5,1 4,2 3,8 5,4 3,8 4,0

Solución:

1º: Hipótesis:

H0: μ = 4

H1: μ   ≠ 4 (ensayo de dos colas)

Page 116: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 116/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.115

2º: Datos muestrales

=x 4,35

=S 0,6164414

Error muestral:18

61644140x

−=σ

,= 0,233

Estadístico de prueba:

Se usará el estadístico t porque se trata de una muestra chica y la varianza es desconocida.

x

0xt

σ

μ−=  

2330

4354t

,

, −= = 1,5

Este es un valor de t con 8 – 1 = 7 grados de libertad.

3º: Valor p = 2 · P( 7pt ; > 1,5) = 2 · 0,089 = 0,178

4º: Como *α > 0,01; no se rechaza H0, al 1%.

5º: Conclusión: El pH promedio de la lluvia es 4 (p = 0,178).

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Condiciones ambientales

Una industria requiere para el funcionamiento de su línea de producción una temperatura de 22ºC y 40% de humedad relativa.Una medición de la temperatura ambiental de la sala de producción cada 2 horas dio el siguiente resultado:

Medición 1 2 3 4 5 6 7 8 9 10 11 12

Temperatura (ºC) 18 20 23 20 23 22 22 22 18 21 20 19

1.1. La temperatura media muestral llega a:

A) 18,6ºC B) 20,7ºC C) 21,4ºC D) 22,7ºC E) 23,1ºC

1.2. El error estándar de la temperatura media es igual a:

A) 0,396ºC B) 0,491ºC C) 0,513ºC D) 1,699ºC E) 1,775

1.3. Respecto del contraste al 5% de la hipótesis de que la temperatura media es 22ºC, se afirma que:

I: La hipótesis nula es: ≠μ 22

II: Se contrasta con el modelo t

III: La probabilidad de error de tipo I es 0,05

Es (son) correcta(s):

A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

Page 117: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 117/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.116

1.4. Si se contrasta la hipótesis de que la temperatura media es 22ºC con un ensayo de dos colas, el valor p es,aproximadamente, igual a:

A) 0,015 B) 0,018 C) 0,042 D) 0,055 E) 0,03

1.5. Si se contrasta la hipótesis de que la temperatura media es 22ºC con un ensayo de dos colas, al 5% se concluye que:

A) La temperatura media no es 22ºC

B) La temperatura media es más de 22ºC

C) La temperatura media es menor a 22ºC

D) La temperatura media es de 20,7ºC

E) La temperatura media es menor a 20,7ºC

2. Contraste de la media

Se realiza un contraste de hipótesis de la media con ensayo de cola izquierda en una muestra de tamaño 10. El estadístico deprueba dio un valor -1,9.

2.1. El valor p de la prueba es:A) 0,045 B) 0,043 C) 0,0287 D) 0,086 E) 0,090

2.2. Respecto de este test de hipótesis, de las afirmaciones siguientes:

I: No se rechaza la hipótesis nula al 1%

II: Se rechaza la hipótesis nula al 5%

III: Se rechaza la hipótesis nula al 10%

Es (son) correcta(s):

A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

3. Tiempo de operación

Se toma el tiempo en que una muestra de 104 operarios del sector servicios eléctricos emplea individualmente en realizar unatarea que requiere seguir un protocolo específico. La conclusión del estudio fue que:

“El tiempo medio de ejecución de la tarea es menor a 20 minutos (p = 0,0314)”

3.1. La hipótesis nula en el contraste es:

A) μ = 20 B) μ > 20 C) μ < 20 D) μ   ≠ 20 E) μ = 23,7

3.2. Respecto del contraste, de las afirmaciones:

I: Se realizó con ensayo de cola izquierdaII: Se rechazó la hipótesis nula

III: Se utilizó un 1% de significación

Es (son) correcta(s):

A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

3.3. En el contraste, el valor del estadístico de prueba fue:

A) 1,96 B) 1,87 C) 3,1 D) -1,87 E) -1,96

Page 118: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 118/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.117

Solución a problemas propuestos:1.1. B 1.2. C 1.3. D 1.4. E 1.5. A

2.1. A 2.2. E

3.1. A 3.2. B 3.3. D

V. RECURSOS COMPLEMENTARIOS1. Test de hipótesis

http://www.bioestadistica.freeservers.com/temas.html 

Tema 12. Teoría de la decisión estadística: Hipótesis estadísticas. Validaciones estadísticas: uso del test de hipótesis. Modelode Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones demedias y proporciones. Intervalos de confianza versus tests de hipótesis. Ejemplos.

2. Contraste de la media 

9.4 Contrastes paramétricos en una población normal 

9.4.2 Contrastes para la media 

Page 119: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 119/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.118

3ª UNIDAD: DÓCIMAS DE HIPÓTESIS CLASE 14

Contraste de la diferencia de medias

«Los descubrimientos ya logradosse deben al azar y a la experiencia vulgar más que a la ciencia».

Sir F. Bacon

APRENDIZAJES ESPERADOS CONTENIDOS

-Realizan pruebas de hipótesis para la diferencia media con varianzas iguales y desconocidas.-Analizan e interpretan los resultados de la dócimas de hipótesis para la diferencia media convarianzas iguales y desconocidas en el contexto de casos dados.

-Prueba de hipótesis para ladiferencia media con varianzasiguales y desconocidas.

II. DESARROLLO

1. La situación

En ocasiones, una investigación requiere establecer comparaciones entre los promedios de dos segmentos. En estos casos, sedebe realizar un contraste de diferencia de medias.

Ejemplos:

•  En promedio, los matrimonios de zonas rurales duran más años que los de zonas urbanas.

•  Los hombres consumen diariamente, en promedio, más calorías que las mujeres.

La situación se ilustra en el siguiente esquema:

La comparación entre dos medias puede darse en tres situaciones distintas. Sin embargo se abordará la comparación de dosmedias con varianza desconocida y muestras chicas a través de la prueba t, que sirve de caso general. De este caso general sepueden derivar simplificaciones cuando las muestras son mayores de 30.

Población AAμ  

Población BBμ  

Ax Bx

?=μ−μ BA

Fig 12.1: Esquema del contraste de la diferencia

de medias.

Page 120: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 120/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.119

2. El problema de la varianza desconocida

Uno de los problemas más complicado es que generalmente, por no decir siempre, se desconocen las varianzas poblacionales ydeben ser estimadas a partir de las muestras. Una simplificación conveniente de adoptar es el supuesto de que las varianzas deambas poblaciones son iguales. Con esto se alivia el problema, pero no se soluciona.

Se pueden distinguir en una variable numérica tres varianzas:

Varianza Símbolo Fórmula Descripción

Poblacional2σ  

N

x 2i )( μ−Σ

 Es la varianza poblacional. Es un parámetro desconocido.

Sesgada2S

n

xx 2i )( −Σ

 Es la varianza muestral. Describe la variabilidad al interior de lamuestra.

Insesgada2S  

1n

xx 2i

−−Σ )(

 Es una varianza muestral, con denominador n-1. Sirve como elmejor estimador de la varianza poblacional.

Cuando la muestra es grande (n > 30) la diferencia entre la varianza sesgada y la insesgada es irrelevante, pero cuando setrabaja con muestras chicas, la diferencia puede llegar a ser decisiva.

Desviación estándar Símbolo Descripción Calculadora

Poblacional σ   Es la desviación estándar poblacional. Es un parámetrodesconocido.

-

Sesgada SEs la desviación estándar sesgada. Describe la variabilidadal interior de la muestra.

nxσ  

Insesgada S Es la desviación estándar insesgada. Es el mejor estimador de la desviación estándar poblacional.

1nx −σ  

3. El cont raste con la prueba t

Se tienen dos muestras de tamaños An y Bn , provenientes de poblaciones normales A y B, con medias Ax y Bx ,

respectivamente. Ambas varianzas son iguales.

Se desea saber si las diferencias entre Ax y Bx son significativas o simplemente son producto de la aleatoriedad de los

fenómenos estadísticos y el error muestral.

4. Hipótesis

4.1. Hipótesis nula:

H0: BA μ−μ = 0Esta hipótesis dice que la diferencia entre la media de A y B es cero. Por lo tanto, no hay diferencia y las muestras provienen deuna misma población de media μ .

4.2. Hipótesis alternativas: 

Según el caso, se pueden plantear una de las siguientes hipótesis alternativas:

H1: BA μ−μ > 0

Esta hipótesis afirma que la media de la población A es mayor que la de B, y, por lo tanto, la diferencia es positiva.

Page 121: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 121/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.120

H1: BA μ−μ < 0

Esta hipótesis alternativa afirma que la media de la población A es menor que la de B, y, por lo tanto, la diferencia es negativa.

H1: BA μ−μ ≠ 0

Esta hipótesis alternativa afirma que la media de la población A es distinta que la de B.

5. Error muestral de la diferencia de medias

Se tiene para cada muestra:

Muestra de A: An  ; Ax ; 2AS (Varianza sesgada)

Muestra de B: B n  ; Bx ; 2BS (Varianza sesgada)

El error muestral de la diferencia de medias para muestra chica y varianzas desconocidas e iguales, es:

BA xx −σ = )(· · · 

BABA

2BB

2AA

n

1

n

1

2nn

SnSn+

−+

6. Estadístico de prueba

Se usa el estadístico siguiente:

BA xx

BA xxt

−σ

−=  

Cuando la hipótesis nula es verdadera, este estadístico tiene una distribución t con ( 2nn BA −+ ) grados de libertad.

7. Valor p de la prueba

Ensayo de cola derecha: =α*  P( ν;pt > pruebat )

Ensayo de cola izquierda: =α*  P( ν;pt > pruebat )

Ensayo de 2 colas: =α*  2 · P( ν;pt > pruebat )

Siendo =ν ( 2nn BA −+ ) grados de libertad.

8. Criterio de decisión

A un nivel de significación α :

•  Rechazar H0 si α<α*  

•  No rechazar en caso contrario

Nota: toda decisión se refiriere exclusivamente a la hipótesis nula.

Page 122: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 122/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.121

9. Condici ones, supuestos y restric ciones de la prueba

-Poblaciones: las poblaciones en estudio deben ser normales o aproximadamente normales.

-Tamaño de la muestra: el modelo funciona muy bien para cualquier tamaño de muestra.

-Las muestras deben ser independientes.

-Las varianzas son iguales.

10. Resumen

Para contrastar una hipótesis de diferencia de medias se siguen los siguientes pasos:

1º: Plantear las hipótesis: esto es, traducir las hipótesis al lenguaje algebraico, planteando H0 y su H1.

2º: Calcular el estadístico de prueba: esto es, calcular medias, varianzas, error muestralBA xx −σ y t de prueba.

3º: Calcular el valor p: Con t de prueba, se calcula *α , según ensayo de cola izquierda, cola derecha o dos colas.

4º: Aplicar la regla de decisión: comparando *α con α , se decide rechazar o no H0 con una significación α .

5º: Construir la conclusión: conectando la decisión con las hipótesis, se da respuesta a la cuestión planteada.

III. EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Edad del personal

Se afirma que, en promedio, la empresa A contrata personal de menor edad que la empresa B. Una muestra aleatoria del últimopersonal contratado en ambas empresas dio el siguiente resultado de edades:

Empresa A: 27 – 36 – 21 – 30 – 28 – 41 años.

Empresa B: 38 – 39 – 25 – 32 – 27 años.

Si las edades se distribuyen en forma aproximadamente normal y las muestras son independientes:

1.1. Calcule medias y varianzas para las edades de cada empresa.

1.2. A un nivel del 5%, contraste la hipótesis de que la afirmación carece de fundamento.1.3. Docime, al 5%, la hipótesis de que las contrataciones de la empresa B tienen un promedio mayor a 30 años.

Solución:

1.1. Cálculo de estadígrafos

Introduciendo los datos a la calculadora, se obtiene:

n Media Desv. St.

Sesgada (S)

nxσ  

Desv. St.

Insesgada (S)

1nx −σ  

Varianza

sesgada

Varianza

insesgada

Empresa A 6 30,5 años 6,449 años 7,064 años 41,583 49,9Empresa B 5 32,2 años 5,636 años 6,301 años 31,760 39,7

1.2. Se trata de un contraste de diferencia de medias con muestras chicas y varianza desconocida:

1º: Hipótesis:

H0: AB μ−μ = 0

H1: AB μ−μ > 0

Se plantea la hipótesis nula como AB μ−μ para que quede un ensayo de cola derecha.

Page 123: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 123/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.122

2º: Cálculo del estadístico de prueba

Cálculo del error estándar de la diferencia media:

BA xx −σ = )(· ,· ,· 

5

1

6

1

256

76315583416+

−++

= 4,08 años.

084

530232t

,

,, −= = 0,42

Este es una t con 6 + 5 – 2 = 9 gl.

3º: Cálculo del valor-p:

P( 9pt ; ≥ 0,42) ≈ 0,349 (según tabla t de probabilidad superior)

4º: Decisión:

Como >α* 0,05 no se rechaza la hipótesis nula.

5º: Conclusión:

Con los datos con que se cuenta, no se puede afirmar que, en promedio, la empresa A contrata personal de menor edad que laempresa B (p = 0,349).

1.3. Contraste de la media de B:

Se trata de un contraste de la media, con muestra chica y varianza desconocida

1º: Hipótesis

H0: 30B =μ  

H1: 30B >μ  

2º: Cálculo del estadígrafo de prueba

Error estándar de la media de B:

Bxσ15

6365

−=

,= 2,818 años (Equivalente es:

Bxσ5

3016,= )

Entonces:

8182

30232t

,

, −= = 0,78

Esta es una t con 5 – 1 = 4 gl.

3º: Cálculo del valor-p:P( 4pt ; ≥ 0,78) ≈ 0,234 (según tabla t de probabilidad superior)

4º: Decisión:

Como >α* 0,05 no se rechaza la hipótesis nula.

5º: Conclusión:

La edad promedio de las últimas contrataciones de la empresa B no es mayor a 30 años (p = 0,234).

Page 124: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 124/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.123

2. Sexo e i ngreso mensual

Se realiza un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una población de trabajadoresdependientes de distintas empresas pero de igual sector económico, trabajo, jerarquía, edad, ciudad y estado civil.

Las interrogantes que el estudio desea esclarecer, con un 1% de significación, tienen que ver con las siguientes afirmaciones yconjeturas que se plantearon inicialmente:

P: Las mujeres de esta población ganan, en promedio, $2.100 la hora de trabajo.

Q: El sueldo promedio de los hombres de esta población es mayor a $450.000 al mes.

R: En este sector laboral, en promedio, los hombres ganan más que las mujeres.

En los contrastes de las respectivas hipótesis, los cálculos dieron los siguientes valores p:*Pα = 0,021; *

Qα = 0,036; *Rα = 0,007.

2.1. Indique, en lenguaje corriente, las hipótesis nulas en cada uno de los casos.

2.2. Para la conjetura R, identifique:

a) Tipo de ensayo: cola derecha, cola izquierda o de dos colas.

b) Decisión correcta:c) Probabilidad de error de tipo I

2.3. En la dócima de la afirmación Q ¿En qué consiste cometer el error de tipo I?

2.4. En el test para validar la afirmación R ¿En qué consiste cometer el error de tipo II?

2.5. Construya una conclusión para cada una de las afirmaciones dadas.

2.6. ¿En qué consiste el error de tipo I en la afirmación R?

Solución:

2.1. Indique, en lenguaje corriente, las hipótesis nulas en cada uno de los casos.

Para P. H0: Las mujeres de esta población ganan, en promedio, $2.100 la hora de trabajo.Para Q: H0: El sueldo promedio de los hombres de esta población es mayor a $450.000 al mes.

Para R: H0: En este sector laboral, en promedio, los hombres ganan igual que las mujeres.

2.2. Para la conjetura R, identifique:

a) La hipótesis se puede contrastar con un ensayo de cola derecha o de cola izquierda, dependiendo de cómo se plantea lahipótesis nula.

Si H0: MH μ−μ = 0, entonces, H1 debe ser: MH μ−μ > 0, lo que lleva a ensayo de cola derecha.

Si H0: HM μ−μ = 0, entonces, H1 debe ser: HM μ−μ < 0, lo que lleva a ensayo de cola izquierda.

b) En este caso:

*

Rα = 0,007. Como *α < 0,01, se rechaza la hipótesis nula al 1%.c) En un test de hipótesis, el error de tipo I corresponde al nivel de significación α . Entonces, la probabilidad de error de tipo Ies igual al 0,001 (1%).

2.3. En la dócima de la afirmación Q ¿En qué consiste cometer el error de tipo I?

El error de tipo I es rechazar a hipótesis nula siendo que es verdadera. En este caso consiste en rechazar que el sueldopromedio de los hombres es de $450.000 al mes, siendo que es verdadero.

2.4. En el test para validar la afirmación R ¿En qué consiste cometer el error de tipo II?

Page 125: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 125/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.124

El error de tipo II es aceptar la hipótesis nula cuando en realidad es falsa. En este caso significa aceptar la igualdad de sueldoscuando en realidad eso es falso.

2.5. Construya una conclusión para cada una de las afirmaciones dadas.

Para P: *Pα = 0,021. No se rechaza la hipótesis nula, al 1%.

Conclusión: Las mujeres de esta población ganan, en promedio, $2.100 la hora de trabajo.

Para Q: *Qα = 0,036. No se rechaza la hipótesis nula, al 1%.

Conclusión: El sueldo promedio de los hombres de esta población NO es mayor a $450.000 al mes.

Para R: *Rα = 0,007. Se rechaza la hipótesis nula, al 1%.

Conclusión: En este sector laboral, en promedio, los hombres ganan más que las mujeres.

2.6. Error tipo I

Rechazar que en este sector laboral, en promedio, los hombres ganan igual que las mujeres, siendo que es verdadero.

IV. EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Ingreso mensual según género

Se realiza un estudio de los sueldos de 9 mujeres y 13 hombres seleccionados al azar desde una población de trabajadoresdependientes de distintas empresas pero de igual sector económico, trabajo, jerarquía, edad, ciudad y estado civil. El sueldomensual es medido en miles de pesos, en cada uno de los seleccionados, comprobado con la liquidación de sueldo.

El estudio llegó a establecer, con un 5% de significación, las siguientes conclusiones:

P: Los hombres de esta población ganan, en promedio, $1.800 la hora de trabajo (p= 0,382)

Q: El sueldo promedio de las mujeres de esta población es menor a $250.000 al mes (p= 0,026).R: En este sector laboral, en promedio, los hombres ganan más que las mujeres (p= 0,004).

1.1. Respecto de las decisiones, se rechazó la hipótesis nula:

A) Solo en P B) Solo en R C) Solo en Q y en R D) Solo en P y en Q E) Solo en Q y en R

1.2. Respecto de los tipos de ensayo, corresponde a contraste de dos colas:

A) Solo en P B) Solo en R C) Solo en Q y en R D) Solo en P y en Q E) Solo en Q y en R

1.3. Para la conclusión R, el contraste que corresponde es:

A) De la diferencia de proporciones con muestra chicaB) De la diferencia de medias, con varianza conocida y muestra grande

C) De la diferencia de medias, con muestra chica y varianza conocida

D) De la diferencia de medias, con muestra chica y varianza desconocida

E) De la media, con muestra chica y varianza desconocida

Page 126: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 126/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.125

1.4. El contraste de hipótesis de la conjetura R permite afirmar que en este sector laboral:

A) Los hombres ganan, en promedio, menos que las mujeres

B) Los hombres ganan, en promedio, más que las mujeres

C) Las mujeres ganan, en promedio, igual que los hombres

D) No hay diferencias en el sueldo de hombres y mujeres

E) Faltan datos para construir una conclusión al respecto

1.5. En el test de hipótesis para validar la afirmación R ¿En qué consiste cometer el error de tipo I?

A) Aceptar que, en promedio, los hombres ganan más que las mujeres, siendo que es falso

B) Rechazar que, en promedio, los hombres ganan más que las mujeres, siendo que es falso

C) Rechazar que, en promedio, los hombres ganan igual que las mujeres, siendo que es falso

D) Rechazar que, en promedio, los hombres ganan más que las mujeres, siendo que es verdadero

E) Rechazar que, en promedio, los hombres ganan igual que las mujeres, siendo que es verdadero

2. Talla de bebés de madres fumadoras

Una muestra de mujeres es controlada durante su embarazo para determinar la talla del recién nacido, según si fumó o nodurante el embarazo. Para ello se midió la talla de recién nacidos varones, hijos de madres comparables en su estado generalde salud y contextura física, encontrándose los siguientes datos:

Tipo de Madre n Talla promedio (cm.) Desviación estándar (cm.)

Fumadora 9 48,1 2,5

No fumadora 13 50,4 2,2

Con el supuesto de independencia de la muestra, normalidad de la talla e igualdad de varianzas, al 5% de significación, sedesea contrastar la hipótesis de que la talla media de los niños de madres fumadoras es menor a la de los niños de madres nofumadoras.

2.1. El error estándar de la diferencia de medias es igual a:

A) 1,058 cm. B) 2,31 cm. C) 0,05 cm. D) 0,85 cm. E) 3,88 cm.

2.2. El test de hipótesis permite concluir, al 5% que, en promedio:

A) La talla de los niños de madres fumadoras es mayor a la de los niños de madres no fumadoras

B) La talla de los niños de madres fumadoras es menor a la de los niños de madres no fumadoras

C) La talla de los niños de madres fumadoras es igual a la de los niños de madres no fumadoras

D) No hay diferencia de tallas entre niños de madres fumadores y no fumadoras

E) Hay diferencia de tallas entre madres fumadores y no fumadoras

3. Salud y nutr ición

Considere el siguiente texto, extraído de un informe de investigación en el ámbito de la salud y nutrición. El caso se dio en unconsultorio de una comuna del Sur de Santiago, con madres que dieron a luz bebés con sobrepeso y con peso normal.

“Las madres de los niños nacidos con sobrepeso presentaron algunas cifras significativamente más altas que elgrupo de madres de niños nacidos con peso normal, en cuanto a (1) mayor promedio de edad (p = 0,027) y (2)mayor peso al inicio de la gestación (p = 0,006); (3) no encontrándose diferencias en los años promedio deescolaridad (p = 0,324).”

Page 127: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 127/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.126

3.1. En la dócima para la conclusión (2), la hipótesis alternativa, es que, al inicio de la gestación, las madres de niños nacidoscon sobrepeso, en promedio:

A) Pesan igual que las de niños nacidos con peso normal

B) Pesan distinto que las de niños nacidos con peso normal

C) Pesan menos que las de niños nacidos con peso normal

D) Pesan más que las de niños nacidos con peso normal

E) No se diferencian de las de niños nacidos con peso normal

3.2. Las tres hipótesis fueron testeadas al mismo nivel de significación. De los siguientes:

I: 0,01 II: 0,05 III: 0,10

¿Cuál(es) puede(n) haber sido utilizado(s)?

A) Solo I B) Solo I y II C) Solo II y III D) Solo I y III E) Cualquiera de los tres

3.3. En cuál de los tres contrastes no se rechazó la hipótesis nula?

A) Solo (1) y (2) B) Solo (1) y (3) C) (2) y (3) D) Solo (2) E) Solo (3)

Solución a problemas propuestos:1.1. C 1.2. A 1.3. D 1.4. B 1.5. E

2.1. A 2.2. B

3.1. D 3.2. C 3.3. E

V. RECURSOS COMPLEMENTARIOS1. Test de hipótesis para muestras pequeñas

Tema 13. Teoría de pequeñas muestras: Modelo de Student para una muestra: aplicación para medias muestrales yproporciones. Student para dos muestras independientes: comparaciones de medias y proporciones. Test de equivalenciabiológica. Comparación de dos muestras apareadas. Modelo de la Chi-cuadrado. Modelo de Fisher. Significación clínica versusestadística. Ejemplos.

2. La prueba t.

Fisterra: Metodología de la investigación

http://www.fisterra.com/mbe/investiga/index.asp 

Métodos paramétricos para la comparación de dos medias. t de Student 

3. Contraste de la media 

http://ftp.medprev.uma.es/libro/html.htm 

9.10 Contrastes de dos distribuciones normales independientes 

9.10.2 Contraste de medias con varianzas conocidas 

Page 128: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 128/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.127

Ejercicios de recapitulaciónCON AYUDA DE FORMULARIO, TABLAS Y CALCULADORA, CONSTRUYA UNA RESPUESTA A LAS PREGUNTAS FORMULADASSOBRE LA BASE DE LOS SIGUIENTES CASOS.

Caso 1: Economía en comun idad étnicaEn cierta comunidad étnica, las familias practican la ganadería y la agricultura. Se sabe de las familias, lo siguiente:

•  El 28% se dedica a la ganadería y a la agricultura

•  El 67% se dedica a la agricultura

•  El 15% se dedica a la ganadería pero no a la agricultura

Según estos datos:

1.1. ¿Cuál es la probabilidad de que una familia se dedique a la agricultura, pero no a la ganadería?

1.2. Calcule la probabilidad que una familia no se dedique a la agricultura, ya que se dedica a la ganadería.

1.3. Calcule la probabilidad de que en esta comunidad una familia que se dedica a la agricultura se dedique también a laganadería.

1.4. ¿Son las actividades Ganadería y Agricultura, independientes?

Caso 2. Accidentes laborales y antigüedad

En cierta empresa, el 36% de los trabajadores tiene más de 5 años de experiencia laboral. La probabilidad de accidente laboralen el curso de un año en la empresa es de 0,04. Si estos fenómenos son independientes:

2.1. ¿Cuál es la probabilidad de que se accidente un trabajador con menos de 5 años de experiencia laboral?

2.2. Si ocurre un accidente laboral, ¿cuál es la probabilidad de que sea de un trabajador de más de 5 años de experiencia?¿Puede explicar el porqué del resultado?

Caso 3. Población bi lingüeCanadá tiene dos lenguas oficiales: el inglés y el francés. Sin embargo, en la provincia de Québec la lengua predominante es elfrancés, dado que el 45% de la población habla inglés y francés, el 20% habla inglés pero no francés, y el 5% no habla ningunade estos dos lenguas, sino otras, producto de la inmigración y la existencia de grupos autóctonos.

3.1. ¿Cuál es la probabilidad de que un sujeto de esta provincia hable francés?

3.2. ¿Cuál es la probabilidad de que un sujeto de esta provincia hable inglés ya que no habla francés?

Caso 4. El “Loco Bielsa”

En una reciente publicación se cita un dato estadístico que ha servido de base para la estrategia de Bielsa con la selecciónchilena de fútbol. Refiriéndose a los goles, dice:

“De cada diez, uno se hace desde media distancia, tres de pelota detenida, dos de jugadas que parten delcentro del campo y cuatro de avances que parten por los costados que finalizan en el medio del área.”12 

Si esto es así:4.1. Si se eligen al azar dos goles de las eliminatorias para el mundial de Sudáfrica, ¿cuál es la probabilidad de que uno de elloshaya sido de jugadas que parten del centro del campo y el otro de pelota detenida?

4.2. Si se eligen al azar dos goles de las eliminatorias para el mundial de Sudáfrica, ¿cuál es la probabilidad de que solo uno deellos haya sido de jugadas que parten del centro del campo?

4.3. Si se seleccionan al azar ocho goles de las eliminatorias para el mundial de Sudáfrica, ¿cuál es la probabilidad de que 5 deellos hayan sido de pelota detenida?

12 Carcuro, Pedro – Abarzúa, Esteban. “Me pongo de pie”. Aguilar, 2009.

Page 129: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 129/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.128

Caso 5. Economía informal

Se sabe lo siguiente de las familias que habitan cierta región geográfica del sur de Chile:

•  El 71% de las familias se dedica a la alfarería.

•  El 8% de las familias tiene alguna actividad económica formal.

Si se seleccionan al azar 30 familias de esta región:5.1. ¿Cuál es la probabilidad de que 20 de ellas se dediquen a la alfarería?

5.2. ¿Cuál es la probabilidad de que solo 3 de ellas tengan una actividad económica formal?

Caso 6. Accidentes fatales

Según estudios realizados en Chile por la empresa Alka-Stat, al año se producen, en promedio, 3,87 accidentes fatales por cada50 mil trabajadores. Se desea calcular la probabilidad de que en un año se produzcan en Chile cinco accidentes fatales por cada50 mil trabajadores.

6.1. ¿Es aplicable el modelo Poisson? Fundamente.

6.2. Si la respuesta para 6.1 es sí, ¿cuál sería e modelo específico para el caso?

Caso 7. Edad de accidentadosEn cierto sector industrial, se ha constatado que la edad de los trabajadores afectados por accidentes de trabajo, se distribuyenormalmente, con media 32,3 años y desviación estándar 5,7 años. Si esto es así:

7.1. ¿Qué % de los trabajadores accidentados tienen menos de 30 años?

7.2. ¿Qué % de los trabajadores accidentados tienen entre 25 y 40 años?

Caso 8. Ascensor dudoso

En cierto edificio hay un ascensor que falla, en promedio 1,7 veces por semana. Es razonable pensar que el número de fallaspor semana es abordable mediante el modelo de Poisson.

8.1. ¿Cuál es la probabilidad de que este ascensor falle 3 veces en una misma semana?

8.2. ¿Cuál es la probabilidad de que este ascensor falle más de 2 veces en una misma semana?

8.3. ¿Cuál es la probabilidad de que el ascensor falle en la semana?

Caso 9. Duración del empleo

Se ha constatado que la duración de la relación laboral con un mismo empleador en una muestra de trabajadores, sigue unacurva normal con media 7,4 años y desviación estándar 2,5 años.

9.1. ¿Qué % de ellos ha durado más de 10 años con el mismo empleador?

9.2. ¿Cuál es la duración máxima del 20% de menor duración de la relación laboral?

9.3. ¿Cuál es la ubicación relativa de una persona que ha durado 12 años con el mismo empleador?

9.4. ¿Cuál es la probabilidad de que un trabajador dure menos de 5 años con el mismo empleador?

Caso 10. Cuestionario burnout

El cuestionario breve de burnout (CBB) tiene por objeto diagnosticar el fenómeno burnout en trabajadores. En su versión breve,divide en tres las dimensiones del fenómeno. Uno de ellos es el síndrome burnout, cuya escala de puntajes va de 9 a 36 puntos.Se adopta como supuesto que los puntajes del cuestionario pueden ser tratados como variable continua y que se distribuyennormalmente. A efectos de diagnóstico del síndrome, se considera Bajo nivel de burnout hasta 19 puntos, medio, desde 19 a 25,y alto grado de burnout desde 25 puntos hacia arriba. Es decir, a partir de 25 puntos puede considerarse que una persona estáafectada claramente por el síndrome del burnout.

Este cuestionario es aplicado a los 258 trabajadores de una empresa de servicios financieros, llegando a obtenerse una mediade 19,8 puntos con desviación estándar 4,6 puntos.

10.1. ¿Cuántos trabajadores de esta empresa estarían afectados por el síndrome de burnout en un alto grado?

10.2. ¿Qué % de trabajadores de esta empresa estarían medianamente afectados por el síndrome de burnout?

Page 130: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 130/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.129

Caso 11. Penetración del celular en Chile

Se estudia la penetración del celular en Chile con una muestra aleatoria e independiente de hombres y mujeres. En estos, el usodel teléfono celular se muestra el siguiente gráfico:

Sobre la base de estos datos:

11.1. Construya un intervalo de confianza del 99% para la proporción de hombres que usan celular.

11.2. Con un 1% de significación contraste las hipótesis correspondientes para validar o refutar las siguientes afirmaciones:

A1: Más del 20% de las mujeres usan celular A2: El uso del celular se da en menos del 30% de los hombres

A3: El uso del celular se da en mayor proporción en los hombres

Caso 12. Contaminación de aguas de un lago

Se realiza un muestreo de las aguas en un lago tras la búsqueda de ciertas bacterias que se reproducen cuando haycontaminación por productos derivados del petróleo. Se hace un conteo del número de bacterias por muestra de 100 ml de aguaen un total de 72 ensayos, arrojando el siguiente resultado:

Bacterias (/100 ml) Nº de casos

30 – 3535 – 4040 – 4545 – 5050 – 5555 – 60

48141068

12.1. Calcule un IC del 95 % para la cantidad de bacterias por cada 100 ml de agua.

12.2. Con un 5% de significación contraste la hipótesis que, en promedio, las aguas contienen menos de 42 bacterias por cada100 ml de agua.

Caso 13. Sodio en el queso

Se realiza la medición de la cantidad de sodio por rebanada (50 g) en una muestra de quesos. La muestra de 65 rebanadasarrojó una media de 384 mg de sodio, con desviación estándar 40 mg.

13.1. Calcule un IC del 90 % para la cantidad de sodio por rebanada de 50 gramos de queso.

13.2. Si se desea construir un IC del 99% para la cantidad media poblacional de sodio por rebanada con un error de no más de 6mg, calcule el tamaño de la muestra.

13.3. Con un 5% de significación contraste la hipótesis que el contenido medio de sodio en este queso está por sobre los 370 mgpor rebanada de 50 gramos.

Hombre Mujer

28,6%25,0%

Uso de celular por sexo458 hombres – 360 mujeres

Fuente: ALKA-Stat, 2010.

Page 131: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 131/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.130

Caso 14. Outsourcing 

Dentro de las características del empleo actual está la progresiva disolución de las relaciones laborales empleado-empleador.Uno de sus aspectos materiales lo constituye el outsourcing (externalización) de servicios. Esto es, la entrega de ciertosservicios a empresas externas, tales como jardinería, seguridad, transporte, etc.

Cierta investigación que estudia el fenómeno, se inicia asumiendo como hipótesis, que hoy en Chile, más del 30% de lasempresas medianas y grandes, han incorporado a su gestión la externalización de servicios.

El estudio declara un nivel de significación del 5%.En una muestra aleatoria de 450 empresas, se verificó un total de 144 con servicios externalizados.

14.1. Construya una estimación del 95% de confianza para el % de empresas han incorporado el outsourcing a su gestión.

14.2. Si se quisiera calcular un intervalo de confianza del 95% para el porcentaje de empresas que han incorporado eloutsourcing a su gestión, con un error no mayor al 2%, calcule el tamaño de la muestra mínima requerida.

14.3. Contraste al 5% la hipótesis de que en Chile, más del 30% de las empresas medianas y grandes, han incorporado a sugestión la externalización de servicios.

Caso 15. Condiciones ambientales

Una industria requiere para el funcionamiento de su línea de producción, mantener constantes una temperatura de 22ºC y unahumedad relativa del 40%.

Se realizan más de 50 mediciones independientes de temperatura y humedad, llegando a las siguientes conclusiones:

•  C1. La temperatura media fluctúa entre 18,4ºC y 21,6ºC (p = 0,95).

•  C2. La temperatura media es menor a la requerida (p = 0,0073).

•  C3. La humedad media cumple con el estándar requerido (p = 0,245)

15.1. Determine la temperatura media de la muestra y su error muestral.

15.2. Para la conclusión C1, indique cuál fue la hipótesis alternativa y cuál fue la decisión en el contraste.

15.3. Para la conclusión C2 indique cuál fue la hipótesis nula en el contraste y en qué consiste el error de tipo I.

Caso 16. Días perdidos por accidente o enfermedad

Se investiga los días perdidos por accidentes laborales y enfermedades profesionales en una muestra de 10 empresasconstructoras y 8 del sector industria.

Los estadísticos de las muestras se dan en la tabla siguiente:

Sector n Media

(días)

Desv. Estándar (S)

(días)

Error muestral de ladiferencia de medias (días)

Construcción 10 122 48

Industria 8 134 4022,45

16.1. Construya un intervalo de confianza del 95% para el promedio de días perdidos por accidentes laborales o enfermedadesprofesionales en el sector construcción.

16.2. Calcule cuántas empresas más habría que investigar en el sector construcción para trabajar un intervalo de confianza conun 95% de confianza y un error no superior a 15 días.

16.3. Con un 5% de significación, ponga a prueba la hipótesis de que en el sector industria los días perdidos por accidenteslaborales y enfermedades profesionales están por sobre los 120 días.

16.4. Con un 5% de significación, contraste la hipótesis de que en el sector construcción se pierden más días por accidenteslaborales y enfermedades profesionales que en sector industria.

Page 132: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 132/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.131

Caso 17. Ficha técnica de investigación

Cierta investigación realizada en España, declaró la siguiente ficha técnica de investigación:

17.1. ¿Está correcto el error y confianza declarados en esta ficha técnica? Fundamente.

Caso 18. Uso de los elementos de protección personal

Se desea investigar qué % de trabajadores de la industria metal-mecánica se resiste al uso de los elementos de protecciónpersonal.

18.1. Indique el tamaño de muestra adecuado, especificando el error de investigación y confianza.

18.2. Si se puede encuestar solo a 580 trabajadores, indique la confianza de trabajo y el % de error de investigación.

Caso 19. Intención de siembra de trigo

Una encuesta realizada a 140 agricultores de una sector A y 125 de un sector B, acerca de la Intención de Siembra de Trigopara el año próximo, generó la siguiente información para tres de las variables estudiadas:

W: Área a sembrar:

Sector A: =Aw 84 há;AwS = 28 há.

Sector B: =Bw 92 há;BwS = 34 há.

X: % de agricultores que utilizaría semilla de alto rendimiento:

Sector A: 57%

Sector B: 64%

Y: Nº de agricultores con dificultades de financiamiento para su próxima siembra:

Sector A: 108 de los 140

Sector B: 91 de los 125

Con esta información, con α = 5% y los supuestos adecuados, realice el test de las siguientes afirmaciones:

19.1. El área media a sembrar en sector A es menor a 90 hectáreas.

19.2. Los agricultores del sector A están dispuestos a sembrar más área que los del sector A.

19.3. Más del 60% de los agricultores están dispuestos a utilizar semilla de trigo de alto rendimiento para su próxima siembra.

Ficha técnicaAMBITO DE LA ENCUESTA: Segovia capital.

UNIVERSO: Población segoviana de ambos sexos de 18 años y másTAMAÑO DE LA MUESTRA: Diseñada: 300 entrevistas. Realizada:

322 entrevistas.

TÉCNICA DE INVESTIGACIÓN: Encuestas telefónicas y

presenciales asistidas por programa informático.

FECHAS TRABAJO DE CAMPO: 24 y 25 de febrero de 2003

PROCEDIMIENTO MUESTREO: Muestreo aleatorio estratificado,

con selección de unidades finales por muestreo aleatorio simple. Los

estratos se forman atendiendo a categorías de edad, sexo y situaciónlaboral.

ERROR ESPERADO: +/- 2.5% para un nivel de confianza del 95%.

Page 133: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 133/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.132

19.4. Una proporción mayor de agricultores del sector B que del sector A están dispuestos a utilizar semilla de trigo de altorendimiento para su próxima siembra.

19.5. El 80% de los agricultores del sector A tiene dificultades de financiamiento para su próxima siembra.

19.6. Menos agricultores del sector B tienen problemas de financiamiento para su próxima siembra que del sector A.

Caso 20. Estudio del mercado de las hamburguesas en oferta 

Cierta institución ha hecho un estudio de las hamburguesas en locales de comida rápida en Santiago, donde el producto está enoferta. Una muestra aleatoria de locales y productos arrojó la siguiente información en las tres variables que se indican:

X: Materia grasa en hamburguesas. Gramos por cada 100 gramos de producto.

Xi = 26, 34, 30, 27, 20, 22, 26, 23, 30, 35, 28, 22, 26, 20 gramos.

Y: Peso, en gramos, de la ración de hamburguesa.

Yi: 275, 320, 315, 220, 285, 370, 330, 325 gramos.

Z: % de hamburguesas con déficit de hidratos de carbono y fibra.Zi: 143 unidades, de una muestra de 175.

Sobre la base de estos datos, con los supuestos adecuados y con un 5% de significación, contraste las hipótesis para validar ono las siguientes afirmaciones:

20.1. El contenido graso promedio en las hamburguesas es mayor a 25 gramos por cada 100 gramos de producto.

20.2. La ración media de hamburguesa pesa 320 gramos.

20.3. Más del 75% de las hamburguesas presentan déficit de hidratos de carbono y fibra.

Caso 21. Tiempo de proceso y capacitaciónUna industria produce cierta pieza en acero fundido que, luego de fundida debe mecanizarse (tornearse). El departamento deproducción ha calculado que si el tiempo medio de mecanizado excede los 45 minutos, resulta más conveniente externalizar eseservicio.

21.1. Una muestra aleatoria del tiempo de mecanizado dio el siguiente resultado:

t = 42 – 50 – 48 – 54 – 36 – 60 – 45 – 53 minutos.

A un nivel de significación del 5% docime la hipótesis correspondiente y evalúe la decisión de externalizar.

21.2. Con el propósito de reducir el tiempo de proceso, se realiza una capacitación a los trabajadores y se toma una nuevamuestra aleatoria del tiempo de mecanizado, con el siguiente resultado:

t = 45 – 39 – 52 – 50 – 37 – 42 – 34 – 46 – 42 minutos.

A un nivel del 5% pruebe si la capacitación dio los frutos esperados.

Supuestos:

-Las muestras son independientes.

-El tiempo de mecanizado se distribuye normalmente.

-Las varianzas son iguales, antes y después de la capacitación.

Page 134: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 134/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.133

Tabla 1: Distribución normal estándar Z~N(0, 1)Valores de la probabilidad p inferior, por debajo de z 

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916

2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952

2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974

2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995

3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998

3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

Valores calculados con la función DISTR.NORM.ESTAND(z) de Excel.Gentileza de ALKA S. A. DERECHOS RESERVADOS.

0i z 

z

p

Page 135: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 135/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.134

Tabla 2: Distribución normal estándar Z~N(0, 1)Valores de la probabilidad p superior por sobre Z 

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641

0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451

0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148

0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,13791,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170

1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985

1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823

1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681

1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183

2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143

2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,01102,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084

2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064

2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048

2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036

2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026

2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019

2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014

3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010

3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007

3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005

3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,00033,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002

3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002

3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Valores calculados con la función DISTR.NORM.ESTAND(z) de Excel.Gentileza de ALKA S. A. DERECHOS RESERVADOS.

0i z 

z

p

Page 136: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 136/138

Page 137: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 137/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.136

Tabla 4: Distr ibución t (Student)

Probabilidad superior de valores de t con ν grados de li bertad de 1 a 15

GRADOS DE LIBERTADν    t

1 2 3 4 5 6 7 8 9 10 11 12 13 14 150,1 0,468 0,465 0,463 0,463 0,462 0,462 0,462 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,4610,2 0,437 0,430 0,427 0,426 0,425 0,424 0,424 0,423 0,423 0,423 0,423 0,422 0,422 0,422 0,4220,3 0,407 0,396 0,392 0,390 0,388 0,387 0,386 0,386 0,385 0,385 0,385 0,385 0,384 0,384 0,3840,4 0,379 0,364 0,358 0,355 0,353 0,352 0,351 0,350 0,349 0,349 0,348 0,348 0,348 0,348 0,3470,5 0,352 0,333 0,326 0,322 0,319 0,317 0,316 0,315 0,315 0,314 0,313 0,313 0,313 0,312 0,312

0,6 0,328 0,305 0,295 0,290 0,287 0,285 0,284 0,283 0,282 0,281 0,280 0,280 0,279 0,279 0,2790,7 0,306 0,278 0,267 0,261 0,258 0,255 0,253 0,252 0,251 0,250 0,249 0,249 0,248 0,248 0,2470,8 0,285 0,254 0,241 0,234 0,230 0,227 0,225 0,223 0,222 0,221 0,220 0,220 0,219 0,219 0,2180,9 0,267 0,232 0,217 0,210 0,205 0,201 0,199 0,197 0,196 0,195 0,194 0,193 0,192 0,192 0,1911,0 0,250 0,211 0,196 0,187 0,182 0,178 0,175 0,173 0,172 0,170 0,169 0,169 0,168 0,167 0,167

1,1 0,235 0,193 0,176 0,167 0,161 0,157 0,154 0,152 0,150 0,149 0,147 0,146 0,146 0,145 0,1441,2 0,221 0,177 0,158 0,148 0,142 0,138 0,135 0,132 0,130 0,129 0,128 0,127 0,126 0,125 0,1241,3 0,209 0,162 0,142 0,132 0,125 0,121 0,117 0,115 0,113 0,111 0,110 0,109 0,108 0,107 0,1071,4 0,197 0,148 0,128 0,117 0,110 0,106 0,102 0,100 0,098 0,096 0,095 0,093 0,092 0,092 0,091

1,5 0,187 0,136 0,115 0,104 0,097 0,092 0,089 0,086 0,084 0,082 0,081 0,080 0,079 0,078 0,077

1,6 0,178 0,125 0,104 0,092 0,085 0,080 0,077 0,074 0,072 0,070 0,069 0,068 0,067 0,066 0,0651,7 0,169 0,116 0,094 0,082 0,075 0,070 0,066 0,064 0,062 0,060 0,059 0,057 0,056 0,056 0,0551,8 0,161 0,107 0,085 0,073 0,066 0,061 0,057 0,055 0,053 0,051 0,050 0,049 0,048 0,047 0,0461,9 0,154 0,099 0,077 0,065 0,058 0,053 0,050 0,047 0,045 0,043 0,042 0,041 0,040 0,039 0,0382,0 0,148 0,092 0,070 0,058 0,051 0,046 0,043 0,040 0,038 0,037 0,035 0,034 0,033 0,033 0,032

2,1 0,141 0,085 0,063 0,052 0,045 0,040 0,037 0,034 0,033 0,031 0,030 0,029 0,028 0,027 0,0272,2 0,136 0,079 0,058 0,046 0,040 0,035 0,032 0,029 0,028 0,026 0,025 0,024 0,023 0,023 0,0222,3 0,131 0,074 0,052 0,041 0,035 0,031 0,027 0,025 0,023 0,022 0,021 0,020 0,019 0,019 0,0182,4 0,126 0,069 0,048 0,037 0,031 0,027 0,024 0,022 0,020 0,019 0,018 0,017 0,016 0,015 0,0152,5 0,121 0,065 0,044 0,033 0,027 0,023 0,020 0,018 0,017 0,016 0,015 0,014 0,013 0,013 0,012

2,6 0,117 0,061 0,040 0,030 0,024 0,020 0,018 0,016 0,014 0,013 0,012 0,012 0,011 0,010 0,0102,7 0,113 0,057 0,037 0,027 0,021 0,018 0,015 0,014 0,012 0,011 0,010 0,010 0,009 0,009 0,0082,8 0,109 0,054 0,034 0,024 0,019 0,016 0,013 0,012 0,010 0,009 0,009 0,008 0,008 0,007 0,007

2,9 0,106 0,051 0,031 0,022 0,017 0,014 0,011 0,010 0,009 0,008 0,007 0,007 0,006 0,006 0,0053,0 0,102 0,048 0,029 0,020 0,015 0,012 0,010 0,009 0,007 0,007 0,006 0,006 0,005 0,005 0,004

3,1 0,099 0,045 0,027 0,018 0,013 0,011 0,009 0,007 0,006 0,006 0,005 0,005 0,004 0,004 0,0043,2 0,096 0,043 0,025 0,016 0,012 0,009 0,008 0,006 0,005 0,005 0,004 0,004 0,003 0,003 0,0033,3 0,094 0,040 0,023 0,015 0,011 0,008 0,007 0,005 0,005 0,004 0,004 0,003 0,003 0,003 0,0023,4 0,091 0,038 0,021 0,014 0,010 0,007 0,006 0,005 0,004 0,003 0,003 0,003 0,002 0,002 0,0023,5 0,089 0,036 0,020 0,012 0,009 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,002 0,002 0,002

3,6 0,086 0,035 0,018 0,011 0,008 0,006 0,004 0,003 0,003 0,002 0,002 0,002 0,002 0,001 0,0013,7 0,084 0,033 0,017 0,010 0,007 0,005 0,004 0,003 0,002 0,002 0,002 0,002 0,001 0,001 0,0013,8 0,082 0,031 0,016 0,010 0,006 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,0013,9 0,080 0,030 0,015 0,009 0,006 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,0014,0 0,078 0,029 0,014 0,008 0,005 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001

4,1 0,076 0,027 0,013 0,007 0,005 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,0004,2 0,074 0,026 0,012 0,007 0,004 0,003 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000

4,3 0,073 0,025 0,012 0,006 0,004 0,003 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,0004,4 0,071 0,024 0,011 0,006 0,004 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,0004,5 0,070 0,023 0,010 0,005 0,003 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000

4,6 0,068 0,022 0,010 0,005 0,003 0,002 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,0004,7 0,067 0,021 0,009 0,005 0,003 0,002 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,0004,8 0,065 0,020 0,009 0,004 0,002 0,002 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,9 0,064 0,020 0,008 0,004 0,002 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,0005,0 0,063 0,019 0,008 0,004 0,002 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Valores calculados con la función DISTR.T(x; grados_de_libertad; colas) de Excel.Gentileza de ALKA S. A. DERECHOS RESERVADOS.

0i t   

t

ν  

p

Page 138: INFERENCIA ESTADÍSTICA MAT - 322

5/10/2018 INFERENCIA ESTAD STICA MAT - 322 - slidepdf.com

http://slidepdf.com/reader/full/inferencia-estadistica-mat-322 138/138

Vicerrectoría AcadémicaCuaderno de Apuntes – 2010

137

Tabla 5: Distr ibución t (Student)

Probabilidad superior de valores de t con ν grados de li bertad de 16 a 30

GRADOS DE LIBERTADν    t

16 17 18 19 20 21 22 23 24 25 26 27 28 29 300,1 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,461 0,4610,2 0,422 0,422 0,422 0,422 0,422 0,422 0,422 0,422 0,422 0,422 0,422 0,421 0,421 0,421 0,4210,3 0,384 0,384 0,384 0,384 0,384 0,384 0,383 0,383 0,383 0,383 0,383 0,383 0,383 0,383 0,3830,4 0,347 0,347 0,347 0,347 0,347 0,347 0,347 0,346 0,346 0,346 0,346 0,346 0,346 0,346 0,3460,5 0,312 0,312 0,312 0,311 0,311 0,311 0,311 0,311 0,311 0,311 0,311 0,311 0,310 0,310 0,310

0,6 0,278 0,278 0,278 0,278 0,278 0,277 0,277 0,277 0,277 0,277 0,277 0,277 0,277 0,277 0,2770,7 0,247 0,247 0,246 0,246 0,246 0,246 0,246 0,245 0,245 0,245 0,245 0,245 0,245 0,245 0,2450,8 0,218 0,217 0,217 0,217 0,217 0,216 0,216 0,216 0,216 0,216 0,215 0,215 0,215 0,215 0,2150,9 0,191 0,190 0,190 0,190 0,189 0,189 0,189 0,189 0,189 0,188 0,188 0,188 0,188 0,188 0,1881,0 0,166 0,166 0,165 0,165 0,165 0,164 0,164 0,164 0,164 0,163 0,163 0,163 0,163 0,163 0,163

1,1 0,144 0,143 0,143 0,143 0,142 0,142 0,142 0,141 0,141 0,141 0,141 0,141 0,140 0,140 0,1401,2 0,124 0,123 0,123 0,122 0,122 0,122 0,121 0,121 0,121 0,121 0,120 0,120 0,120 0,120 0,1201,3 0,106 0,105 0,105 0,105 0,104 0,104 0,104 0,103 0,103 0,103 0,103 0,102 0,102 0,102 0,1021,4 0,090 0,090 0,089 0,089 0,088 0,088 0,088 0,087 0,087 0,087 0,087 0,086 0,086 0,086 0,086

1,5 0,077 0,076 0,075 0,075 0,075 0,074 0,074 0,074 0,073 0,073 0,073 0,073 0,072 0,072 0,072

1,6 0,065 0,064 0,064 0,063 0,063 0,062 0,062 0,062 0,061 0,061 0,061 0,061 0,060 0,060 0,0601,7 0,054 0,054 0,053 0,053 0,052 0,052 0,052 0,051 0,051 0,051 0,051 0,050 0,050 0,050 0,0501,8 0,045 0,045 0,044 0,044 0,043 0,043 0,043 0,042 0,042 0,042 0,042 0,042 0,041 0,041 0,0411,9 0,038 0,037 0,037 0,036 0,036 0,036 0,035 0,035 0,035 0,035 0,034 0,034 0,034 0,034 0,0342,0 0,031 0,031 0,030 0,030 0,030 0,029 0,029 0,029 0,028 0,028 0,028 0,028 0,028 0,027 0,027

2,1 0,026 0,025 0,025 0,025 0,024 0,024 0,024 0,023 0,023 0,023 0,023 0,023 0,022 0,022 0,0222,2 0,021 0,021 0,021 0,020 0,020 0,020 0,019 0,019 0,019 0,019 0,018 0,018 0,018 0,018 0,0182,3 0,018 0,017 0,017 0,016 0,016 0,016 0,016 0,015 0,015 0,015 0,015 0,015 0,015 0,014 0,0142,4 0,014 0,014 0,014 0,013 0,013 0,013 0,013 0,012 0,012 0,012 0,012 0,012 0,012 0,012 0,0112,5 0,012 0,011 0,011 0,011 0,011 0,010 0,010 0,010 0,010 0,010 0,010 0,009 0,009 0,009 0,009

2,6 0,010 0,009 0,009 0,009 0,009 0,008 0,008 0,008 0,008 0,008 0,008 0,007 0,007 0,007 0,0072,7 0,008 0,008 0,007 0,007 0,007 0,007 0,007 0,006 0,006 0,006 0,006 0,006 0,006 0,006 0,0062,8 0,006 0,006 0,006 0,006 0,006 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,004 0,004

2,9 0,005 0,005 0,005 0,005 0,004 0,004 0,004 0,004 0,004 0,004 0,004 0,004 0,004 0,004 0,0033,0 0,004 0,004 0,004 0,004 0,004 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003

3,1 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,002 0,002 0,002 0,002 0,002 0,002 0,0023,2 0,003 0,003 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,0023,3 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,0013,4 0,002 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,0013,5 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001

3,6 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,0013,7 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,0003,8 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0003,9 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,0 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

4,1 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,2 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

4,3 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,4 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

4,6 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,7 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,8 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004,9 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0005,0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Valores calculados con la función DISTR.T(x; grados_de_libertad; colas) de Excel.Gentileza de ALKA S. A. DERECHOS RESERVADOS.

0i t   

t

ν  

p