Guia de Estadística General

113
Guía Práctica de Estadística General | 1 Área de Estadística Lima Perú 2015 Estadística General

description

gukgkg

Transcript of Guia de Estadística General

Page 1: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

1

Área de Estadística

Lima – Perú

2015

E s t a d í s t i c a

G e n e r a l

Page 2: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

2

GUÍA DE PRÁCTICAS DE ESTADÍSTICA GENERAL © Derechos Reservados 2015 © Área de Matemática y Estadística

Primera Edición 2011 Segunda Edición 2013 Tercera Edición 2014 Cuarta Edición 2015

Diseño, Diagramación e Impresión Universidad Científica del Sur Cantuarias 385. Miraflores. Lima-Perú 610-6400

Tiraje 1500 ejemplares IMPRESO EN PERÚ PRINTED PERU

Page 3: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

3

Autoridades

Ing. José Dextre Chacón Presidente del Directorio

MBA Rolando Vallejo Gerente General

Dr. José Amiel Pérez Rector

Dra. Josefina Takahashi Vicerrectora Académica

M Sc. Alejandro Fukusaki Coordinador General de Ciencias Básicas

Coordinadora de Área

Estadística Lic. Sarita Bocanegra Gonzales

Comité Editorial

Ing. José Dávila jdavilat@científica.edu.pe

Lic. Michaels Mejía mmejia@científica.edu.pe

Page 4: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

4

CONTENIDO

Capítulo 1: Conceptos y Presentación de datos 5

Capítulo 2: Medidas de Tendencia Central y de Dispersión 20

Capítulo 3: Cálculo de Probabilidades 31

Capítulo 4: Distribuciones de Probabilidad 43

Capítulo 5: Estimación de Parámetros 58

Capítulo 6: Pruebas de Hipótesis 68

Capítulo 7: Regresión y Correlación Lineal Simple 91

Capítulo 8: Tablas de Contingencia y Pruebas Chi – Cuadrado 103

Page 5: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

5

Page 6: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

6

Page 7: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

7

CONCEPTOS ESTADÍSTICOS

Población.-

Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.) que cumplen o

satisfacen la o las características en estudio.

Por el número de elementos que la componen la población se clasifica en finita e infinita. La

población es finita si tiene un número determinado de elementos en caso contrario es infinita. En la

práctica una población finita con un gran número de elementos se considera como una población

infinita; por otro lado el tamaño de una población va a depender de objetivo trazado por el

investigador.

Muestra.-

Está constituida por una parte de los individuos o elementos que componen la población,

seleccionada de acuerdo a cierta técnica con el fin de obtener información acerca de la población,

de la cual proviene. La muestra debe ser seleccionada de manera que sea representativa, es decir

tenga características similares a las de su población.

Parámetro.-

Es una medida descriptiva que resume una característica de la población, es decir constituye el

valor real, verdadero; su cálculo implica utilizar toda la información contenida en la población;

entre los más conocidos tenemos:

La media poblacional ( μ )

La varianza poblacional ( σ2 )

La proporción poblacional ( P ) etc.

Estadístico.- Es una medida que describe una característica de la muestra, se calcula a partir de los

datos observados en la muestra; es decir constituyen los estimadores de cada uno de sus respectivos

parámetros; entre estos tenemos:

La media muestral )( X

La varianza muestral ( S2 )

La proporción muestral )ˆ( p

Variable.- Es una característica definida en la población de acuerdo a cierto interés en una

investigación estadística, que puede tomar dos o más valores (cualidades o números). Puede ser

una característica medible (peso, precio, ingresos, temperatura etc) o una cualidad no medible

(estado civil, calidad, color, sexo etc). Se representa con las letras X, Y, Z.

CLASIFICACIÓN DE LAS VARIABLES

SEGÚN LA NATURALEZA DE LA VARIABLE

a) VARIABLES CUALITATIVAS O CATEGÓRICAS

Son aquellas cuyos valores expresan cualidades o atributos; estas a su vez pueden ser:

VARIABLES NOMINALES.- Son aquellas en donde no existe un orden preestablecido entre

las categorías de las variable. Ejemplos:

Page 8: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

8

VARIABLE CATEGORÏAS

Color Azul, rojo, blanco, verde, negro, amarillo etc.

Estado Civil Soltero, casado, conviviente, viudo, divorciado.

Distrito Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc

Sexo Masculino, femenino

Calidad Buena, mala.

VARIABLES ORDINALES.- Son aquellas en donde existe un orden preestablecido entre las

categorías de la variable.

Ejemplos:

VARIABLE CATEGORÏAS

Grado de Instrucción Primaria, Secundaria, Superior

Orden de Mérito Primero, Segundo, Tercero etc.

Nivel Socioeconómico Bajo, Medio, Alto etc.

También podemos considerar como variables ordinales por ejemplo grado de satisfacción de

un servicio (1 = Muy insatisfecho; 2 = Insatisfecho; 3 = Ni satisfecho ni insatisfecho; 4 =

Satisfecho; 5 = Muy satisfecho) o también el grado de depresión, etc.

b) VARIABLES CUANTITATIVAS

Son aquellas que se obtienen como resultado de mediciones o conteos; estas a su vez se

clasifican en:

VARIABLES DISCRETAS

Son aquellas cuyos valores resultan como consecuencia de conteos, y por lo tanto solo pueden

asumir valores enteros positivos, incluido el cero. Ejemplos

Número de empresas, número de hospitales, número de trabajadores, número de comprobantes

de pago, número de máquinas, número de conservas etc.

VARIABLES CONTINUAS

Son aquellas cuyos valores se obtienen por medición, pueden asumir valores decimales.

Ejemplos:

Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso, la estatura, la presión etc.

SEGÚN EL ROL QUE TIENEN EN LA INVESTIGACIÓN

a) VARIABLE DEPENDIENTE

La variable dependiente es aquella determinada por el investigador para estudiarla en función de

otras variables denominadas independientes. Generalmente se simboliza esta variable con la letra

Y.

b) VARIABLE INDEPENDIENTE

La variable independiente es aquella que es controlada en un experimento por el investigador.

Generalmente se simboliza esta variable con la letra X.

Page 9: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

9

En la mayoría de los experimentos el investigador está interesado en determinar el efecto que tiene

la variable X, sobre la variable Y; para esto el investigador controla los niveles de la variable X y

mide el efecto sobre la otra variable.

Ejemplo:

- La variación en los precios de un determinado artículo, motiva cambios en las ventas. En este

ejemplo las variables son:

Precio = X Venta = Y

- El costo de producción de un artículo, determina su precio de venta. En este caso las variables

son:

Costo de producción = X Precio de venta = Y

Podemos notar que el rol que asuma una determinada variable como dependiente o independiente

en una investigación, va a depender con qué variable se asocie.

E J E R C I C I O S P R O P U E S T O S

1. Determinar, en cada caso el tipo de variable, de acuerdo a su naturaleza:

a. Tiempo que demora un paciente para ser atendido en un Centro Médico.

b. Carreras que quieren seguir las alumnas y los alumnos de un centro educativo al

terminar la Educación Secundaria.

c. Intención de voto para las elecciones presidenciales.

d. Horas que dedican a ver televisión los estudiantes de Primaria en Arequipa.

e. Número de aparatos de radio que hay en los hogares de Ayacucho.

f. Grado de instrucción de los trabajadores de una Empresa.

g. Número de televisores LCD vendidos durante el mes de diciembre del año

pasado. h. Temperaturas registradas cada hora en un observatorio.

i. Número de pacientes atendidos por emergencia durante el mes pasado.

2. Clasificar cada una de las afirmaciones siguientes ya sea como inferencias o métodos

descriptivos.

a. El año pasado en la UCS el puntaje promedio del examen de admisión fue 85.

b. El Dr. García, un ecólogo, informó que en cierto río del oriente peruano, la carne de los

peces contienen un promedio de 300 unidades de mercurio.

c. La compañía “RM” predijo quién sería el ganador en una elección presidencial después de

conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que

hubo en total.

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES

CUANTITATIVAS

a) Tabla de frecuencias para Datos No Agrupados.- Es apropiada para datos cuyos valores

distintos no son muy numerosos.

Ejemplo:

Los siguientes datos corresponden a las edades de 50 estudiantes:

Page 10: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

10

20 22 21 19 18 18 20 22 20 19 20 19

23 19 18 20 21 22 19 20 18 23 20 21

19 22 23 20 21 19 22 18 19 20 21 24

21 20 21 20 24 23 20 21 19 20 22 21

21 22

a) Presentar dichos datos en una tabla de frecuencias

b) Presentar los datos gráficamente a través de un Histograma

c) Presentar los datos gráficamente en un Polígono de Frecuencias

Solución:

En este caso notamos que la variable edad, apenas está tomando solamente siete

valores distintos que van desde 18 hasta 24

Variable: Xi Frecuencias Absolutas: fi

Frecuencias Absolutas Acumuladas: Fi

Frecuencias Relativas: hi

Frecuencias Relativas Acumuladas: Hi

La siguiente tabla y el gráfico han sido obtenidos, usando el software MINITAB

Tabla de frecuencias para la variable edad:

Edad fi Fi Porcentaje % Acumulado

18 5 5 10.00 10.00

19 9 14 18.00 28.00

20 13 27 26.00 54.00

21 10 37 20.00 74.00

22 7 44 14.00 88.00

23 4 48 8.00 96.00

24 2 50 4.00 100.00

Total 50 100.00

Comentario: Se observa que el 26% de los estudiantes tienen 20años de edad mientras que solo un

4% tienen 24 años. También podemos ver que un 46% tienen entre 20 y 21 años.

Page 11: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

11

b) Histograma de Frecuencias

24232221201918

25

20

15

10

5

0

Edad (años )

Po

rce

nta

je

Distribución de los estudiantes según edad

c) Polígono de Frecuencias obtenido con SPSS

d) Tabla de frecuencias para Datos Agrupados.- Es apropiada cuando los valores distintos

que toma la variable es muy numeroso. Se siguen los siguientes pasos:

1) Calcular el rango de la variable: R = Valor máximo – Valor mínimo

2) Elegir el número de intervalos de clases: K se sugiere entre 5 y 10 inclusive

3) Calcular la amplitud de los intervalos de clases: C

C = R cuyo cociente en lo posible deberá ser exacto, caso contrario deberá

K trabajarse con los llamados “excesos”

Page 12: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

12

Ejemplo 1:

Los siguientes datos representan el contenido de yodo en la sangre de 40 pacientes adultos en

µg/100cc.

8.6 9.5 6.5 7.4 10.5 6.8 7.7 5.9 7.0 7.3 5.1 4.3 7.9

9.2 6.5 7.3 5.5 5.6 5.1 4.4 10.2 6.5 7.5 5.8 5.8 5.3

4.6 3.8 7.0 8.1 5.9 7.3 5.5 5.5 4.5 3.5 5.6 5.7 5.8

5.9

Presente los datos en una tabla de frecuencias

Solución

Rango: R

R = 10.5 – 3.5 = 7.0

K = 1 + 3.32 log 40 = 6.32 K = 5 ó 6 ó 7

Si k = 5 C = 7.0 = 1.4

5

Si k = 7 C = 7.0 = 1.0

7

Observamos que para ambos valores de K; hemos obtenido un cociente exacto

Eligiendo K = 5 obtenemos la siguiente tabla de frecuencias según el Programa SPSS

Yodo (µg/100cc) Xi fi Fi hi Hi

3.5 - 4.9 4.2 6 6 0.150 0.150

4.9 - 6.3 5.6 15 21 0.375 0.525

6.3 - 7.7 7.0 12 33 0.300 0.825

7.7 - 9.1 8.4 3 36 0.075 0.900

9.1 - 10.5 9.8 4 40 0.100 1.000

TOTAL 40 1.000

Se observa que el 37.5% de los pacientes tienen un nivel de yodo en la sangre que varía entre 4.9 y

6.3 microgramos por 100 cc. También podemos decir que poco más del 50% han tenido entre 3.5 y

6.3 microgramos de yodo en la sangre.

Page 13: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

13

Ejemplo 2:

Como control de la ética publicitaria, se requiere que el rendimiento en millas/ galón, de gasolina

esté basado en un buen número de pruebas efectuadas en diversas condiciones. Al tomar una

muestra de 50 automóviles se registraron las siguientes observaciones en millas por galón

35.6 27.9 29.3 31.8 22.5 34.2 32.7 26.5 26.4 31.0 31.6 28.0

33.7

32.0 28.5 27.5 29.8 34.2 31.2 28.7 30.0 28.7 33.2 30.5 27.9

31.2

29.5 28.7 23.0 30.1 30.5 31.3 24.9 26.8 29.9 28.7 30.4 31.3

32.7

30.3 33.5 30.5 30.6 35.1 28.6 30.1 30.3 29.6 31.4 32.4

Presente los datos en una tabla de frecuencias

Solución:

Rango: R

R = 35.6 – 22.5 = 13.1

K = 1 + 3.32 log 50 = 6.64 K = 6 ó 7 u 8

Si k = 6 C = 13.1 = 2.1833………… 2.2

6

Exceso E = (6 x 2.2) – 13.1 = 13.2 – 13.1 = 0.1

Page 14: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

14

Si k = 7 C = 13.1 = 1.8714………… 1.9

7

Exceso E = (7 x 1.9) – 13.1 = 13.3 – 13.1 = 0.2

Si k = 8 C = 13.1 = 1.6375 1.7

8

Exceso E = (8 x 1.7) – 13.1 = 13.6 – 13.1 = 0.5

Eligiendo K = 6 por tener el menor exceso

Las frecuencias han sido obtenidas según el Programa SPSS

Rendimiento

(millas/galón)

Xi fi Fi hi Hi

22.5 - 24.7 23.6 2 2 0.04 0.04

24.7 - 26.9 25.8 4 6 0.08 0.12

26.9 - 29.1 28.0 10 16 0.20 0.32

29.1 - 31.3 30.2 20 36 0.40 0.72

31.3 - 33.5 32.4 9 45 0.18 0.90

33.5 - 35.7 34.6 5 50 0.10 1.00

T O T A L 50 1.00

Se observa que el 60% de los automóviles tienen un rendimiento entre aproximadamente 27 y

31.3 millas por galón de gasolina.

Ejemplo 3

Los siguientes son los puntajes logrados en un examen de cierta asignatura por 50 estudiantes:

61 50 65 70 45 60 80 65 60 65 64 54 65

67 48 64 56 60 61 62 62 57 75 53 58 59

56 54 67 68 60 63 56 53 61 62 69 70 44

47 65 56 57 58 55 51 43 79 72 48

Presentar los datos en una tabla de frecuencias

Solución

R = 80 – 43 = 37

K = 1 + 3.32 log 50 = 6.64 7 K = 6 ó 7 u 8

Si k = 6 C = 37 = 6.1666………… 7

Page 15: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

15

6

Exceso E = (6 x 7) – 37 = 42 - 37 = 5

Si k = 7 C = 37 = 5.2857……….. 6

7

Exceso E = (7 x 6) – 37 = 42 - 37 = 5

Si k = 8 C = 37 = 4.625 5

8

Exceso E = (8 x 5) – 37 = 40 - 37 = 3

Eligiendo K = 8 por tener el menor exceso

Puntaje Xi fi Fi hi Hi

42 – 46 44 3 3 0.06 0.06

47 – 51 49 5 8 0.1 0.16

52 – 56 54 9 17 0.18 0.34

57 – 61 59 12 29 0.24 0.58

62 – 66 64 11 40 0.22 0.8

67 – 71 69 6 46 0.12 0.92

72 – 76 74 2 48 0.04 0.96

77 - 81 79 2 50 0.04 1

Total 50 1

Poco menos de la mitad de los estudiantes (46%) han obtenido entre 57 y 66 puntos.

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES

CUALITATIVAS O CATEGÓRICAS

Ejemplo 1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo.

La siguiente tabla incluye datos de 400 sujetos seleccionados al azar:

Fuentes de empleo Nº de

sujetos

Porcentaje

Anuncios clasificados 56 14

Empresas de búsqueda de ejecutivos 44 11

Contactos profesionales 280 70

Correo masivo 20 5

Total 400 100

Page 16: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

16

Gráfico de Barras Simples ( EXCEL )

Gráfico de Sectores Circulares ( EXCEL )

Diagrama de Pareto ( MINITAB )

Porcentaje 70 14 11 5

Porcentaje 70.0 14.0 11.0 5.0

% acumulado 70.0 84.0 95.0 100.0

Fuentes de Empleo

Correo

mas

ivo

Empres

as de bú

sq

Anun

cios clas

if.

Contac

tos prof.

100

80

60

40

20

0

100

80

60

40

20

0

Po

rce

nta

je

Po

rce

nta

je

Fuentes de Empleo

Page 17: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

17

Ejemplo 2.- La siguiente información se refiere al número de estudiantes matriculados en tres

especialidades de Administración de Empresas, durante los años 2,000 y 2,005

Especialidad 2000 2005

Finanzas

Marketing

Contabilidad

160

140

100

250

200

150

Gráfico de Barras Dobles

EJERCICIOS PROPUESTOS

1.- Al contar el número de materias reprobadas por los alumnos de cierta Universidad, se han

obtenido los siguientes datos:

1, 1, 2, 3, 2, 6, 0, 0, 1, 0, 4, 5, 0, 0, 0, 3, 2, 1, 3, 1, 1, 1, 0, 1, 2, 0,

0, 5, 4, 2.

Construya una tabla de frecuencias y el histograma correspondiente.

2.- En un colegio “X” se piensa en la posibilidad de cambiar el timbre por unos acordes de música

rock. Se ha preguntado a 20 alumnos cual es su opinión acerca de estos acordes, según la escala:

No me gusta nada ( 1 ), Me gusta poco ( 2 ), Me es indiferente ( 3 ), Me gusta bastante ( 4 )

Me gusta muchísimo ( 5 ). Estos han opinado la siguiente manera (codificada):

5, 4, 1, 2, 2, 4, 2, 5, 3 , 5, 3, 5, 1, 1, 3, 1, 2, 5, 3, 3

Construir la tabla de distribución de frecuencias adecuada para responder las siguientes preguntas:

a. ¿A qué porcentaje de alumnos les gusta poco estos acordes?

b. ¿A cuántos alumnos les gusta bastante los acordes?

c. ¿Cuál es la proporción de alumnos a los que les es indiferente los acordes?

d. ¿Cuál es la proporción de alumnos a los que les gusta poco o no les gusta nada los acordes?

Page 18: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

18

e. ¿Cuál es la proporción de alumnos a los que a lo más les gusta bastante los acordes?.

3.- El gerente de una tienda comercial está interesado en el número de veces que 52 clientes han

ido

a comprar en su almacén durante un período de dos semanas. Los datos que se registraron

fueron:

5 3 3 1 4 4 5 6 4 2 6 6 1

1 14 1 2 4 4 5 6 3 5 3 6 8

4 7 6 5 9 11 3 12 4 7 14 1 1

10 8 9 2 12 5 7 6 4 5 6 5

a) Organice los datos en un cuadro de distribución de frecuencias

b) Presente los datos en una gráfica apropiada.

4.- Los siguientes datos proporcionan los ingresos anuales en miles de dólares de 50 personas:

7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0

30.0 25.5 50.0 17.1 25.5 43.5 31.6 59.0 41.5 13.5 12.0 9.2

42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5

18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0

12.0 8.3

a) Presentar dichos datos en una tabla de distribución de frecuencias, usando 6 intervalos de

clase.

b) Estime la proporción de ingresos que están entre 12,500 dólares y 52,500 dólares.

c) Estimar la proporción de ingresos que están debajo de 50,000 dólares.

5.- Los siguientes datos son calificaciones en la prueba de Miller de personalidad de 82 estudiantes.

22 22 20 27 30 23 29 21 26 31 21 23 25

29 18 22 31 30 28 16 28 33 25 23 31 23

18 24 26 25 17 22 25 28 19 24 20 23 26

21 31 25 24 33 29 20 27 21 25 28 24 23

25 30 27 23 26 22 24 17 33 26 24 19 18

33 25 28 31 29 27 28 24 26 24 22 26 24

18 21 29 22

a) Organice los datos en un cuadro de distribución de frecuencias

b) Presente los datos en una gráfica apropiada.

6.- Cierto investigador especialista en salud pública afirma que el nivel de plomo en sangre en

niños en edad escolar de una cierta región, se ha incrementado. Para verificar este supuesto se toma

una muestra de 120 niños en edad escolar, obteniendo los siguientes resultados:

27.88 28.42 45.81 6.55 6.4 6.14 3.73 26.88 31.93 14.85 26.88 38.35

34.26 38.97 7.22 5.24 15.4 3.73 31.93 28.34 10.79 26.88 6.32 33.09

28.24 4.67 6.07 9.77 5.35 28.34 33.43 14.85 28.84 3.27 4.88 47

6.56 49.24 6.82 35.49 33.43 27.38 11.33 5.44 9.28 4.36 35.6 9.17

Page 19: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

19

34.26 28.84 26.53 7.92 27.96 6.28 38.62 6.55 4.4 10.79 33.09 28.42

27.38 34.47 5.91 33.1 12.04 34.26 4.24 7.22 45.16 5.91 34.94 5.04

27.6 28.42 33.09 13.38 37.47 38.41 4.67 36.23 33.09 6.67 36.71 33.83

5.04 34.98 6.56 36.56 8.85 29.33 4.88 34.26 34.99 4.82 17.96 7.92

4.68 25.21 4.68 35 9.17 25.17 4.82 28.84 34.13 6.28 4.88 8.7

51.24 5.84 34.72 33.83 35.09 28.42 30.83 4.79 5.44 7.17 29.29 32.29

a) Construya una tabla de frecuencias

b) Obtenga un histograma y polígono de frecuencias.

7.- Se hizo un estudio sobre el cangrejo Xantido referente al número de huevos puestos por

individuo

Las siguientes son las observaciones obtenidas para 45 cangrejos.

1959 4534 7020 6725 6964 7428 2802 2462 4000 3378 7343 4189

2412 7624 1548 4801 737 5321 6837 8639 7417 6082 10241 962

5099 6627 4484 5633 4148 6588 6472 8372 8225 6142 12130 9359

8973 849 3894 5847 9166 4327 5749 1801 4632

Presentar en una tabla de frecuencias usando 6 intervalos de clase cerrados.

8.- En marzo de 1995 la inversión extranjera en el Perú y de acuerdo al país de origen fue como

sigue:

España 46% Países Bajos 6%

EE.UU. 16% Panamá 5%

Reino Unido 8% Chile 4%

Otros 15%

Representar gráficamente dicha información.

9.- Una tienda comercial, ubicada en Lima Metropolitana, vende ropa de moda para damas y

caballeros además de una amplia gama de productos domésticos. A continuación se presentan las

ventas netas observadas durante los años del 2002 al 2006. Represente gráficamente dicha

información.

Año Ventas netas (millones de S/.)

2002 500.0

2003 519.2

2004 535.8

2005 560.9

2006 544.1

10.- Se ha hecho una encuesta para saber con qué regularidad se lee el periódico en Lima, y los

resultados fueron estos:

RESPUESTAS %

Todos los días 37.5

Una vez por semana 29

Una vez al mes 10.5

Page 20: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

20

Alguna vez al año 12

Nunca

No contesta 0.4

a. ¿Qué tanto por ciento de personas respondieron “nunca”?

b. Si las personas que no contestaron fueron 6, ¿cuántas personas fueron encuestadas?

c. Las personas encuestadas, ¿son muestra o población?

Page 21: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

21

Page 22: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

22

Ejercicios de Desarrollo

1.- Los salarios en una Empresa son en promedio S/. 380 semanales, con posterioridad se

incorpora a la Empresa un grupo de trabajadores igual al 25 % de los que estaban anteriormente.

El nuevo grupo ingresa a la Empresa con un salario medio igual al 60 % de los antiguos. Dos

meses más tarde, la Empresa concede un aumento de salarios de S/. 50. Hallar el salario promedio

del total de trabajadores.

Solución:

6.399506.3496.34925.1

)228(25.0)380(

228)380(6.0380

:º:25.0

:º:

1

11

21

221

11

n

nnX

xxqueSabemos

estrabajadorlostodosdepromedioSalarioX

nuevoslosdepromedioSalarioxnuevosestrabajadordeNnn

antiguosdepromedioSalarioxantiguosestrabajadordeNn

p

p

2.- En una Compañía que maneja cuatro productos; los márgenes de utilidad y las totales de

ventas observados durante el año pasado aparecen en la siguiente tabla.

Producto Margen de utilidad Venta total

A 4.2 % $ 30,000

B 5.5 % $ 20,000

C 7.4 % $ 5,000

D 10.1 % $ 3,000

Calcule el margen de utilidad promedio.

Solución: Considerando que las ventas totales no son las mismas para cada producto, utilizaremos un

promedio ponderado

0523.0000,3........................000,20000,30

)000,3(101.0...................................)000,20(055.0)000,30(042.0

pX

Por lo que el margen de utilidad promedio será del 5.23 %

3.- Una fábrica tiene 3 máquinas. La máquina B produce la mitad de lo que produce la máquina A

y la producción de la máquina C es inferior en un 20 % de lo que produce la máquina B. Los

costos de producción por unidad son: 3, 4 y 5 soles para las máquinas A, B y C respectivamente.

Se desea ganar el 20 % por unidad. Calcule el precio medio de venta.

Page 23: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

23

Solución:

Máquinas Costo por unidad Cantidad producida Precio de venta

A S/. 3 2x 3.6

B 4 x 4.8

C 5 0.8x 6.0

solesxxx

xxxVP 42.4

8.02

)8.0(68.4)2(6.3

4.- El ingreso per cápita mensual de un país es $315. El sector público que constituye un 55% de la

población percibe 18% del ingreso total. Calcule el ingreso medio por habitante del sector público

y no público.

Solución: Consideremos:

dólaresxxn

xnn

n

xnxn

PúbliconoSectordelpromedioingresoelhallaremosAhora

PúblicoSectordelpromedioIngresodólaresn

n

n

xxluego

nnxPúblicoSectordeltotalIngresoxnxn

xx

nnPúbliconoSectornnPúblicoSector

ntotalIngreson

xnxnXpercápitaIngreso p

57445.07.56315)(45.07.56

315

)(09.10355.0

7.56

.

7.56)315(18.0

45.0:55.0:

315315$:

2222211

1

1

1

1111

1

1

1

21

2211

5.- Un grupo de 200 estudiantes, cuya estatura media es de 60.96 pulgadas se divide en dos

grupos, uno con estatura media de 63.4 pulgadas y otro con una estatura de 57.3 pulgadas.

¿Cuántos estudiantes hay en cada grupo?.

Solución: Sea n1 = Nº de hombres y n2 = Nº de mujeres

Page 24: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

24

12080200

3.574.63)200(96.60

3.574.6396.60

200200

1222

21

2121

nnnn

luego

XXXademás

nnnnqueSabemos

p

6.- El coeficiente de variación de los ingresos mensuales de 100 empleados de una

compañía es 0.6. Después de un aumento general de S/. 90 mensuales para cada uno de

los trabajadores de la compañía, el coeficiente de variación es ahora de 0.55. Determinar

la cantidad de dinero que necesitará mensualmente la compañía para pagar los sueldos

después de hacer efectivos los aumentos.

Solución: Sea X: Sueldos antes del aumento

55.090

.6.0.

X

SVC

X

SVC

DespuésAntes

solesserásueldoslospagarparatotalDineroLuego

actualpromedioSueldoXentonces

anteriorpromedioSueldoXXXX

XX

SestándaresdesviacionlasIgualando

XSXSluego

000,108)1080(100:

)(108090

)(9905.4905.05.4955.06.0

)90(55.06.0

)90(55.06.0

7.- Una estación de servicio automotriz gasta $500 en la compra de latas de aceite que cuestan $10

la docena; $500 en latas que cuestan $12.5 la docena; otros $500 en latas que cuestan $20 la

docena y $500 en otras que cuestan $25 la docena.

a) Determinar el costo promedio por docena de las latas de aceite.

b) En promedio ¿Cuántas docenas de latas de aceite compró?

Page 25: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

25

Solución:

a) Hallaremos el costo promedio por docena

Monto Costo por docena Docenas compradas

500 10 50

500 12.5 40

500 20 25

500 25 20

Total = 2000 135

docenascompradasdocenasdeomediob

docenadólaresdocenas

dólaresX

75.334

135:Pr)

/8.14135

2000

8.- Una muestra de 70 datos da una media de 120 y una desviación estándar de 6; otra muestra de

30 datos da una media de 125 y una desviación estándar de 5. Se reúnen las dos muestras formando

una sola muestra de 100 datos. Calcule el coeficiente de variación de esta muestra de 100 datos.

Solución: Se tiene que:

56

125120

3070

21

21

21

SS

XX

nn

21

2211

..:

nn

XnXnXcasoesteen

X

SVCHallaremos

= 5.1213070

)125(30)120(70

1:

1:

2

212

2

2

12

2

2

2

n

nXX

XXSgruposdosdetratarseporcasoesteen

n

nX

XSqueSabemos

Page 26: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

26

%05.5%1005.121

14.6.tan

14.672.3799

10012150

1479959

46947529

303750

252

101048469

708400

361

2

2

2

2

22

22

2

22

22

2

2

1

22

1

1

1

2

12

12

1

xVCtoloPor

SSLuego

XX

n

nX

X

S

XX

n

nX

X

S

EJERCICIOS PROPUESTOS

1.- Una firma comercial afirma que el salario promedio mensual pagado a su personal es de $640,

esto sugiere que dicha firma paga bien. Sin embargo, un análisis posterior indicó que se trata de

una pequeña empresa, que emplea 4 jóvenes con haberes mensuales de $300 c/u y el gerente

general con un haber de $2000 mensuales. ¿Ud. puede seguir afirmando que la firma paga bien?

2.- En cierto hospital se encuentran en observación en el Departamento de Urología: 5 adultos de 51

kg de peso; 8 de 53; 10 de 62; 7 de 64; 3 de 70; 8 de 72; 15 de 75 y 2 de 79 kg de peso. Hallar la

mediana y la moda. Interprete.

3.- Las temperaturas medias de 40 días del año, registradas en la localidad de Monteagudo han

sido:

(en grados centígrados):

-9 -8 -5 -2 2 1 6 7 9 12 13 17 16

15 18 17 14 17 23 22 25 25 28 26 29 31

35 38 37 36 29 25 24 18 16 8 7 3 -1

-3

a) Construya la tabla de frecuencias clasificando la temperatura en cinco clases.

b) Calcule la media aritmética

c) ¿Cuántos días han registrado temperaturas entre CXyCX º8º8

d) ¿Cuál es el porcentaje de días con temperaturas entre CyC º33º3 ?

e) ¿Cuál es la proporción de días con temperaturas mayores a 26ºC ?.

4.- Una población industrial tiene 4 fábricas: M, N, O y P. Los 50 obreros de la fábrica M ganan,

en promedio $24 por día; los 35 obreros de N, $38 por día, los 25 obreros de O, $43 por día y los

72 empleados de P, $36 por día. Hallar el ingreso promedio por día de esa población industrial.

Rpta. 34.05

Page 27: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

27

5.- Ciertos inspectores de salubridad examinan toneladas de mariscos. El inspector A examinó 30

toneladas de las cuales 10 no sirven. El inspector B examinó 50 de las cuales 40 están en perfectas

condiciones. El inspector C examina 80 de las cuales el 25% no sirve. ¿Qué porcentaje de los

mariscos están en buenas condiciones?. Rpta. 75%

6.- Para evaluar como influye el consumo de alcohol en el deterioro de la inteligencia, se realizó

una investigación en la ciudad de Trujillo sobre un cierto número de personas de entre 25 y 55

años. Se tomó entre otras técnicas el test de Wais que mide el CI; los resultados obtenidos se

muestran en la tabla. ¿Se puede calcular la mediana? ¿y la moda? de ser así hallar el valor de

dichos estadígrafos e interpretar los resultados obtenidos. Rpta. Me = 121.5

7.- Seis mecanógrafas escriben a las siguientes velocidades 45, 37, 30, 38, 35 y 42 palabras

por minuto. Si cada una de ellas escribe un mismo texto calcular la velocidad media. Rpta. 37.2

palab/min

8.- Las notas de 50 alumnos se clasificaron en una tabla de frecuencias con siete intervalos de clase

de igual amplitud. Se pide calcular la mediana y la moda sabiendo además que: x5 = 75; f2 = f5 =

7;

F1 = 6; f7 = 4; F3 = 22; F5 = 41 y x = 62.6.

9.- Hallar e interpretar la moda de la distribución siguiente:

Intervalo de clase 34 -36 36 - 38 38 - 40 40 - 42 42 - 44 44 – 46

Frecuencia absoluta 2 5 30 40 20 3

10.- Dado los siguientes datos: 20, 9, 25, 4, 13, 15, 20, 27, 22, 18, 30, 7, 10 .

Hallar: Me, Mo, Q3, y P85

11.- De las mediciones biométricas efectuadas con cierto número de estudiantes se han extraído los

siguientes datos:

Los varones de 17 años tienen un peso medio de 60.8 kg. con una desviación estándar de 6.69 kg.

Los varones de 10 años tienen un peso medio de 30.5 kg y una desviación estándar de 5.37 kg

A partir de los datos anteriores se puede afirmar que el peso es más variable a los 10 años que a los

17 años. Rpta. Efectivamente el peso es más variable a los 10 años

12.- Se tiene la siguiente información sobre una distribución de frecuencias de los pesos en kg de

50 elementos de un determinado material. La amplitud de los intervalos de clase es igual a 20:

[Li-1 - Li> xi fi Fi xifi

850

1710

27 2730

9

- 260 1500

50

a. Realiza el histograma de frecuencias absolutas y el polígono de frecuencias.

b. Determinar la media y la mediana.

C. Intelectual 100-110 110-120 120-130 130-140 140-150

Hi 0.14 0.44 0.85 0.97 1.00

Page 28: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

28

c. Hallar el número de datos que se estima pertenezcan al intervalo [200, mediana].

d. Hallar el primer cuartil y el 85avo percentil. Interpretar los resultados obtenidos.

13.- Suponga que la siguiente tabla de distribución representa los salarios diarios de los

trabajadores de construcción civil de Lima:

Salarios diarios (en S/.) Frecuencia

De 24 a 36 360

De 36 a 42 420

De 42 a 60 510

De 60 a 72 660

De 72 a 84 570

De 84 a 96 480

Total 3000

a. El sindicato de construcción civil solicita que en el nuevo pacto colectivo se establezca un

salario diario mínimo de S/. 42. ¿Qué porcentaje de trabajadores se beneficiarán con este

pacto?

b. Los trabajadores que reciben más de 90 soles diarios, se supone son muy calificados

(maestros de obra). ¿Cuál es ese porcentaje?

c. Estime el número de trabajadores que ganan entre 45 y 81 soles diarios.

14.- En la tabla siguiente se tiene los datos del número de seguidores de diferentes religiones en el

mundo, según una estimación de www.adherents.com

a. Elaborar la distribución de frecuencias relativas

b. ¿Se puede calcular la media, la mediana o la moda de estos datos? Si es así, obtenerlos

y explicar el significado de tus cálculos.

Religión Millones de

personas

Cristianismo 2000

Islam 1300

Hinduismo 900

Ateos-agnósticos-sin religión 850

Budismo 360

Confucionismo / Maoísmo 225

Animismo y religiones

tradicionales africanas 245

Otras 93

Total 5880

15.- Dada la siguiente distribución respecto a edades de un grupo de personas: 18, 39, 33, 28,

29, 40, 21, 26, 23, 48, 22, 43, 24, 46, 19, 27, 38, 12, 36, 32.

Calcular e interpretar: Q1, y P87.

Page 29: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

29

16.- El Ministerio de Educación realiza un estudio para determinar el monto de las subvenciones

anuales entregadas a colegios de Arequipa. Para ello selecciona una muestra de 40 de ellos; los

montos por subvención son los que a continuación de se detallan (expresados en millones de soles):

Subvención

(millones de soles)

Nº colegios

6 – 7 1

7 – 8 5

8 – 9 3

9 – 10 4

10 – 11 5

11 – 12 7

12 – 13 5

13 – 14 7

14 – 15 3

Calcular e interpretar:

a. La subvención mínima del 25% de los colegios con mayor subvención.

b. La subvención máxima del 40% de los colegios con menor subvención

c. El numero de colegios del intervalo [P40, P85].

17.- Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas que se

muestran a continuación muestran los salarios percibidos hasta fines de mayo de este año

(expresado en miles de soles):

Dpto. producción Dpto. ventas

Intervalos Nº

trabajadores Intervalos

trabajadores

1 – 1.5 12 6 - 8 4

1.5 – 2 28 8 – 10 6

2 – 2.5 32 10 – 12 12

2.5 – 3 24 12 – 14 15

3 – 3.5 12 14 – 16 3

a. Hallar la desviación típica correspondiente a cada departamento.

b. Determinar cual de los departamentos presenta mayor dispersión relativa.

18.- Dos países son igual de ricos, porque tienen la misma renta per cápita (o renta media), de

8.000 dólares al año. Pero en el país A la desviación típica es de 1.000 dólares y en el país B es de

4.000 dólares. ¿Qué podemos decir sobre la distribución de la riqueza de ambos países gracias a

este dato?

Page 30: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

30

19.- Los pesos de los jugadores de un equipo de fútbol son los siguientes: 76 78 75 72 81 75

82 71 68 71

a. Calcula el peso medio del equipo.

b. ¿Cuál es la mediana?

20.- Determinar la varianza del conjunto de observaciones x1, x2, x3, x4, x5, a los cuales se les

ha restado 4, obteniéndose el siguiente conjunto: 3, 0, 2, 4, 1.

21.- Se ha realizado un estudio a través de una prueba que mide el CI (coeficiente de inteligencia)

de 90 personas. Los resultados se recogen en la tabla siguiente:

a) ¿Qué porcentaje de personas tuvieron a lo más un CI de 118?. Rpta. 34.4% aprox

b) ¿Cuál es el CI mínimo que se requiere tener para pertenecer al quinto superior? Rpta.

129

22.- Un comerciante vende cinco tipos de limpiadores para desagües. En la tabla se muestra cada

tipo junto con la utilidad por lata y el número de latas vendidas.

Limpiador Utilidad por lata Volumen de ventas en latas

A $ 2.00 3

B 3.50 7

C 5.00 15

D 7.50 12

E 6.00 15

Calcular la utilidad promedio por lata.

23.- En una clase hay 70 estudiantes varones con una edad promedio de 21.8 años y 30 mujeres

las cuales en promedio son 15% más jóvenes. Calcular la edad promedio de los estudiantes.

Rpta. 20.82

24.- Los siguientes datos son los haberes básicos en dólares del mes de agosto de 20 empleados

de un Ministerio.

210 200 220 150 190 100 160 150 170 190 150

180 230 210 160 140 180 120 200 190.

Para el mes de setiembre se decreta un aumento del 10% sobre los haberes del mes de agosto y un

descuento del 2% de los haberes del mes de setiembre pro fondos de compensación social. Se

pide calcular la media y la desviación estándar de los nuevos haberes.

Rpta. 188.65 y 35.51

C. Intelectual 100-110 110-120 120-130 130-140 140-150

Nº de

estudiantes 10 26 40 12 2

Page 31: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

31

25.- El cuadro siguiente presenta la distribución (en porcentajes) de volúmenes de ventas anuales

en las empresas de cerámicas de la provincia de Lima durante el año pasado:

Ventas (dólares) Empresas (%)

Menos de 2500 19,8

2500 – 5000 13,2

5000 – 10000 13,0

10000 – 20000 17,7

20000 – 40000 11,0

40000 – 100000 14,4

100000 – 250000 8,5

250000 – 500000 1,8

500000 ó más 0,6

a) Calcule el volumen de venta promedio anual de las empresas

b) Determine el volumen de ventas mínimo observado por el 25% de las empresas que

registraron mayores ventas.

26.- Se pretende lanzar un producto del hogar al mercado para ser vendido en las grandes tiendas

de

Lima. Se hizo una encuesta en la salida de dichas tiendas a 200 personas y se le preguntó por el

precio que estarían dispuestos a pagar por el producto. Los resultados fueron los siguientes:

Precio (soles) Nº de

personas

1400 - 1800 40

1800 - 2200 45

2200 - 2600 44

2600 - 3000 39

3000 - 3400 32

Total 200

a) Determine el precio promedio que una persona está dispuesto a pagar por el producto.

b) El precio mínimo en que conviene lanzar el producto al mercado es de S/. 2180 y solo se

lanzará si por lo menos la mitad de los encuestados están dispuestos a pagar dicho precio.

¿Qué decisión se toma según la información anterior?.

27.- Los precios de una artículo, el mes pasado tenía una media de S/. 45.8 y una desviación

estándar de 8.2. En el presente mes hubo un aumento en los precios equivalente a un 3 % de los

precios del mes pasado. Calcule los nuevos valores de la media y la desviación estándar.

Page 32: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

32

Page 33: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

33

Page 34: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

34

OPERACIONES CON EVENTOS Y PROBABILIDADES

1.- En una compañía hay 6 varones y 4 damas que aspiran a ser miembros de un comité. Si se debe

escoger dos al azar. ¿Cuál es la probabilidad de que:

a) Los dos sean hombres

b) Sean un hombre y una mujer o dos mujeres.

Solución:

a) Sea el evento A = {Los dos sean hombres}

3

1

2

10

2

6

)(

AP

b) Sean los eventos:

B = {Sean un hombre y una mujer} C = {Sean dos mujeres} luego hallaremos:

3

2

45

624

2

10

2

4

1

4

1

6

)()()()(

CBPCPBPCBP

2.- Un lote contiene 100 artículos de los cuales 20 son defectuosos. Se inspecciona del siguiente

modo. Se sacan 5 artículos del lote: si los 5 son buenos se acepta el lote; en otro caso se rechaza.

¿Cuál es la probabilidad de rechazar el lote?.

Solución: Sea X: Nº de artículos defectuosos en la muestra de tamaño 5

P(Rechazar el lote) = P ( X = 1 ) + P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )

= 1 – P ( X = 0 ) = 1 – P ( Aceptar el lote )

68.032.01)Re(32.0

5

100

5

80

)(

chazarPAceptarPdondeen

Page 35: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

35

3.- Un recién graduado solicita empleo en la compañía A y en la B. Se estima que la probabilidad

de ser contratado por A es 0.7 y de ser contratado por B es 0.5. En tanto que la probabilidad de que

se rechace por lo menos una de sus solicitudes es de 0.6. ¿Cuál es la probabilidad de ser contratado

al menos por una de las compañías?

Solución Sean los eventos:

8.04.05.07.0)(

4.0)(6.0)(1)'()''(

)()()()(

)()(

6.0)''(}{''

5.0)(}{

7.0)(}{

BAPLuego

BAPBAPBAPBAPladootroPor

BAPBPAPBAP

compañiaslasdeunamenosalencontratadoSeaPBAPHallaremos

BAPcompañíaslasdeunamenosalenrechazadoSeaBA

BPBcomañíalaporcontratadoseagraduadorecienElB

APAcompañíalaporcontratadoseagraduadorecienElA

4.- Suponga que en un sorteo la probabilidad de ganar el primer premio es 2/5 y la de ganar el

segundo premio es 3/8. Si la probabilidad de ganar al menos uno de los dos premios es 3/4.

Calcular la probabilidad de ganar:

a) Sólo uno de los dos premios

b) Ninguno de los dos premios

Solución Sean los eventos:

40/1)()(8/35/24/3

)()()()(

4/3)(

8

3)(

5

2)(

BAPBAP

BAPBPAPBAP

BAPpremiodoslosdeunomenosalGanarBA

BPpremiosegundoelGanarB

APpremioprimerelGanarA

15

40

1

40 14

40

Page 36: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

36

725.040

29

40

1415)''(

ABBAPLuego

b) 25.04/14/31)(1)'()''( BAPBAPBAP

5.- Un banco de sangre dispone de 10 unidades de sangre tipo A. De ellas cuatro están

contaminadas con suero de hepatitis. Se seleccionan aleatoriamente 3 de estas unidades para

utilizarlas con tres pacientes diferentes.

a) ¿Cuál es la probabilidad de que los tres pacientes estén expuestos a contraer hepatitis por esta

razón?

b) ¿Que al menos dos de ellos no estén expuestos a contraer hepatitis?

Solución:

a) P ( X = 3 ) en donde X: Nº de pacientes expuestos a contraer hepatitis

033.0120

4

3

10

3

4

)3(

XP

667.0120

2060)2(

120

20

3

10

3

6

)3(120

60

3

10

1

4

2

6

)2(

expº:)3()2)2()

XPLuego

XPXP

contraerauestosnopacientesdeNXXPXPXPb

Page 37: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

37

PROBABILIDAD CONDICIONAL

Se trata de dos eventos A y B definidos en un mismo espacio muestral, en donde uno de ellos

(evento B) ya ocurrió, es decir se conoce su resultado.

( )( / )

( )

P A BP A B

P B

Ejemplo 1.- Una cierta compañía compra insumos de tres proveedores A, B y C.

Proveedor A abastece con 40% de los insumos, de los cuales el 8% son defectuosos.

Proveedor B abastece con el 35% de los cuales el 9% son defectuosos.

Proveedor C abastece con el 25% de los cuales el 10% son defectuosos.

Si se elige un insumo al azar:

a) ¿Cuál es la probabilidad de que este sea defectuoso?

b) Si el insumo salió defectuoso. ¿Cuál es la probabilidad de que haya sido adquirido del

proveedor A?

Solución:

Proveedor C a l i d a d Total

Defectuoso No Defectuoso

A 0.032 0.368 0.40

B 0.0315 0.3185 0.35

C 0.025 0.225 0.25

Total 0.0885 0.9115 1.00

a) Según la tabla: P (Defectuoso) = 0.0885

b) 36.00885.0

032.0

)(

)()/(

DP

DAPDAP

Page 38: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

38

OTRO MÉTODO: DIAGRAMA DEL ÁRBOL

D

P(D/A) = 0.08

A P(D’/A) = 0.92

P(A) = 0.40

D’

P(B)=0.35 P(D/B) = 0.09

B D

P(D’/B) = 0.91

P(C) = 0.25

D’

C P(D/C) = 0.10

D

P(D’/C) = 0.9

D’

a) Ahora hallaremos la probabilidad de obtener un artículo defectuoso

0885.0)10.025.0()09.035.0()08.040.0()(

)/()()/()()/()()(

xxxDP

CDPCPBDPBPADPAPDP

b) Ahora hallaremos la probabilidad que un artículo sea proveniente del proveedor A,

sabiendo que el artículo seleccionado salió defectuoso.

36.00885.0

08.040.0

)(

)/()(

)(

)()/(

x

DP

ADPAP

DP

DAPDAP

Ejemplo 2.- Una cierta prueba médica tiene una efectividad de 99% para descubrir la presencia o

no de una enfermedad (resultado positivo cuando realmente lo tiene o negativo cuando realmente

no lo tiene). Se aplica masivamente la prueba a una población en la cual hay 1% de individuos con

la enfermedad; se desea saber qué porcentaje de los individuos con resultados positivos tendrán

efectivamente la enfermedad.

Solución: Sean los eventos

Page 39: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

39

9801.099.099.0'''

''99.0

'

'

0099.001.099.099.0:

01.0)(}{

}Re{

xPEPEP

PEP

E

PP

xPEPEP

PEP

E

PPquesabeSe

P

EPhallarpideSe

EPenfermedadlatengaPersonaE

posiivoseasultadoP

Total

Tiene la enfermedad: E No tiene la enfermedad: E’

Resultado Positivo: P 0.0099 0.0099 0.0198

Resultado Negativo: P’ 0.0001 0.9801 0.9802

Total 0.01 0.99 1.000

5.00198.0

0099.0

PP

PEP

P

EPLuego

MÉTODO DEL DIAGRAMA DEL ÁRBOL:

P

P ( P/E ) = 0.99

E P ( P’/E ) = 0.01

P ( E ) = 0.01

P’

P

P ( E’) = 0.99 P ( P/E’ ) = 0.01

E’

P ( P’/E’) = 0.99

P’

Page 40: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

40

Ahora hallaremos la probabilidad que un resultado sea positivo, sabiendo que realmente tiene la

enfermedad.

50.00198.0

99.001.0

)(

)/()(

)(

)()/(

x

PP

EPPEP

PP

PEPPEP

EVENTOS INDEPENDIENTES

Son eventos en donde el resultado de uno de ellos en nada afecta al resultado del siguiente evento o

que en nada se ve afectado por el resultado del evento que le antecedió.

Ejemplo 1.- La proporción general de artículos defectuosos en un proceso continuo es 0.10. Cuál

es la probabilidad de que elegidos dos al azar:

a) Ninguno sea defectuoso

b) Cuando menos uno no tenga defectos

Solución Sean los eventos:

90.0)'('

90.0)'('

10.0)(

10.0)(

BPdefectostenganoBartículoElB

APdefectostenganoAartículoElA

BPdefectostengaBartículoElB

APdefectostengaAartículoElA

a) Hallaremos la probabilidad que ninguno sea defectuoso

81.090.090.0

)'()'()''(

x

ntesindependieeventosserPorBPxAPBAP

b) Ahora hallaremos la probabilidad de que cuando menos uno no tenga defectos

99.0)90.0()90.0()90.010.0()10.0()09.0(

)''()'()'(

:

99.001.01)10.0()10.0(1

)(1)'()''(

x

BAPBAPBAP

defectostenganoartículosdoslosdeunomenosloporqueimplicaEsto

OtroMétodo

x

BAPBAPBAP

Ejemplo 2.- La probabilidad de que se alivie un resfriado con el antibiótico A es de 0.7 y con el

antibiótico B es de 0.8. Se tienen dos pacientes resfriados, uno toma el antibiótico A y el otro el B.

¿Cuál es la probabilidad de que:

a) Ambos se curen

Page 41: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

41

b) Uno se cure y el otro no se cure

Solución Sean los eventos:

20.0)'('

30.0)'('

08.0)(

70.0)(

BPBoantibióticelconcuresenoBpacienteElB

APAoantibióticelconcuresenoApacienteElA

BPBoantibióticelconcureseBpacienteElB

APAoantibióticelconcureseApacienteElA

a) Hallaremos la probabilidad de que ambos pacientes se curen

56.08.07.0)()()( xBPxAPBAP

b) Ahora hallaremos la probabilidad de que uno se cure y el otro no se cure

38.024.014.0)8.03.0()2.07.0(

)()'()'()()'()'(

xx

BPxAPBPxAPBAPBAP

EJERCICIOS PROPUESTOS

1.- En un grupo de alumnos de la especialidad de contabilidad se ha determinado de que el 40 %

tienen dificultades en el curso de análisis matemático (M), 20% tienen dificultades en el curso de

estadística aplicada (E) y el 5% tienen dificultades en ambos cursos (M y E). De este grupo de

alumnos de contabilidad seleccionamos uno al azar se pide contestar preguntas

a) Calcular la probabilidad de que tenga dificultad en el curso de análisis matemático o estadística

aplicada.

b) Calcular la probabilidad de que el alumno tenga dificultad en el curso de estadística dado que

tiene dificultad en el curso de análisis matemático.

c) Calcular la probabilidad de que el alumno de contabilidad no tenga dificultad en el curso de

análisis matemático ni en el curso de estadística aplicada.

2.- A continuación se presenta una tabla en el cual se han clasificado a 100 alumnos según hábito

de fumar y rendimiento en el curso de matemática:

Hábito de

fumar

Rendimiento en

matemáticas

Total

Malo Bueno

Si

No

25 5

15 55

30

70

Total 40 60 100

De este grupo seleccionamos un estudiante al azar, se pide contestar las preguntas:

Page 42: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

42

a) Calcular la probabilidad de que tenga un rendimiento malo en matemáticas dado de que fuma

cigarrillos.

b) Calcular la probabilidad de que no fume cigarrillos si se sabe que tiene un buen rendimiento en

matemáticas.

3.- La UCS recientemente lanzó una campaña publicitaria para el examen de admisión 2012,

instalando cuatro anuncios panorámicos en la panamericana norte. Se sabe por experiencia que la

probabilidad de que el primer anuncio sea visto por un conductor es de 0.75. La probabilidad de

que el segundo sea visto es de 0.82, la probabilidad para el tercero es de 0.87 y la del cuarto es de

0.90. Suponiendo que el evento de que un conductor vea uno cualquiera de los anuncios

publicitarios es independiente de si ha visto o no los demás. ¿Cuál es la probabilidad de que:

a) Los cuatro anuncios sean vistos por un conductor?

b) El primero y el cuarto sean vistos, sin que el segundo y el tercero sean notados?

c) Exactamente uno de los anuncios sea visto?

d) Ninguno de los anuncios sea visto?

e) El tercero y cuarto anuncios no sean vistos?

4.- Se estima que el 30% de los habitantes de EE.UU son obesos y que el 3% sufre de diabetes. El

2% son obesos y sufren de diabetes. ¿Cuál es la probabilidad de que una persona elegida al azar.

a) Sea obesa o sufra de diabetes? Rpta. 0.31

b) Sea obesa pero no sufra de diabetes?. Rpta 0.28

5.- De todos los pacientes con cáncer, el 52% son mujeres. El 40% de todos los pacientes sobrevive

al menos 5 años desde el momento del diagnóstico. No obstante, esta tasa de sobrevivencia es

válida solamente para el 35% de las mujeres. ¿Cuál es la probabilidad de que un paciente con

cáncer seleccionado aleatoriamente sea mujer y sobreviva al menos 5 años?. Rpta. 0.182

6.- Una empresa constructora del programa MI VIVIENDA descubrió que sólo el 20% de todos los

trabajos se terminaban a tiempo; mientras que el 30% sufrían sobrecostos. Además, los sobrecostos

se presentaban el 75% de las veces en las que se terminaban el trabajo a tiempo. El propietario de

la empresa desea conocer la probabilidad de que un trabajo:

a) Tenga sobrecostos y se termine a tiempo Rpta. 0.15

b) Tenga sobrecostos o se termine a tiempo. Rpta. 0.35

c) Se termine a tiempo, dado que no tiene sobrecostos. Rpta. 0.0714

7.- La distribución de los tipos de sangre en EE.UU entre los individuos de raza blanca es

aproximadamente la siguiente:

A: 40% B = 11% AB = 4% O = 45%

Tras un accidente automovilístico, un individuo de raza blanca es conducido a una clínica de

emergencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es la

probabilidad de que sea del tipo A o del B? Rpta. 0.51

8.- En un estudio sobre alcohólicos se informa que el 40% de los mismos tiene padre alcohólico y

que el 6% tiene madre alcohólica. El 42% tiene al menos uno de los padres alcohólicos. ¿Cuál es la

probabilidad de que elegido uno al azar:

a) Tenga ambos padres alcohólicos. Rpta. 0.04

b) Tenga un padre alcohólico, pero no una madre alcohólica. Rpta. 0.36

Page 43: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

43

c) Tenga una madre alcohólica, si el padre no lo es. Rpta. 0.033

9.- De 1000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,

500 tienen trabajo. ¿Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:

a) Un bachiller empleado

b) Empleado pero no bachiller

c) Desempleado o un bachiller

d) Desempleado o no bachiller

10.- El Sr. Conti, propietario de un restaurante, ha mejorado la infraestructura para una buena

presentación. Observa que el 25% de todos los autos que pasan por allí, se detienen para consumir

algún alimento.

a) ¿Cuál es la probabilidad de que los próximos cuatro carros se detengan?

b) ¿Cuál es la probabilidad de que el primer auto pare, que el segundo y tercero no lo hagan y el

cuarto pare?

11.- LLusol compra tres acciones diferentes. La probabilidad de que la primera aumente su valor es

1/3, la probabilidad de que la segunda aumente es de 3/4 y la probabilidad de que la tercera

aumente su valor es de 1/10. Determine la probabilidad de que:

a) Todas aumenten de valor

b) Una aumente su valor

12.- Con base en su experiencia un médico ha recabado la siguiente información, relativa a

las enfermedades de sus pacientes: 5 % creen tener cáncer y lo tienen; 45 % creen tener

cáncer y no lo tienen; 10 % no creen tener pero sí lo tienen; y finalmente 40 % creen no

tenerlo, lo cual es cierto. De entre los pacientes del doctor se seleccionó uno al azar

a) Cuál es la probabilidad que el paciente tenga cáncer?. Rpta. 0.15

b) Cuál es la probabilidad de que el paciente tenga cáncer, si cree no tenerlo?. Rpta. 0.2

13.- Se estima que el 15 % de la población adulta padece de hipertensión, además se sabe que el

75% de

todos los adultos creen no tener este problema. Se estima también que el 6 % de la población tiene

hipertensión pero no es consciente de padecer dicha enfermedad.

a) Si un paciente adulto cree que no tener hipertensión. ¿ Cuál es la probabilidad de que la

enfermedad, de hecho exista?. Rpta. 0.08

b) Si la enfermedad existe. ¿Cuál es la probabilidad de que el paciente lo sospeche?. Rpta. 0.60

14.- Sólo el 60% de los estudiantes de la clase de matemática del Profesor X pasaron la primera

prueba. De quienes pasaron el 80% estudiaron, el 20% de quienes no pasaron si estudiaron.

a) ¿Cuál es la probabilidad de que un estudiante pase o estudie?

b) ¿Cuál es la probabilidad de que un estudiante pase pero no estudie?

15.- El 5% de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso

de fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce un

30% de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo

control es de 0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál

es la probabilidad de que el proceso se encuentre bajo control?

16.- Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes B1, B2 y

B3. El 50% del total se compra a B1, mientras que a B2 y B3 se les compra un 25% a cada uno. El

porcentaje de circuitos defectuosos para B1, B2 y B3 es 5, 10 y 12% respectivamente. Si un

circuito está defectuoso, ¿cuál es la probabilidad de que haya sido vendido por el proveedor B2 ?

Page 44: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

44

17.- Se estima que la probabilidad de que una Cía. B tenga éxito al comercializar un producto es de

0.95 si su competidora la compañía A no interviene en el mercado; y es de 0.15 si la compañía A

interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0.7

a) ¿Cuál es la probabilidad de que la compañía B tenga éxito?. Rpta. 0.39

b) Si la Cía. B no tuviera éxito ¿En cuánto se estima la probabilidad de que A intervenga en el

mercado?. Rpta. 0.975

18.- Contratistas S.A. está negociando dos contratos. La Gerencia piensa que la probabilidad de

ganar el primer contrato es de 60% y que el ganador tendrá ventaja definitiva en la negociación del

segundo contrato. La Gerencia cree que si Contratistas S.A gana el primer contrato va a tener un

70% de probabilidad de ganar el segundo contrato, en caso contrario disminuirá a 0.10.

a) ¿Cuál es la probabilidad de que Contratistas S.A. pierda ambos contratos?. Rpta. 0.36

b) ¿Cuál es la probabilidad que gane el segundo contrato?. Rpta. 0.46

19.- Una Compañía tiene 1000 repuestos para cierto ensamblado. El 20% de las partes son

defectuosas; además el 40% se compraron a proveedores de fuera y el resto fue fabricado por la

misma compañía. De los comprados fuera de la compañía el 80% son buenos. Si se elige un

repuesto al azar entre esta existencia. ¿Cuál es la probabilidad de que :

a) Sea fabricado por la Compañía y esté buena. Rpta. 0.48

b) Sea defectuosa o comprada. Rpta. 0.52

c) No sea fabricada por la Compañía ni sea buena. Rpta. 0.08

d) Sea comprada, siendo defectuosa. Rpta. 0.4

20.- En un cajón hay 80 artículos buenos y 20 malos; en un 2ª cajón el 30% son malos y en un

tercer cajón el 25% son malos. Se sabe que el número de artículos del tercer cajón es el triple de los

que hay en el segundo y que en total hay 260 artículos. Se mezclan los artículos de las cajas.

a) Si se extrae al azar un artículo. Calcule la probabilidad de que sea malo si se sabe que pertenece

al 2ª cajón. Rpta. 0.3

b) Si se extraen al azar dos artículos. Calcule la probabilidad de que el primero y el segundo sean

malos. Rpta. 0.056

21.- Se ha determinado que el porcentaje de televidentes que ven los programas A, B y C son

respectivamente 0.4. 0.5 y 0.3. Cada televidente ve los programas independientemente uno del

otro. Si se elige al azar a uno de tales televidentes. ¿Qué probabilidad hay de que vea:

a) Dos de los tres programas. Rpta. 0.29

b) Al menos uno de los tres programas. Rpta. 0.79

22.- En cierta región la probabilidad de que llueva en cualquier día del año es 0.1. Suponiendo la

independencia de un día con otro. ¿Cuál es la probabilidad de que la primera lluvia ocurra después

de 14 días sin lluvia?. Rpta. 0.023

Page 45: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

45

Page 46: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

46

DISTRIBUCIÓN BINOMIAL

Estudia a eventos independientes que se repiten varias veces y cuyos resultados tienen solo dos

alternativas; así por ejemplo: masculino-femenino, sano-enfermo, bueno-defectuoso, aprobado-

desaprobado, compra-no compra etc.

0, 1, 2, 3,...........................,x n xn

P X x p q x nx

Ejemplo 1.- Un fabricante envía sus productos en lotes de 20 unidades a sus clientes. El sabe que

la probabilidad de que cualquier artículo esté defectuoso es de 0.05. Cual es la probabilidad de que

determinado lote:

a) No contenga artículos defectuosos

b) ¿Cuál es el número de artículos defectuosos que se espera encontrar en un lote?.

Solución:

a) Hallaremos P ( X = 0 ) en donde X: Nº de artículos defectuosos en un lote

0 20

0, 1, 2, 3,.................................

20( 0) (0.05) (0.95) 0.36

0

x n xn

P X x p q x nx

P X

b) Ahora hallaremos el Nº promedio de artículos defectuosos por lote

lotepordefectuosoartículoXE

pnXE

1)05.0(20)(

)(

Ejemplo 2.- El 20% de todas las mujeres que reciben a un vendedor de aspiradoras en sus hogares

terminan por comprar una. ¿Cuál es la probabilidad de que entre 6 mujeres que admiten la

demostración del vendedor en sus casas:

a) Exactamente dos compren una aspiradora

b) Al menos una acabe por comprar la aspiradora

c) A lo más una no compre una aspiradora

Page 47: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

47

Solución:

a)

24576.0)8.0()2.0(2

6)2(

º:)2(

42

XP

compranquemujeresdeNXdondeenXPhallaremosluego

aspiradoraunacomprendoseExactament

b)

738.026214.01)1(tan

26214.0)8.0()2.0(0

6)0(

º:)0(1)1(

)6()5()4()3()2()1()1(

60

XPtoloPor

XP

compranquemujeresdeNXdondeenXPXPluego

XPXPXPXPXPXPXP

c) Ahora hallaremos la probabilidad que a lo más una no compre

0016.0)1(

001536.0)2.0()8.0(1

6)1(

000064.0)2.0()8.0(0

6)0(

º:)1()0()1(

51

60

XPLuego

XP

XP

aspiradoralacomprannoquecasadeamasdeNXXPXPXP

Ejemplo 3.- En una empresa donde los empleados son 80% hombres y 20% mujeres; están aptos

para jubilarse el 10% de las mujeres y el 15% de los hombres. De 5 solicitudes para jubilarse ¿Cuál

es la probabilidad de que al menos dos estén aptos para jubilarse?

Solución:

0 5

: º

( 2) 1 ( 0) ( 1)

5( 0) ( ) ( ) :

0

0.15 (0.8) 0.1 (0.2) 0.14

5sec ( 0) (0.14

0

Sea X N de empleados aptos para jubilarse

P X P X P X

P X p q en donde p probabilidad que una persona esté apto para jubilarse

luego p

En con uencia P X

0 5

1 4

) (0.86) 0.4704

5( 1) (0.14) (0.86) 0.3829

1

tan ( 2) 1 0.8533 0.1467

P X

Por lo to P X

Page 48: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

48

Ejemplo 4.- El jefe de la sección de recaudación de cierto municipio observa que, de todas las

multas de aparcamiento que se ponen, se pagan el 78%. La multa es de $2. En la semana mas

reciente, se han puesto 620 multas.

a) Halle la media y la desviación estándar del número de multas que se pagan.

b) Halle la cantidad de dinero que se obtiene por el pago de estas multas; así como también su

desviación estándar.

Solución:

a) Sea X: Nº de multas impuestas

E( X ) = n p = 0.78 ( 620) = 483.6 multas o sea aproximadamente 484 multas serán

pagadas

V( X ) = n p q = 620 x 0.78 x 0.22 = 106.392 luego σ = 10.315 multas

b) Recaudación por el pago de multas = 483.6 x 2 = 967.2 dólares

La desviación estándar será: 10.315 ( 2 ) = 20.63

Ejemplo 5.- La probabilidad de cura de una enfermedad normalmente mortal con cierto

medicamente, se estima en 0.30. Si cinco enfermos se tratan con este medicamento. ¿Cuál es la

probabilidad de que al menos cuatro se curen?

Solución:

a) Hallaremos P( X ≥ 4 ) en donde X: Nº de pacientes que se curan

00243.0)7.0()3.0(5

5)5(

02835.0)7.0()3.0(4

5)4(

)5()4()4(

........................,.........3,2,1,0

05

14

XP

XP

XPXPXP

nxqpx

nxXP xnx

03078.000243.002835.0)4( XPLuego

Ejemplo 6.- Se somete a un estudiante a un examen del tipo verdadero – falso que contiene 10

preguntas; para que apruebe debe responder correctamente a 8 preguntas o más. Si el estudiante

está adivinando. ¿Cuál es la probabilidad de que apruebe el examen?.

Page 49: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

49

Solución: Sea X: Nº de preguntas contestadas correctamente

0547.0)8(tan

000976.0)5.0()5.0(10

10)10(

009765.0)5.0()5.0(9

10)9(

043945.0)5.0()5.0(8

10)8(

)10()9()8()8(

010

19

28

XPtoloPor

XP

XP

XP

XPXPXPXP

DISTRIBUCIÓN DE POISSON

Estudia a los eventos independientes que suceden con muy poca frecuencia y que ocurren en un

determinado espacio, volumen o tiempo.

0, 1, 2, 3,....................!

xeP X x x

x

Ejemplo 1.- El promedio de llamadas telefónicas en una hora es de 3. ¿Cuál es la probabilidad de

recibir:

a) Exactamente 2 llamadas en una hora

b) Dos o más llamadas en 90 minutos

Solución:

a) Hallaremos P ( X = 2) X: Nº de llamadas en una hora

!x

exXPPoissondeóndistribucilaSegún

x

224.0!2

3)2(

23

e

XPLuego

b) Enseguida hallaremos la probabilidad de que ocurran dos o más llamadas en 90 minutos

Page 50: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

50

9389.00611.015.51)2(

5.4!1

)5.4()1(

!0

)5.4()0(

min90º:)}1()0({1)2(

5.4

5.415.4

5.405.4

eXPLuego

ee

XP

ee

XP

utosenllamadasdeNXXPXPXP

Ejemplo 2.- Una fábrica envía al depósito 500 artículos. La probabilidad de deterioro de un

artículo en el camino es de 0.002. Hallar la probabilidad de que en el camino se deterioren:

a) Menos de tres artículos

b) Por lo menos un artículo

Solución:

a) Dado que np ≤ 1 usaremos la aproximación de la Binomial a la de Poisson en donde λ =

np

En este caso λ = np = 500(0.002) = 1

92.05.2)3(

2!2

1)2(

!1

1)1(

!0

1)0(

)2()1()0()3(

1

121

111

101

eXPLuego

eeXP

ee

XP

ee

XP

XPXPXPXP

b) 63212.036788.011)0(1)1( 1 eXPXP

Ejemplo 3.- Un líquido contiene cierta bacteria con un promedio de 3 bacterias por centímetro

cúbico. Calcular la probabilidad de que:

a) No contenga bacteria alguna una muestra de 1/3 de cc.

b) Contenga por lo menos una bacteria una muestra de 2 cc.

Solución:

a) Hallaremos P ( X = 0 ) X: Nº de bacterias en 1/3 de cc.

1.3/1Pr:

!

ccdeenbacteriasdeomediodondeen

x

exXPPoissondeóndistribucilaSegún

x

Page 51: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

51

368.0!0

1)0( 1

01

ee

XPLuego

9975.01

!0

6)0(

2º:)0(1)1()

6

606

eluego

ee

XP

ccdemuestraunaenbacteriasdeNXXPXPb

Ejemplo 4.- Una vacuna produce inmunidad contra la polio en un 99.99%. Suponiendo que la

vacuna ha sido administrada a 10,000 niños.

a) ¿Cuál es el número esperado de niños que no han sido inmunizados?.

b) ¿Cuál es la probabilidad que menos de 2 niños no sean inmunes?

Solución:

a) Dado que np ≤ 1 usaremos la aproximación de la Binomial a la de Poisson en donde

λ = np

En este caso λ = np = 10,000 (0.0001) = 1 niño

7358.02)2(

!1

1)1(

!0

1)0(

)1()0()2()

1

111

101

eXPLuego

ee

XP

ee

XP

XPXPXPb

DISTRIBUCIÓN NORMAL

Es una distribución de probabilidad que se diferencia de las anteriores por ser de variable aleatoria

continua. Es una de las más importantes ya que la mayoría de los trabajos de investigación están

basados en muestras aleatorias provenientes de poblaciones que se distribuyen normalmente

.

Ejemplo1.- Una máquina expendedora de refrescos se regula de manera que descargue un

promedio de

196 gr. por vaso. La cantidad descargada tiene aproximadamente distribución normal con una

desviación estándar de 14 gramos.

a) ¿Cuál es la probabilidad de obtener un vaso con más de 218.4 gramos?.

Page 52: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

52

Solución:

Consideremos a X: Cantidad descargada por la máquina vendedora de refrescos, la cual se

distribuye normalmente con µ = 196 gr y σ = 14 gr.

Hallaremos

grdemayorcantidadunatendránvasoslosdeElciónInterpreta

ZP

ZX

Z

fórmulalamedianteXdevaloreldarizandoesXP

4.218%48.5.

0548.0)6.1(

6.114

9614.218

:tan)4.218(

b) Si los vasos pueden contener solo 224 gramos sin que haya derrame. ¿En cuántos vasos de 200

vendidos es probable que el líquido se derrame?.

Solución:

vasosmenteaproximadaderramaránsedecirestolopor

ZPluegoZXP

556.4)0228.0(200tan

0228.0)2(214

196224)224(

Ejemplo 2.- La puntuación media en un examen final de una asignatura fue de 72 y la varianza 81.

El

10% superior de los alumnos reciben calificación A. ¿Cuál es la puntuación mínima que un

estudiante

debe tener para recibir un calificación A?.

Solución:

5.839

7228.1

X

XXZ

Page 53: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

53

Ejemplo 3.- Una variable aleatoria tiene una distribución normal con σ = 21.5. Hallar su media si

la

probabilidad de que la variable aleatoria tome un valor menor que 120.5 es de 0.8849

Solución:

8849.0)5.120( XPquesabeSe

7.945.21

5.1202.1

XZ

Ejemplo 4.- Suponga que las puntuaciones obtenidas en un examen de un curso tienen distribución

normal con µ = 80. Si el 95% de los examinados obtienen puntajes entre 60.4 y 99.6

a) Calcule el valor de la desviación estándar

10806.99

96.1

XZ

b) ¿Qué porcentaje de los examinados obtuvieron entre 55 y 98 puntos

8.110

80985.2

10

805521

ZZ

Page 54: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

54

%79.959579.04641.04938.0)8.15.2( ZP

Ejemplo 5.- Los puntajes del coeficiente de inteligencia tomados a un grupo de personas adultas,

en un

proceso de selección de personal están distribuidos normalmente con una media de 105 y una

desviación estándar de 12.

a) Si el puntaje mínimo para aprobar es 90. ¿Cuál es el porcentaje de no aprobados?.

b) Si han aprobado el 80% de las personas. ¿Cuál es el puntaje mínimo aprobatorio?.

Solución:

a) Consideremos a X: Puntaje del coeficiente de inteligencia, la cual se distribuye

normalmente

con µ = 105 y σ = 12

Hallaremos

%56.101056.0)25.1(

25.112

05190

:tan)90(

seaoZP

ZX

Z

fórmulalamedianteXdevaloreldarizandoesXP

b) Ahora hallaremos el puntaje mínimo aprobatorio

puntosmenteaproximadaseaoXX

9592.9412

10584.0

80%

Page 55: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

55

Ejemplo 6.- En una distribución normal hay 47 % de valores inferiores a 47 y 28% superiores a

70.

Calcular la proporción de valores entre 57 y 86.

Solución

04.185.34

79.498621.0

85.34

79.4957

85.3479.49)2()1(Re

)2(7058.0

)1(4708.0

7058.04708.0

7058.0

4708.0

21

ZZAhora

obtenemosyecuacionessolviendo

Luego

%76.262676.00832.03508.0

)21.00()04.10()04.121.0(

ZPZPZP

Page 56: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

56

EJERCICIOS PROPUESTOS

1.- Para estudiar la regulación hormonal de una línea metabólica se inyectan ratas albinas con un

fármaco que inhibe la síntesis de proteínas del organismo. En general 4 de cada 20 ratas

mueren a causa del fármaco antes de que el experimento haya concluido. Si se trata a 10

animales con el fármaco. ¿Cuál es la probabilidad:

a) Que exactamente 3 no lleguen vivas al final del experimento. Rpta. 0.2013

b) Que al menos 8 lleguen vivas al final del experimento. Rpta. 0.6778

2.- Se determina que un 25% de los niños expuestos a un determinado agente infeccioso contraerán

la enfermedad producida por dicho agente. Entre un grupo de 4 niños igualmente expuestos al

agente infeccioso. ¿Cuál es la probabilidad de que:

a) Exactamente 2 niños se enfermen. Rpta. 0.211

b) Por lo menos un niño se enferme. Rpta. 0.684

3.- En cierto país en desarrollo el 30% de los niños están desnutridos; en una muestra aleatoria de

25 niños de esa área. ¿Cuál es la probabilidad de que el número de niños desnutridos sea:

a) Menos de cinco. Rpta. 0.0905

b) Menos de 7; pero más de 4? Rpta. 0.2502

4.- La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es

0.4. Si se sabe que 15 personas contraen esta enfermedad. ¿Cuál es la probabilidad:

a) Que sobrevivan de 4 a 7

b) No sobrevivan exactamente 5

5.- Un prominente médico afirma que 70% de las personas con cáncer de pulmón son

fumadores empedernidos. Si su afirmación es correcta:

Encuentre la probabilidad de que de 10 de tales pacientes admitidos recientemente en un

hospital, menos de 3 sean fumadores empedernidos

6.- Si la probabilidad de que un individuo sufra una reacción desfavorable por una inyección de

cierto suero es de 0.001. Determinar la probabilidad de que de 200 personas:

a) Exactamente 3 sufran la reacción. Rpta. 0.0011

b) Dos o más sufran la reacción. Rpta. 0.0175

7.- De la población de valores de Z seleccionamos uno al azar, se pide:

I. Determinar las probabilidades siguientes:

a. P ( Z > 1.37 )

b. P ( Z < - 0.84 )

c. P ( Z ≥ - 2.05 )

d. P ( 1.64 < Z < 1.96 )

e. P ( - 0.84 < Z < 0.84 )

f. P ( -1.24 < Z < 1.63 )

g. P ( - 1 < Z < 2)

II. Calcular el valor de Zo en las siguientes expresiones:

a. P ( Z > zo ) = 0.025

b. P ( Z < zo ) = 0.15

c. P ( Z ≥ zo ) = 0.85

d. P ( Z < zo ) = 0.10

e. P ( - zo < Z < zo ) = 0.8

Page 57: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

57

f. P ( - zo < Z < zo ) = 0.98

8.- Supóngase que se sabe que los pesos de 300 individuos están distribuidos en forma normal con

media de 68 Kg. y una desviación estándar de 11.5 Kg.

a.- Cuál es la probabilidad de que una persona seleccionada al azar pese 70 Kg. O menos?

b.- Cuántas personas se espera encontrar que pesen 70 Kg o menos?

9.- Las notas de un examen del curso de bioestadística se distribuye normalmente con una media de

13.5 y una desviación estándar de 4.3

a.- Cuál es el porcentaje de estudiantes cuyas notas están entre 11 y 15?

b.- Cuál es la probabilidad de que un alumno elegido al azar no tenga una nota mayor de 10?

c.- Determinar el valor de la nota debajo el cual se ubica el 15% inferior de los alumnos.

10.- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas

están distribuidos normalmente con una media de 66 y una varianza de 42.

a.- Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en

sangre mayor o igual a 71?

b.- Cuántos niños presentan un nivel de glucosa en sangre menor o igual a 61?

c.- Determinar la mediana y la moda de la distribución.

11.- Los puntajes del Coeficientes de Inteligencia tomados a un grupo de personas adultas, en un

proceso de selección de personal están distribuidos normalmente con una media de 105 y una

desviación estándar de 12.

a.- Si el puntaje mínimo para aprobar es 90, ¿Cuál es el porcentaje de no aprobados?

b.- Si han aprobado el 75% de las personas, ¿Cuál es el puntaje mínimo aprobatorio?

12.- Supóngase que la estancia promedio de internación en un hospital es de 5.5 días, con una

desviación estándar de 1.8 días. Si se supone que la duración de la internación se distribuye

normalmente, encuentre la probabilidad de que un paciente seleccionado al azar de dicho

grupo tenga una duración de internación:

a.- De más de 6 días

b.- Entre 4 y 7 días.

c.- De menos de 3 días.

13.- El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro

lado se sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que

el 10% inferior de los trabajadores su colesterol está por debajo de 170. Se pide determinar los

valores de la media y varianza de la distribución normal. Si de esta población seleccionamos

un trabajador al azar, cuál es la probabilidad de que su colesterol sea mayor a 250.

14.- Calcular k si P ( X ≤ k ) = 0.6141 y X sigue una N(15,4).

15.- De una variable normal N(µ; σ) se sabe que P (X ≤ 7 ) = 0.9772 y P (X ≤ 6.5) = 0.8413.

Calcular:

a) µ y σ.

b) P ( 5.65 ≤ X ≤ 6.25 )

c) El numero k tal que P ( X > k ) = 0.3

16.- La presión arterial sistólica de los cobayos tiene distribución normal con una media de 95 y

una desviación estándar de 9. Si de esta población seleccionamos un cobayo al azar, ¿cuál es

la probabilidad de que:

a. Su presión arterial sistólica sea menor a 75?

b. Su presión arterial sistólica esté comprendida entre 75 y 120?

Page 58: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

58

c. Si el número de cobayos es de 1000, ¿Cuántos cobayos se espera que su presión arterial

sistólica sea mayor a 120?

d. A qué valor de presión arterial sistólica se localiza el 25% inferior de la población de

cobayos?

17.- Las calificaciones de una prueba final de una cierta signatura tienen distribución normal con

media de 12. Si el 95.44% de los examinados obtuvieron calificaciones entre 8 y 16.

a) Calcule la desviación estándar. Rpta. 2

b) Si la nota aprobatoria es 11. ¿Qué porcentaje de alumnos aprobaron el curso? Rpta. 69.15%

c) ¿Qué nota como mínimo deberá tener un alumno para estar ubicado en el quinto superior?.

Rpta. 13.7

18.-. El número promedio de personas que comen en un restaurante es aproximadamente normal,

con una media de 250 y una desviación estándar de 20 por día.

a) Si el consumo promedio por cliente es de $4 ¿Cuál es el consumo diario esperado? Rpta.

$1000 b) ¿Cuál es la probabilidad de que el consumo exceda a $1,100? Rpta. 0.1056

19.- Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una

media de 650 kg y una desviación estándar de 100 kg.

a) ¿Qué probabilidad hay de que la demanda no supere los 500 kg? Rpta. 0.0668

b) ¿Qué cantidad del bien debe haber mensualmente a fin de satisfacer la demanda en un 89.8 %?

Rpta. 777 kg

20.- Trescientas estudiantes tienen talla media de 65 pulgadas y desviación estándar de 2 pulgadas.

Las 300 tallas presentan distribución normal y se miden a la pulgada más cercana.

a) ¿Cuántas estudiantes tienen talla de 64 pulgadas o menos?.

b) ¿Debajo de qué talla están el 30% de las estudiantes?.

c) ¿Cuántas de las estudiantes tienen talla que difiere de la media por más de una desviación

estándar?.

21.- En base a pruebas y la experiencia, un fabricante de lavadoras mecánicas modelo 101XE,

decide que la vida media con uso familiar normal es de 5.8 años, con desviación estándar de 2

años. Si la vida de este modelo presenta distribución normal:

a) ¿Qué garantía debe ofrecer si está dispuesto a reparar únicamente al 1% de las lavadoras

vendidas?.

b) Si da una garantía de dos años ¿Qué porcentaje de las máquinas necesitarán reparación antes que

expire el período de garantía?.

22.- Una máquina automática que expende café llena los vasos con 6 onzas de café, con desviación

estándar de 0.40 onzas. Si se usan vasos de 7 onzas ¿Qué porcentaje de ellas se derramarán?

23.- Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con

media de $400 y desviación estándar $50.

a) Si el 10% de las familias debe pagar un impuesto. ¿A partir de qué ingreso familiar se debe

pagar el impuesto? Rpta. $464

b) Si el ahorro familiar está dado por la relación Y = X - 50

4

¿Cuál es la probabilidad de que el ahorro sea superior a $75? Rpta. 0.0228

24.- Si el 20% de los residentes en una ciudad prefiere un teléfono blanco que cualquier otro color

disponible. ¿Cuál es la probabilidad de que entre los siguientes 1000 teléfonos que se instalen

en esa ciudad:

Page 59: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

59

a) Más de 185 sean blancos. Rpta 0.8749

b) Al menos 210 pero no más de 225 sean blancos. Rpta. 0.2049

25.- Si el 40% de los clientes de una estación de servicio utilizan tarjetas de crédito. ¿Cuál es la

probabilidad de que entre 400 clientes; más de 250 paguen en efectivo?. Rpta. 0.1423

Page 60: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

60

Page 61: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

61

Page 62: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

62

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL

CASO: Cuando la muestra proviene de una población normal con σ2

conocida Ejemplo 1.- Un director de producción sabe que la cantidad de impurezas contenida en los envases

de cierta sustancia química sigue una distribución normal con una desviación estándar de 3.8 gr. Se

extrae una muestra aleatoria de 9 envases cuyos contenidos de impurezas son los siguientes:

18.2 16.6 13.7 12.3 15.9 18 17.4 16.2 y 21.8

Determinar un intervalo de confianza del 95% para a media

Solución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación

2.192.1448.267.169

8.396.167.16

2/

xZXpordadosestaránconfianzadelímiteslosluego

Con un 95% de confiabilidad podemos afirmar que la cantidad promedio de impurezas en los

envases está entre 14.2 y 19.2

También podemos afirmar con un 95% de confiabilidad de que la cantidad media de impurezas

contenida en los envases es de 16.67 con un margen de error de 2.48

Ejemplo 2.- Supongamos que un investigador está interesado en estimar el nivel medio de alguna

enzima en cierta población, toma una muestra de 10 individuos, determina el nivel de la enzima de

cada uno y obtiene una media igual a 22. Suponga además que la variable de interés está

distribuida normalmente con varianza de 45. Encuentre un intervalo de confianza del 98% para la

media poblacional.

Solución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación

nZX

nZX

22

nZX

nZX

22

Page 63: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

63

/ 2

6.708222 2.33 22 4.94 17.06 26.94

10

17 27

xluego los límites de confianza estarán dados por X Z

La cantidad promedio de dicha enzima estaría entre y aproximadamente

CASO: Cuando la muestra proviene de una población normal con σ2

desconocida

Ejemplo 1.- En el departamento de personal de una compañía grande se requiere estimar los gastos

familiares en odontología de sus empleados para determinar la factibilidad de proporcionarles un

plan de seguro dental. Una muestra aleatoria de 10 empleados reveló los siguientes gastos (en

dólares) durante el año anterior:

110 362 246 85 510 208 173 425 316 179

Establezca un intervalo de confianza del 90% para el gasto promedio familiar en odontología

Solución: En este caso como la varianza σ2 es desconocida utilizaremos la variable T de Student:

Cálculos

8.1384.26110 SXquetienesenPara

1.3227.2007.604.26110

8.138383.14.261

2/

xStXpordadosestaránconfianzadelímiteslosluego

El gasto promedio familiar en odontología en dicha empresa es de 261.4 dólares con un margen de

error de 80.46 dólares y con un 90% de confiabilidad.

Ejemplo 2.- Una compañía emplea 200 agentes de ventas; en una muestra aleatoria de 25 los

auditores encontraron un gasto promedio de $220 con una desviación estándar de $20 en sus

cuentas de gasto de representación en una semana. Establezca un intervalo de confianza del 98%

para el gasto promedio semanal.

Solución:

3.2297.21035.9220200

25200

25

204922.2220

2/

xStXpordadosestaránconfianzadelímitesLos

n

stX

n

stX

22

Page 64: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

64

Ejemplo 3.- Se desea determinar el peso total de una partida de 10,000 naranjas. Como solo se

tiene una balanza pequeña y además no se dispone de tiempo; se selecciona una muestra aleatoria

de 16 naranjas, la cual da una media de 175 gramos y una desviación estándar de 25 gr. Determinar

un intervalo de confianza del 98% para el peso total de la partida de naranjas.

Solución:

El peso total estimado estará dado por:

.750,11750000)175(000,10 kgseaogrXN

Ahora estimaremos un intervalo de confianza para el peso total de las naranjas; para lo cual

primeramente estimaremos un intervalo de confianza para el peso promedio por naranja.

kgyentreestaríanaranjaslasdetotalpesoeldecirEs

NseaoN

NLuego

StXpordadosestaránconfianzadelímitesLos x

5.912,15.587,1

5.19125.158719125261587474

)2526.191(000,10)7474.158(000,10

2526.1917474.1582526.16175000,10

16000,10

16

256025.2175

2/

Ejemplo 4.- Un sondeo efectuado en 400 familias de cierta clase social de una ciudad encontró un

gasto mensual promedio de S/.74 en productos de tocador con desviación estándar de S/. 40.

Con qué nivel de confianza se puede afirmar que el gasto promedio mensual en artículos de tocador

está entre 71 y 77.

Solución: En este caso utilizaremos la variable Z por ser una muestra muy grande

5.13)2(3400

40

ˆ

:arg

2/2/2/

2/2/

2/

ZZZ

en

SZeZcasoesteEn

ZpordadoestáeerrordeenmelqueSabemos

x

x

Page 65: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

65

8664.0)5.15.1(: ZPpordadoestaráconfianzadenivelelLuego

Ejemplo 5.- Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los

niños ven televisión. Por estudios anteriores se sabe que la desviación estándar de dicho tiempo es

de 3 horas. Con el nivel de confianza del 95%.

a) ¿Qué tamaño de muestra se debe elegir, de tal manera que el error de estimación no sea superior

a media hora?.

Solución

niñosnx

e

Zn 1393.138

5.0

396.122

2/

b) ¿Qué costo se debe presupuestar para hacer la encuesta, si esta tiene un costo fijo de

$5,000 más un costo variable de $2 por cada entrevista?.

Solución

5,000 + 2 ( 139 ) = $5,278

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

POBLACIONAL

Ejemplo 1.- En cierta ciudad, se entrevistó a una muestra de 500 bebedores de cerveza, hallándose

que 114 de ellos preferían la marca X a la de Y. Hállese el intervalo de confianza del 98% para la

fracción de bebedores de cerveza de esa ciudad que prefieren la marca X.

Solución:

Page 66: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

66

228.0500

114ˆ

ºˆˆ

pluego

muestradeTamaño

XmarcalaprefierenquecervezadebebedoresdeN

n

xpmuestralproporciónpSea

Ejemplo 2.- De una lista de opinión pública, se invita a 100 personas de un total de 1,000 a

expresar su preferencia por los productos A y B; 30 personas prefirieron A, de esto se concluye que

entre 210 y 390 de la población prefieren el producto A. ¿Qué nivel de significación se usa en este

informe?.

Solución:

30.0100

30ˆ000,1100: pNnquetieneSe

038.0)07.207.2(1 ZPLuego

Ejemplo 3.- La oficina de Planificación Familiar de cierto distrito desea determinar la proporción

de familias con un ingreso mensual inferior a S/. 800. Estudios previos han indicado que esta

proporción era del 20%. ¿Qué tamaño muestral se requiere para asegurar con una confianza del

95% que el error en la estimación de esta proporción no sobrepase a 0.03?.

Solución:

familiasne

qpZn 683

)03.0(

)8.0()2.0()96.1(2

2

2

2/2

n

ppZpp

n

ppZp

)ˆ1(ˆˆ

)ˆ1(ˆˆ

22

272.0418.0044.0228.0

500

772.0228.033.2228.0

)ˆ1(ˆˆ

2

p

x

n

ppZp

07.209.0)0435.0(09.0)94868.0()046.0(

09.0000,1

100000,1

100

70.030.0)ˆ1(ˆˆ

2/2/2/

2/2

ZZZ

xZ

n

nN

n

ppZp

Page 67: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

67

EJERCICIOS PROPUESTOS

1. Una encuesta efectuada a una muestra aleatoria de 150 familias en cierta comunidad

urbana reveló que, en el 87 por ciento de los casos, por lo menos uno de los miembros de

la familia tenía alguna forma de seguro relacionado con la salud. Construir un intervalo de

confianza del 99 por ciento para la proporción real ( P ) de familias en la comunidad con

las características de interés.

2. Una muestra de 100 hombres adultos aparentemente sanos, de 25 años de edad, muestran una

presión sistólica sanguínea media de 125. Si se supone que la desviación estándar de la población

es de 15, calcular el intervalo de confianza del 90 por ciento para .

3. En un estudio diseñado para establecer la relación entre un medicamento y cierta anomalía en los

embriones de pollo, se inyectaron con el medicamento 50 huevos fecundados al cuarto día de

incubación. En el vigésimo día de incubación se examinaron los embriones y se observó la

presencia de la anomalía en 12 de ellos. Encontrar un intervalo de confianza del 90 por ciento para

P.

4. En una determinada región se tomó una muestra aleatoria de 125 individuos, de los

cuales 12 padecían afecciones pulmonares.

a) Estímese la proporción de individuos con afecciones pulmonares en dicha región; con

un 95% de confiabilidad.

b) Si queremos estimar dicha proporción con un error máximo del 4%, con una confianza

del 95%, ¿qué tamaño de muestra debemos tomar?

5. En una muestra de 60 pacientes la cantidad mínima requerida para que un anestésico surta efecto

en una intervención quirúrgica fue por término medio de 50 mg, con una desviación típica de

10,2 mg, Obtener un intervalo de confianza para la media al 95%, suponiendo que la muestra fue

extraída mediante muestreo aleatorio simple sobre una población normal.

6. Se ha proyectado una encuesta para determinar los gastos médicos anuales promedio por familia

de los empleados de una gran compañía. La administración de la compañía desea tener una

confianza del 95% de que el promedio de la muestra esté correcto en una escala de ± $50 de los

gastos reales promedio por familia. Un estudio piloto señala que la desviación estándar se puede

estimar como $400. ¿Qué tamaño de muestra se necesita?

7.- Un psicólogo advierte que el tiempo medio de reacción de 36 ratas a un choque eléctrico de 18

voltios es de 0.45 segundos, con desviación estándar de 0.06 segundos. Encuentre un intervalo de

confianza del 90% para el tiempo medio de reacción de todas las ratas de la misma cepa a un

choque de 18 voltios?.

8.- Un estudio de 50 hogares de cuatro personas cada uno, tomados aleatoriamente, que viven en

cierta ciudad, mostró un gasto promedio de 76 dólares por semana en alimentos, con desviación

estándar de 3 dólares. Encuentre el gasto semanal promedio en alimentos en todos los hogares de

cuatro personas en dicha ciudad, con una confianza de un 96%.

9.- Si un gerente de control de calidad quisiera estimar la vida promedio de un producto en una

escala

± 20 horas con una confianza del 95% y también supone que la desviación estándar del proceso

permanece en 100 horas ¿qué tamaño de muestra se necesita?

Page 68: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

68

10.- Si una cadena de supermercados quisiera estimar el importe promedio de ventas en una escala

de

± $100 con una confianza del 99% y si se supone que la desviación estándar de la población es

$200 ¿qué tamaño de muestra se necesita?

11.- Si una compañía de gas quisiera estimar el tiempo de espera promedio en días, dentro de ±5

días con una confianza del 95% y si se supone que la desviación estándar de la población es de 20

días ¿qué tamaño de muestra se necesita?

12.- Un analista político quisiera estimar la proporción de votantes que elegirán al candidato

demócrata en una campaña presidencial. El analista quisiera tener una confianza del 90% de que su

predicción esté correcta en una escala de ±0.04 de la proporción real. ¿Qué tamaño de muestra se

necesita?

13.- El gerente de un banco quiere tener una confianza del 90% de estar en lo correcto en una

escala de

± 0.05 de la proporción real de depositantes, que tienen al mismo tiempo cuentas de ahorro y de

cheques. ¿Qué tamaño de muestra se necesita?

14.- ¿Qué tamaño de muestra se necesitará si una compañía de autobuses quisiera realizar una

encuesta, en la que desearía tener una confianza del 95% de estar en lo correcto en una escala de ±

0.02 de la proporción real de viajeros que utilizarían el servicio de autobús?. En base a la

experiencia con otras rutas, se supone que la proporción real es de aproximadamente 0.40.

15.- Una investigadora de una empresa cafetalera sabe que el consumo mensual de café por casa

está normalmente distribuida con una media desconocida y una desviación estándar de 0.3 kg.

Si se toma una muestra aleatoria de 36 casas y se registra su consumo de café durante un mes.

¿Cuál es la probabilidad de que la media de la muestra difiera de la verdadera media en menos de

100 gramos?. Rpta. 0.9544

16.- Una muestra aleatoria de 49 personas que habitan en apartamentos de dos piezas en cierta

ciudad, mostró que pagaban un alquiler mensual promedio de $129.5 con desviación estándar de

$18.75

Construya un intervalo de confianza del 99% para el alquiler promedio mensual pagado por

apartamentos de dos piezas en dicha ciudad. Rpta [122.3 ; 136.7]

17. Un analista de investigación de mercados escoge una muestra aleatoria de 100 clientes de un

conjunto de 500 clientes de una gran tienda que declaran sus ingresos mayores a $800.

El encuentra que los clientes de la muestra gastaron en la tienda un promedio de $2,500 por

año. Si con este valor de la muestra se estima que el gasto promedio de la población varía entre

2,446 a 2554. ¿Qué nivel de confianza se utilizó?. Suponga que la desviación estándar de la

población es de $300. Rpta. 0.9556

18.- Se tiene establecido que las facturas de los clientes tienen una desviación estándar de S/. 45. Si

se toma una muestra de 225 facturas. ¿Cuál es la probabilidad de que el valor medio de la muestra

se desvíe de la media de todas las 2,000 facturas por S/: 7.5 soles o más? Rpta. 0.008

19.- Para determinar el rendimiento anual de ciertos valores, un grupo de inversionistas tomó una

muestra aleatoria de 49 de tales valores encontrando una media de 8.71% y una desviación estándar

de 2.1%.

a) Estime el verdadero rendimiento anual promedio de tales valores mediante un intervalo de

confianza del 96%. Rpta. [8.1% ; 9.3%]

Page 69: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

69

b) Calcule el nivel de significancia si el rendimiento anual promedio de todos los valores se

estima entre 7.96% y 9.46%. Rpta. 0.0124

20. El Gerente de ventas de la tienda “CREDITOS” quiere determinar el porcentaje de clientes

morosos por más de $100. Una muestra aleatoria de 200 de tales clientes de la tienda reveló que 50

de ellos eran morosos.

a) Halle un intervalo de confianza del 98% para la proporción de clientes morosos por más de

$100?.

b) Si la estimación de la proporción de clientes morosos está en el intervalo [0.183 ; 0.317]. ¿Con

qué grado de confianza se realizó esta investigación?. Rpta. 0.9714

21.- El consumo regular de cereales preendulzados contribuye a la caída de los dientes,

enfermedades del corazón y otros procesos degenerativos. En una muestra aleatoria de 20

porciones sencillas de un cereal el contenido promedio de azúcar fue de 11.3 gr con desviación

estándar de 2.45 gr. Suponiendo que los contenidos de azúcar están distribuidos normalmente.

Determine un intervalo de confianza del 95% para el contenido promedio de azúcar en porciones

sencillas de dicho cereal.

Rpta 10.15 < µ < 12.45

22.- Algunos investigadores creen que la vitamina C puede ser útil para reducir el colesterol en las

paredes internas de las arterias. Se observa el nivel de colesterol de 50 personas (con niveles de

colesterol mayores que lo normal) antes y después de un tratamiento de un mes bajo un régimen de

500 mg de vitamina C por día, obteniéndose una media de 64.3 mg/100ml y desviación estándar de

18.9 mg en la disminución del nivel de colesterol. Estime la disminución promedio por persona del

nivel de colesterol, usando un intervalo de confianza del 90%. Rpta 59.8 < µ < 68.8

23.- Se determinaron los niveles del PH de la saliva en una muestra aleatoria de niños de escuela

primaria, los cuales presentaban una alta incidencia de caries. Los resultados fueron los siguientes:

7.36 7.04 7.19 7.41 7.10 7.15 7.36 7.57 7.64 7.00 7.25 7.19

Halle un intervalo de confianza para la media con un 98% de confiabilidad.

24.- Ciertos investigadores se interesan por la calidad del aire; uno de estos indicadores es el

número de microorganismos de partículas de suspensión por m3. Para controlar la situación se hace

una lectura cada 6 días extrayendo 1m3 de aire a través de un filtro y determinando el número de

µg de partículas concentradas en él. Los datos observados para un período de 30 días fueron:

58 70 57 61 59.

Supóngase que por experiencias anteriores se sabe que la variable número de microorganismos de

partículas está distribuida normalmente con varianza de 9. Halle un intervalo de confianza para la

media con α = 0.01 Rpta 58 < µ < 64 aproximadamente

25.- Se desea estimar el promedio de pH de las lluvias en un área que experimenta una gran

contaminación por parte de la descarga del humo de una planta de energía eléctrica. Si se sabe que

la desviación estándar tiene un valor de 0.5 pH y se desea que la estimación difiera a lo más en 0.1

de la media verdadera con una probabilidad de 0.95. ¿Cuántas lluvias deben incluirse

aproximadamente en la muestra (una lectura de pH por lluvia). Rpta. n = 100 aprox.

26.- Se pretende estimar el número promedio de latidos por minuto para cierta población. Se

encontró que el número promedio de latidos por minuto para 49 personas era de 90. Considere que

esos 49 pacientes constituyen una muestra aleatoria y que la población sigue una distribución

normal, con una desviación estándar de 10. Use α = 0.02 Rpta 87 < µ < 93

Page 70: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

70

27.- Entre 100 peces capturados en cierto lago 18 no eran comestibles debido a la contaminación

del medio ambiente. ¿Con qué confianza se puede asegurar que el error de estimación es a lo

mucho de 0.065?. Rpta. 0.909

28.- Un equipo de investigación médica está seguro sobre un suero que han desarrollado, el cual

curará cerca del 75% de los pacientes que sufren de ciertas enfermedades. ¿Qué tamaño debe ser la

muestra para que el grupo pueda estar seguro en un 98% que la proporción muestral de los que se

curan esté dentro de más menos 0.04 de la proporción de todos los casos que el suero

curará?.Rpta. n = 637

29.- En una muestra al azar de 127 niños de guarderías infantiles se han diagnosticado 7 niños con

sintomatología autista y 12 niños con enuresis nocturna. Utilizando α = 0.05.

a) Determine un intervalo de confianza para la proporción de niños autistas que hay en la

población, origen de la muestra. Rpta. 0.015 < p < 0.095

b) Determine un intervalo de confianza para la proporción de niños con enuresis nocturna que hay

en la población, origen de la muestra. Rpta. 0.043 < p < 0.145

Page 71: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

71

Page 72: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

72

PRUEBAS DE HIPÓTESIS ACERCA DE UNA SOLA MEDIA

1° Caso: Cuando la muestra proviene de una población normal con

varianza σ2 conocida

La estatura media de los alumnos de cierta universidad es de 1.68 m con desviación estándar de

5 cm. ¿Hay razón para creer que se ha producido un cambio en la estatura promedio si una muestra

de 25 estudiantes dio una estatura promedio de 1.70 m? Use α = 0.05

Solución

mH

mHHipótesis

68.1:

68.1:)1

1

0

05.0:)2 iónsignificacdeNivel

2

2505.0

68.170.1:)3

Z

n

XZaestadísticVariable

)tan(96.1

Re:Re)4 0

darizadaesnormaltablalaenhalladoValorVdondeen

VtZoVZsiHchazaremosdecisióndegla

t

t

.:)5

tan 0

cambiadohapromedioestaturaLaConclusión

HhipótesislarechazarserádecisiónlatoloPor

2° Caso: Cuando la muestra proviene de una población normal con

varianza σ2 desconocida

Ejemplo 1.- Una máquina vendedora de refrescos se ajusta para servir 6 onzas por vaso. La

máquina se pone en funcionamiento y se analiza una muestra de 9 vasos obteniendo un llenado

medio de 6.4 onzas con desviación estándar de 0.5 onzas. A un nivel de significancia de 0.05.

¿Esto evidencia de que la máquina está llenado demasiado los vasos?.

Solución

Sea X la variable aleatoria que denota la cantidad servida por la máquina. Se supone que la

variable X se distribuye normalmente con media µ y varianza σ2 desconocida.

onzasH

onzasHHipótesis

6:

6:)1

1

0

05.0:)2 iónsignificacdeNivel

Page 73: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

73

4.2

95.0

64.6:)3

T

nS

XTaestadísticVariable

libertaddegradosnconStudentdettablalaenhalladoValorVtdondeen

VtTsiHchazaremosdecisióndegla

1)(8595.1

Re:Re)4 0

vasoslosdemasiadollenandoestámáquinalanteEfectivameConclusión

HhipótesislaosrechazaremtoloPor

,:)5

tan 0

Ejemplo 2.- En su calidad de comprador comercial para una marca privada de un supermercado,

suponga que se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se encuentra

que el peso promedio de café de cada sobre es de 15.97 gramos con desviación estándar de 0.15 gr.

Los empacadores afirman que el peso neto promedio mínimo de café es de 16 gr por sobre. ¿Puede

rechazarse esta afirmación con un nivel de significación del 5%?.

Solución

onzasH

onzasHHipótesis

61:

16:)1

1

0

05.0:)2 iónsignificacdeNivel

69.0

1215.0

1697.15:)3

T

nS

XTaestadísticVariable

libertaddegradosnconStudentdettablalaenhalladoValorVdondeen

VTsiHchazaremosdecisióndegla

t

t

1)(7959.1

Re:Re)4 0

.:)5

tan 0

afirmacióntalrechazarsepuedeNoConclusión

HhipótesislarechazarnoserádecisiónlatoloPor

Ejemplo 3.- Cuando funciona correctamente; un proceso produce frascos de mermelada, cuyo

contenido pesa en promedio 200 gramos. Una muestra aleatoria de 9 frascos de una remesa

presentó los siguientes pesos (en gramos) para el contenido:

214 197 197 206 208 201 197 203 209

Contrastar la hipótesis nula, de que el proceso está funcionando correctamente, al nivel del 5%.

Solución

gramosH

gramosHHipótesis

200:

200:)1

1

0

05.0:)2 iónsignificacdeNivel

Page 74: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

74

74.1

913.6

20056.203:)3

T

nS

XTaestadísticVariable

libertaddegradosnconStudentdettablalaenhalladoValorVdondeen

VToVTsiHchazaremosdecisióndegla

t

tt

1)(306.2

Re:Re)4 0

controlbajoestáprocesoElConclusión

HhipótesislarechazarnoserádecisiónlatoloPor

:)5

tan 0

Ejemplo 4.- En el pasado una planta química ha producido un promedio de 1,100 kg/día de un

compuesto. Los archivos del año pasado en base a 260 días de operación muestran lo siguiente:

kgSdíakgX 340/060,1

Se desea saber si el promedio de producción diaria ha bajado significativamente durante el

año pasado. Use α = 0.05

Solución: Utilizaremos la variable Z por ser la muestra muy grande

kgH

kgHHipótesis

100,1:

100,1:)1

1

0

05.0:)2 iónsignificacdeNivel

897.1

260340

100,1060,1

ˆ:)3

Z

n

XZaestadísticVariable

)tan(645.1

Re:Re)4 0

darizadaesnormaltablalaenhalladoValorVdondeen

VZsiHchazaremosdecisióndegla

t

t

ivamentesignificatbajóproducciónLaConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 5.- Se ha valorado el tiocianato en el plasma de los individuos de una muestra formada

por 38 fumadores y se ha observado una media de 1.1 mg/l y una desviación estándar de 0.4 mg. El

tiocianato en el plasma de la población adulta presenta una media de 0.9 mg/l.

¿El consumo de tabaco está relacionado con el nivel de tiocianato en el plasma?. Use α = 0.05

Solución:

Page 75: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

75

Sea X la variable aleatoria que denota la cantidad de tiocianato en el plasma. Se supone que la

variable X se distribuye normalmente con media µ y varianza σ2 desconocida.

mgH

mgHHipótesis

9.0:

9.0:)1

1

0

05.0:)2 iónsignificacdeNivel

08.3

384.0

9.01.1:)3

T

nS

XTaestadísticVariable

libertaddegradosnconStudentdettablalaenhalladoValorVtdondeen

VtTsiHchazaremosdecisióndegla

1)(6871.1

Re:Re)4 0

0tan

5) : mo d co s l n de t

Por lo to la decisión será rechazar la hipótesis H

Conclusión El consu e taba i está relacionado con e ivel iocianato en el plasma

Ejemplo 6.- Las especificaciones de determinado medicamento exigen 30% de aspirina en cada

comprimido. Se toman aleatoriamente y analizan 16 comprimidos; la concentración media de

aspirina es 30.4% con desviación estándar de 0.8%. ¿El fármaco cumple las especificaciones a

nivel de significación de 0.01?.

Solución:

30:

30:)1

1

0

H

HHipótesis

01.0:)2 iónsignificacdeNivel

2

168.0

304.30:)3

T

nS

XTaestadísticVariable

04) Re : Re

2.9467 ( ) 1

t t

t

gla de decisión chazaremos H si T V o T V

en donde V Valor hallado en la tabla t de Student con n grados de libertad

cionesespecificalascumplefármacoElConclusión

HhipótesislarechazarnoserádecisiónlatoloPor

:)5

tan 0

Page 76: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

76

PRUEBAS DE HIPÓTESIS ACERCA DE UNA SOLA

PROPORCIÓN

Ejemplo 1.- Una industria lechera está estudiando la posibilidad de cambiar sus botellas para la

leche por envases de plástico; pero el cambio no se hará a no ser que por lo menos 70% de sus

clientes lo prefieran. Cuando se ha hecho una encuesta a 200 de sus clientes, 120 de ellos están a

favor del cambio. ¿Hará el cambio de envases a un nivel de significación 0.05?

Solución:

7.0:

7.0:)1

1

0

pH

pHHipótesis

05.0:)2 iónsignificacdeNivel

08.3

200

3.07.0

7.06.0ˆ:)3

xZ

n

pq

ppZaestadísticVariable

)tan(645.1

Re:Re)4 0

darizadaesnormaltablalaenhalladoValorVdondeen

VZsiHchazaremosdecisióndegla

t

t

envasesdecambioelharáseNoConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 2.- Un fabricante de lavadoras automáticas produce un modelo particular en tres colores

A, B y C. De las primeras 1,000 lavadoras vendidas, se nota que 400 eran del color A. ¿Concluiría

que los clientes tienen una preferencia por el color A?. Use α = 0.01

Solución:

33.0:

33.0:)1

1

0

pH

pHHipótesis

01.0:)2 iónsignificacdeNivel

Page 77: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

77

707.4

000,1

67.033.0

33.04.0ˆ:)3

xZ

n

pq

ppZaestadísticVariable

)tan(33.2

Re:Re)4 0

darizadaesnormaltablalaenhalladoValorVdondeen

VZsiHchazaremosdecisióndegla

t

t

AcolorelporapreferencimayortienennteefectivameclientesLosConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 3.- De una lista de 2,000 clientes de un banco comercial se seleccionó una muestra

aleatoria para obtener opinión acerca del servicio. En la muestra se halló que 215 no tenían quejas

del servicio, 25 tenían quejas y 10 no opinan al respecto. Tradicionalmente el 5% tenían quejas del

servicio, sin embargo se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si se

quiere una probabilidad de 0.008 de cometer error de tipo I?.

Solución:

05.0:

05.0:)1

1

0

pH

pHHipótesis

008.0:)2 iónsignificacdeNivel

88.3

000,2

250000,2

250

95.005.0

05.010.0

10.0250

25ˆ

ˆ:)3

xZ

pdondeen

N

nN

n

pq

ppZaestadísticVariable

)tan(41.2

Re:Re)4 0

darizadaesnormaltablalaenhalladoValorVdondeen

VZsiHchazaremosdecisióndegla

t

t

Page 78: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

78

aumentadoaquejasdeporcentajeElConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 4.- Una compañía farmacéutica afirma que un fármaco que elabora alivia los síntomas del

resfriado común durante un período de 10 horas en el 90% de quienes lo ingieren. En una muestra

aleatoria de 400 personas que ingirieron el fármaco, 350 aliviaron durante 10 horas. Al nivel de

significación de 0.05 la afirmación del fabricante es exacta?.

Solución:

9.0:

9.0:)1

1

0

pH

pHHipótesis

05.0:)2 iónsignificacdeNivel

67.1

400

1.09.0

9.0875.0ˆ:)3

xZ

n

pq

ppZaestadísticVariable

)tan(645.1

Re:Re)4 0

darizadaesnormaltablalaenhalladoValorVdondeen

VZsiHchazaremosdecisióndegla

t

t

falsaesafirmaciónLaConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

OTRA FORMA: Usando la aproximación de la Binomial a la Normal

67.11.09.0400

360350

xxqpn

pnXZ

Page 79: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

79

EJERCICIOS PROPUESTOS

1.- El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la

UNAC manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este

supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se

considera el nivel de significancia de 0.05

Datos:

Día Usuarios Día Usuarios Día Usuario

1 356 11 305 21 429

2 427 12 413 22 376

3 387 13 391 23 328

4 510 14 380 24 411

5 288 15 382 25 397

6 290 16 389 26 365

7 320 17 405 27 405

8 350 18 293 28 369

9 403 19 276 29 429

10 329 20 417 30 364

2.- Los siguientes valores son las presiones sistólicas sanguíneas (en mm de Hg) de 12 pacientes que

experimentan terapia con drogas debido a que padecen de hipertensión.

183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158

Page 80: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

80

¿Puede concluirse a base de estos datos que la media de la población es menor que 165?.

Utilice = 0,05.

3.- Caso: Nivel de hemoglobina de la gestante

INTRODUCCIÓN

El nivel bajo de hemoglobina en gestantes durante el embarazo es previsible por las

modificaciones fisiológicas que suceden en el sistema circulatorio materno al final del embarazo,

modificaciones a las que se tiene que adaptar el cuerpo de la gestante. El nivel bajo de

hemoglobina en la sangre de la gestante puede conllevar a muchas patologías durante el embarazo,

parto y puerperio, entre ellas el parto pretérmino.

En el Hospital Santa Rosa se observa que la mayoría de las gestantes que acuden en el tercer

trimestre presentan un nivel de hemoglobina por debajo de lo normal, así como también se reportan

con frecuencia casos de amenaza de parto pretérmino; por lo cual se desea realizar un estudio para

evaluar la relación que existe entre el nivel de hemoglobina y el parto pretérmino.

ANTECEDENTES:

La Encuesta Demográfica de Salud Familiar 2000 (ENDES 2000) reporta un 38.6% de la

prevalencia de anemia (hemoglobina < 11g/dl.) en la mujer gestante . La OMS considera a la

anemia como un factor que aumenta el riesgo de parto pretérmino en la gestante.

Por ello el Ministerio de Salud en coordinación con el Centro Latinoamericano de Perinatologìa

(CLAP), establecen pautas para el control pre natal, una de ellas es la suplementación de hierro a

todas las gestantes que acuden al control, pero esto aún no se logra inclusive en un hospital de

referencia.

PLANTEAMIENTO DEL PROBLEMA:

El Jefe del Servicio de Gineco-Obstetricia del Hospital Santa Rosa desea saber si el nivel de

hemoglobina en promedio, de las gestantes en el tercer trimestre con diagnóstico de parto pre-

término es menor a 11 mg / dl; para lo cual toma una muestra al azar de 30 gestantes con dicho de

diagnóstico, con un nivel de significancia del 5%.

BASE DE DATOS: Nivel de Hemoglobina en el 3er. Trimestre

10.9 11.2 9.8 11.6 9.9 10.0 11.2 10.2 10.8 9.5 10.0 10.9 11.5 10.4 10.9

10.3 11.7 11.2 9.8 10.4 11.4 11.3 10.5 10.2 11.1 10.6 9.9 8.9 10.8 9.5

4.- Un fabricante de cereales afirma que el peso promedio de cada caja de cereal es de 500 gramos.

¿Los datos que a continuación se le dan apoyan la afirmación del fabricante? Pruebe con = .10.

506, 508, 499, 503, 504, 510, 497, 512,

514, 505, 493, 496, 506, 502, 509, 496

5.- Los siguientes datos corresponden a los pesos en Kg de 15 hombres escogidos al azar: 72, 68,

63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69.

Page 81: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

81

Pruebe la Ho : 74 con un nivel de significancia de 0.05.

6.-Los húmeros de animales de la misma especie tienden a tener aproximadamente las mismas

razones longitud/anchura. Cuando se descubren húmeros fósiles, los arqueólogos con frecuencia

pueden determinar la especie a la que pertenece el animal examinando las razones longitud/anchura

de los huesos. Se sabe que la especie A tiene una razón media de 8,5. Suponga que se

desenterraron 41 húmeros fósiles en una excavación del África Oriental, donde se cree que habitó

la especie A. Se midieron las razones longitud/anchura de los huesos y se presentan en la siguiente

tabla:

10,73 8,89 9,07 9,2 10,33 9,98 9,84 9,59

8,48 8,71 9,57 9,29 9,94 8,07 8,37 6,85

8,52 8,87 6,23 9,41 6,66 9,35 8,86 9,93

8,91 11,77 10,48 10,39 9,39 9,17 9,89 8,17

8,93 8,8 10,02 8,38 11,67 8,3 9,17 12,0

9.38

Queremos probar si los huesos desenterrados pertenecen a la especie A con un nivel de

significación

de un 5%.

7.- Las especificaciones de construcción en cierta ciudad requieren que las tuberías de desagüe

empleadas en áreas residenciales tengan una resistencia media a la ruptura de más de 2.500 libras

por pie lineal. Un fabricante que quisiera proveer a la ciudad de tubos para desagüe ha presentado

una licitación junto con la siguiente información adicional: un contratista independiente seleccionó

al azar siete secciones de los tubos del fabricante y determinó su resistencia a la ruptura. Los

resultados (libras por pie lineal) son los siguientes:

2610 2750 2420 2510 2540 2490 2680

¿Hay suficientes pruebas para llegar a la conclusión de que los tubos de desagüe del fabricante

cumplen con las especificaciones requeridas? Utilice un nivel de significación de un 10%.

8.- Un fabricante de cigarrillos afirma que sus cigarrillos no contienen más de 25 mg. de nicotina.

Una muestra de 16 cigarrillos tiene una media de 26.4 y una desviación estándar igual a 2.

¿Proporcionan estos datos suficiente evidencia para no estar de acuerdo con la afirmación del

fabricante?. Use α = 0.05

9.- Al investigar prácticas comerciales pretendidamente desleales, una comisión estatal toma una

muestra aleatoria de 49 barras de chocolate de “9 onzas” de un gran despacho. La media de los

pesos muestrales fue de 8.94 onz y la desviación estándar 0.12. Mostrar que a un nivel de

significación de 0.05, la comisión tiene fundamentos para proceder contra el fabricante.

10.- Se encuentra que el número promedio de empleados para una muestra de 50 empresas de una

industria específica es de 420.4 con una desviación estándar de 55.7 Existe un total de 380

empresas en ese ramo industrial. Antes de recolectar los datos, se planteó la hipótesis de que el

número promedio de empleados por empresa en esa industria no era superior a 408.

Pruebe esa hipótesis con un nivel de significación de 0.05.

11.- Al gerente del departamento de crédito de una compañía petrolera le gustaría determinar si el

saldo promedio mensual en contra de los tarjetahabientes es igual a $75. Un auditor selecciona

una muestra aleatoria de 100 cuentas y encuentra que la deuda promedio es de $83.4 con

desviación estándar de la muestra de $23.65. Utilizando el nivel de significación de 0.05 ¿Debería

Page 82: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

82

el auditor llegar a la conclusión de que existe evidencia de que el saldo promedio es diferente de

$75?.

12.- Las cajas de un cereal producidas en una fábrica deben tener un contenido de 16 onzas. Un

inspector tomó una muestra que arrojó los siguientes pesos en onzas:

15.7 15.7 16.3 15.8 16.1 15.9 16.2 15.9 15.8 15.6

Indicar si es razonable que el inspector, usando un nivel de significación del 5 % ordene se multe

al fabricante.

13.- En una oficina gubernamental se investiga a un empacador de pescado congelado. Los

empaquetes que utiliza indican que contiene 12 onzas de pescado, en tanto que se han recibido

quejas de que ello no es cierto. La oficina adquiere 100 paquetes de pescado procesado por esta

compañía y encuentra que:

75.249,13150,1100

1

2100

1

i

i

i

i XX

Con base a esta muestra y con = 0.01. ¿Cuál es su conclusión?.

14.- Ante un reclamo sobre el tiempo de realización de una tarea, los empleados de una compañía

sostienen que en promedio ellos completan la tarea en a lo más 13 minutos. Si Ud. Es el gerente

de la compañía.

¿Qué conclusión obtiene si para una muestra de 400 tareas se obtiene un promedio de tiempo de

terminación de 14 minutos. Se sabe que por información de trabajos similares, que los tiempos de

ejecución de la tarea tiene una distribución normal, con desviación estándar de 10 min. Use =

0.05

15.- Un vendedor de seguros de vida dice que en promedio un trabajador en la ciudad de Lima

Metropolitana tiene no más de S/. 25,000 de seguro de vida personal. Para probar esto, muestrea

aleatoriamente 100 trabajadores en L.M. y encuentra que esta muestra de trabajadores promedia

S/. 26,650 de seguro de vida personal y que la desviación estándar es S/. 12,000.

Determine si la prueba muestra suficiente evidencia para rechazar la hipótesis nula planteada por

el vendedor. Use = 0.05

16.- Al estudiar si conviene o no una sucursal en la ciudad de Tarapoto, la gerencia de una gran

tienda comercial de Lima, establece el siguiente criterio para tomar una decisión. Abrir la

sucursal solo si el ingreso promedio familiar mensual en dicha ciudad es no menos de $500 y no

abrirla en caso contrario. Si una muestra aleatoria de 100 ingresos familiares de esa ciudad ha

dado una media de $480. ¿Cuál es la decisión a tomar al nivel de significación del 5 %

17.- Los sacos de café que recibe un exportador de cierto proveedor deben tener un peso

promedio de 100 kilos. Un inspector tomó una muestra de 50 sacos de un lote de 500 sacos de

café encontrando una media de 99 kilos y una desviación estándar de 3 kilos.

Con = 0.01 ¿Es razonable que el exportador rechace el lote de sacos de café?.

18.- Un investigador está realizando una prueba para determinar si una nueva medicina tiene el

efecto colateral de elevar la temperatura del cuerpo. Se entiende que la temperatura del cuerpo

humano se distribuye normalmente con una media de 98.6 ºF. Se administra la nueva medicina a 9

pacientes, se toman las temperaturas y se obtiene una media de 99 ºF y una desviación estándar de

0.36 ºF. ¿Debería permitirse a la compañía poner a la venta la nueva medicina, si el nivel de

significación se especifica en 0.01?

Page 83: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

83

19.- Cinco hipertensos reciben un nuevo fármaco que disminuye la presión arterial en:

14 25 13 18 20 puntos respectivamente.

¿El nuevo fármaco disminuye la presión arterial en por lo menos 20 puntos?

20.- Se conoce que el valor medio de protombina en la población normal es de aproximadamente

20 mg/100ml de plasma. Una muestra de 625 pacientes con deficiencia de vitamina K presenta un

nivel medio de protombina de 18.50 mg/100ml. La desviación estándar de la muestra es 4 mg.

¿Tienen los pacientes con deficiencia de vitamina K un nivel significativamente más bajo de

protombina que la población general?.

21.- Se llevó a cabo un estudio sobre nutrición en un país en desarrollo. Una muestra de 500

campesinos adultos reportó un consumo diario de 1985 calorías con una desviación estándar de

210. ¿Puede concluirse a partir de estos datos que la media de la población es menor que 2,000?.

Use α = 0.05

22.- Antes el número medio de ataques de angina de pecho por semana entre los pacientes era de

1.03. Se está probando un nuevo medicamento y se espera que reduzca esta cifra. Los datos se

obtienen mediante la observación de una muestra de 20 pacientes que están utilizando el nuevo

fármaco.

1 3 0 1 1 1 0 2 2 0 0 1 0

0 0 1 1 1 1 0

¿Puede rechazarse la hipótesis de investigación al nivel 0.01?

23.- Un productor de cápsulas de uña de gato envía al mercado en promedio 1,000 por semana.

La demanda tiene distribución normal; sin embargo en un estudio reciente, una muestra de 36

semanas dio una demanda promedio de 850 cápsulas y una desviación estándar de 360 cápsulas.

En el nivel de significación de 0.05. ¿Es posible concluir que la media de la demanda semanal

está bajando?.

24.- El gerente de un laboratorio farmacéutico quiere determinar si cierto somnífero aumenta las

horas de sueño en las personas. Para este fin, selecciona una muestra aleatoria de 10 pacientes y

registra el número de horas de sueño ganadas al aplicar el somnífero a cada paciente; los

resultados fueron:

Paciente: 1 2 3 4 5 6 7 8 9 10

Nº de horas: 1.2 -1.3 1.7 0.9 2.4 0.8 -1.0 1.8 2.0 2.1

Suponiendo que las horas de sueño ganadas con el somnífero en cada paciente es una variable

aleatoria con distribución normal. Al nivel de significancia del 5%. ¿Hay prueba de que el

somnífero aumenta las horas de sueño?.

25.- Se sospecha que una nueva medicina es eficaz en menos del 90% para curar cierta

enfermedad, pero el laboratorio que la fabrica cree que es efectiva por lo menos en un 90%. En

una muestra de 400 personas que tenían la enfermedad, 320 se curaron con la aplicación de la

medicina. ¿Se ha de concluir que la medicina es eficaz por lo menos en un 90%? Use α = 0.05

26.- Un fabricante de televisores afirma que su póliza de garantía que en el pasado no más de

10% de sus aparatos de televisión necesitaron reparación durante sus primeros dos años de

operación. Con el fin de probar la validez de esta afirmación, una agencia de pruebas del

Page 84: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

84

gobierno selecciona una muestra de 100 aparatos de televisión y encuentra que 14 de ellos

requirieron alguna reparación dentro de los dos primeros años de operación.

Utilizando un nivel de significación de 0.01

¿Es válida la afirmación del fabricante o existe evidencia de que ésta no es válida?.

27.- Una cadena de tiendas de ropa está considerando la propuesta de un fabricante sobre la venta

de un gran lote de camisas, a precios de liquidación.

El fabricante afirma que no más del 2 % de las camisas tienen defectos de fabricación. Los

representantes de la cadena inspeccionan una muestra de 400 camisas del lote y encuentran 15

camisas con defectos de fabricación.

Deberá la cadena rechazar la propuesta del fabricante, si ha decidido comprar el lote, a condición

de que lo afirmado por el fabricante sea cierto con una probabilidad de 1 en 10?

PRUEBAS DE HIPÓTESIS ACERCA DE LA DIFERENCIA DE

DOS MEDIAS POBLACIONALES

CASO: Muestras independientes provenientes de dos poblaciones

normales con varianzas desconocidas e iguales

Ejemplo 1.- Un fabricante de cigarrillos anuncia que el contenido de alquitrán de los cigarrillos

marca B es menor que los de la marca A. Para probarlo se anotan los contenidos de alquitrán:

Marca A ( mg ) : 12 9 13 11 14

Marca B ( mg ) : 8 10 7

Utilice α = 0.05 para determinar si el anuncio es válido.

Solución

AB

BA

H

HHipótesis

:

:)1

1

0

05.0:)2 iónsignificacdeNivel

64.2

3

1

5

1

235

)33.2(2)7.3(4

8.1133.8

33.27.333.88.11:

11

2

)1()1(:)3

22

22

T

SSXXCálculos

nnnn

SnSn

XXTaestadísticVariable

BABA

BABA

BBAA

BAAB

Page 85: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

85

)6(9132.1

Re:Re)4 0

libertaddegradosconStudentdettablalaenhalladoValorVdondeen

VTsiHchazaremosdecisióndegla

t

t

válidoesanuncioElConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 2.- Se aplicó un mismo test a dos grupos de personas con el objeto de analizar si existe o

no diferencia entre las puntuaciones medias; elija α = 0.05

Grupo I: 26 24 18 17 18 20 18

Grupo II: 38 26 24 24 30 22

Solución

211

210

:

:)1

H

HHipótesis

05.0:)2 iónsignificacdeNivel

73.2

6

1

7

1

267

)667.34(5)143.12(6

33.2714.20

667.34143.1233.2714.20:

11

2

)1()1(:)3

2

2

2

121

2121

2

22

2

11

2121

T

SSXXCálculos

nnnn

SnSn

XXTaestadísticVariable

)11(201.2

Re:Re)4 0

libertaddegradosconStudentdettablalaenhalladoValorVdondeen

VtToVTsiHchazaremosdecisióndegla

t

t

Page 86: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

86

gruposambosenobservadasspuntacionelasentreivasignificatdiferenciaexisteSíConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 3.- En una serie de experimentos para la determinación de estaño en productos

alimenticios, las muestras se llevaron al punto de ebullición con HCl a reflujo durante diferentes

tiempos. Los resultados fueron:

Tiempo de reflujo (min) Estaño encontrado (mg/kg)

30 55 57 59 56 56 59

70 57 55 58 59 59 59

¿Es diferente la cantidad media de estaño encontrada para los dos tiempos de ebullición?. Use α =

0.05

Solución

211

210

:

:)1

H

HHipótesis

05.0:)2 iónsignificacdeNivel

845.0

6

57.28.2

8.5757

57.28.283.5757:

11

2

)1()1(:)3

21

2

2

2

121

2121

2

22

2

11

2121

T

quetieneseentoncesnnComo

SSXXCálculos

nnnn

SnSn

XXTaestadísticVariable

)10(2281.2

Re:Re)4 0

libertaddegradosconStudentdettablalaenhalladoValorVdondeen

VtToVTsiHchazaremosdecisióndegla

t

t

Page 87: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

87

.

.inf:)5

tan 0

ónrecuperacidetasalaafecteebullicióndeperíodoelquedepruebashaynodecirEs

encontradaestañodecantidadlaenluyenoebullicióndetiempoElConclusión

HhipótesislarechazarnoserádecisiónlatoloPor

CASO: Muestras dependientes o datos apareados

Ejemplo 1.- Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de

salsa envasada, que puede preparar en una forma más espesa ( A ) o en otra forma menos espesa (

B ). Para medir la preferencia por uno y otro tipo de salsa, utiliza una muestra de diez amas de

casa, quienes manifiestan sus preferencias por dichos tipos de salsa, con los siguientes resultados

en puntajes

Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5

Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8

Al nivel de significación del 5% ¿Se puede concluir que el tipo de salsa menos espesa ( B ) tiene

mayores oportunidades de funcionar en el mercado, que el tipo más espeso ( A )?.

Solución

BA

BA

H

HHipótesis

:

:)1

1

0

05.0:)2 iónsignificacdeNivel

Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5

Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8

Diferencias: 1 -3 1 -5 -3 0 -3 -2 -3 -3

1

:)3

2

1

1

2

2

1

n

n

d

d

S

n

d

ddondeen

n

S

dTaestadísticVariable

n

i

in

i

i

d

n

i

i

d

Page 88: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

88

Cálculos

22

10

204

9

1020

76

7620

2

2

10

1

210

1

dd

i

i

i

i

SdS

dd

16.3

102

2

n

S

dTLuego

d

)9(8331.1

Re:Re)4 0

libertaddegradosconStudentdettablalaenhalladoValorVdondeen

VTsiHchazaremosdecisióndegla

t

t

ventadedoportunidamayortieneBsalsaLaConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Ejemplo 2.- Se desea analizar el efecto de una droga sobre la presión de la sangre para lo cual se

utiliza una muestra de 10 personas, obteniendo los siguientes datos (presión codificada). Utilice α =

0.05

Antes de la droga 14 15 12 9 14 12 10 9 13 12

Después de la droga 10 12 12 7 15 10 7 8 11 11

Solución

DA

DA

H

HHipótesis

:

:)1

1

0

05.0:)2 iónsignificacdeNivel

1

:)3

2

1

1

2

2

1

n

n

d

d

S

n

d

ddondeen

n

S

dTaestadísticVariable

n

i

in

i

i

d

n

i

i

d

Page 89: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

89

Antes: 14 15 12 9 14 12 10 9 13 12

Después: 10 12 12 7 15 10 7 8 11 11

Diferencias: 4 3 0 2 -1 2 3 1 2 1

Cálculos

494.17.1

10

17233.2

9

1017

49

4917

2

2

10

1

210

1

dd

i

i

i

i

SdS

dd

6.3

10494.1

7.1

n

S

dTLuego

d

)9(8331.1

Re:Re)4 0

libertaddegradosconStudentdettablalaenhalladoValorVdondeen

VTsiHchazaremosdecisióndegla

t

t

sanguíneapresiónlareducirparaivosignificatefectotuvosídrogaLaConclusión

HhipótesislarechazarserádecisiónlatoloPor

:)5

tan 0

Page 90: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

90

EJERCICIOS PROPUESTOS

1.- En un estudio sobre cáncer pulmonar se dispone del contenido de nicotina de varios cigarrillos

tomados de dos marcas diferentes:

Marca X : 17; 20; 20; 23

Marca Y : 18; 20; 21; 22; 24

Utilizando el nivel de significación de 0,05, ¿puede concluirse que el contenido nicotínico de

ambas marcas de cigarrillos no es el mismo?

2.- Dos empresas dedicadas a servir comidas rápidas a domicilio han alcanzado una notable

popularidad en cierta ciudad. Se pide a siete clientes habituales de cada empresa que informen

sobre los tiempos (en minutos) que ha tardado su pedido, obteniéndose los siguientes resultados:

Empresa A: 15 23 30 22 22 29 25

Empresa B: 12 21 25 22 15 21 15

Con esta información y con un nivel de significación del 1%. ¿Se puede considerar que los tiempos

de entrega de los pedidos son iguales en ambas empresas?

3.- Se desea comparar la calidad de dos nuevas clases de trigo. Para ello se toman 10 fincas al azar,

plantando en cada una de ellas y en dos partes distintas ambas clases. Los datos sobre la

producción en las 10 fincas son los siguientes:

Clase A: 57 49 60 55 57 48 50 61 52 56

Clase B: 55 48 58 56 54 48 52 56 50 58

¿Podemos aceptar que la producción es la misma para ambas clases de trigo con un 95% de

confianza, suponiendo que las distribuciones son normales?

4.- Los datos que siguen corresponden a 10 hombres entre 45 y 55 años. Se trata de lecturas del

colesterol tomadas tras 12 horas de ayuno y repetidas una hora después de comer.

Sujeto 1 2 3 4 5 6 7 8 9 10

Ayuno 180 210 195 220 210 190 225 260 200 210

Después 185 225 200 225 200 180 235 265 195 220

¿Hubo un incremento significativo del colesterol después de la comida?

5.- Se dividieron 30 pacientes de epilepsia en dos muestras aleatorias iguales. Al grupo A se les dio

un tratamiento que incluía dosis diarias de vitamina D. Al grupo B se le dio el mismo tratamiento

excepto que no recibió vitamina D sino un placebo en su lugar. Las medias del número de ataques

experimentados durante el tratamiento por los dos grupos fueron:

1282415 22 BABA SSXX

¿Hay suficiente evidencia que indique que la vitamina D reduce el número de ataques epilépticos?

Use α = 0.05 Rpta. La vitamina D si reduce el Nº de ataques epilépticos

Page 91: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

91

6.- Los siguientes datos fueron recabados en un experimento que fue diseñado para verificar si

existe una diferencia sistemática en los pesos en gramos obtenidos con dos diferentes balanzas:

Balanza I: 11.23 14.36 8.33 10.50 23.42 9.15 13.47 6.47 12.40 19.38

Balanza II: 11.27 14.41 8.35 10.52 23.41 9.17 13.52 6.46 12.45 19.35

Existe diferencia significativa entre los pesos obtenidos con las dos balanzas? Use = 0.05

7.- Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y mujeres para realizar

determinada tarea. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los siguientes

tiempos en minutos:

Hombres: 12 28 10 25 24 19 22 33 17

Mujeres: 16 20 16 20 16 17 15 21

Se puede concluir que los hombres emplean mayor tiempo que las mujeres para hacer la tarea?

Use = 0.05

8.- Se desea determinar el contenido de grasa en la carne para poder fijar su precio de venta al

consumidor. Una compañía empacadora de carne está considerando el uso de dos métodos

diferentes para determinar el porcentaje de grasa. Ambos métodos fueron usados para evaluar el

contenido de grasa en doce diferentes muestras de carne. Los resultados se muestran en la siguiente

tabla:

Método A: 24.1 28.1 26 28.6 23.2 28.1 24.2 25.7 22.8 24 25

Método B: 23.7 27.4 25.9 28.2 23.5 28.4 24.6 25.4 22.5 25 24

28.0

27.2

¿Sugieren estos datos que los dos métodos difieren en su medición del contenido de grasa en la

carne? Use = 0.05

9.- Un gerente de publicidad de una compañía de cereales para el desayuno desea determinar si un

nuevo envase podría aumentar las ventas del producto. Para probar la factibilidad de la nueva

forma del envase se seleccionó una muestra de 40 tiendas similares y se asignaron en forma

aleatoria, 20 de ellas como mercado de prueba de la nueva forma del envase, en tanto que las otras

20 continuarían recibiendo el envase antiguo. Las ventas semanales durante el tiempo del estudio

fueron las siguientes:

Nuevo Antiguo

Media = 130 cajas

Desv. Estándar = 10 cajas

Media = 117 cajas

Desv. Estándar = 12 cajas

Con α = 0.05. ¿La nueva forma del envase dio como resultado mayores ventas?

10.- Un investigador cree tener razón para creer que cierto medicamento aumentará el contenido de

hemoglobina en gr/100 ml para ello mide el contenido de hemoglobina de 8 sujetos antes y después

de la administración del medicamento.

Antes 10 9 11 12 8 7 12 10

Después 12 11 13 14 9 10 12 14

Analice los datos y determine el efecto del medicamento. Utilice α = 0.01

Rpta. El medicamento sí es efectivo

Page 92: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

92

11.- Los siguientes datos son porcentajes de grasa encontrados en dos tipos de carne:

Carne A: 30 26 30 19 25 37 27 38 26 31

Carne B: 40 34 28 29 26 36 28 37 35 42

¿Tiene las carnes diferente contenido de grasa?. Use = 0.05 12.- Un psicólogo desea verificar que cierto fármaco aumenta el tiempo de reacción a un estímulo

dado. Para una muestra de 4 individuos se obtuvieron los siguientes tiempos de reacción en

décimos de segundo, antes y después de inyectarse el fármaco:

Individuo

Tiempo de reacción

Antes Después

1

2

3

4

7

2

12

12

13

3

18

13

Con un nivel de significación del 5 % realice una prueba para determinar si el fármaco aumenta

significativamente el tiempo de reacción.

13.- Se desea comparar dos dietas. Se seleccionaron 80 individuos al azar en una población de

músicos excedidos de peso; 45 integrantes de este grupo recibieron la dieta A, los otros 35 la dieta

B. Las pérdidas de peso en libras durante un período de una semana resultaron ser los siguientes:

Dietas Media muestral ( lbs ) Varianza muestral

Dieta A

Dieta B

10.3

7.3

7.0

3.25

Usando α = 0.01. ¿Cuál dieta fue mejor en la reducción de peso?

14.- Se administran dos nuevos medicamentos a pacientes con un padecimiento cardíaco. El primer

medicamento bajó la presión sanguínea de 16 pacientes en un promedio de 11 puntos con una

desviación estándar de 6. El segundo medicamento bajó la presión sanguínea de otros 20 pacientes

en un promedio de 12 puntos con una desviación estándar de 8.

¿Existe diferencia significativa entre los efectos de ambos medicamentos? Use α = 0.05

Rpta. No existe diferencia significativa

15.- Veinticuatro animales de laboratorio con deficiencia de vitamina D, se dividieron en dos

grupos iguales: El grupo I recibió un tratamiento consistente en una dieta que proporcionaba la

vitamina D.

El grupo II no fue tratado. Al término del período experimental se hicieron las determinaciones del

calcio en el suero, obteniéndose los siguientes resultados:

mgSmgS

mlmgXmlmgX

TRATADONOGRUPOTRATADOGRUPO

0.25.1

100/8.7100/1.11

21

21

Suponiendo que las poblaciones son normales. ¿Existe diferencia significativa?. Rpta. Sí

16.- El tiempo de recuperación fue observado para pacientes al azar y sometidos a dos tipos

distintos de procedimientos quirúrgicos. Los datos son los siguientes:

Page 93: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

93

49.123.1

9.83.7

2321

2

2

2

1

21

21

SS

XX

nn

IINTOPROCEDIMIEINTOPROCEDIMIE

Presentan los datos suficiente evidencia para concluir que hay diferencia entre los tiempos medios

de recuperación de los dos procedimientos quirúrgicos?. Use α = 0.05

17.- Once estudiantes de medicina midieron la presión sanguínea del mismo paciente y repitieron

la medición al día siguiente. A continuación se listan las lecturas sistólicas en mmHg.

Día 1: 138 130 135 140 120 125 120 130 130 144 143

Día 2: 116 120 125 110 120 135 124 118 120 130 140

Con α = 0.05 ¿Existe diferencia significativa entre ambas mediciones?

Page 94: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

94

Page 95: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

95

Page 96: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

96

Ejemplo 1.- El costo de fabricar un lote de cierto producto depende del tamaño del lote, como

se aprecia en el siguiente conjunto de datos:

Costo ($10): 30 70 140 270 530 1010 2500

5020

Tamaño del lote (100 unidades): 1 5 10 25 50 100 250

500

a) Grafique un diagrama de dispersión

b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.

c) Grafique sobre el diagrama de dispersión, la línea de regresión.

d) Estime el costo para un lote cuyo tamaño es de 500 unidades

e) Calcule el error estándar de estimación

f) Calcule e interprete el coeficiente de correlación.

g) Interprete el coeficiente de determinación.

Solución

a) Diagrama de Dispersión

5004003002001000

5000

4000

3000

2000

1000

0

Tamaño del lote ( 100 unidades): X

Co

sto

( 1

0 d

óla

res )

: Y

Gráfica de dispersión de Y vs. X

Page 97: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

97

b) Determinación de la Ecuación de regresión lineal: XbaY ˆ

32575132710309570941: 2 iiiii XYXYXdondeen

Luego

8987.22941)325751(8

)3271030(941)9570(3257512

a

975.9)941()325751(8

)9570()941()3271030(82

b

XYserálinealregresióndeecuaciónlatoloPor 975.98987.22ˆ:tan

Interpretación: Al aumentar el tamaño del lote en 100 unidades, el costo aumentará en 9.975

decenas de dólar o sea aproximadamente en 100 dólares.

c) Gráfica de la línea de regresión lineal

22

2

ii

iiiii

XXn

YXXYXa

22

ii

iiii

XXn

YXYXnb

Page 98: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

98

5004003002001000

5000

4000

3000

2000

1000

0

Tamaño del lote ( X )

Co

sto

( Y

)S 12,0374

R-cuad. 100,0%

R-cuad.(ajustado) 100,0%

Gráfica de línea ajustadaY = 22,90 + 9,975 X

d) Costo estimado para un lote de 500 unidades: 8.72)5(975.98987.22ˆ Y

Es decir el costo estimado sería de 728 dólares.

e) Cálculo del Error Estándar de Estimación: Sy/x

dólaresdedecenasS

n

YXbYaYS

xy

xy

0374.1228

)3271030(975.9)9570(8987.2232849700

2

/

2

/

f) Cálculo del Coeficiente de Correlación: r

2222 YYnXXn

YXYXnr

ii

Page 99: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

99

Interpretación: Existe una correlación lineal positiva perfecta; a medida que el tamaño del lote

se incrementa, el costo también crecerá.

g) Cálculo del Coeficiente de Determinación: r2 = 1

Interpretación: Las variaciones que se observa en el costo, se debe únicamente a la variación

del tamaño del lote.

Ejemplo 2.- Se llevó a cabo un experimento para estudiar el efecto de cierto medicamento para

disminuir la frecuencia cardíaca en adultos. La variable independiente es la dosis en miligramos

del medicamento y la variable dependiente es la diferencia entre la frecuencia cardíaca más baja

después de la administración del medicamento y un control antes de administrarlo. Se reunieron

los siguientes datos:

a) Grafique un diagrama de dispersión

b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.

c) Grafique sobre el diagrama de dispersión, la línea de regresión.

d) Estime la disminución de la frecuencia cardíaca para una dosis de 2 mg

e) Calcule el error estándar de estimación

f) Calcule e interprete el coeficiente de correlación.

g) Calcule e interprete el coeficiente de determinación

Dosis

(mg)

Disminución de la frecuencia

cardíaca (latidos/min)

0.50

0.75

1.00

1.25

1.50

1.75

2.00

2.25

2.50

2.75

3.00

3.25

3.50

10

08

12

12

14

12

16

18

17

20

18

20

21

00.1

)9570()32849700(8)941()325751(8

)9570()941()3271030(8

22

r

Page 100: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

100

Solución:

a) Diagrama de Dispersión

3.53.02.52.01.51.00.5

22

20

18

16

14

12

10

8

X: Dosis ( mg )

Y:

Dis

min

ució

n d

e la

fre

cu

en

cia

ca

rdía

ca

(la

t/m

in) Gráfica de dispersión de Y vs. X

b) Determinación de la Ecuación de regresión lineal: XbaY ˆ

375.635.44219826: 2 iiiii XYXYXdondeen

Luego

055.726)375.63(13

)5.442(26)198(375.632

a

088.4)26()375.63(13

)198()26()5.442(132

b

XYserálinealregresióndeecuaciónlatoloPor 088.4055.7ˆ:tan

22

2

ii

iiiii

XXn

YXXYXa

22

ii

iiii

XXn

YXYXnb

Page 101: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

101

Interpretación: Al aumentar la dosis del medicamento en 1 mg.la reducción de los latidos del

corazón, se incrementan en 4 lat/min aproximadamente; es decir por cada mg de la dosis, los

latidos del corazón se reducen en 4 aproximadamente.

c) Gráfica de la línea de regresión lineal

3.53.02.52.01.51.00.5

22

20

18

16

14

12

10

8

Dosis: X

Re

du

cció

n d

e la

fre

cu

en

cia

ca

rdía

ca

: Y S 1.35579

R-cuad. 90.4%

R-cuad.(ajustado) 89.5%

Gráfica de línea ajustadaY = 7.055 + 4.088 X

d) Disminución estimada de la frecuencia cardíaca para una dosis de 2 mg:

15)2(088.4055.7ˆ Y

Es decir para una dosis de 2 mg de dicho medicamento, se espera que la frecuencia cardíaca

disminuya en 15 lat/min aproximadamente.

e)Cálculo del Error Estándar de Estimación: Sy/x

latidosS

n

YXbYaYS

xy

xy

3558.1213

)5.442(088.4)198(055.73226

2

/

2

/

f) Cálculo del Coeficiente de Correlación: r

2222 YYnXXn

YXYXnr

ii

Page 102: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

102

Interpretación: Existe una correlación lineal positiva entre la dosis del medicamento y la

reducción de la frecuencia cardíaca; a medida que se aumenta la dosis del medicamento

entonces la reducción de la frecuencia también aumentará.

g) Cálculo del Coeficiente de Determinación: r2 = 0.904

Interpretación: El 90.4% de las variaciones que se observa en la reducción de la frecuencia

cardíaca, se debe a la variación de la dosis del medicamento; el 9.6% restante se debe a la

influencia o efecto de alguna otra variable no tomada en cuenta en el presente estudio.

EJERCICIOS PROPUESTOS

1. Una muestra aleatoria de cinco familias da la siguiente información en relación al ingreso

familiar mensual y los gastos mensuales en gastos en seguros de salud.

FAMILIA Ingreso mensual

Gastos en

seguros de

salud

Ávila 3500 320

Benavides 2800 280

Calderón 4700 410

Díaz 2100 120

Ercilla 3150 340

a. Grafique un diagrama de dispersión

b. Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.

Grafique sobre el diagrama de dispersión, la línea de regresión.

c. Pruebe otros modelos de regresión y elija el mejor a base del coeficiente de determinación.

d. Estímese el gasto anual en prevención de la salud de una familia cuyo ingreso mensual es

2500 soles.

e. Calcule el error estándar de la estimación del modelo

f. Calcule e interprete el coeficiente de determinación

2.- Con la siguiente información:

Horas-hombre por mes de instrucción 200 500 450 800 900 150 300 600

Accidentes por millón de Horas-hombre 7.0 6.4 5.2 4.0 3.1 8.0 6.5 4.4

a) Grafique el diagrama de dispersión

9507.0

)198()3226(13)26()375.63(13

)198()26()5.442(13

22

r

Page 103: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

103

b) Determine una ecuación que describa la relación entre la frecuencia de accidentes y el nivel

de educación preventiva. Grafique esta ecuación.

c) Interprete los valores de los coeficientes de regresión.

d) Calcule el error estándar de la estimación del modelo.

e) Calcule e interprete el coeficiente de correlación.

f) Calcule e interprete el coeficiente de determinación.

g) Estime el número de accidentes si el número de horas de instrucción fuese 340.

3.- El editor en jefe de un importante periódico metropolitano ha intentado convencer al dueño del

periódico para que mejore las condiciones de trabajo en el taller de prensas. Está convencido de

que, cuando trabajan las prensas, el grado de ruido crea niveles no saludables de tensión y

ansiedad. Recientemente hizo que un psicólogo realizara una prueba durante la cual los prensistas

se situaron en cuartos con niveles variables de ruido y luego se le hizo otra prueba para medir

niveles de humor y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o

nerviosismo y el nivel de ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es alto).

Nivel de ruido 4 3 1 2 6 7 2 3

Grado de ansiedad 39 38 16 18 41 45 25 38

a) Represente gráficamente estos datos.

b) Desarrolle una ecuación de estimación que describa los datos.

c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de ruido es 5.

d) Calcule e interprete el coeficiente de correlación

e) Calcule e interprete el coeficiente de determinación

f) Calcule el error estándar de la estimación

4.- El Gerente de una Clínica dispone de la siguiente información:

Año 2001 2002 2003 2004 2005 2006

Cirugías 120 143 150 170 162 158

a) Grafique y determine la ecuación de la tendencia.

b) Proyecte las cirugías al corazón para el año 2007

5.- Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga

antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla:

Días tras la diálisis: X

1 5 10 15 20 25 35

Creatinina (mg/dl): Y

5.7 5.2 4.8 4.5 4.2 4 3.8

a.- Calcule el modelo de regresión lineal

b.- Interprete la variación de creatinina, en función de los días transcurridos tras la diálisis.

c.- Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis, que sucede con la

creatinina (mg/dl).

6.- En un grupo de 8 pacientes se registran las medidas antropométricas peso (kg) y edad (años)

obteniendo el modelo de regresión:

ˆ 20.61 2.83Y X

Page 104: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

104

a.- Interprete la recta de regresión lineal

b.- ¿Cómo cree Ud. que será el diagrama de dispersión?

7.- Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para medir la

influencia del gasto en publicidad sobre las ventas. En 8 regiones del país, se realizaron diferentes

variaciones relativas en el gasto de publicidad, comparado con el año anterior y se observaron las

variaciones en los niveles de ventas resultantes. La tabla muestra los resultados:

Incremento del gasto

en publicidad ( % )

0 4 14 10 9 8 6 1

Incremento en las ventas ( % ) 2.4 7.2 10.3 9.1 10.2 4.1 7.6 3.5

a) Calcule el coeficiente de correlación lineal.

b) Estimar la ecuación regresión lineal del incremento en las ventas sobre el incremento del

gasto en publicidad

c) Calcule el error estándar de estimación.

d) Estime el incremento en las ventas, si el gasto en publicidad es del 10%.

8.- Los siguientes datos se refieren al número de horas de estudio invertidas por los estudiantes

fuera de clase durante un período de tres semanas para cierto curso, junto con las calificaciones que

obtuvieron en un examen aplicado al final de ese período.

Calificaciones 64 61 84 70 88 92 72 77

Horas de estudio 20 16 34 23 27 32 18 22

a) Calcule el coeficiente de correlación lineal.

b) Estimar la ecuación regresión lineal

c) Calcule el error estándar de estimación.

d) Estime la calificación para un estudiante que estudió 24 horas durante dicho período de

tiempo.

9.- Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo,

obteniendo los siguientes datos.

Número de páginas 630 550 400 250 370 320 610

Precio ( $10 ) 10 8 7 4 6 6 9

a) Calcule el coeficiente de correlación lineal.

b) Estimar la ecuación regresión lineal

c) Calcule el error estándar de estimación.

d) Estimar el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en

una segunda edición. ¿En cuánto se incrementará su precio?.

10.- Un investigador de una fábrica de refrescos ha tomado al azar 8 semanas del año observando

en cada semana la temperatura media (ºC ) y la cantidad de refrescos (miles) pedidos durante cada

uno de dichos períodos. La información es la siguiente:

Temperatura 10 28 12 31 30 19 24 15

Pedidos 21 65 19 72 75 36 67 24

a) Calcule el coeficiente de correlación lineal.

b) Halle la ecuación regresión lineal

Page 105: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

105

c) Calcule el error estándar de estimación.

d) Estimar el pedido de refrescos para una semana cuya temperatura media es de 20ºC.

11.- Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las

pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la droga durante seis días. La

tabla que sigue resume los resultados del experimento.

Dosis diaria

total

de efedrina

(granos)

Nº de

pulsaciones

por minuto

3

2

1

3

5

4

70

60

50

80

100

90

Nota. 1 grano = 0.06 gramos

a. Grafique un diagrama de dispersión

b. Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión

lineal. Grafique sobre el diagrama de dispersión, la línea de regresión.

c. Estímese el número de pulsaciones para una dosis diaria de 4 granos de efedrina.

d. Calcule el error estándar de la estimación del modelo

e. Calcule e interprete el coeficiente de correlación.

f. Calcule e interprete el coeficiente de determinación

12.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de

mercurio en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces

contaminados.

Consumo de metil

mercurio

(µgHg/día)

Mercurio en la sangre

( ng/g )

180

200

230

410

600

550

275

580

105

250

460

650

90

120

125

290

310

290

170

375

70

105

205

480

a) Calcule el coeficiente de correlación lineal.

b) Estimar la ecuación regresión lineal de la cantidad de mercurio en la sangre sobre el

consumo de metil mercurio

c) Calcule el error estándar de estimación.

Page 106: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

106

d) Estime la cantidad de mercurio en la sangre, considerando una ingesta de 300 µg de

mercurio.

13.- Se quiere determinar la relación entre la experiencia en ventas y el volumen de ventas para

cada vendedor basado en un grupo de 10 vendedores de una compañía de seguros. Los años de

experiencia en ventas y los volúmenes de ventas son:

Experiencia en ventas

(años)

Volumen de ventas

($10,000)

1

2

3

4

5

6

7

8

9

10

3

2

5

4

6

8

9

9

12

10

a) Halle la ecuación de regresión lineal. Interprete el coeficiente de regresión

b) Estime las ventas para un vendedor con 5 años de experiencia

c) Calcule e interprete el coeficiente de correlación

d) Interprete el coeficiente de determinación

14.- En una muestra de 8 pacientes se miden las cantidades antropométricas peso y edad

obteniéndose los siguientes resultados

Edad (años) 12 8 10 11 7 7 10 14

Peso (kg) 56 42 51 54 40 39 49 58

a) Calcule e interprete el coeficiente de correlación

b) Halle la ecuación de regresión lineal

c) Estime el peso para un paciente de 10 años de edad

d) Determine e interprete el coeficiente de determinación

15.- Consideremos los siguientes datos respecto al precio de venta ($1,000) de una muestra de

viviendas y sus áreas (100 pies2) correspondientes a cada una de ellas, en cierta ciudad.

Precio de venta: 41 32 24 44 42 36 35 40 29 26

Área de la vivienda: 13 10 08 14 14 12 10 12 10 08

a) Hallar la ecuación de regresión lineal

b) Interprete el coeficiente de regresión lineal

c) Estime el precio de venta para una vivienda cuya área es de 1,000 pies2

d) Calcule e interprete el coeficiente de correlación lineal

e) Interprete el coeficiente de determinación

Page 107: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

107

Page 108: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

108

PRUEBA DE INDEPENDENCIA

Tiene por objeto probar si dos variables cualitativas o categóricas no están relacionadas o

asociadas; también una de ellas podría ser cuantitativa.

2

2

1 1

r c

ij ij

i j

ij

O E

E

Ejemplo 1.- En una empresa se desea estudiar si existe una relación entre el nivel de las

remuneraciones y los años de experiencia del personal de su planta de profesionales. Con este

objeto, se clasifican las remuneraciones según su monto, en tres categorías: bajo, medio y alto;

asimismo los años de experiencia de acuerdo a su número en cuatro categorías: A, B, C y D.

Al nivel de 0.05. ¿Hay alguna relación entre los años de experiencia y las remuneraciones que

perciben los 100 empleados de la empresa?.

REMUNERACIONES

AÑOS DE EXPERIENCIA

Total A B C D

Bajo 4 9.88 11 9.88 9 9.12 14 9.12 38

Medio 12 8.58 9 8.58 8 7.92 4 7.92 33

Alto 10 7.54 6 7.54 7 6.96 6 6.96 29

Total 26 26 24 24 100

Solución:

05.0

exp:

exp:

1

0

ciasignificandeNivel

erienciadeañoslosyonesremuneracilasentrerelaciónexisteSiH

erienciadeañoslosyonesremuneracilasentrerelaciónexisteNoH

.exp:

tan.592.12

..6(Re:Re

814.1096.6

)96.66(....................................

58.8

)58.812(

88.9

)88.94(

0

22

0

2222

erienciadeañoslosyonesremuneracilasentrerelaciónexisteNoConclusión

HosrechazaremnotoloPorVtcasoesteen

lgcontablalaenhalladoValorVtsiHchazardecisióndegla

Ejemplo 2.- Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.

D I A G N Ó S T I C O

Total Muerte por cáncer de pulmón Muerte por otras causas

Fumadores 348 301 3,152 3199 3,500

No Fumadores 82 129 1,418 1371 1,500

Total 430 4,570 5,000

Page 109: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

109

Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son independientes

con

α = 0.01

Solución

01.0

:

:

1

0

ciasignificandeNivel

pulmonarcáncerpormuertelayfumardehábitoelentrerelaciónexisteSiH

pulmonarcáncerpormuertelayfumardehábitoelentrerelaciónexisteNoH

.:

tan635.6

..1(Re:Re

764.26371,1

)371,1418,1(

129

)12982(

199,3

)199,3152,3(

301

)301348(

0

22

0

22222

osrelacionadestánfactoresAmbosConclusión

HosrechazaremtoloPorVtcasoesteEn

lgcontablalaenhalladoValorVtsiHchazardecisióndegla

PRUEBA DE HOMOGENEIDAD

Ejemplo 1.- El Director de compras de una fábrica grande debe decidir por la compra de una de las

cuatro marcas que hay en el mercado. Para probar si existe diferencia significativa en la calidad de

las máquinas, obtiene una muestra de la producción de 150 artículos para cada una de ellas y

observa el número de defectuosos. Los resultados se dan en la siguiente tabla:

CALIDAD

M A Q U I N A S

Total A B C D

Defectuosos 21 16.5 12 16.5 15 16.5 18 16.5 66

Buenos 129 133.5 138 133.5 135 133.5 132 133.5 534

Total 150 150 150 150 600

Solución

05.0

.:

)(:

1

0

ciasignificandeNivel

mismalaesnosdefectuosodeproporciónlamáquinaslasdeunaenmenosAlH

máquinaslasdeunacadaenmismaslassonsdefectuosodeproporciónLappppH DCBA

.:

tan.815.7

..3(Re:Re

064.35.133

)5.133132(....................................

5.133

)5.133129(

5.16

)5.1621(

0

22

0

2222

mismalaessísdefectuosodeproporciónLaConclusión

HosrechazaremnotoloPorVtcasoesteen

lgcontablalaenhalladoValorVtsiHchazardecisióndegla

Page 110: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

110

Ejemplo 2.- Se sostiene que una droga determinada es efectiva para la curación del catarro común.

En un experimento con 164 personas con catarro, a la mitad de ellas se le suministró la droga y a la

otra mitad se le suministró píldoras azucaradas. Las reacciones de los pacientes aparecen anotadas

en la siguiente tabla:

R E A C C I O N E S

Total Mejorados Empeorados Efecto Nulo

Droga 52 48 10 11 20 23

82

Azúcar 44 48 12 11 26 23

82

Total 96 22 46

164

Solución

05.0

.:

:

1

0

ciasignificandeNivel

efectoigualtienennopíldoraslasydrogaLaH

efectoigualtienenpíldoraslasydrogaLaH

.:

tan991.5

..2(Re:Re

631.123

)2326(....................................

11

)1110(

48

)4852(

0

22

0

2222

similaresreaccionesproducenazucaradaspíldoraslasydrogaLaConclusión

HosrechazaremnotoloPorVtcasoesteen

lgcontablalaenhalladoValorVtsiHchazardecisióndegla

Page 111: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

111

EJERCICIOS PROPUESTOS

1.- Una encuesta realizada en 378 hospitales por el Colegio de Cirujanos Americanos produjo los

datos de la tabla siguiente:

Tipo de tumor Total

Benigno Maligno

Usan anticonceptivos 138 49 187

No usan 39 41 80

No conocen su uso 35 76 111

Total 212 166 378

Proporcionan los datos evidencia suficiente para indicar una dependencia entre el tipo de tumor y

el uso de anticonceptivos orales?. Use α = 0.05 Rpta. Sí

2.- Sobre una muestra de 500 niños de cierta escuela primaria se hizo un estudio acerca de su

estado de nutrición y el desempeño académico, obteniéndose los siguientes resultados:

Desempeño Académico Estado de Nutrición Total

Pobre Bueno

Malo 105 15 120

Satisfactorio 80 300 380

Total 185 315 500

Existe relación entre el desempeño académico y el estado de nutrición. Use α = 0.01 Rpta. Sí

3.- Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si

existía alguna predilección entre las tres marcas competitivas (A, B y C ) dependiendo de la región

geográfica en la que habita el consumidor. La información obtenida es la siguiente:

Región I Región II Región III Total

Marca A 40 52 25 117

Marca B 52 70 35 157

Marca C 68 78 60 206

Total 160 200 120 480

Con esta información ¿La preferencia por una determinada marca depende de la región geográfica?

Rpta. No

4.- Los puntajes obtenidos en una muestra de 218 estudiantes en el examen de ingreso a una

universidad, así como los promedios finales durante el primer semestre de la universidad fueron

clasificados en cuatro categorías: A, B, C y D. Estos aparecen en la siguiente tabla:

Promedios del

Primer Semestre

Puntajes de Ingreso

Total A B C D

A 20 10 17 8 55

B 17 16 18 7 58

C 19 4 15 12 50

D 12 8 12 23 55

Total 68 38 62 50 218

Page 112: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

112

Se puede decir que los puntajes obtenidos en ambos exámenes son independientes? Use α = 0.05

5.- Se tomó una muestra de 400, 500 y 400 compradores de las ciudades de Piura, Trujillo y

Chiclayo respectivamente con la finalidad de determinar si la proporción verdadera de

compradores que se inclinan por el producto A en lugar del B, es la misma en las tres ciudades.

Use α = 0.05

Producto A Producto B Total

Piura 232 168 400

Trujillo 260 240 500

Chiclayo 197 203 400

Total 689 611 1300

6.- Se examinó una muestra de 2,000 registros médicos los cuales dieron los siguientes resultados:

Muerte por cáncer

del intestino

Muerte por otras causas Total

Fumadores 22 1,178 1,200

No Fumadores 26 774 800

Total 48 1,952 2,000

Probar la hipótesis que las dos clasificaciones son independientes con α = 0.05

7.- Cierta compañía desea determinar si el ausentismo se relaciona con la edad. Se toma una

muestra de 200 empleados al azar y se clasifica según su edad y causa de ausentismo:

¿Está la edad relacionada con el ausentismo? Use α = 0.01

8.- Una fábrica de automóviles quiere averiguar si el sexo de sus posibles clientes no tiene relación

con la preferencia del modelo. Se toma una muestra aleatoria de 2,000 posibles clientes y se

clasifican así:

Contrastar la hipótesis de que el sexo no tiene relación con la

preferencia hacia un determinado modelo para un α

= 0.01

9.- Se desea determinar si existe algún tipo de relación entre la concentración de procaína usada en

operaciones del molar mandibular y el porcentaje de casos satisfactorios (efectividad clínica de la

anestesia). Se tuvo la siguiente información:

Solución de procaína Casos satisfactorios Casos no satisfactorios

1.0 %

Más de 1.0 %

07

63

18

12

Use α = 0.05

CAUSA EDAD

Menos de 30 30 - 50 Más de 50

Enfermedad

Otras

40

20

28

36

52

24

SEXO MODELO

I II III

Masculino

Femenino

350

340

270

400

380

260

Page 113: Guia de Estadística General

G u í a P r á c t i c a d e E s t a d í s t i c a G e n e r a l |

113

10.- Un investigador estudia el nivel de efectividad de tres remedios R1, R2 y R3 para aliviar cierta

enfermedad. Para esto escogió tres muestras aleatorias de tamaños 50, 70 y 60 pacientes con la

enfermedad, suministrando a la primera el remedio R1, a la segunda muestra el remedio R2 y a la

tercera el remedio R3; y midiendo la efectividad de los remedios en tres niveles: Sin alivio, cierto

alivio y alivio total. Los resultados del experimento se dan en la tabla que sigue:

Efectividad Remedios para la alergia

R1 R2 R3

Sin alivio

Cierto alivio

Alivio total

10

30

10

20

20

30

15

20

25

¿Puede inferir que los tres remedios para la alergia son igualmente efectivos?.

11.- El ingeniero quiere saber si hay diferencias en la calidad de los productos procesados en los

tres turnos operativos de una fábrica. Para esto se tomó una muestra aleatoria de tamaño 100 de

cada turno del día anterior y las clasificó según el turno de su producción: mañana, tarde y noche; y

según su calidad: defectuoso o no defectuoso. Los resultados se dan en la siguiente tabla:

Calidad Turnos de producción

Mañana Tarde Noche

Defectuosos

No defectuosos

3

97

12

88

15

85

Pruebe al nivel de significación del 5% la hipótesis de la igualdad de las tres proporciones reales de

producción defectuosa.