Post on 29-Dec-2015
UNIVERSIDAD TECNOLÓGICA DEL PERÚ
Vicerrectorado de Investigación
"ESTADÍSTICA APLICADA"
TINS Básicos
ADMINISTRACIÓN DE EMPRESAS, ADMINISTRACIÓN DE NEGOCIOS INTERNACIONALES, MARKETING EMPRESARIAL
TEXTOS DE INSTRUCCIÓN BÁSICOS (TINS) / UTP
Lima - Perú
ESTADÍSTICA APLICADA
2
© ESTADÍSTICA II Desarrollo y Edición: Vicerrectorado de Investigación Elaboración del TINS: Ing. Estadístico Nilton Horacio Machicao Bejar
Diseño y Diagramación: Julia Saldaña Balandra
Soporte académico: Instituto de Investigación
Producción: Imprenta Grupo IDAT
Queda prohibida cualquier forma de reproducción, venta, comunicación pública y transformación de esta obra.
ESTADÍSTICA APLICADA
3
“El presente material contiene una compilación de
contenidos de obras de Estadística publicadas lícitamente,
resúmenes de los temas a cargo del profesor, constituye un
material auxiliar de enseñanza para ser empleado en el
desarrollo de las clases de nuestra institución.
Este material es de uso exclusivo de los alumnos y docentes
de la Universidad Tecnológica del Perú, preparados para
fines didácticos en aplicación del artículo inc. C y el Art.43
inc. A; del Decreto Legislativo 822; Ley sobre Derechos de
Autor”
ESTADÍSTICA APLICADA
4
ESTADÍSTICA APLICADA
5
PRESENTACIÓN
La Matemática, ciencia de la más alta jerarquía, en el concierto de las Ciencias, desde los albores de la civilización sigue siendo la base del desarrollo científico, tecnológico y humanístico de nuestro mundo. La Estadística como conjunto de conocimientos de la Matemática, se erige en el espacio del pensamiento probabilístico, permite la sistematización análisis de datos y la síntesis de resultados en el tratamiento de datos; conduce a la validación de resultados y facilita la producción de informes paramétricos, obtenidos en diferentes sucesos ocurridos en el acontecer de los actos del hombre. De allí que, en la formación académica de profesionales, se debe demandar el estudio de la Estadística en la convicción de dotar a sus estudiantes con un instrumento matemático analítico pertinente a la necesidad que plantea un determinado ejercicio, problema o proyecto en el campo de la política, la economía, la antropología de una sociedad, envueltos en la dinámica de la naturaleza y la cultura. En este marco, se ha desarrollado el presente texto de instrucción, dirigido a estudiantes de Administración; para la Asignatura de Estadística Aplicada, basado en una selección de temas, contenidos en diferentes fuentes bibliográficas, apropiados para la formación de profesionales en tecnología blanda. El texto en mención plasma la preocupación institucional de innovación de la enseñanza-aprendizaje en educación universitaria, que en acelerada continuidad promueve la producción de materiales educativos, actualizados en concordancia a las exigencias de estos tiempos. Comprende 6 unidades de instrucción de carácter aplicativo, matizado por ejercicios y problemas: La unidad I comienza con una exposición sobre las técnicas de conteo o análisis combinatorio que es la base para entender a las probabilidades y sus propiedades y luego se expone acerca de la independencia de eventos y los teoremas de probabilidad total y de Bayes. En la unidad II trata de las variables aleatorias discretas y continuas, función de probabilidad, esperanza matemática, variancia y sus propiedades.
ESTADÍSTICA APLICADA
6
La unidad III trata de las principales distribuciones de probabilidades tanto discretas y continuas, como Bernoulli, Binomial, Hipergeométrica, Poisson, Normal y Normal Estándar. La unidad IV trata de las distribuciones muestrales, el teorema del límite central, distribución Chi-cuadrado, “t” de Student y “F” de Snedecor. La unidad V trata de la inferencia estadística, tema importante para la toma de decisiones en medio de incertidumbre, se divide en dos partes como son la estimación de parámetros y las pruebas de hipótesis. La unidad VI trata del análisis de regresión lineal múltiple, el análisis de variancia y el coeficiente de determinación que nos permitirá saber si nuestros datos se adecuan o no a nuestro modelo. Además al final se presenta un apéndice con las principales tablas estadísticas y la bibliografía. Al finalizar estas líneas, el reconocimiento institucional al profesor Nilton Machicao Bejar, que habiendo trabajado con denuedo ha hecho posible éste texto de instrucción, como expresión de su destacada labor profesional y académica.
VICERRECTORADO DE INVESTIGACIÓN
ESTADÍSTICA APLICADA
7
ÍNDICE GENERAL Unidad I TEORÍA DE PROBABILIDADES...................................................... 11 Unidad II VARIABLES ALEATORIAS ............................................................. 37 Unidad III DISTRIBUCIÓN DE PROBABILIDADES ......................................... 61 Unidad IV DISTRIBUCIONES MUESTRALES .................................................. 79 Unidad V INFERENCIA ESTADÍSTICA ........................................................... 107 Unidad VI ANÁLISIS DE REGRESIÓN MÚLTIPLE .......................................... 135 TABLAS ESTADÍSTICAS…………………………………………………. 163 BIBLIOGRAFÍA ................................................................................ 183
ESTADÍSTICA APLICADA
8
ESTADÍSTICA APLICADA
9
DISTRIBUCIÓN TEMÁTICA CLASE
N° TEMA SEMANA
1 Técnicas de conteo, Principio de Multiplicación y Adición, Variaciones, Permutaciones y Combinaciones
1
2 Probabilidades: Definiciones básicas . Experimento, Experimento Aleatorio, Espacio Muestral, Evento o Suceso Aleatorio, Definición de probabilidad de un evento. Propiedades.
2
3 Reglas de Probabilidades de la Unión , suceso complementario. Probabilidad Condicional, Multiplicación de probabilidades, Independencia de eventos.
3
4 Partición de eventos, Probabilidad Total y Teorema de Bayes. 4
5 Probabilidad Total – Teorema de Bayes. PRÁCTICA CALIFICADA Nº1 5
6 Variable aleatoria. Función de Probabilidad. Función de Distribución. Distribución de variable Discreta . Distribución de Variable Continua.
6
7 Esperanza Matemática o valor esperado, Propiedades . Varianza, Propiedades. 7
8 Distribución de probabilidades. Distribuciones Discretas: Distribución Bernoulli, Distribución Binomial. PRÁCTICA CALIFICADA Nº 2
8
9 Distribución de Poisson y Distribución Hipergeométrica. 9
10 EXAMEN PARCIAL 10
11 Distribuciones Continuas: Distribución Normal. Distribución Normal Estandar. Manejo de la Tabla Z . PD: Distribución Muestral: T. Límite Central.
11
12 Distribuciones Muestrales: Distribución de Promedios Muestrales, Teorema del Limite Central PRÁCTICA CALIFICADA Nº 3
12
13 Distribución de Proporciones Muestrales. Distribución Chi-Cuadrado, Manejo de la Tabla χ2 13
ESTADÍSTICA APLICADA
10
CLASE
N° TEMA SEMANA
14 Distribución “t” de Student, Distribución “F” de Snedecor. Manejo de las tablas “t” y “F”. PRÁCTICA CALIFICADA Nº4
14
15 Inferencia Estadística. Estimación de Parámetros y Estimación por Intervalos para la Media y la Variancia Poblacional.
15
16
Prueba de Hipótesis. Tipos de Errores. Error Tipo I yError Tipo II. Prueba de Hipótesis para la Media y Variancia Poblacional PRÁCTICA CALIFICADA Nº 5
16
17 Análisis de Regresión Lineal Múltiple. Coeficiente de Determinación Múltiple. 17
18 Análisis de varianza (ANVA). Repaso 18
19 EXAMEN FINAL 19
ESTADÍSTICA APLICADA
11
UNIDAD I
TEORÍA DE PROBABILIDADES
En la asignatura anterior se ha definido a la ESTADÍSTICA como la ciencia del conocimiento humano, que se ocupa de la colección, representación, análisis y extracción de conclusiones para toda una población, en base a datos proporcionados por muestras aleatorias. La ESTADÍSTICA es una matemática aplicada, que nace de la preocupación de los gobernantes y es base de toma de decisiones en medio de incertidumbre. La Estadística, como un método de toma de decisiones, debe evaluar la confiabilidad y riesgos existentes en todo proceso de estimación. Esto es posible gracias a la teoría de probabilidades, base de la teoría Estadística, que permite generar indicadores de confiabilidad o riesgo. El término probabilidad frecuentemente es relacionado con posibilidad y azar, es decir, probabilidad es la posibilidad de que ocurra algo, por ejemplo, si la probabilidad que un estudiante elegido al azar apruebe Estadística es 0.02, esto significaría que es bien remota o poco posible que apruebe. Para entender bien a la teoría de probabilidades o cálculo de probabilidades es importante tener un buen dominio de las técnicas de conteo o análisis combinatorio, es por ello que comenzare exponiendo este tema. TÉCNICAS DE CONTEO O ANÁLISIS COMBINATORIO PRINCIPIO DE MULTIPLICACIÓN Si un experimento puede ocurrir de “n” maneras diferentes y otro experimento puede ocurrir de “m” maneras diferentes, el número total de maneras diferentes en que pueden ocurrir ambas simultáneamente es:
“nxm”
ESTADÍSTICA APLICADA
12
EJEMPLOS 1. Se lanzan 2 monedas simultáneamente. ¿Cuántos resultados
posibles hay? SOLUCIÓN: La primera moneda tiene 2 posibilidades de caer: cara(c) o sello(s) La segunda moneda tiene 2 posibilidades de caer c o s Entonces por el principio de multiplicación hay, 2x2 = 4, resultados
posibles, es decir: cc, cs, sc y ss. 2. Al lanzar simultáneamente un dado y una moneda. ¿Cuántos
resultados posibles hay? SOLUCIÓN: El dado tiene 6 posibilidades: 1,2,3,4,5 ó 6 La moneda tiene 2 posibilidades: c ó s Entonces por el principio de multiplicación hay, 6x2 = 12, resultados
posibles. COROLARIO Si se ejecutan “n” experimentos con m1 , m2 , m3 , . . . , mn resultados posibles respectivamente, entonces, el número total de resultados posibles es:
EJEMPLO ¿De cuántas maneras diferentes pueden caer si lanzamos 3 monedas? SOLUCIÓN: Como cada moneda puede caer de 2 maneras diferentes, entonces las tres pueden caer de 2x2x2 = 23 = 8 maneras diferentes. Es decir: ccc, ccs, csc, css, scc, scs, ssc y sss
m1 x m2 x m3 x … x mn
ESTADÍSTICA APLICADA
13
PRINCIPIO DE ADICIÓN Si un experimento puede ocurrir de “n” ó “m” maneras diferentes, entonces dicho experimento puede ocurrir de: “n + m” maneras diferentes. EJEMPLO Un estudiante para ir a la UTP puede hacerlo en la combi A, combi B, combi C o a pie. ¿De cuántas maneras diferentes puede asistir a la UTP? SOLUCIÓN: Como puede tomar cualquiera de las 3 combis, tiene 3 posibilidades o puede ir a pie, tiene una posibilidad, entonces por el principio de adición, tiene 3 + 1 = 4 maneras diferentes de ir a la UTP. VARIACIÓN Dado “n” objetos una variación de estos “n” objetos tomados de “r” en “r”, es un arreglo de “r” de estos objetos, en el cual el orden tiene importancia. El número total de variaciones esta dado por:
Donde “n” y “r” son enteros y positivos; r ≤ n Recordar: 1) n! = nx(n-1)!x(n-2)!x(n-3)!x · · · X3x2x1 , ∀ n entero y positivo 2) 0! = 1 EJEMPLO Hallar el número de formas que se puede confeccionar una bandera de franjas de 3 colores, si se tiene tela de 5 colores distintos. SOLUCIÓN: Si consideramos franjas verticales, tenemos: n = 5 y r = 3, como el orden importa, entonces, nos piden:
6012
12345)!35(
!553 ==
−=
xxxxxV
ESTADÍSTICA APLICADA
14
PERMUTACIÓN (Pn) Cuando n=r la variación recibe el nombre de permutación de “n” elementos, es decir:
!!0!
)!(! nnnn
nVP nnn ==
−== , puesto que 0! = 1, entonces:
EJEMPLO ¿De cuántas maneras diferentes pueden sentarse 5 personas en una banca? SOLUCIÓN: Siempre que en un arreglo se use la totalidad de elementos a la vez se trata de una permutación, como en este caso.
P5 = 5! = 120
PERMUTACIONES CIRCULARES (PC) En este tipo de agrupaciones no hay primero, ni último elemento, por encontrarse todos en una línea cerrada. El número de permutaciones de “n” elementos tomados alrededor del círculo es:
EJEMPLO ¿De cuántas maneras diferentes se pueden sentar 5 personas en una meza redonda? SOLUCIÓN:
Pc = (5 – 1)! = 4! = 24 PERMUTACIONES CON REPETICIÓN El número total de permutaciones de “n” elementos repetidos
n1 , n2, n3, . . . ,nk veces es:
ESTADÍSTICA APLICADA
15
Donde: n1 + n2 + n3 + . . . + nk = n EJEMPLO ¿Cuántas palabras diferentes pueden formarse con las letras de la palabra MISSISSIPPI? SOLUCIÓN: Como M=1, I=4, S=4, P=2 y n = 11, entonces:
34650!2!·4!·4!·1
!11112,4,4,1 ==P
COMBINACIÓN Dados “n” objetos, una combinación de los “n” objetos tomados de “r” en “r” es un arreglo de “r” de estos objetos, en el cual el orden no es importante. El número total de combinaciones esta dado por:
Donde “n” y “r” son enteros y positivos; r ≤ n EJEMPLO ¿Cuántos comités de 3 personas pueden formarse de un grupo de 9 personas?
ESTADÍSTICA APLICADA
16
SOLUCIÓN: Como n = 9 y r = 3 y el orden no importa, entonces:
64123!6!6789
!3)!39(!99
3 ==−
=xxx
xxxx
C
El número total de comités de 3 personas que pueden formarse con 9 personas es 64. EJERCICIOS RESUELTOS 1. De entre 5 ejemplares de un texto de Matemática, 3 de
Administración y 2 de Contabilidad; hay que escoger un ejemplar de cada texto. Calcular el número de formas diferentes para hacerlo.
SOLUCIÓN: El texto de Matemática puede escogerse de 5 maneras diferentes. El texto de Administración puede escogerse de 3 maneras
diferentes. El texto de Contabilidad puede escogerse de 2 maneras diferentes. Entonces, por el principio de multiplicación hay, 5x3x2 = 30 formas
diferentes de escoger un ejemplar de cada texto. 2. ¿De cuántas maneras diferentes pueden caer si lanzamos 2 dados
y una moneda? SOLUCIÓN: Por el principio de multiplicación: Cada dado puede caer de 6 formas diferentes y la moneda de 2
formas diferentes; entonces: 6x6x2 = 72. 3.- En el último campeonato mundial de fútbol participaron 32 países
donde los premios fueron medallas de oro, plata y bronce. ¿De cuántas formas pueden distribuirse las medallas?
SOLUCIÓN: Número de países = n = 32 Número de medallas = r= 3 Como el orden es importante, se trata de una variación, entonces
existen
ESTADÍSTICA APLICADA
17
29760303132"29
!29303132!29!3232
3 ==== xxxxxV formas diferentes de
distribuirse las 3 medallas entre los 32 países. Observe que también puede usarse el principio de multiplicación. 4. ¿Cuántos collares diferentes se pueden formar con 7 perlas
diferentes? SOLUCIÓN: Como los collares tienen forma circular, es decir no hay ni primer ni
última perla, se trata de una permutación circular, entonces:
Pc = 3602
7202!6
2)!17(
===−
Observe que: A, B, C, D, E, F, G es igual a: G, F, E, D, C, B, A Por este motivo se ha dividido entre 2. 5. Una sociedad científica está formada por 25 personas y es
necesario elegir al presidente, al vicepresidente, al secretario y al tesorero. ¿De cuántas formas se puede efectuar esta elección si cada miembro de la sociedad puede ocupar sólo un cargo?
SOLUCIÓN: Número de científicos = 25 El presidente puede ser cualquiera de los 25 científicos, el
vicepresidente cualquiera de los 24 restantes, el secretario cualquiera de los 23 restantes y el tesorero cualquiera de los 22 científicos que quedan, entonces por el principio de multiplicación, hay 25x24x23x22 = 303600 formas diferentes de realizar esta elección.
6. Kattia, Dajana y 10 amigos se encuentran reunidos. ¿De cuántas
maneras diferentes pueden sentarse en una banca si las 2 amigas siempre deberán permanecer juntas?
SOLUCIÓN: Una primera forma seria: Katty-Dajana A1 A2 A3 A4 A5 A6 A7 A8 A9
A10 , esto es: P11 = 11!, como las dos amigas pueden intercambiar posiciones se tiene que multiplicar por 2, es decir el resultado seria: 2!x 11! = 79833600.
ESTADÍSTICA APLICADA
18
7. Se encuentran reunidos 16 cachimbos en la UTP de los cuales 10
son varones. Se desea formar un comité de 9 cachimbos. ¿De cuántas maneras se puede formar el comité, si debe haber necesariamente 4 damas en el comité?
SOLUCIÓN: Como hay 6 damas, entonces pueden integrar el comité 4, 5 y hasta
6 damas. 1º Cuando integran 4 damas habrá 5 varones en el comité:
3780105
64 =xCC
2º Cuando integran 5 damas habrá 4 varones en el comité:
1260104
65 =xCC
3º Cuando integran 6 damas habrá 3 varones en el comité:
120103
66 =xCC
El número total de maneras será: 3780 + 1260 + 120 = 5160. Observación: Se trata de combinación puesto que el orden no importa.
8. Los ingleses suelen dar varios nombres a sus hijos. ¿De cuántas
formas se puede dar un nombre a un niño si el número total de nombres es 300 y le dan no más de 3 nombres?
SOLUCIÓN: En este caso el orden importa, entonces se tratará de variaciones,
como le dan no mas de 3 nombres, esto significa que el nombre puede estar compuesto de uno, dos ó tres nombres, esto es:
26820600300
3300
2300
1 =++ VVV
ESTADÍSTICA APLICADA
19
EJERCICIOS PROPUESTOS 1. De entre 10 ejemplares de un texto de Matemática, 8 de
Administración y 5 de Contabilidad; hay que escoger un ejemplar de cada texto. Calcular el número de formas diferentes para hacerlo.
2. ¿De cuántas maneras diferentes pueden caer si lanzamos 2 dados
y 3 monedas? 3. En el último campeonato mundial de fútbol que participó Perú fue el
año 1982, en el cual participaron 24 países donde los premios fueron medallas de oro, plata y bronce. ¿De cuántas formas pueden distribuirse las medallas?
4. ¿Cuántos collares diferentes se pueden formar con 10 perlas
diferentes? 5. Una sociedad científica está formada por 20 personas y es
necesario elegir al presidente, al vicepresidente y al secretario. ¿De cuántas formas se puede efectuar esta elección si cada miembro de la sociedad puede ocupar sólo un cargo?
6. Lizbeth, Rocío, Zaida y 9 amigos se encuentran reunidos. ¿De
cuántas maneras diferentes pueden sentarse en una banca si las 3 amigas siempre deberán permanecer juntas?
7. Se encuentra reunidos 20 cachimbos en la UTP de los cuales 15
son varones. Se desea formar un comité de 8 cachimbos. ¿De cuantas maneras se puede formar el comité, si debe haber necesariamente 4 damas en el comité?
8. Los ingleses suelen dar varios nombres a sus hijos. ¿De cuántas
formas se puede dar un nombre a un niño si el número total de nombres es 50 y le dan no más de 4 nombres?
9. Vanesa, Juanita y 8 amigos se encuentran reunidos. ¿De cuántas
maneras diferentes pueden sentarse en una banca si las 2 amigas nunca deberán permanecer juntas?
10. Yovana, Pamela, Lizeth y 12 amigos se encuentran reunidos. ¿De
cuántas maneras diferentes pueden sentarse en una banca si las 3 amigas nunca deberán permanecer juntas?
ESTADÍSTICA APLICADA
20
11. ¿De cuántas maneras diferentes pueden sentarse los 2 primeros estudiantes que llegan a un aula de 20 carpetas?
12. Un estudiante posee 10 monedas de distintos valores. ¿Cuántas
sumas diferentes de dinero puede formar con las 10 monedas? 13. Sarita tiene seis amigos. ¿De cuántas maneras puede invitar a por
lo menos uno de ellos a cenar? 14. Los números de las placas de los automóviles, están formados por 2
letras y 4 cifras. Hallar el número total de placas que se puedes confeccionar.
15. Un comité estudiantil de 12 personas debe ser formado, entre 100
cachimbos(60 hombres y 40 mujeres), 80 estudiantes intermedios(50 hombres y 30 mujeres), 70 estudiantes avanzados(46 hombres y 24 mujeres) y 40 graduados(28 hombres y 12 mujeres). Encuentre el número total de diferentes comités que se pueden formar bajo cada una de los siguientes requerimientos:
a) No se imponen restricciones a la formación del comité. b) Siete estudiantes deben ser hombres y 5 mujeres. c) El comité debe contener el mismo número de estudiantes de
cada clase. d) El comité debe contener 2 hombres y una mujer de cada clase. e) El presidente del comité debe ser graduado y hombre. 16. En la siguiente figura se representa el plano de una ciudad : Un caminante desea trasladarse del punto A hasta el punto B por el
camino más corto, es decir, desplazarse todo el tiempo o bien de izquierda a derecha, o bien de abajo hacia arriba . ¿Por cuántos caminos puede llegar desde A hasta B?.
B A
ESTADÍSTICA APLICADA
21
17. Una contraseña para acceder a una computadora consiste de 6 caracteres que pueden ser letras (26) o números (10).
a) ¿Cuántas contraseñas distintas se pueden formar? b) ¿Cuántas contraseñas distintas se pueden formar conteniendo
sólo números? c) ¿Cuántas contraseñas distintas se pueden formar si deben
tener por lo menos una letra?. 18. Ocho atletas compiten en la final olímpica de los 110 metros con
vallas. Asumiendo que ellos cruzan la meta en distintos instantes. ¿Cuántas maneras distintas hay para entregar las medallas de oro, de plata y de bronce?.
19. Una señora tiene 8 amigas y desea invitar a 5 de ellas a una fiesta.
¿De cuántas maneras puede hacerlo si dos de ellas están enojadas entre sí y no pueden ser invitadas juntas?.
20. Suponga que un artículo es comercializado por dos empresas A y B.
La empresa A tiene 5 tiendas y la empresa B tiene 8 tiendas, a través de las cuales se vende dicho artículo. ¿De cuántas maneras diferentes puede un cliente comprar un artículo?.
21. Un grupo de 7 personas deben participar en una serie de charlas a
llevarse a cabo en dos días sucesivos. En el primer día deben participar 3 personas, y en el segundo día las 4 personas restantes. ¿ De cuántas maneras diferentes se puede organizar las charlas del primer día?.
22. En el siguiente diagrama A, B, C, D, E y F denotan islas y las líneas
de unión son puentes. Un hombre empieza en A y camina de isla en isla, se detiene para almorzar cuando no puede continuar caminando sin tener que cruzar el mismo puente dos veces. Hallar el número de maneras de cómo puede hacer su recorrido antes de ir a almorzar.
ESTADÍSTICA APLICADA
22
PROBABILIDADES EXPERIMENTO Un experimento es cualquier proceso de ensayo y observación. EXPERIMENTO ALEATORIO Es cualquier experimento real o hipotético que pueda dar lugar a varios resultados sin que sea posible anunciar con certeza cuál de estos resultados va a ser observado. A estos experimentos también se les conoce como no determinísticos. EJEMPLOS 1. Lanzamiento de una moneda balanceada. En este caso los resultados posibles serán: cara ( c ) o sello ( s ). 2. Lanzamiento de un dado no cargado (insesgado). En este caso los resultados posibles serán: 1, 2, 3, 4, 5 ó 6. CARACTERÍSTICAS DEL EXPERIMENTO ALEATORIO (O ESTOCÁSTICO) 1. Se tiene varios resultados posibles. 2. Estos resultados tienen cierta incertidumbre de aparecer, es decir,
no podemos afirmar con certeza cual de los resultados va a ser observado.
ESPACIO MUESTRAL ( S ) Es el conjunto de todos los resultados posibles de un experimento aleatorio. Para los ejemplos anteriores, tenemos: S = ⎨c , s ⎬ ⇒ n(S) = 2 y S = ⎨1, 2, 3, 4, 5, 6 ⎬ ⇒ n(S) = 6 EVENTO ( E ) Es un subconjunto del espacio muestral. EJEMPLO Si se lanza un dado, un evento seria que salgan números pares, es decir:
E = ⎨2, 4, 6 ⎬ ⇒ n(E) = 3
ESTADÍSTICA APLICADA
23
PROBABILIDAD La probabilidad de un evento es la razón entre el número de casos favorables y el número total de casos posibles; es decir: número de elementos del evento entre número de elementos del espacio muestral. Es decir:
EJEMPLOS 1. ¿Cuál es la probabilidad de que salga cara al lanzar una moneda? SOLUCIÓN:
P = 21
)()(=
SnEn
2. ¿Cuál es la probabilidad de que salga el 2 al lanzar un dado? SOLUCIÓN:
P = 61
)()(=
SnEn
PROPIEDADES Sean los eventos A , B Y C , entonces: 1. 0 ≤ P(A) ≤ 1 2. P(S) = 1 3. P(∅) = 0 4. P(AUB) = P(A) + P(B) Si: A ∩ B = ∅ 5. P(AUB) = P(A) + P(B) – P(A ∩ B) Si: A ∩ B ≠ ∅ 6. P(AUBUC) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C)
+ P(A ∩ B ∩ C) 7. P(A′)= 1 – P(A)
ESTADÍSTICA APLICADA
24
EJERCICIOS RESUELTOS 1. Se lanzan dos monedas. ¿Cuál es la probabilidad de que ambas
salgan cara?
SOLUCIÓN: Como S = {(C,C), (C,S), (S,C), (S,S) } y hay un solo caso
favorable: ( C,C), entonces: P = 41
2. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que
la suma de los puntos obtenidos sea igual a 10.
SOLUCIÓN: Por el principio de multiplicación: n(S) = 6x6 = 62 = 36 y sea el evento, suma de puntos igual a 10, es decir, (4,6), (6,4) y (5,5) entonces: n(E) = 3 Luego:
p = 121
363=
3. Se tiene una baraja de 52 cartas. ¿Cuál es la probabilidad de que la
primera que se saque sea de espadas?
SOLUCIÓN: Como n(s) = 52 y hay 13 espadas, es decir: n(E) = 13, entonces:
P = 5213
4. El vicerrector académico informa que de 200 desaprobados, 30 son
de Matemática, 50 de Estadística y 10 de Métodos Cuantitativos. ¿Cuál es la probabilidad de que un estudiante elegido azar desapruebe Estadística?
SOLUCIÓN: En este caso: n(S) = 200 y hay 50 casos favorables, entonces:
P = 41
20050
=
ESTADÍSTICA APLICADA
25
5. Una urna contiene bolillas numeradas del 1 al 5. Se sacan
sucesivamente al azar las 5 bolillas (sin reposición). Hallar la probabilidad de que juntando los números de cada bolilla según el orden de extracción resulte el número 53412.
SOLUCIÓN: El espacio muestral es: n(S) = 5! = 120 y hay un solo caso favorable, entonces:
P = 120
1!5
1=
6. Una urna contiene 8 bolillas rojas y 10 bolillas verdes. Se sacan al
azar y de una vez 6 bolillas, ¿cuál es la probabilidad de que todas ellas sean verdes?
SOLUCIÓN: Como el orden no importa se trata de combinaciones, entonces:
P = 011312217,04425
186
106 ==
CC
7. Se tiene 5 pares de zapatos mezclados y cada par es distinto de los
demás. Si se eligen 2 zapatos al azar, hallar la probabilidad de que correspondan a un mismo par.
SOLUCIÓN: Como el orden no importa, se trata de una combinación, es decir: n(S) = 4510
2 =C y hay 5 casos favorables, entonces:
p = 91
455=
8. Los eventos A y B son mutuamente excluyentes, si P(A) = 0.25 y
P(B) = 0.15. ¿Cuál es la probabilidad de que ocurra A o B? SOLUCIÓN: Sabemos que P(AUB) = P(A) + P(B) Si: A ∩ B = ∅ , entonces: P(AUB) = 0.25 + 0.15 = 0.40.
ESTADÍSTICA APLICADA
26
EJERCICIOS PROPUESTOS 1. Se lanzan tres monedas. ¿Cuál es la probabilidad de que todas
salgan sello? 2. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que
la suma de los puntos obtenidos sea igual a 8. 3. Se tiene una baraja de 52 cartas. ¿Cuál es la probabilidad de que la
primera que se saque sea el as de corazones? 4. El vice-rector académico informa que de 500 desaprobados, 80 son
de Matemática, 125 de Estadística y 30 de Métodos Cuantitativos. ¿Cuál es la probabilidad de que un estudiante elegido azar desapruebe Matemática?
5. Una urna contiene 10 bolillas numeradas del 0 al 9. Se sacan sucesivamente al azar 5 bolillas (sin reposición). Hallar la probabilidad de que juntando los números de cada bolilla según el orden de extracción resulte el número 20957.
6. Una urna contiene 10 bolillas negras y 12 bolillas rojas. Se sacan al
azar y de una vez 5 bolillas, ¿cuál es la probabilidad de que todas ellas sean negras?
7. Se tiene 8 pares de zapatos mezclados y cada par es distinto de los
demás. Si se eligen 2 zapatos al azar, hallar la probabilidad de que correspondan a un mismo par.
8. Los eventos A y B son mutuamente excluyentes, si P(A) = 0.40 y
P(B) = 0.35. ¿Cuál es la probabilidad de que no ocurra ni A ni B? 9. Se desea entrevistar a un grupo de empleados de la UTP con
respecto a un plan de pensiones, se efectuaran entrevistas detalladas a cada uno de los empleados seleccionados en una nuestra aleatoria. Estos se clasificaron como sigue:
CLASIFICACIÓN Nº DE EMPLEADOS
Vigilantes 16 Mantenimiento 14 Docentes 50 Secretarias 20
ESTADÍSTICA APLICADA
27
¿Cuál es la probabilidad de que la primera persona seleccionada: a) sea docente o secretaria? b) sea vigilante o de mantenimiento? c) no sea vigilante?
10. El directorio de la empresa MACHI SAC está formado por seis
hombres y tres mujeres. Se desea seleccionar un comité de tres miembros, en forma aleatoria, para que recomienden a un nuevo presidente de la empresa. a) ¿Cuál es la probabilidad de que sean mujeres los tres
miembros del comité? b) ¿Cuál es la probabilidad de que sean hombres los tres
miembros del comité?
11. Se lanzan cuatro monedas. ¿Cuál es la probabilidad de que todas salgan cara?
12. Se lanzan cuatro monedas. ¿Cuál es la probabilidad de que salgan
dos sellos? 13. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que
la suma de los puntos obtenidos sea a lo más 10. 14. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que
la suma de los puntos obtenidos sea por lo menos 4. 15. Una urna contiene 8 bolillas numeradas del 1 al 8. Se sacan
sucesivamente al azar 4 bolillas. Hallar la probabilidad de que juntando los números, de cada una, en el orden de extracción resulte el número 7656.
16. Una urna contiene 6 bolillas blancas y 10 bolillas rojas. Se sacan al
azar 7 bolillas de una vez, hallar la probabilidad de que todas sean rojas.
17. En una carrera de autos participan los competidores A, B, C y D. Se
sabe que uno de ellos necesariamente debe de ganar. Si la probabilidad de que gane A es el doble de la de B, la de B es la mitad de C y la de D es el triple de A, ¿Cuál es la probabilidad que gane D?.
ESTADÍSTICA APLICADA
28
18. De 100 estudiantes, 48 llevan Matemática, 32 Estadística y 40 Administración; 16 Matemática y Estadística ,13 Administración y Estadística , 20 Matemática y Administración, y 22 ninguno de los 3 cursos . Si se elige un estudiante al azar, ¿Cuál es la probabilidad de que lleve?: a) Solo Estadística. b) Solamente Matemática o Administración. c) Solamente Estadística y Administración.
19. Se tienen 6 libros, de los cuales uno es de economía y otro es de
estadística. Si los libros se ordenan aleatoriamente de izquierda a derecha, hallar la probabilidad que: a) Los libros de economía y estadística estén juntos. b) Uno de los libros (economía y estadística) esté al inicio
(primera posición desde la izquierda) o que los libros de economía y estadística no estén juntos.
20. En una reunión de 30 personas, ¿cuál es la probabilidad de que, por
lo menos dos de ellas, cumplan años el mismo día? 21. Suponga que en una clase de 50 estudiantes, 30 alumnos opinan
que el profesor es claro, 8 alumnos opinan que el material bibliográfico es deficiente, 35 alumnos opinan que el sistema de evaluación es exigente, 5 alumnos opinan que el profesor es claro y que el material bibliográfico es deficiente, 22 alumnos opinan que el profesor es claro y que el sistema de evaluación es exigente, 3 alumnos opinan que el material bibliográfico es deficiente y que el sistema de evaluación es exigente, y 5 alumnos opinan que el profesor no es claro, que el material bibliográfico no es deficiente y que el sistema de evaluación no es exigente. Si se elige al azar un alumno, hallar la probabilidad que: a) El alumno opine que el sistema de evaluación es exigente o
que el material bibliográfico es deficiente. b) El alumno opine que el sistema de evaluación es exigente o
que: el profesor es claro y el material bibliográfico es deficiente. 22. Una empresa tiene dos maneras A y B de presentar un nuevo
producto al mercado. Si presenta el producto de la manera A la probabilidad de que el producto sea exitoso es 0.44 y si lo presenta de la manera B la probabilidad de éxito se reduce a 0.29. La probabilidad de que el producto fracase con ambas maneras de presentación es 0.37. ¿Cuál es la probabilidad de que el producto sea exitoso con ambas formas de presentación?
ESTADÍSTICA APLICADA
29
23. Se desea hallar la probabilidad de sacar por lo menos una vez el 6 al lanzar un dado 4 veces.
24. Se desea hallar la probabilidad de sacar dos seis por lo menos una
vez al lanzar dos dados 24 veces.
25. Se tiene una baraja de 40 cartas, donde hay 4 ases. Se reparten éstas entre 4 personas, ¿qué probabilidad hay de que a cada una le toque un as?
26. En una reunión de 30 personas,¿Cuál es la probabilidad de que, por
lo menos dos de ellas, cumplan años el mismo día?
PROBABILIDAD CONDICIONAL Si A y B son dos eventos de un espacio muestral S; entonces, la probabilidad condicional de que ocurra el evento A dado que el evento B ya ocurrió esta dado por:
∀ P(B) ≠ 0 También se cumple que:
∀ P(A) ≠ 0 MULTIPLICACIÓN DE PROBABILIDADES Si A, B y C son tres eventos de un espacio muestral S; entonces, se cumple que:
1. P(A∩B) = P(A) P(B/A) P(A∩B) = P(B) P(A/B)
ESTADÍSTICA APLICADA
30
2. P(A∩B∩C) = P(A)P(B/A)P(C/A∩B) P(A∩B∩C) = P(B)P(A/B)P(C/A∩B) P(A∩B∩C) = P(C)P(A/C)P(B/A∩C) P(A∩B∩C) = P(A)P(C/A)P(B/A∩C) P(A∩B∩C) = P(B)P(C/B)P(A/B∩C) P(A∩B∩C) = P(C)P(B/C)P(A/B∩C) P(A∩B∩C) = P(A∩B)P(C/A∩B) P(A∩B∩C) = P(A∩C)P(B/A∩C) P(A∩B∩C) = P(B∩C)P(A/B∩C)
INDEPENDENCIA DE EVENTOS INDEPENDENCIA DE DOS EVENTOS Dos eventos A y B son independientes si:
Dos eventos son independientes si la ocurrencia de uno de ellos no afecta la ocurrencia del otro evento. Es decir, también se cumplen que: P(A/B) = P(A) y P(B/A) = P(B)
INDEPENDENCIA DE TRES EVENTOS Tres eventos A, B y C de un espacio muestral S son mutuamente independientes si cumplen las siguientes condiciones: 1. P(A ∩ B) = P(A)P(B) 2. P(A ∩ C) = P(A)P(C) 3. P(B ∩ C) = P(B)P(C) 4. P(A∩B∩C) = P(A)P(B)P(C)
PARTICIÓN DE EVENTOS Los eventos A1 , A2 , A3 , · · · , AK forman una partición del espacio muestral S, si cumplen las siguientes condiciones: 1. Ai ≠ ∅ ∀ i = 1, 2, 3, · · · , k 2. Ai ∩ Aj = ∅ ∀ i ≠ j , i , j = 1, 2, 3, · · · , k 3. A1 ∪ A2 ∪ A3 ∪ · · · ∪ AK = S
ESTADÍSTICA APLICADA
31
TEOREMA DE PROBABILIDAD TOTAL Sean los eventos A1 , A2 , A3 , · · · , AK , los cuales forman una partición del espacio muestral S, y sea B otro evento cualquiera de S; entonces, se cumple que:
TEOREMA DE BAYES Sean los eventos A1 , A2 , A3 , · · · , AK , los cuales forman una partición del espacio muestral S, y sea B otro evento cualquiera de S; entonces, se cumple que:
EJERCICIOS RESUELTOS 1. Suponga que P(A) = 0.35 y P(B/A) = 0.25 . Hallar P(A ∩ B). SOLUCIÓN: Sabemos que P(A∩B) = P(A) P(B/A) entonces, P(A∩B) = (0.35)(0.25) = 0.0875 2. En un lote de 15 artículos se tiene 4 defectuosos. Si se eligen al
azar y sin reemplazo tres artículos, hallar la probabilidad que los 3 artículos elegidos sean defectuosos.
SOLUCIÓN: Sea Di = {el i-ésimo artículo es defectuoso}, entonces: P(D1∩ D2∩D3) = P(D1)P(D2)P(D3)
P(D1∩ D2∩D3) = 00879121.04554)
132)(
143)(
154( ==
ESTADÍSTICA APLICADA
32
3. Una urna contiene 10 bolillas rojas, 8 negras y 12 azules. Si se eligen al azar y sin reemplazo 3 bolillas, hallar la probabilidad que las 3 bolillas sean negras.
SOLUCIÓN: Sea Ni = {la i-ésimo bolilla es negra}, entonces: P(N1∩ N2∩N3) = P(N1)P(N2)P(N3)
P(N1∩ N2∩N3) = 013793103.0145
2)286)(
297)(
308( ==
4. En una urna hay 15 bolillas numeradas del 1 al 15. Si se van
sacando una a una al azar sin reposición, ¿cuál es la probabilidad de que la bolilla número 5 salga precisamente en la quinta extracción?
SOLUCIÓN: La probabilidad de que la bolilla Nº 5 no salga en la primera vez es
14/15; la probabilidad de que tampoco salga la segunda vez es 13/14; tampoco la tercera vez es 12/13; tampoco la cuarta vez es 11/12 y la probabilidad de que si salga en la quinta vez es 1/11. Luego la probabilidad buscada es:
P = 066666666.0151
111·
1211·
1312·
1413·
1514
==
5. Se lanza una moneda 3 veces. Sea el evento A de que caiga cara
en cada uno de los dos primeros lanzamientos, B es el evento de que caiga sello en el tercer lanzamiento y C de que caigan exactamente dos sellos en los tres lanzamientos, compruebe que los eventos A y B son independientes mientras que B y C son dependientes.
SOLUCIÓN: El espacio muestral para este experimento seria: S = {ccc, ccs, csc, css, scc, scs, ssc, sss} De acuerdo al enunciado los eventos serian: A = {ccc, ccs } B = {ccs, css, scs, sss} C = {css, scs, ssc}
ESTADÍSTICA APLICADA
33
Para que A y B sean independientes debe cumplirse: P(A∩B) = P(A)P(B) Como A∩B = {ccs}, entonces: P(A∩B) = 1/8 ; P(A) = 2/8 = ¼ y
P(B) = 4/8 = ½ Luego: P(A∩B) = P(A)P(B)
21·
41
81= ⇒
81
81= es decir A y B son independientes.
Para que B y C sean dependientes debe cumplirse:
P(B∩C) ≠ P(B)P(C) Como B∩C = {css, scs}, entonces: P(B∩C) = 1/4 ; P(B) = 1/4 y P(C) = 3/8 Luego; como: P(B∩C) ≠ P(B)P(C)
83·
21
41≠ ⇒
163
41≠ es decir B y C son dependientes.
6. El equipo de la UTP juega el 70% de sus partidos en la noche, y el
30% durante el día. El equipo gana el 50% de sus partidos nocturnos y el 90% de los diurnos. De acuerdo con un diario de hoy día, la UTP ganó ayer. ¿Cuál es la probabilidad de que el partido se haya jugado en la noche?. SOLUCIÓN: De acuerdo a los datos se tiene que: P(juegue de noche) = 0.70 P(juegue de día) = 0.30 P(gane/juegue de noche) = 0.50 P(gane/juegue de día) = 0.90 Entonces por el teorema de Bayes: P(juegue de noche/gane) =
)/()·()·/()·()/()·(
ajueguedediganePajueguedediPchejueguedenoganePchejueguedenoPchejueguedenoganePchejueguedenoP
ESTADÍSTICA APLICADA
34
Reemplazando:
P(juegue de noche/gane) = 564516129.062.035.0
90.0·30.050.0·70.050.0·70.0
==+
EJERCICIOS PROPUESTOS 1. Suponga que P(A) = 0.50 y P(B/A) = 0.40 . Hallar P(A ∩ B). 2. En un lote de 18 artículos se tiene 5 defectuosos. Si se eligen al
azar y sin reemplazo tres artículos, hallar la probabilidad que los 3 artículos elegidos no sean defectuosos.
3. Una urna contiene 6 bolillas rojas, 8 negras y 10 azules. Si se eligen
al azar y sin reemplazo 3 bolillas, hallar la probabilidad que las 3 bolillas sean azules.
4. En una urna hay 25 bolillas numeradas del 1 al 25. Si se van
sacando una a una al azar sin reposición, ¿cuál es la probabilidad de que la bolilla número 10 salga precisamente en la décima extracción?
5. Se lanza una moneda 3 veces. Sea el evento A de que caiga sello
en cada uno de los dos primeros lanzamientos, B es el evento de que caiga cara en el tercer lanzamiento y C de que caigan exactamente dos caras en los tres lanzamientos, analice si los eventos A y B y B y C son independientes y/o dependientes.
6. El equipo de la “U” juega el 20% de sus partidos en la noche, y el
80% durante el día. El equipo gana el 60% de sus partidos nocturnos y el 90% de los diurnos. De acuerdo con un diario de hoy día, la “U” ganó ayer. ¿Cuál es la probabilidad de que el partido se haya jugado de día?.
ESTADÍSTICA APLICADA
35
7. El profesor MACHI esta enseñando Estadística en la UTP durante varios años. Se sabe que el 80% de los estudiantes terminaron los ejercicios propuestos por el profesor. Determino que de los estudiantes que cumplen con sus trabajos , 90% aprueban el curso. De aquellos estudiantes que no lo hacen así, 60% será aprobado. Juanita tomó Estadística durante el último semestre con el profesor MACHI y aprobó el curso. ¿Cuál es la probabilidad de que si haya hecho sus trabajos?
8. El vice-rector de investigación de la UTP necesita rentar
automóviles en tres agencias: el 60% de la agencia A, el 30% de la agencia B y el 10% de la agencia C. Si el 9% de los vehículos de la agencia A necesitan afinación, el 20% de las unidades de la agencia B necesitan también afinación y el 6% de los autos de la agencia C necesitan asimismo afinación. ¿Cuál es la probabilidad de que un automóvil rentado al vice-rector de investigación de la UTP necesitará afinación?
9. Suponga que en un lote de 20 artículos se tiene 5 defectuosos. Si
se eligen al azar y sin reemplazo 3 artículos, hallar la probabilidad que:
a) Los 3 artículos elegidos no sean defectuosos. b) El segundo articulo elegido sea defectuoso y que el tercero no
sea defectuoso. c) El tercer artículo elegido sea defectuoso, si el primero no fue
defectuoso.
10. Suponga que 3 máquinas A, B y C producen respectivamente, el 50%, 30% y 20% del número total de artículos producidos por una empresa, y que los porcentajes de unidades defectuosas producidas por estas máquinas son: 3%, 4% y 5% respectivamente. Si se elige un artículo al azar y es no defectuoso, hallar la probabilidad que haya sido producido por la máquina A.
ESTADÍSTICA APLICADA
37
UNIDAD II
VARIABLES ALEATORIAS En el análisis estadístico de una variable casi siempre se desea conocer el valor que tomaría en el futuro, este valor no siempre se puede predecir con certeza; por ejemplo al rector de la UTP le interesa saber el número de estudiantes que abandonan la universidad por ciclo o semestre, en estos casos, el análisis resulta mas sencillo si se establece cual es el comportamiento probabilístico de dicha variable para así poder establecer una metodología para estimar su comportamiento futuro. VARIABLE ALEATORIA Una variable aleatoria es una función que tiene como dominio a un espacio muestral y como rango a un subconjunto de los números reales. Una variable aleatoria es una función “X” que le asigna un número real a cada uno de los elementos del espacio muestral. VARIABLE ALEATORIA DISCRETA Cuando el número de posibles valores de la variable es un número finito o infinito numerable. FUNCIÓN DE PROBABILIDAD Sea “X” una variable aleatoria discreta, la función f(x) es llamada función de probabilidad si cumple las siguientes condiciones: 1. f(xi) = P(X= xi) ≥ 0 2. 0 ≤ f(xi) ≤ 1 3. ∑ =1)( ixf EJEMPLO Sea el experimento aleatorio que consiste en lanzar una moneda 2 veces. Analice si la variable aleatoria número de caras constituye una función de probabilidad. SOLUCIÓN: Sea el espacio muestral del experimento:
S = {cc, cs, sc, ss}
ESTADÍSTICA APLICADA
38
Sea la variable aleatoria: x = número de caras Entonces x = 0, 1 y 2 X1 = 0, x2 = 1 y x3 = 2 f(x1) = P(X=x1) = P(X=0) = P(ss) = ¼ f(x2) = P(X=x2) = P(X=1) = P(cs) + P(sc) = 1/4 +1/4 = 2/4 = ½ f(x3) = P(X=x3) = P(X=2) = P(cc) = 1/4 Como los f(xi) están comprendidos entre 0 y 1; y además:
∑=
==++
=++=++=3
1321 1
44
4121
41
42
41)()()()(
ii xfxfxfxf
Entonces f(xi) si es una función de probabilidad; esto es:
F(x)⎩⎨⎧
==
1;22/10;4/1
xyx
Gráfica de f(x):
FUNCIÓN DE PROBABILIDAD ACUMULATIVA Sea “x” una variable aleatoria discreta con función de probabilidad f(x); luego, la función de probabilidad acumulativa o función de distribución de la variable aleatoria “x” es:
F(x) = P(X ≤ xi) = ∑ )( ixf
ESTADÍSTICA APLICADA
39
PROPIEDADES 1. F(X) = 0 ∀ x < m, donde m es el menor valor de los xi 2. F(X) = 1 ∀ x ≥ M, donde M es el mayor valor de los xi 3. 0 ≤ F(X) ≤ 1 4. F(X) es una función creciente Del ejemplo anterior:
F(x)=
⎪⎪⎩
⎪⎪⎨
⎧
≥<≤<≤
<
2;121;4/310;4/1
0;0
xxx
x
Gráfica de F(x):
ESPERANZA MATEMÁTICA Sea “x” una variable aleatoria discreta con función de probabilidad f(x); entonces, la Esperanza Matemática o valor esperado o media de la variable aleatoria “x” es: PROPIEDADES 1. E(c) = 0 ; ∀ c = constante 2. E(cx) = cE(x) ; ∀ c = constante 3. E(cx + m ) = cE(x) + m ; ∀ c y m = constantes 4. E(ax + by) = aE(x) + bE(y) ; ∀ a y b = constantes
E(x) = ∑ )( ii xfx
ESTADÍSTICA APLICADA
40
Del ejemplo anterior: E(X) =
144
4220
41·2
42·1
41·0)()()()( 332211
3
1==
++=++=++=∑
=
xfxxfxxfxxfxi
ii
VARIANCIA O VARIANZA Sea “x” una variable aleatoria discreta con función de probabilidad f(x); entonces, la Variancia o Varianza de la variable aleatoria “x” es:
Es decir: También:
PROPIEDADES 1. V(c) = 0 ; ∀ c = constante 2. V(cx) = c2V(x) ; ∀ c = constante 3. V(ax + b) = a2V(x) ; ∀ a y b = constantes 4. Si “x” e “y” son variables aleatorias independientes V(ax + by) = a2V(x) + b2V(y) ∀ a y b = constantes Del ejemplo anterior:
V(X) = ∑ − )())(( 2ii xfxEx ; se sabe que E(X) = 1
V(X) = (x1 – E(X))2f(x1) + (x2 – E(X))2f(x2) + (x3 – E(X))2f(x3)
V(X) = (0 – 1)2 · 41 + ( 1 – 1 )2 ·
42 + ( 2 – 1 )2 ·
41 =
21
Var(X) = V(X) = 2xσ = E[xi –E(X)]2
V(X) = ∑ − )())(( 2ii xfxEx
V(X)= E(x2) – [E(x)]2
ESTADÍSTICA APLICADA
41
También:
V(X) = E(x2) – [E(x)]2 E(X2) =
23
46
41·2
42·1
41·0)()()()( 222
3232
221
21
3
1
2 ==++=++=∑=
xfxxfxxfxxfx ii
i
Entonces: V(X) = 211
231
23 2 =−=−
EJERCICIOS RESUELTOS 1. Se lanzan 3 monedas y se desea analizar la variable aleatoria
número de sellos. Obtenga su función de probabilidad y su grafica.
SOLUCIÓN: El espacio muestral S para este caso es: S = {ccc, ccs, csc, css, scc, scs, ssc, sss} La variable aleatoria: x = número de sellos X = 0, 1, 2, 3 x1 = 0 ; x2 = 1 ; x3 = 2 ; x4 = 3
f(x1) = P(X = x1) = P(X = 0) = P(ccc) = 81
f(x2) = P(X = x2) = P(X = 1) = P(ccs) + P(csc) + P(scc) = 83
f(x3) = P(X = x3) = P(X = 2) = P(css) + P(scs) + P(ssc) = 83
f(x4) = P(X = x4) = P(X = 3) = P(sss) = 81
Se observa que cumple las condiciones de una función de
probabilidad.
f(x) =⎩⎨⎧
==
2,1;8/33,0;8/1
xx
ESTADÍSTICA APLICADA
42
Gráfica de f(x):
2. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una
bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Encuentre su función de probabilidad.
SOLUCIÓN: Sea la variable aleatoria: x = número de divisores del número
obtenido. El espacio muestral S consta de cualquiera de las 12 bolillas, es
decir: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Como la bolilla 1 tiene 1 divisor, la bolilla 2 tiene 2 divisores, la
bolilla 3 tiene 2 divisores, la bolilla 4 tiene 3 divisores, la bolilla 5 tiene 2 divisores, la bolilla 6 tiene 4 divisores, la bolilla 7 tiene 2 divisores, la bolilla 8 tiene 4 divisores, la bolilla 9 tiene 3 divisores, la bolilla 10 tiene 4 divisores, la bolilla 11 tiene 2 divisores y la bolilla 12 tiene 6 divisores; entonces:
X = 1, 2, 3, 4, 6
f(1) = 1/12 , f(2) = 5/12 , f(3) = 2/12 , f(4) = 3/12 , f(6) = 1/12
⎪⎪⎩
⎪⎪⎨
⎧
====
=
4;4/13;6/1
2;12/56,1;12/1
)(
xxxx
xf
ESTADÍSTICA APLICADA
43
3. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una
bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Encuentre su función de probabilidad acumulativa y su gráfica.
SOLUCIÓN: Del ejercicio anterior ya conocemos su función de probabilidad,
entonces:
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
≥<≤<≤<≤<≤
<
=
6;164;12/11
43;12/832;12/6
21;12/11;0
)(
xx
xx
xx
xF
Gráfica de F(x):
4. Se lanza una moneda 3 veces y se desea analizar la variable
aleatoria número de sellos. Calcule e interprete su esperanza matemática y varianza.
ESTADÍSTICA APLICADA
44
SOLUCIÓN: Del ejercicio 1 su función de probabilidad es:
⎩⎨⎧
==
=2,1;8/33,0;8/1
)(xx
xf
Entonces: E(x) = ∑ )( ii xfx
E(x)=
23
812
83630
81·3
83·2
83·1
81·0)()()()()( 44332211
4
1==
+++=+++=+++=∑
=
xfxxfxxfxxfxxfxi
ii
Si este experimento lo repetimos varias veces, esperamos que en promedio el número de sellos sea 3/2. Cálculo de la varianza: V(X) = E(x2) – [E(x)]2 E(X2)=
3824
81·3
83·2
83·1
81·0)()()()()( 2222
4243
232
221
21
4
1
2 ==+++=+++=∑=
xfxxfxxfxxfxxfx ii
i
Entonces: V(x) = 3 – ( 3/2 )2 = 3 - 49 =
43
Este valor nos indica que hay poca dispersión cuando se analiza el número de sellos al lanzar una moneda 3 veces.
5. Sea “x” una variable aleatoria discreta con función de
probabilidad: f(x) = c(x + 2) ; x = 1, 2, 3, 4, 5 Hallar el valor de “c”. SOLUCIÓN: Como f(x) es una función de probabilidad, entonces se cumple que: ∑ =1)( ixf f(1) + f(2) + f(3) + f(4) + f(5) = 1 c(3) + c(4) + c(5) + c(6) + c(7) = 1
25c = 1 ⇒ c = 251
ESTADÍSTICA APLICADA
45
EJERCICIOS PROPUESTOS 1. Se lanzan 4 monedas y se desea analizar la variable aleatoria
número de caras. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza.
2. Una urna contiene 15 bolillas numeradas del 1 al 15. Se saca una
bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza.
3. Se lanzan 3 monedas y se desea analizar la variable aleatoria
número de sellos. Obtenga su función de probabilidad acumulativa y su gráfica. Además halle a su coeficiente de variabilidad.
4. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una
bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Calcule e interprete su esperanza matemática, varianza y coeficiente de variabilidad.
5. Se lanzan dos dados y se desea estudiar la variable aleatoria
suma de resultados. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza.
6. Sea “x” una variable aleatoria discreta con función de
probabilidad: f(x) = cx ; x = 1, 2, 3, 4, 5 Hallar el valor de “c”. 7. Sea “x” una variable aleatoria discreta con función de
probabilidad: f(x) = cx2 ; x = 1, 2, 3, 4, 5 Hallar el valor de “c”. 8. Sea “x” una variable aleatoria discreta con función de
probabilidad: f(x) = c · 2x ; x = 1, 2, 3, 4 Hallar el valor de “c”. 9. Se lanzan dos dados y se desea estudiar la variable aleatoria “x”
suma de resultados. Si además se cumple que: z = 2x + 5. Calcule E(z) y V(z).
ESTADÍSTICA APLICADA
46
10. Dado que la variable aleatoria discreta “x” tiene por función de probabilidad acumulativa:
F(x)=
⎪⎪⎪⎪⎪
⎩
⎪⎪⎪⎪⎪
⎨
⎧
≥
<≤
<≤
<≤
<
10;1
106;65
64;21
41;31
1;0
x
x
x
x
x
Hallar: a) P(2< x ≤ 6); b) P(x = 4); c) Su función de probabilidad. 11. Dado que la variable aleatoria discreta “x” tiene por función de
probabilidad acumulativa:
F(x)=
⎪⎪⎪⎪⎪
⎩
⎪⎪⎪⎪⎪
⎨
⎧
≥
<≤
<≤
<≤−
−<
5;1
53;43
31;21
11;41
1;0
x
x
x
x
x
Hallar: a) P(x ≤ 3); b) P(x = 3); c) P(x < 3); d) P(x ≥ 1); e) P(-0.4< x < 4); f) P(x = 5). 12. Una urna contiene cuatro bolillas con los números 1, 2, 3 y 4,
respectivamente. Si se toma dos bolas de la urna sin sustitución y se define la variable aleatoria “x” como la suma de los números de las dos bolillas extraídas, determine:
a) La función de probabilidad de “x” y su gráfica. b) La función de distribución de “x” y su gráfica.
ESTADÍSTICA APLICADA
47
13. Una moneda está cargada y de este modo hay tres veces mayor probabilidad de que caigan caras que sellos. En tres lanzamientos independientes de la moneda determine:
a) La distribución de probabilidad de x, el número total de caras; b) La probabilidad de que cuanto mucho caigan dos caras. 14. Una caja contiene 10 artículos, de los cuales 2 son defectuosos.
Si se eligen al azar y sin reemplazo 3 artículos y se define la variable aleatoria número de artículos buenos elegidos, hallar f(x) y F(x) y sus gráficas, además calcule e interprete a su esperanza matemática y varianza.
15. Suponga que se han recibido 3 cajas (A, B y C) con 4 artículos
cada una. La caja A contiene un artículo defectuoso, la caja B contiene 2 artículos defectuosos y en la caja C no hay artículos defectuosos. Si se elige al azar un artículo de cada caja y se define la variable aleatoria “x” como el número de artículos buenos elegidos. Hallar f(x) y F(x) y sus gráficas, además calcule e interprete a su esperanza matemática y varianza.
VARIABLE ALEATORIA CONTINUA Si el número de valores posibles de la variable en estudio es un conjunto no numerable. Es decir, la variable toma infinitos valores. FUNCIÓN DE PROBABILIDAD Sea “X” una variable aleatoria continua, la función f(x) es llamada función de probabilidad o de densidad si cumple las siguientes condiciones: 1. 0 ≤ f(x) ≤ 1 ; ∀ x ∈ ℜ 2. 1)( =∫
∞
∞−dxxf
Nota: Sea el evento: A = {x / a ≤ x ≤ b} ; entonces: P(A) = P(a ≤ x ≤ b) = ∫
b
adxxf )(
ESTADÍSTICA APLICADA
48
EJEMPLO Suponga que el tiempo de producción de un artículo (minutos) es una variable aleatoria “x” que tiene como función de densidad:
18x ; 0 ≤ x ≤ 6
f(x) = 0 ; de otro modo (d.o.m.) Verificar si f(x) es una función de densidad y hallar la probabilidad de que el tiempo de producción de un artículo elegido al azar sea menor de 4 minutos. SOLUCIÓN: Debe de cumplirse que: 1)( =∫
∞
∞−dxxf
6
0
26
0
6
0 2181
181
18xxdxdxx
== ∫∫ = 1)18(181)
20
26(
181 22
==−
Lo cual verifica que f(x) si constituye una función de densidad. La probabilidad pedida equivale a:
P( x < 4 ) = P( 0 < x < 4) = 4
0
24
0 2181
18xdxx
=∫ =
44444444.094
3616
24
181 2
===
Gráfica de f(x):
ESTADÍSTICA APLICADA
49
FUNCIÓN DE PROBABILIDAD ACUMULATIVA Sea “x” una variable aleatoria continúa con función de densidad f(x); luego, la función de probabilidad acumulativa o función de distribución de la variable aleatoria “x” se define como: PROPIEDADES 1. F(-∝) = 0 2. F(+∝) = 1 3. 0 ≤ F(X) ≤ 1 ; ∀ x ∈ ℜ 4. F(X) es una función creciente
5. f(X) = dx
xdF )(
6. P(a ≤ x ≤ b) = F(b) – F(a) Del ejemplo anterior: F(x) = P(X ≤ x) = ∫ ∞−
xdxxf )(
F(x) = xx xdxx0
2
0 2181
18=∫ =
362181 22 xx
=
⎪⎪⎩
⎪⎪⎨
⎧
>
≤≤
<
=
6;1
60;36
0;0
)(2
x
xxx
xF
Gráfica de F(x):
F(x) = P(X ≤ x) = ∫ ∞−
xdxxf )(
ESTADÍSTICA APLICADA
50
ESPERANZA MATEMÁTICA Sea “x” una variable aleatoria continua con función de densidad f(x); entonces, la Esperanza Matemática o valor esperado o media de la variable aleatoria “x” es: PROPIEDADES 1. E(c) = 0 ; ∀ c = constante 2. E(cx) = cE(x) ; ∀ c = constante 3.- E(cx + m ) = cE(x) + m ; ∀ c y m = constantes 4. E(ax + by) = aE(x) + bE(y) ; ∀ a y b = constantes Del ejemplo anterior: E(x) = ∫
∞
∞−dxxxf )(
E(x) = 6
0
36
0
26
0 3181
181
18· xdxxdxxx == ∫∫ = 4
54216
36
181 3
==
VARIANCIA O VARIANZA Sea “x” una variable aleatoria continua con función de probabilidad f(x); entonces, la Variancia o Varianza de la variable aleatoria “x” es:
Es decir: También:
E(x) = ∫∞
∞−dxxxf )(
Var(X) = V(X) = 2xσ = E[x – E(X)]2
V(X) = ∫∞
∞−− dxxfxEx )()]([ 2
V(X)= E(x2) – [E(x)]2
ESTADÍSTICA APLICADA
51
PROPIEDADES 1.- V(c) = 0 ; ∀ c = constante 2. V(cx) = c2V(x) ; ∀ c = constante 3. V(ax + b) = a2V(x) ; ∀ a y b = constantes 4. Si “x” e “y” son variables aleatorias independientes V(ax + by) = a2V(x) + b2V(y) ∀ a y b = constantes Del ejemplo anterior: V(x) = E(x2) – [E(x)]2 Como E(x) = 4
Entonces: E(x2) = 6
0
46
0
36
0
2
4181
181
18xdxxdxxx == ∫∫ = 18
721296
41864
==x
Luego: V(x) = 18 – ( 4 )2 = 18 – 16 = 2 EJERCICIOS RESUELTOS 1. Suponga que el tiempo de producción de un artículo (minutos) es
una variable aleatoria “x” que tiene como función de densidad:
⎪⎩
⎪⎨⎧ ≤≤
−=
...;0
42;4
5)(
mod
xxxf
Hallar la probabilidad de que el tiempo de producción de un
artículo elegido al azar sea menor de 3 minutos. SOLUCIÓN: Sea la variable aleatoria: x = tiempo de producción de un artículo Nos piden:
P(x < 3) = P( 2 ≤ x < 3) = 3
2
23
2
3
2)
25(
41)5(
41
45 xxdxxdxx
−=−=−
∫ ∫
P(x < 3 ) = 625.085)
25(
41)
255(
41)
24
29(1015[
41
===−=−−−
ESTADÍSTICA APLICADA
52
2. Sea “x” una variable aleatoria continua con función de densidad:
⎩⎨⎧ ≤≤
=...;0
60;)(
modxcx
xf
Si además se cumple que: y = 20 + 4x Hallar:
a) El valor de “c”. b) La mediana de “x”. c) E(y) y V(y)
SOLUCIÓN:
a) Debe de cumplirse que: 1)( =∫∞
∞−dxxf
1)018(2
·6
0
26
0=−==∫ cxccxdx ⇒ 18c = 1 ⇒ c =
181
b) Para calcular al valor de la mediana debe de cumplirse:
21)( =∫ ∞−
medxxf en nuestro caso:
21
2181
2181
18
2
0
2
0===∫
mexdxx meme ⇒
me2 = 18 ⇒ me = 18 = 3 2 c) Del ejemplo sabemos que: E(x) = 4 y V(x) = 2 Entonces, por propiedades: E(y) = E(20+4x) = E(20)+E(4x) = 20+4E(x) = 20 + 4(4) = 36 V(y) = V(20+4x) = V(20)+V(4x) = 0+ 42 V(x) = 16(2) = 32 3. Si la función de distribución del ejercicio 1 es:
F(x) = 81016 2xx −+− (compruébalo)
ESTADÍSTICA APLICADA
53
Determine: P( x < 3 ) SOLUCIÓN: Por la propiedad 6 de F(X):
P( x < 3 ) = P( 2 < x < 3 ) = F(3) – F(2) = 85 - 0 =
85
* F(3) = 85
893016=
−+− y F(2) = 08
42016=
−+−
EJERCICIOS PROPUESTOS 1. Suponga que el tiempo de producción de un artículo (minutos) es
una variable aleatoria “x” que tiene como función de densidad:
⎪⎩
⎪⎨⎧ ≤≤
−=
...;0
42;4
5)(
mod
xxxf
Verificar si f(x) es una función de densidad y hallar la probabilidad
de que el tiempo de producción de un artículo elegido al azar sea por lo menos de 3 minutos.
2. Sea “x” una variable aleatoria continua con función de densidad:
⎩⎨⎧ <<+
=...;0
42);1()(
modxxc
xf
Si además se cumple que: y = 10 + 5x Hallar:
a) El valor de “c”. b) E(x) y V(x) c) E(y) y V(y)
ESTADÍSTICA APLICADA
54
3. Si la función de distribución del ejercicio 1 es:
F(x) = 81016 2xx −+−
Determine: P( x > 3 ) 4. La función de densidad de la variable aleatoria continua “x” está
dada por:
⎪⎩
⎪⎨⎧ <<
=...;0
72;51
)(mod
xxf
a) Demuestre que el área situada debajo de la curva (sobre el
eje x) es igual a 1. b) Determine P(3< x < 5).
5, Si la función de densidad de la variable aleatoria continua “x” está
dada por:
⎪⎩
⎪⎨⎧ <<+
=...;0
42);1(81
)(mod
xxxf
Hallar: a) P(x < 3.2); b) P(2.9 < x < 3.2).
6. Si la función de densidad de la variable aleatoria x está dada por:
⎩⎨⎧ <<−
=...;0
10);1(6)(
modxxx
xf
Hallar: a) P(x > ½); b) La función de distribución de esta variable aleatoria; c) El valor de la mediana de la variable x.
7. Si la función de densidad de la variable aleatoria “x” está dada
por:
⎩⎨⎧ <<+
=...;0
10;)(
2
modxxcx
xf
ESTADÍSTICA APLICADA
55
Hallar: a) El valor de “c”. b) La función de distribución de esta variable aleatoria “x” y
trace su gráfica; c) P(0 ≤ x ≤ ½).
8. Si la función de densidad de la variable aleatoria “x” está dada por:
⎪⎩
⎪⎨
⎧<≤
<<−−=
...;010;
01;.)(
modxkx
xkxxf
Hallar: a) El valor de “k”. b) La función de distribución de esta variable aleatoria “x” y
trace su gráfica; c) P(- ½ < x < ½).
9. Si la función de densidad de la variable aleatoria “x” está dada por
⎪⎩
⎪⎨
⎧<≤−
<<=
...;01;2
10;)(
modcxx
xxxf
Hallar: a) El valor de “c” b) La función de distribución de “x”. c) P(0.8 < x < 0.6c).
10. Obtenga la función de distribución de la variable aleatoria “x” cuya
función de densidad está dada por:
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
<<−
≤<
≤<
=
...;0
32;2
3
21;21
10;2
)(
mod
xx
x
xx
xf
Trace asimismo las gráficas de las funciones de densidad y de distribución.
ESTADÍSTICA APLICADA
56
11. Si la función de distribución de la variable aleatoria “x” está dada
por:
⎪⎪⎩
⎪⎪⎨
⎧
≥
<≤−+
−<
=
1;1
11;2
11:0
)(
x
xxx
xF
Hallar: a) P(- ½ < x < ½); b) P(2 < x < 3), c) La densidad de probabilidad de esta variable aleatoria “x” y
utilícela para volver a determinar la probabilidad del inciso a). 12. Si la función de distribución de la variable aleatoria “x” está dada
por:
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
≥
<≤−
<≤
<
=
5.1;1
5.11;21
10;2
0;0
)(
x
xx
xxx
xF
Hallar:
a) P(0.4 < x ≤ 1.3) b) P( x > 0.5) c) La función de densidad de la variable “x”.
13. Si la función de distribución de la variable aleatoria “x” está dada
por:
⎪⎪⎩
⎪⎪⎨
⎧
≥
<≤−+
−<
=
2;1
22;8
42;0
)(
x
xxx
xF
Hallar: a) P(x = -2); b) P( x = 2); c) P(-2 < x <1); d) P(0 ≤ x ≤ 2).
ESTADÍSTICA APLICADA
57
14. La cantidad real de café (en gramos) en un recipiente de 230
gramos llenado por cierta máquina es una variable aleatoria cuya función de densidad está dada por:
⎪⎪⎩
⎪⎪⎨
⎧
≥
<<
≤
=
5.232;0
5.2325.227;51
5.227;0
)(
x
x
x
xf
Determine la probabilidad de que un recipiente de 230 gramos
llenado por esta máquina contendrá: a) Cuanto mucho 228.65 gramos de café. b) Entre 229.34 y 231.66 gramos de café. c) Cuanto menos 229.85 gramos de café.
15. El retraso o adelanto (en minutos) de un vuelo de Lima a Juliaca
es una variable aleatoria “x” cuya función de densidad está dada por:
⎪⎩
⎪⎨⎧ <<−−
=...;0
66);36(2881
)(2
mod
xxxf
donde los valores negativos son indicativos de que el vuelo llega
adelantado y los valores positivos señalan que el vuelo llega retrasado.
Determine las probabilidades de que uno de estos vuelos llegará
a) Cuando menos dos minutos antes. b) Cuando menos un minuto retrasado. c) Entre uno y tres minutos antes. d) Exactamente cinco minutos tarde.
ESTADÍSTICA APLICADA
58
16. Suponga que las ventas diarias de un establecimiento (decenas de miles de soles) es una variable aleatoria “x” con función de densidad:
f(x)=
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
<≤−
<≤−
omd
xx
xx
.;0
64;6
6
42;3
2
Si se elige aleatoriamente un día:
a) Hallar la probabilidad de que las ventas del establecimiento sea mayor de 22,000 soles pero no mayor de 45,000 soles
b) Hallar la media, variancia y el coeficiente de variabilidad de las ventas diarias.
c) Si la utilidad neta diaria es definida por la función Y=0.2X–0.5, hallar la media y la variancia de la utilidad neta diaria.
d) Hallar la función de probabilidad acumulativa de “x”. 17. Suponga que el tiempo de vida (en miles de horas) de los tubos
fluorescentes de 30 w. de cierta marca, es una variable aleatoria “x” que se distribuye según la siguiente función de densidad:
⎪⎩
⎪⎨
⎧≤≤−<≤−
=...;0
63);210(31);22(
)(mod
xxkxxk
xf
a) Determine el valor de “k” y la función de probabilidad
acumulativa . b) Utilizando la función de distribución acumulativa hallada en
(a), halla la probabilidad que un fluorescente que haya durado dos mil horas, dure no más de 2500 horas adicionales.
c) Determine el tiempo de vida esperado y el coeficiente de variabilidad de la distribución del tiempo de vida. ¿Qué nos indican?
d) Halle el valor del percentil 70. Interprete.
ESTADÍSTICA APLICADA
59
18. El tiempo total, medido en unidades de 100 horas, que un adolescente escucha un estéreo durante un año, es una variable aleatoria “x” cuya función de densidad de probabilidad es:
⎪⎩
⎪⎨
⎧<≤−
<<=
...;021;2
10;)(
modxx
xxxf
a) Halla la función de probabilidad acumulativa. b) Para un año en particular, ¿cuál es la probabilidad que un
adolescente utilice entre 50 a 125 horas?. Utilizar lo determinado en la pregunta anterior.
c) Si se eligen aleatoriamente 4 adolescentes, ¿cuál es la probabilidad que por lo menos 2 escuchen su estéreo menos de 25 o más de 175 horas anuales?
d) Halla el coeficiente de variabilidad. ¿Qué nos indica? e) Si y = 60x + 40, halle la variancia de y.
ESTADÍSTICA APLICADA
61
UNIDAD III
DISTRIBUCIONES DE PROBABILIDADES En esta unidad estudiaremos algunas de las distribuciones de probabilidades que son usadas con mayor frecuencia en estudios estadísticos. DISTRIBUCIONES DISCRETAS PRUEBA DE BERNOULLI Una prueba o ensayo de Bernoulli es aquella en la que su espacio muestral consta sólo de 2 resultados posibles; éxito (E) y fracaso (F), donde a la probabilidad de éxito denotaremos “p” y a la probabilidad de fracaso “q” o “1 – p”, ya que p + q = 1. Si esta prueba la repetimos varias veces, la probabilidad de éxito se mantiene constante y las pruebas son independientes. EJEMPLO: Lanzamiento de una moneda balanceada. Observe que su espacio muestral consta de solo dos resultados posibles: cara(c) o sello(s). Si nos interesa el número de caras, su probabilidad de éxito será 1/2, es decir p = 1/2 y q = 1 – p = 1/2. DISTRIBUCIÓN DE BERNOULLI Una variable aleatoria discreta “x” sigue una distribución de Bernoulli si su función de probabilidad está dada por:
Donde “x” es el número de éxitos. Además su media y variancia están dadas por:
f(x) = pxq1-x ; x = 0 , 1
E(x) = μx = p V(x) = 2xσ = pqy
ESTADÍSTICA APLICADA
62
Note que esta distribución es usada para una sola prueba de Bernoulli o cuando elegimos al azar un solo elemento de una población. Para dos o mas pruebas de Bernoulli o para una muestra al azar con reemplazo usamos: DISTRIBUCIÓN BINOMIAL Una variable aleatoria discreta “x” tiene una distribución binomial si su función de probabilidad está dada por: Donde “x” es el número de éxitos en “n” pruebas de bernoulli o el tamaño de una muestra aleatoria con reemplazo. Además su media y variancia están dadas por: EJEMPLO Se lanza una moneda 10 veces y se desea hallar la probabilidad de obtener exactamente 4 caras. SOLUCIÓN: Sea la variable aleatoria: x = número de caras Para un solo lanzamiento la probabilidad de éxito es 1/2, esta probabilidad se mantiene constante en los otros lanzamientos, como “n” es 10, entonces: f(x) = xnxn
x qpC − ; x = 0, 1, 2, 3, · · · , n f(x) = 10101010 )5.0()5.0()5.0( x
xxx CC =− ; x = 0, 1, 2, 3, · · · , 10
Nos piden: P(x = 4) = f(4) = 205078125.0)5.0( 1010
4 =C
f(x) = xnxnx qpC − ; x = 0, 1, 2, 3, · · · , n
E(x) = μx = np V(x) = 2xσ = npqy
ESTADÍSTICA APLICADA
63
DISTRIBUCIÓN HIPERGEOMÉTRICA Una variable aleatoria discreta “x” tiene una distribución hipergeométrica si su función de probabilidad está dada por: Donde “x” es el número de éxitos de una muestra aleatoria de tamaño “n” sin reemplazo, tomado de una población de tamaño N. A es el número de elementos que tienen una determinada característica, definida como éxito, y B los elementos que no tienen dicha característica, definida como fracaso, donde A + B = N. Además su media y variancia están dadas por:
IMPORTANTE
Si el tamaño de la población(N) es grande y 05.0<Nn , entonces se
puede aproximar a la distribución binomial, en donde p = NA
EJEMPLO Como parte de un estudio de la contaminación del aire, un inspector decide examinar la emisión de gases de seis de los 24 camiones de carga de una compañía. Si cuatro de los camiones de la compañía emiten cantidades excesivas de contaminantes, ¿cuál es la probabilidad de que ninguno de ellos sea incluido en la muestra del inspector? SOLUCIÓN: Sea x = número de camiones que contaminan N = 24, A = 4, B = 20 y n = 6
Nn
Bxn
Ax
CCCxf −=·)( ; x= 0, 1, 2, 3, · · · , n
E(x) = μx = NnA y V(x) = 2
xσ = )1
(2 −−
NnN
NnAB
ESTADÍSTICA APLICADA
64
Entonces: f(x) = 246
206
4 ··CCC
CCC xxNn
Bxn
Ax −− =
Nos piden: f(0) = 288.0·246
206
40 =C
CC
DISTRIBUCIÓN DE POISSON Una variable aleatoria discreta “x” tiene una distribución de Poisson si su función de probabilidad está dada por:
Donde: x = número de éxitos obtenidos en un periodo de tiempo o unidad de evaluación.
λ = razón media de ocurrencia por periodo de tiempo o unidad de
evaluación. t = periodo de tiempo o unidad de evaluación. Además su media y variancia están dadas por: IMPORTANTE La probabilidad de éxito es pequeña y constante, los números de éxitos son independientes. Se puede aproximar la distribución binomial a la Poisson cuando el tamaño de la muestra “n” es grande y la probabilidad de éxito “p” pequeña ( p < 0.1); es decir cuando np < 5; para esto considere:
!·)(x
exfxμμ−
= ; x = 0,1, 2, 3,
μ = λt
E(x) = μx = μ
μ = np (t = n y λ = p)
V(x) = 2xσ = μ y
ESTADÍSTICA APLICADA
65
EJEMPLO Se sabe que durante ciertas horas las llamadas telefónicas a la UTP están distribuidas al azar según un proceso de Poisson, con un promedio de 3 llamadas por minuto. Se desea hallar la probabilidad de que transcurran 4 minutos sin llamadas. SOLUCIÓN: Sea x = número de llamadas λ = 3 t = 4 μ = 3·4 = 12
Entonces: f(x) = !12·
!· 12
xe
xe xx −−
=μμ
Nos piden: f(0) = 000006144.0!012· 12
012
== −−
ee
EJERCICIOS PROPUESTOS 1. Demuestre que la media y la varianza de la distribución de
Bernoulli son “p” y “pq” respectivamente. 2. Se lanza una moneda 15 veces y se desea hallar la probabilidad
de obtener: a) Exactamente 7 caras.
b) Por lo menos 2 caras. c) A lo mas 14 caras. 3. Como parte de un estudio de la contaminación del aire, un
inspector decide examinar la emisión de gases de cinco de los 20 camiones de carga de una compañía. Si tres de los camiones de la compañía emiten cantidades excesivas de contaminantes, ¿cuál es la probabilidad de que dos camiones estén contaminando?
ESTADÍSTICA APLICADA
66
4. Se sabe que durante ciertas horas las llamadas telefónicas a la UTP están distribuidas al azar según un proceso de Poisson, con un promedio de 5 llamadas por minuto. Se desea hallar la probabilidad de que en 2 minutos haya exactamente 3 llamadas y de que en 2 minutos haya 8 llamadas.
5. Suponga que el 30% de los créditos otorgados por un banco
tienen cuotas vencidas. Si se eligen al azar y con reemplazo 10 créditos, determinar: a) La probabilidad que por lo menos dos créditos tengan cuotas
vencidas. b) La media y el coeficiente de variabilidad.
6. Una urna contiene 9 bolillas verdes y 11 azules. Si se sacan al
azar 5 bolillas sin reemplazo, hallar: a) La probabilidad de que una sea de color verde. b) La probabilidad de que al menos 2 sean de color verde. c) La probabilidad de que a lo mas 4 sean de color verde.
7. Una urna contiene 8 bolillas blancas, 10 negras y 12 rojas. Se
sacan al azar y sin reemplazo 7 bolillas, determinar: a) La probabilidad que a lo mas 6 sean rojas. b) La probabilidad que por lo menos 2 sean negras.
8. Suponga que “x” tiene una distribución de Poisson si P(x = 3) = 2/3 P(x = 1). Calcular P( x > 1). 9. En una población grande el 16 % de los miembros son zurdos. En
una muestra aleatoria de tamaño 10, encontrar la probabilidad de que exactamente dos o más sean zurdos.
10. En un estudio sobre la efectividad de un insecticida contra cierto
insecto, se roció en un área grande de tierra. Posteriormente, se examinó el área en relación con los insectos vivos, seleccionando lotes cuadrados al azar y contando el número de insectos vivos por lote cuadrado. Experiencias anteriores han demostrado que el número promedio de insectos vivos por lote cuadrado después de haber rociado el insecticida es de 0.5. Si el número de insectos vivos por lote se distribuye según Poisson, hallar:
ESTADÍSTICA APLICADA
67
a) ¿Cuál es la probabilidad de que un lote cuadrado contenga uno o más insectos vivos?.
b) Si la evaluación se hizo en unos 10000 lotes, ¿cuántos lotes tendrían un insecto vivo?.
c) ¿Cuál es la probabilidad de encontrar tres insectos en dos lotes?.
11. Los resultados de una encuesta a un aula de 30 alumnos indica
lo siguiente : - 10 alumnos aceptaron dar el examen el día sábado. - 5 alumnos aceptaron dar el examen el día domingo. - 7 alumnos aceptaron dar el examen en Navidad. - Al resto le era indiferente cuando dar el examen. Si se elige una muestra de 10 alumnos, ¿Cuál es la probabilidad de elegir más de 6 alumnos que le sean indiferente la fecha del examen?.
12. En una estación telefónica se recepcionan llamadas a una razón
promedio de 4 llamadas cada 5 minutos. Si se elige al azar un periodo de 2 minutos, hallar la probabilidad que se recepcionen por lo menos 3 llamadas.
13. El gerente de crédito de un banco recibe 12 solicitudes de crédito,
de las cuales 3 tienen documentación incompleta, por lo que serán devueltas a los clientes. Si se eligen 5 solicitudes al azar y sin reemplazo, hallar: a) La probabilidad de devolver por lo menos 3 solicitudes de
crédito. b) La media, varianza y coeficiente de variabilidad.
14. El gerente de crédito de un banco recibe 10 solicitudes de crédito,
de las cuales 4 tienen documentación incompleta, por lo que serán devueltas a los clientes. Si se eligen 5 solicitudes al azar y con reemplazo, hallar:
a) La probabilidad de devolver por lo menos 3 solicitudes de crédito.
b) La media, varianza y coeficiente de variabilidad.
ESTADÍSTICA APLICADA
68
15. Un fabricante de piezas de automóviles garantiza que una caja de sus piezas contendrá como máximo 2 defectuosos. Si la caja contiene 20 piezas y la experiencia ha demostrado que ese proceso de fabricación produce 5% de piezas defectuosas. ¿Cuál es la probabilidad de que una caja satisfaga la garantía?.
16. Un estudiante no se ha preparado absolutamente nada para un
examen (cosa muy corriente en algunos estudiantes) el cual contiene 20 preguntas de verdadero, falso. Decide lanzar al aire una moneda para responder, anota verdadero si la moneda sale cara y falso si la moneda sale sello. Hallar:
a) La probabilidad de que apruebe el examen, si para ello debe contestar correctamente el 70% de las preguntas.
b) La probabilidad de que conteste por lo menos la mitad de las preguntas correctamente.
17. Una empresa fabrica mesas de billar y sospecha que el 2% de su
producción está defectuosa en alguna firma. Si ésta sospecha es correcta. Encuentre la probabilidad de que en una muestra de 9 mesas:
a) Haya por lo menos una defectuosa. b) A lo mas 2 mesas sean defectuosas. 18. Si el 3% de los focos fabricados por una empresa son
defectuosas. Hallar la probabilidad de que en una muestra de 50 focos:
a) No resulte ningún defectuoso. b) Resulte 5 defectuosos. c) Resulte a lo más 2 defectuosos. d) Resulte por lo menos 3 defectuosos. 19. A una construcción llegan camiones de carga a una razón media
de 2.8 camiones/hora. Hallar la probabilidad de tener por lo menos 3 camiones que llegan en: a) Un lapso de 30 minutos. b) Un lapso de 45 minutos. c) Un lapso de una hora. d) Un lapso de dos horas. e) Un lapso de tres horas.
ESTADÍSTICA APLICADA
69
20. Una compañía de seguros contra accidentes de tránsito sabe que el 0.005% de la población fallece por accidente de tránsito. ¿Cuál es la probabilidad de que la compañía tenga que pagar a sus 10000 asegurados que tiene este año? a) A mas de 3 asegurados. b) A lo mas a 3 asegurados. c) Exactamente a 3. d) A por lo menos 2 asegurados.
ESTADÍSTICA APLICADA
70
DISTRIBUCIONES CONTINUAS DISTRIBUCIÓN NORMAL Una variable aleatoria continua “x” tiene una distribución normal con media μ y varianza σ2, si su función de probabilidad es: GRÁFICA:
CARACTERÍSTICAS: 1. Tiene una forma acampanada. 2. Es asintótica con respecto al eje horizontal. 3. Es simétrica con respecto a su media μ. DISTRIBUCIÓN NORMAL ESTÁNDAR Sea “x” una variable aleatoria continua que tiene una distribución normal
con media μ y varianza σ2, entonces la variable aleatoria Z = σμ−x
tiene una distribución normal con media cero ( 0 ) y varianza uno ( 1 ) y su función de probabilidad está dada por:
f(x) = 2)(
21
21 σ
μ
σπ
−−
x
e ; -∝ < x < ∝
f(z) = 2
2
21 z
e−
π ; -∝ < z < ∝
ESTADÍSTICA APLICADA
71
GRÁFICA:
CARACTERÍSTICAS: 1. Tiene una forma acampanada. 2. Es asintótica con respecto al eje horizontal. 3. Es simétrica con respecto a su media 0. USO DE LA TABLA Z Haciendo uso de la tabla “z” compruebe las siguientes probabilidades: 1. P(z < 2.37) = 0.9911
2. P(z > 3.24) = 1 – 0.9994 = 0.0006
ESTADÍSTICA APLICADA
72
3. P(z < - 1.53) = 0.0630
4. P(z > - 2.08) = 1 – 0.0188 = 0.9812
5. P(1.66 < z < 2.69) = 0.9964 – 0.9515 = 0.0449
ESTADÍSTICA APLICADA
73
6. P(-0.45 < z < 3.25) = 0.9994 – 0.3264 = 0.6730
7. P(-1.23 < z < 0) = 0.5 – 0.1093 = 0.3907
8. P(-2.76 < z < -1.94) = 0.0262 – 0.0029 = 0.0233
ESTADÍSTICA APLICADA
74
EJERCICIOS RESUELTOS 1. El costo de producción de un determinado artículo tiene una
distribución normal con una media de 20 soles y una varianza de 4 soles2. Si se elige al azar un artículo, ¿cuál es la probabilidad de que su costo de producción sea a lo más de 18 soles?
SOLUCIÓN: Sea x = costo de producción Donde: x ∼ N( μ = 20 ; σ2 = 4 ) por lo cual σ = 2 Nos piden:
P( x ≤ 18 ) como z = σμ−x ∼ N(0,1)
P( x ≤ 18 ) = )18(σμ
σμ −≤
−xP , reemplazando:
P( x ≤ 18 ) = 1587.0)1()2
2018( =−≤=−
≤ zPzP
2. Las llamadas que se registran en la UTP tienen una distribución
normal con una media de 2 minutos y una variancia de 1 minuto. Hallar la probabilidad de que una llamada tenga una duración comprendida entre 3 y 4 minutos.
SOLUCIÓN: Sea x = número de llamadas Donde: x ∼ N( μ = 2 ; σ2 = 1 ) por lo cual σ = 1 Nos poden:
P(3 < x < 4) = )1
241
23()43( −<<
−=
−<
−<
− zPxPσμ
σμ
σμ
P(3 < x < 4) = P(1< z < 2) = 0.9772 – 0.8413 = 0.1359
ESTADÍSTICA APLICADA
75
3. El tiempo que le dedican los estudiantes para aprender Estadística es una variable aleatoria que tiene una distribución normal con una media de 20 horas y una varianza de 9 horas2. Si se elige al azar a un estudiante, ¿cuál es la probabilidad de que haya estudiado a lo más 14 horas?.
SOLUCIÓN: Sea x = tiempo de estudio o número de horas. Donde: x ∼ N( μ = 20 ; σ2 = 9 ) por lo cual σ = 3 Nos piden:
P(x ≤ 14 ) = 0228.0)2()3
2014( =−≤=−
≤− zPxPσμ
4. Suponga que el costo de producción de una calculadora tiene una
distribución normal con una media de 50 soles y una varianza de 16 soles2. Si se elige una calculadora al azar, hallar la probabilidad que su costo de producción sea por lo menos de 45 soles.
SOLUCIÓN: Sea x = costo de producción de una calculadora Donde: x ∼ N( μ = 50 ; σ2 = 16 ) por lo cual σ = 4 Nos piden:
P(x ≥ 45) = 8944.01056.01)25.1()4
5045( =−=−≥=−
≥− zPxPσμ
5. El tiempo de incapacidad por enfermedad de las secretarias de la
UTP en un mes, tiene una distribución normal con una media de 120 horas y una desviación estándar de 25 horas. Si Rosita se enferma, hallar la probabilidad de que el tiempo de ausencia a la UTP esté comprendida entre 60 y 90 horas.
SOLUCIÓN: Sea x = tiempo de incapacidad Donde: x ∼ N( μ = 120 ; σ = 25 )
ESTADÍSTICA APLICADA
76
Nos piden: P(60 < x < 90) =
)20.140.2()25
1209025
12060( −<<−=−
<−
<− zPxP
σμ
P(60 < x < 90) = 0.1151 – 0.0082 = 0.1069 EJERCICIOS PROPUESTOS 1. Use la tabla Z para calcular las siguientes probabilidades:
a) P(z < -3.96) b) P(z < 1.77) c) P(z > 3.04) d) P(z > -2.88) e) P(1.43 < z < 3.69) f) P(-2.34 < z < 1.71) g) P(-3.07 < z < -1.68)
2. Use la tabla Z para hallar el valor de “m” en: a) P(z < m) = 0.9
b) P(z > m) = 0.1 c) P(-1.24 < z < m) = 0.8 d) P(-m < z < m) = 0.99 e) P(-m < z < m) = 0.68
3. Si “x” se distribuye en forma normal con una media de 12 y una
desviación estándar de 3, calcule las siguientes probabilidades: a) P(x < 15)
b) P(x > 10) c) P( 9 < x < 13) d) P(2 < x < 5) e) P( -3 < x < 10)
4. Si “x” se distribuye en forma normal con una media de 10 y una
desviación estándar de 2, calcule el valor de “m” si: a) P(x > m) = 0.95
b) P(m < x < 10) = 0.2 c) P(-m < x – 10 < m) = 0.99
5. El costo de producción de un determinado artículo tiene una
distribución normal con una media de 30 soles y una varianza de 9 soles2. Si se elige al azar un artículo, ¿cuál es la probabilidad de que su costo de producción sea por lo menos de 27 soles?
ESTADÍSTICA APLICADA
77
6. Las llamadas que se registran en la UTP tienen una distribución
normal con una media de 4 minutos y una variancia de 2 minutos. Hallar la probabilidad de que una llamada tenga una duración comprendida entre 2 y 5 minutos.
7. El tiempo que le dedican los estudiantes para aprender
Estadística es una variable aleatoria que tiene una distribución normal con una media de 25 horas y una varianza de 4 horas2. Si se elige al azar a un estudiante, ¿cuál es la probabilidad de que haya estudiado por lo menos 20 horas?.
8. Suponga que el costo de producción de una calculadora tiene una
distribución normal con una media de 40 soles y una varianza de 9 soles2. Si se elige una calculadora al azar, hallar: a) La probabilidad que su costo de producción sea por lo
menos de 42 soles. b) La probabilidad que su costo de producción sea a lo más de
36 soles. c) La probabilidad que su costo de producción difiera de la
media poblacional en menos de 5 soles. 9. El tiempo de incapacidad por enfermedad de las secretarias de la
UTP en un mes, tiene una distribución normal con una media de 100 horas y una desviación estándar de 16 horas. Si Yuli se enferma, hallar la probabilidad de que el tiempo de ausencia a la UTP esté comprendida entre 80 y 95 horas.
10. Si el largo de una varilla se distribuye en forma normal con una
media de 10 y una varianza de 2. Y una varilla se considera aceptable si tiene una longitud mayor de 11 pulgadas.
a) Hallar el porcentaje de varillas aceptables. b) ¿Cuál es la probabilidad de que si se seleccionan al azar 4
varillas, 3 de ellas presenten una longitud aceptable? 11. El número de horas que un estudiante necesita para aprender un
tema de estadística es una variable aleatoria que tiene una distribución normal. Si el 84.13% de los estudiantes emplean mas de 3 horas y sólo el 2.28% mas de 9 horas. Calcule usted la media y la varianza.
ESTADÍSTICA APLICADA
78
12. Una fábrica se dedica al llenado de botellas de un agua de mesa. La capacidad de las botellas se distribuyen en forma normal con una media de un litro y una desviación estándar de 1.1litros. Se rechazan las botellas con capacidad inferior a 0.99litros o superior a 1.1litros. La fábrica realiza una inspección consistente en elegir 20 botellas al azar y si encuentra más de 2 botellas rechazables, despiden al jefe de producción. ¿Qué probabilidad tiene el jefe de producción de perder su puesto de trabajo?
ESTADÍSTICA APLICADA
79
UNIDAD IV
DISTRIBUCIONES MUESTRALES La estadística trabaja con datos que fueron obtenidas de muestras aleatorias y de éstas obtenemos valores estadísticos o estimadores de las cuales necesitamos saber cuál es su comportamiento probabilístico para poder realizar un análisis estadístico y a su vez nos permitirá establecer los niveles de confiabilidad y de riesgo. DISTRIBUCIÓN MUESTRAL Es una función de probabilidad asociada a un estimador, que se genera con todas las muestras aleatorias de tamaño “n” que se puedan obtener de una población. Por ejemplo x , 21 xx − y S2 son estimadores o valores estadísticos, mas cada una de ellas tiene una determinada distribución de probabilidad particular. DISTRIBUCIÓN DE PROMEDIOS MUESTRALES Es una función de probabilidad que se forma con los promedios muestrales que se obtienen a partir de todas las muestras aleatorias de tamaño “n” que se puedan extraer de una población. TEOREMA Si de una población de tamaño “N” que tiene una media μx y varianza σ2
x se extraen muestras aleatorias de tamaño “n” y en cada muestra
calculamos su promedio n
xx
n
ii∑
== 1 , entonces la media y varianza de la
variable x son: a) Si las muestras son con reemplazo o la población es infinita:
xx μμ = y n
xx
22 σ
σ =
ESTADÍSTICA APLICADA
80
b) Si las muestras son sin reemplazo:
xx μμ = y )1
(2
2
−−
=N
nNn
xx
σσ
OBSERVACIÓN:
Si Nn < 0.05 entonces
nx
x
22 σ
σ = con o sin reemplazo.
DISTRIBUCIÓN DE PROMEDIOS MUESTRAES SI LA VARIABLE EN ESTUDIO SE DISTRIBUYE EN FORMA NORMAL Sea “x” una variable aleatoria que tiene una distribución normal con media μx y varianza σ2
x. Si de esta distribución se extraen muestras aleatorias de tamaño “n” y en cada muestra calculamos su promedio
n
xx
n
ii∑
== 1 , entonces la variable x se distribuye en forma normal con una
media xμ y varianza 2xσ .
Entonces:
TEOREMA DEL LÍMITE CENTRAL Sea “x” una variable aleatoria que tiene una distribución con media μx y varianza σ2
x. Si de esta distribución se extraen muestras aleatorias de
tamaño “n” y en cada muestra calculamos su promedio n
xx
n
ii∑
== 1 ,
entonces si el tamaño de muestra es grande ( n ≥ 30 ), la variable aleatoria x se distribuye en forma aproximadamente normal con una media xμ y varianza 2
xσ .
Z = x
xxσμ−
∼ N(0,1).
ESTADÍSTICA APLICADA
81
Entonces:
DISTRIBUCIÓN DE DIFERENCIAS DE PROMEDIOS MUESTRALES
TEOREMA Si de 2 poblaciones de tamaños N1 y N2 normales e independientes que se distribuyen con medias μ1 y μ2 , y varianzas σ2
1 y σ22 , se extraen
muestras aleatorias de tamaños n1 y n2 , respectivamente; entonces, la variable aleatoria 21 xx − tiene una distribución normal con media
21 xx −μ y
varianza 221 xx −σ .
a) Si las muestras son con reemplazo:
21 xx −μ = μ1 - μ2 y 221 xx −σ =
2
22
1
21
nnσσ
+
b) Si las muestras son sin reemplazo:
21 xx −μ = μ1 - μ2 y
2
21 xx −σ = )1
()1
(2
22
2
22
1
11
1
21
−−
+−−
NnN
nNnN
nσσ
Entonces:
OBSERVACIÓN: Si las poblaciones no tienen distribuciones normales, entonces se puede usar el teorema del límite central siempre y cuando n1 y n2 sean mayores o iguales que 30.
Z = x
xxσμ−
∼ aproximadamente N(0,1)
21
2121
xx
xxxxZ
−
−−−=
σ
μ∼ N(0,1)
ESTADÍSTICA APLICADA
82
DISTRIBUCIÓN DE PROPORCIONES MUESTRALES Si de una población distribuida Binomialmente con probabilidad de éxito p, se extrae una muestra aleatoria de tamaño n, entonces se puede mostrar que la media de X: número de éxitos en la muestra, es μ = np y que su varianza es σ2 = npq. En consecuencia la proporción muestral tiene media
p, y varianza npq . Entonces: por el Teorema del Limite Central, cuando n
es grande se tiene:
Fórmulas de aproximación Normal a la Binomial. Si X es una Binomial con parámetros n y p, entonces: i) ii) iii)
EJERCICIOS RESUELTOS 1. Suponga que una empresa produce un determinado artículo de
acuerdo a un proceso con una media de 950 gramos y una varianza de 1600 gramos2. Si se eligen al azar y con reemplazo 36 artículos, hallar la probabilidad que el promedio muestral sea por lo menos 965 gramos.
SOLUCIÓN: Sea la variable aleatoria: x = peso de los artículos (gramos) x ∼ ?(μx = 950 , σ2
x = 1600) y n = 36
( ) )5.5.()5.5.(npq
npkZnpq
npkPkXkPkXP −+<<
−−=+<<−≅=
( ) )5.5.()5.5.(npq
npbZnpq
npaPbXaPbXaP −−<<
−+=−<<+=<<
( ) )5.5.()5.5.(npq
npbZnpq
npaPbXaPbXaP −+<<
−−=+<<−=≤≤
npq
ppnpq
npXz −=
−= ˆ
ESTADÍSTICA APLICADA
83
Entonces, como el muestreo es con reemplazo:
xx μμ = = 950 y n
xx
22 σ
σ = = 36
1600 ⇒ 640
361600
==xσ
Nos piden: )965( ≥xP Como n ≥ 30 , aplicamos el Teorema del Límite Central. Esto es:
)965( ≥xP = )965
(x
x
x
xxP
σμ
σμ −
≥−
, reemplazando:
)965( ≥xP = )25.2()
640
950965( ≥=−
≥ zPzP , haciendo uso de la
tabla “z”: )965( ≥xP = 1 - P(z ≤ 2.25) = 1 – 0.9878 = 0.0122
2. Las estaturas de 1000 estudiantes tienen una media de 170 centímetros y una varianza de 16 centímetros2. Si se eligen al azar y sin reemplazo una muestra de tamaño 32, hallar la probabilidad que el promedio muestral sea a lo mas 172 centímetros.
SOLUCIÓN: Sea la variable aleatoria: x = estatura de los estudiantes
(centímetros) x ∼ ?(μx = 170 , σ2
x = 16) y n = 32
Entonces, como el muestreo es sin reemplazo:
xx μμ = = 170 y 484484484.0)11000321000(
3216)
1(
22 =
−−
=−−
=N
nNn
xx
σσ
⇒ 696049196.0=xσ Nos piden: )172( ≤xP Como n ≥ 30 aplicamos el Teorema del Límite Central.
ESTADÍSTICA APLICADA
84
Esto es:
)172( ≤xP = )172
(x
x
x
xxP
σμ
σμ −
≤−
reemplazando:
)172( ≤xP = 9979.0)87.2()696049196.0
170172( =≤=−
≤ zPzP (ver tabla z)
3. El tiempo de duración de un foco se distribuye en forma normal con una media de 10000 horas y una varianza de 100 horas2. Si se selecciona una muestra al azar con reemplazo de tamaño 16, hallar la probabilidad que su promedio esté comprendido entre 9980 y 10010 horas.
SOLUCIÓN: Sea la variable aleatoria: x = tiempo de duración de los focos
(horas)
x ∼ N(μx = 10000, σ2x = 100) y n = 16
Entonces, como el muestreo es con reemplazo:
xx μμ = = 10000 y n
xx
22 σ
σ = = 16
10000 , entonces:
254
10016
10000===xσ
Nos piden: P(9980 < x < 1010) estandarizando:
P(9980 < x < 1010) = )25
100001001025
100009980( −<
−<
−
x
xxP
σμ
P(9980 < x < 1010) = P(-0.80 < z < 0.40) = 0.6554 – 0.2119 = 0.4435
ESTADÍSTICA APLICADA
85
4. Suponga que dos máquinas A y B producen bolsas de azúcar de iguales características. La máquina A produce bolsas con una media de 970 gramos y una varianza de 256 gramos2, y la máquina B produce bolsas con una media 980 gramos y una varianza 144 gramos2. Si se eligen al azar y con reemplazo 36 bolsas producidas por A y 64 bolsas producidas por B, hallar la probabilidad que la diferencia de los promedios muestrales sea a lo más 8 gramos.
SOLUCIÓN: Sean las variables aleatorias: xA = peso de las bolsas producidas por la máquina A (gr.) xB = peso de las bolsas producidas por la máquina B (gramos) xA ∼ ?(μA = 970 , σ2
A = 256) y nA = 36 xB ∼ ?(μB = 980 , σ2
B = 144) y nB = 64 Entonces, como el muestreo es con reemplazo:
BA xx −μ = μA - μB = 970 – 980 = -10 y
21 BA xx −σ = 361111.9
64144
3625622
=+=+B
B
A
A
nnσσ , entonces:
059593.3=− BA xxσ Nos piden: P = )88()8( ≤−≤−=≤− BABA xxPxxP Como nA ≥ 30 y nB ≥ 30, aplicamos el Teorema del Límite Central. Esto es:
P = )059593.3
)10(8/)(059593.3
)10(8( −−≤−−≤
−−−−− BABA xxxxBA xxP σμ
P = P(0.65 ≤ z ≤ 5.88) = 1 – 0.7422 = 0.2578
5. Según reportes del centro nacional para estadísticas de salud, alrededor del 20 % de la población masculina adulta de los Estados Unidos es obesa.
Se elige al azar una muestra de 150 hombres adultos en los
Estados Unidos. ¿Cuál es la probabilidad de que:
ESTADÍSTICA APLICADA
86
a) Haya a lo más 25 personas obesas? b) Haya más de 22 pero menos de 35 obesos?
c) Haya por lo menos un 25% de obesos en la muestra? SOLUCIÓN: Sea X el número de personas obesas en la muestra. Usando aproximación normal a la Binomial se tiene que:
a) b) c) P( = P(Z>1.53) = 1-P(Z<1.53) = 1 - 0.9730 = 0.0630.
EJERCICIOS PROPUESTOS 1. Suponga que una empresa produce un determinado artículo de
acuerdo a un proceso con una media de 500 gramos y una varianza de 49 gramos2. Si se eligen al azar y con reemplazo 50 artículos, hallar la probabilidad que el promedio muestral sea a lo mas 505 gramos.
2. Las estaturas de 1200 estudiantes tienen una media de 168
centímetros y una varianza de 20 centímetros2. Si se eligen al azar y sin reemplazo una muestra de tamaño 40, hallar la probabilidad que el promedio muestral esté comprendido entre 166 y 175 centímetros.
3. El tiempo de duración de un foco se distribuye en forma normal
con una media de 100000 horas y una varianza de 80 horas2. Si se selecciona una muestra al azar con reemplazo de tamaño 25, hallar la probabilidad que su promedio esté comprendido entre 99985 y 100025 horas.
( ) ( ) ( ) 1814.091.024
305.255.2525 =−<=⎟⎠⎞
⎜⎝⎛ −
<=<≅≤ ZPZPXPXP
( ) ( ) =⎟⎠⎞
⎜⎝⎛ −
<<−
=<<≅<<24
305.3424
305.225.345.223522 ZPxPXP
( ) 8123.00063.08186.091.053.1 =−=<<− ZP
)24
305.37()5.37()25.ˆ−
>=≥=≥ ZPXPp
ESTADÍSTICA APLICADA
87
4. Suponga que dos máquinas A y B producen bolsas de azúcar de iguales características. La máquina A produce bolsas con una media de 980 gramos y una varianza de 200 gramos2, y la máquina B produce bolsas con una media 990 gramos y una varianza 100 gramos2. Si se eligen al azar y con reemplazo 40 bolsas producidas por A y 50 bolsas producidas por B, hallar la probabilidad que la diferencia de los promedios muestrales sea por lo menos 6 gramos.
5. Suponga que una máquina ha sido programada para producir
artículos cuyos pesos tienen una distribución con una media de 250 gramos y una varianza de 625 gramos2. Si se eligen al azar 49 artículos, hallar la probabilidad que su promedio sea por lo menos 255 gramos y la probabilidad que su promedio esté comprendido entre 243 y 256 gramos, considerando: a) Una muestra con reemplazo. b) Una muestra sin reemplazo tomada de un lote de 400
artículos. 6. En un estudio para comparar los pesos promedios de niños y
niñas de una escuela primaria, se tomó una muestra aleatoria de 40 niños y 45 niñas. Se sabe que los pesos tanto de niños como de niñas tienen una distribución normal con medias de 50 y 46 kilos, y con varianzas de 70 y 75 kilos2 respectivamente, hallar la probabilidad de que el promedio de los pesos de los niños sea al menos 5 kilos más grande que el peso de las niñas.
7. De dos máquinas que embolsan café automáticamente, se han
extraído 64 bolsas al azar de cada máquina. Ambas máquinas embolsan con idénticas medias y varianzas de 6 y 10 respectivamente, hallar la probabilidad que ambos promedios muestrales difieran en por lo menos 2.
8. Suponga que la UTP tiene 200 profesores, 50 de los cuales tienen
el grado de doctor. Dos muestras con reemplazo de tamaño 32 son elegidas al azar y en forma independiente, y se registran a los que tienen doctorado, hallar la probabilidad que las dos muestras difieran en por lo menos 6 doctorados.
9. Suponga que en un distrito de Lima hay aproximadamente 8000
adultos, donde el 20% compra usualmente una revista A. Si se elige una muestra aleatoria de tamaño 225, hallar la probabilidad
ESTADÍSTICA APLICADA
88
que la proporción muestral de personas que compran la revista A, sea mayor de 0.17.
10. Suponga que en un establecimiento la proporción de clientes que
opinan que la atención ofrecida es buena es π. Determinar el mínimo tamaño de la muestra requerida, si se desea que:
a) La proporción muestral difiera de la proporción poblacional en no mas de una cantidad “d”, con una probabilidad “1 - α “.
b) La desviación estándar de la proporción muestral sea no mayor a “d”.
c) El coeficiente de variabilidad de “p” sea no mayor a “d”. DISTRIBUCIÓN CHI – CUADRADO [ ]2
)(mχ Una variable aleatoria “x” tiene una distribución Chi – Cuadrado con “m” grados de libertad, si su función de probabilidad o de densidad es: Donde: Γ(x) es la función gamma, definida por:
∫∞ −−=Γ
0
1)( dyeyx yx , x > 0
GRÁFICA: f(x) χ2(m) CARACTERÍSTICAS: 1. Su variable toma sólo valores positivos. 2. Presenta un sesgo o asimetría a la derecha. 3. Es asintótica con respecto al eje horizontal en su parte positiva.
f(x) = 21
2
22 )(2
1)(xm
mm exxf
−−
Γ= , x > 0
ESTADÍSTICA APLICADA
89
4. A medida que los grados de libertad aumentan (m>30), la distribución presenta menor sesgo.
5. Para “m” grados de libertad su media y varianza son “m” y “2m” respectivamente.
TEOREMA Sea “x” una variable aleatoria que tiene una distribución normal con media μx y varianza 2
xσ , entonces se cumple que:
2)1(2
2
~)1(
−
−n
x
Snχ
σ
TABLA CHI – CUADRADO Compruebe las siguientes probabilidades: 1. 975.0)023.19( 2
)9( =<χP
2. 70.030.01)267.7( 2
)10( =−=>χP
ESTADÍSTICA APLICADA
90
3. 7.02.09.0)412.28578.14( 2)20( =−=<< χP
4. 6.01.07.0)656.10168.4( 2
)9( =−=<< χP
5. 4.05.09.0)256.40336.29( 2
)30( =−=<< χP
ESTADÍSTICA APLICADA
91
DISTRIBUCIÓN “t” DE STUDENT [ ])(mt Una variable aleatoria “x” tiene una distribución “t” de Student con “m” grados de libertad, si su función de probabilidad es:
GRÁFICA: CARACTERÍSTICAS: 1. Tiene una forma ligeramente acampanada. 2. Es simétrica con respecto a su media cero. 3. Es asintótica con respecto al eje “x”. 4. Se aproxima cada vez mas a la distribución normal estándar, a
medida que los grados de libertad sean mayores de 30.
5. Para “m” grados de libertad su media y varianza son “0” y “2−m
m ”
respectivamente. TEOREMA Sea “x” una variable aleatoria que tiene una distribución normal con media μx y varianza σ2
x. Si de la distribución de “x” se extrae una
muestra aleatoria de tamaño “n”; entonces la variable aleatoria x
x
Sxt μ−
=
tiene una distribución “t” de Student con (n – 1) grados de libertad, donde:
a) Si la muestra es con reemplazo: n
SS xx
22 =
b) Si la muestra es sin reemplazo: )1
(2
2
−−
=N
nNn
SS xx
212
)1(
1
)2
(
)2
1()( +
+Γ
+Γ
= m
mxmm
m
xfπ
; -∝ < x < ∝
ESTADÍSTICA APLICADA
92
TEOREMA Sean “x1” y “x2” dos variables aleatorias independientes con distribuciones normales de medias μ1 y μ2 y varianza común σ2. Si de estas distribuciones se extraen muestras aleatorias de tamaños “n1” y “n2” , respectivamente; entonces la variable aleatoria
21
)()( 2121
xxSxxt
−
−−−=
μμ tiene una distribución “t” de Student con (n - 2)
grados de libertad, donde: a) Si el muestreo es con reemplazo:
⎟⎟⎠
⎞⎜⎜⎝
⎛+=−
21
22 1121 nn
SS pxx
b) Si el muestreo es sin reemplazo:
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−−
+⎟⎟⎠
⎞⎜⎜⎝
⎛−−
=− 11
11
2
22
21
11
1
2221 N
nNnN
nNn
SS pxx y
2)1()1(
21
222
2112
−+−+−
=nn
SnSnS p
es la varianza ponderada, que es el estimador de la varianza común σ2
. TABLA “t” DE STUDENT Compruebe las siguientes probabilidades: 1. P( t(8) < 2.306) = 0.975
ESTADÍSTICA APLICADA
93
2. P( t(20) > -1.325) = 1 – 0.1 = 0.9
3. P( -1.310 < t(30) < 2.457 ) = 0.99 – 0.10 = 0.89
4. P( -0.527 < t(75) < 0.846) = 0.8 – 0.3 = 0.5
ESTADÍSTICA APLICADA
94
5. P(0.849 < t(50) < 1.299) = 0.9 – 0.8 = 0.1
DISTRIBUCIÓN F DE SNEDECOR [ ]),( mnF Una variable aleatoria “x” tiene una distribución “F” con “n” y “m” grados de libertad, si su función de probabilidad es: GRÁFICA:
CARACTERÍSTICAS: 1. Su variable está definida sólo para valores positivos. 2. Presenta un sesgo o asimetría positiva o a la derecha. 3. Es asintótica en su parte positiva con respecto al eje positivo. 4. A medida que los grados de libertad aumentan ( n > 30 , m > 30 ) la
distribución presenta menor sesgo, es decir la distribución se hace mas simétrica.
f(x)
F(n,m)
2
22
)1)(()(
))(()(
22
12
mn
nn
mnxmn
mnmn x
xf +
+ΓΓ
Γ=
−+ ; si: x > 0
ESTADÍSTICA APLICADA
95
5. Para “n y m” grados de libertad su media y varianza son:
2−m
m para m > 2 y )4()2(
)2(22
2
−−−+
mmnmnm para m > 4
PROPIEDAD RECÍPROCA Si “x” es una variable aleatoria que tiene una distribución “F” con “ n y m” grados de libertad, se cumple que:
TEOREMA Sean “x1” y “x2” dos variables aleatorias independientes distribuidas en forma normal con medias: μ1 y μ2 y varianzas: 2
1σ y 22σ respectivamente. Si de
ambas poblaciones “x1” y “x2” se extraen muestras aleatorias de tamaños “n1” y “n2” ; entonces, la variable:
21
22
22
21
σσ
SSF = tiene una distribución F con “n1 – 1” y “n2 – 1” grados de
libertad TABLA “F” DE SNEDECOR Compruebe las siguientes probabilidades: 1. P[F(6 , 13) < 2.92] = 0.95
),,(1),,1(
nmFmnF
αα =−
ESTADÍSTICA APLICADA
96
2. P[F(14, 10) > 4.60 ] = 1 – 0.99= 0.01
3. P[F(27, 4) <13.88 ] = 0.99
4. P[F(9, 5) > 4.77 ] = 1 – 0.95 = 0.05
ESTADÍSTICA APLICADA
97
5. P[F(32, 15) < 3.19 ] = 0.99
EJERCICIOS RESUELTOS 1. Suponga que el tiempo de atención por cliente en una tienda tiene
una distribución normal con una desviación estándar de 4 minutos. Si se elige una muestra aleatoria de 25 clientes: a) Hallar la probabilidad que su variancia sea menor de 12
minutos2. b) Hallar la probabilidad que su variancia sea mayor de 10
minutos2. c) Hallar el valor de “m” tal que P( S2 < m ) = 0.7
SOLUCIÓN:
Sea x = tiempo de atención por cliente(minutos) x ∼ N(μx = ?, σx = 4) y n = 25
a) )12)1()1(()12( 22
22
σσxnSnPSP −
<−
=< , reemplazando:
= 1970.0)18()16
1224( 2)24(
2)24( =<=< χχ PxP
b) )10)1()1(()10( 22
22
σσxnSnPSP −
>−
=>
= 9208.0)15()16
1024( 2)24(
2)24( =>=> χχ PxP
ESTADÍSTICA APLICADA
98
c) P(S2 < m) = 0.7
7.0))1()1(( 22
2
=−
<−
σσmnSnP
7.0)16
24( 2)24( =<
mP χ
7.0)5.1( 2
)24( =< mP χ de la tabla: 1.5m = 27.096, entonces: m = 18.064 2. Suponga que los pesos de las calculadoras producidas por una
empresa tienen una distribución normal con una variancia de 16 gramos2. Si se elige una muestra aleatoria de 20 calculadoras, hallar: a) La probabilidad que su desviación estándar sea por lo menos
de 3 gramos. b) La probabilidad que la desviación estándar sea a lo mas de 5
gramos. c) El valor de m tal que P ( S2 < m ) = 0.8
SOLUCIÓN: Sea x = peso de una calculadora(gramos) x ∼ N(μx = ?, σ2
x = 16) y n = 20
a) )9)1()1(()9()3( 22
22
σσxnSnPSPSP −
≥−
=≥=≥ , reemplazando:
= 9339.0)6875.10()16
919( 2)19(
2)19( =≥=≥ χχ PxP
b) )25)1()1(()25()5( 22
22
σσxnSnPSPSP −
≤−
=≤=≤
= 9441.0)6875.29()16
2519( 2)19(
2)19( =≤=≤ χχ PxP
ESTADÍSTICA APLICADA
99
c) P(S2 < m) = 0.8
8.0))1()1(( 22
2
=−
<−
σσmnSnP
8.0)16
19( 2)19( =<
mP χ
8.0)1875.1( 2
)19( =< mP χ de la tabla: 1.1875m = 23.9, entonces: m = 20.1263 3. Suponga que los pesos de los alumnos de la UTP tienen una
distribución normal con una media de 70 kg. y una variancia de 10 kg2. Si se eligen al azar 50 alumnos, hallar:
a) la probabilidad que su variancia esté comprendida entre 8 y
12 kg2. b) el valor de “m” tal que: P( s2 > m) = 0.3
SOLUCIÓN:
Sea x = peso de un alumno de la UTP(kilogramos) x ∼ N(μx = 70, σ2
x = 10) y n = 50
a) )12)1()1(8)1(()128( 22
2
22
σσσxnSnxnPSP −
<−
<−
=<<
reemplazando: =
681.01596.08406.0)8.582.39()10
124910
849( 2)49(
2)49( =−=<<=<< χχ PxxP
b) P(S2 > m) = 0.3
3.0))1()1(( 22
2
=−
>−
σσmnSnP
3.0)10
49( 2)49( =>
mP χ
3.0)9.4( 2)49( => mP χ de la tabla: 4.9m = 53.67, entonces:
m = 10.9531
ESTADÍSTICA APLICADA
100
4. Suponga que para analizar el tiempo de atención por cliente en un establecimiento con 1000 clientes, se tomó una muestra aleatoria sin reemplazo de 24 atenciones con la cual se obtiene un tiempo promedio de 10 minutos y una variancia de 2 minutos2. Si se toma otra muestra sin reemplazo de tamaño 24 hallar la probabilidad que el promedio muestral difiera de su media poblacional en menos de un minuto.
SOLUCIÓN: Sea x = tiempo de atención (minutos) N = 1000, n = 24, 10=x y S2 = 2 )1( <− μxP = )11( <−<− μxP
= )11(xxx SS
xS
P <−
<− μ
Como el muestreo es sin reemplazo, entonces:
)1
(2
2
−−
=N
nNn
SS xx , reemplazando:
081414748.0)11000241000(
2422 =
−−
=xS , entonces: 285333.0=xS , luego:
)285333.0
1285333.0
1()1( )23( <<−
=<− tPxP μ
9981.000095.099905.0)5047.35047.3( )23( =−=<<−= tP 5. Suponga que una maquina produce diariamente 5000 artículos, y
que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 25 unidades producidas en un día, obteniéndose un peso promedio de 450 grs y una variancia de 20 grs2 . Si se toma otra muestra sin reemplazo de tamaño 25, hallar la probabilidad que el promedio muestral difiera de su media poblacional en mas de 6 grs.
SOLUCIÓN: Sea x = peso de los artículos (gramos) N = 5000, n = 25, 450=x y S2 = 20
ESTADÍSTICA APLICADA
101
)6( >− μxP = )6(1 ≤−− μxP = )66(1 ≤−≤−− μxP
= )66(1xxx SS
xS
P ≤−
≤−
−μ
Como el muestreo es sin reemplazo, entonces:
)1
(2
2
−−
=N
nNn
SS xx , reemplazando:
796159231.0)15000255000(
25202 =
−−
=xS , entonces: 89228.0=xS , luego:
)89228.0
689228.0
6(1)6( )24( <<−
−=>− tPxP μ
00000059.0)7243.67243.6(1 )24( =<<−−= tP
6. Suponga que dos máquinas A y B producen un mismo artículo y que los tiempos de producción (minutos) tienen distribuciones normales con medias: μA = 1430, μB =1410 y variancias
6252 =Aσ , 9002 =Bσ , respectivamente. Si se eligen al azar 31 artículos producidos por la máquina A y 25 artículos producidos por la máquina B, hallar la probabilidad que la variancia de B sea a lo mas 2.7216 veces la variancia de A.
SOLUCIÓN: Sean xA = tiempo de producción de la máquina A XB = tiempo de producción de la máquina B
XA ∼ N(μx = 1430, σ2
x = 625) y nA = 31 XB ∼ N(μx = 1410, σ2
x = 900) y nB = 25 Entonces:
)7216.2()7216.2( 2
222 <=<
A
BAB S
SPSSP
ESTADÍSTICA APLICADA
102
Como 21
22
22
21
σσ
SSF = , entonces:
2
2
2
2
2
2
625900
B
A
A
B
B
A
SS
SSF ==
σσ ~F(30,24) y 2
2
2
2
2
2
900625
A
B
B
A
A
B
SS
SSF ==
σσ ~F(24,30)
)900
7216.2625900625()7216.2()7216.2( 2
2
2
222 x
SSP
SSPSSP
A
B
A
BAB <=<=<
= 95.0)89.1( )30,24( =<FP EJERCICIOS PROPUESTOS 1. Hallar las siguientes probabilidades, para 30 grados de libertad:
a) P ( χ2 > 18.493 ) b) P ( 20.599 < χ2 < 43.773 )
2. Hallar las siguientes probabilidades, para 12 grados de libertad:
a) P ( χ2 > 9.034 ) b) P ( 7.807 < χ2 < 18.549 )
3. Calcular:
a) P( χ2(10) < 7.267 )
b) P( χ2(29) > 42.557 )
c) P( 36.755 < χ2(42) < 54.090 )
4. Hallar las siguientes probabilidades, para 11 grados de libertad :
a) P ( χ2 > 19.675 ) b) P ( 3.816 < χ2 < 21.92 ) c) m si P ( m < χ2 < 12.899 ) = 0.25
5. Hallar “m” tal que : P( 2
)29(χ > m ) = 0.8 6. Suponga que el tiempo de atención por cliente en una tienda tiene
una distribución normal con una desviación estándar de 2 minutos. Si se elige una muestra aleatoria de 21 clientes: a) Hallar la probabilidad que su variancia sea menor de 5
minutos2.
ESTADÍSTICA APLICADA
103
b) Hallar la probabilidad que su variancia sea mayor de 2 minutos2.
d) Hallar el valor de m tal que P( S2 < m ) = 0.6 7. Suponga que los pesos de los alumnos de la UTP tienen una
distribución normal con una media de 70 kg. Y una variancia de 16 kg2. Si se eligen al azar 25 alumnos, hallar: a) la probabilidad que su variancia este comprendida entre 12
y 20 kg2. b) el valor de “k” tal que : P( s2 > k) = 0.4
8. Suponga que el tiempo de duración de los tubos fluorescentes
tienen una distribución normal con una media de veinte mil horas y una variancia de 5.76 horas2 . Si se elige al azar una muestra de 36 fluorescentes, hallar: a) La probabilidad que su variancia sea por lo menos de 3.69
horas2. b) La probabilidad que su variancia esté comprendida entre 3
y 7 horas2. c) La probabilidad que su desviación estándar sea a lo mas
4.53 horas. d) El valor de “k” tal que : P( s2 < k ) = 0.4
9. Si t es una variable aleatoria que tiene una distribución “t” de
Student con 29 g. l. , hallar : a) P ( t > -1.699 ) b) P ( -2.045 < t < 1.311 )
10. Hallar las siguientes probabilidades, para 19 grados de libertad:
a) P( -1.328 < t < 2.093) b) P( 0.861 < t < 1.729 )
11. Si: n = 15 a) Hallar P( -2.145 < t < 2) b) Hallar k si P( k < t < 1.761 ) = 0.875 12. Si: n = 15 a) Hallar P( -2.145 < t < 2) b) Hallar k si P( k < t < 1.761 ) = 0.875 13. Si: n = 49, calcular “m” tal que : P(t > m ) = 0.8
ESTADÍSTICA APLICADA
104
14. Si “t” es una variable aleatoria que tiene una distribución “t” de Student con 29 g.l. , hallar : a) P ( t > -1.699 ) b) P ( -2.045 < t < 1.311 ) c) m si P ( m < t < 2.045 ) = 0.875
15. Suponga que una máquina produce diariamente 200 artículos, y
que para analizar los pesos de tales artículos se eligieron al azar 36 unidades producidas en un día, obteniéndose un peso promedio de 120 gramos y una desviación estándar de 5 gr. Si se toma otra muestra de tamaño 36, hallar la probabilidad que el promedio muestral supere a su media poblacional en menos de 3 gramos.
16. Suponga que una máquina produce diariamente 500 artículos, y
que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 16 unidades producidas en un día , obteniéndose un peso promedio de 250 gr. y una variancia de 12 gr2. Si se toma otra muestra, sin reemplazo, de tamaño 16 , hallar la probabilidad que el promedio muestral supere a su media poblacional en menos de 3 gramos.
17. Suponga que una máquina produce diariamente 1000 artículos, y
que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 25 unidades producidas en un día, obteniéndose un peso promedio de 450 grs y una variancia de 200 grs2. Si se toma otra muestra, sin reemplazo, de tamaño 25, hallar la probabilidad que el promedio muestral supere a su media poblacional en menos de 6 grs.
18. Calcular:
a) P(F(31,4) < 13.83) b) P(F(28,14) < 2.32) c) P(F(52,8) < 5.06) d) P(F(26,20) < 2.07) e) P(F(35,25) < 1.89)
19. Suponga que dos máquinas A y B producen un mismo artículo y
que los tiempos de producción (minutos) tienen distribuciones normales con medias μA = 1430, μB =1410 y variancias 6252 =Aσ ,
9002 =Bσ , respectivamente. Si se eligen al azar 31 artículos producidos por la máquina A y 25 artículos producidos por la máquina B, hallar:
ESTADÍSTICA APLICADA
105
a) )7216.2( 22AB SSP <
b) )5568.37216.2( 2
2
<<A
B
SSP
c) “m” tal que: 98.0)5568.3( 2
2
=<<A
B
SSmP
20. Suponga que dos máquinas A y B producen un mismo artículo y
que los pesos por artículo (gramos) tienen distribuciones normales con medias: μA = 550, μB = 565 y variancias 1442 =Aσ ,
2562 =Bσ , respectivamente. Si se eligen al azar 21 artículos producidos por la máquina A y 31 artículos producidos por la máquina B, hallar:
a) )6267.3( 22AB SSP <
b) )4344.108563.1( 2
2
<<B
A
SSP
c) “m” tal que: 94.0)9245.4( 2
2
=<<A
B
SSmP
ESTADÍSTICA APLICADA
107
UNIDAD V
INFERENCIA ESTADÍSTICA La inferencia estadística es la parte de la estadística que se ocupa del análisis, interpretación de resultados y de la generalización de los resultados para toda una población en base a datos tomados de una muestra aleatoria extraída de esa población. La inferencia estadística se divide en dos partes, la estimación de parámetros y las pruebas de hipótesis. ESTIMACIÓN DE PARAMETROS Son las aproximaciones de los parámetros a partir de datos captados en muestras aleatorias y de acuerdo a ciertos procedimientos establecidos por indicadores que son llamados “estimadores, valores estadísticos o estadígrafos” ESTIMADOR O VALOR ESTADÍSTICO O ESTADIGRAFO Un estimador es cualquier función de las observaciones de una muestra aleatoria, cuya finalidad es obtener una estimación o aproximación del valor de un parámetro. Por ejemplo el promedio muestral x estima a su parámetro poblacional μ y la variancia muestral S2 estima a su parámetro poblacional σ2. Es decir x ∼ μ y S2 ∼ σ2. PROPIEDADES DE LOS ESTIMADORES Para que los estimadores sean buenos, es decir confiables, se deben de cumplir las siguientes propiedades: ESTIMADORES INSESGADOS Un estimador es insesgado si su esperanza matemática es igual a su parámetro. Si el estimador no es insesgado, entonces a la diferencia entre la esperanza matemática y el parámetro se le llama sesgo o error del estimador. Por ejemplo x es un estimador insesgado ya que E( x ) = μ también S2 es un estimador insesgado ya que E(S2) = σ2.
ESTADÍSTICA APLICADA
108
ESTIMADORES CONSISTENTES Un estimador es consistente si al tomar un tamaño de muestras aleatorias cada vez más grandes, su valor se aproxima cada vez más a su parámetro. ESTIMADORES EFICIENTES Un estimador insesgado es eficiente con respecto a otros estimadores insesgados si su variancia es más pequeña. ESTIMADORES SUFICIENTES Un estimador es suficiente si es una función de todas las observaciones de la muestra aleatoria, la cual se capto para estimar a su parámetro. TIPOS DE ESTIMACIÓN ESTIMACIÓN PUNTUAL La estimación es puntual cuando el parámetro es estimado por un único valor. ESTIMACIÓN POR INTERVALOS La estimación es por intervalos cuando el parámetro no es estimado por un único valor, sino por un conjunto de valores contenidos en un intervalo. La técnica de la estimación por intervalos consiste en asociar a cada muestra aleatoria un intervalo que se sospecha que debe contener al parámetro, a este se le denomina intervalo de confianza. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL A) Si la variancia poblacional σ2 es conocida: Donde: Ztab =
)2
1( α−
Z
B) Si la variancia poblacional σ2 no es conocida: Donde: ttab =
)1,2
1( −− nt α
ασμσ −=+<<− 1)( xtabxtab ZxZxP
αμ −=+<<− 1)( xtabxtab StxStxP
ESTADÍSTICA APLICADA
109
PARA LA VARIANCIA DE UNA DISTRIBUCIÓN NORMAL A) Si la media poblacional μ es conocida: B) Si la media poblacional μ no es conocida: Donde: α = nivel de significación 1-α = nivel de confianza PARA LA DIFERENCIA DE MEDIAS DE DISTRIBUCIONES NORMALES A) Si las variancias poblacionales 2
1σ y 22σ son conocidas:
Donde: Ztab =
)2
1( α−
Z
B) Si las variancias poblacionales 2
1σ y 22σ no son conocidas pero
homogéneas: Donde: ttab =
)2,2
1( 21 −+− nnt α
αχσσ
χσ
αα
−=<<−
1)( 2
),2
(
22
2
),2
1(
2
NN
NNP
αχ
σχ αα
−=−
<<−
−−−
1))1()1(( 2
)1,2
(
22
2
)1,2
1(
2
nn
SnSnP
ασμμσ −=+−<−<−− −− 1))()((2121
212121 xxtabxxtab ZxxZxxP
αμμ −=+−<−<−− −− 1))()((2121
212121 xxtabxxtab StxxStxxP
ESTADÍSTICA APLICADA
110
PRUEBAS DE HIPÓTESIS En muchos trabajos de investigación es necesario decidir si se acepta o se rechaza un enunciado o supuesto acerca de un parámetro; al enunciado o supuesto se le llama hipótesis y al procedimiento para tomar decisiones se le llama prueba de hipótesis. PRUEBA DE HIPÓTESIS Es un procedimiento de decisión estadística que establece la metodología a seguir para la aceptación o rechazo de una hipótesis, sobre la base de las evidencias contenidas en un conjunto de observaciones de una muestra aleatoria. Se plantean dos tipos de hipótesis, la hipótesis planteada (Hp) o hipótesis nula (H0) y la hipótesis alternante (Ha), ambas hipótesis no deben de tener nada en común, es decir son mutuamente excluyentes. Los investigadores generalmente enuncian como sus hipótesis nulas lo contrario de lo que creen que es verdad, con la esperanza de que los procedimientos de demostración los conduzcan a rechazarlas. Por ejemplo, si deseamos probar que el rendimiento académico promedio de los estudiantes de la UTP es mejor que el de otra universidad u otras universidades, podríamos formular en la hipótesis nula de que no hay diferencias en los rendimientos académicos. TIPOS DE ERRORES Como para realizar una prueba de hipótesis, nos basamos en muestras aleatorias, al tomar nuestras decisiones podríamos cometer algunos errores, es decir podríamos tomar decisiones incorrectas. Error Tipo I Este error lo cometemos cuando rechazamos una hipótesis nula siendo esta verdadera. A la probabilidad de cometer el error tipo I se le denomina nivel de significación (α), es decir:
Al complemento de α se le denomina nivel de confianza, es decir:
1-α = nivel de confianza.
P(Error Tipo I) = α
ESTADÍSTICA APLICADA
111
Error Tipo II Este error lo cometemos cuando aceptamos una hipótesis nula siendo esta falsa. A la probabilidad de cometer el error tipo II se le simboliza por β, es decir:
El valor de β se determina en base a la distribución real o verdadera de la variable en estudio. Al complemento de β se le denomina potencia de la prueba, es decir: 1-β = potencia de la prueba. SUPUESTOS PARA REALIZAR UNA PRUEBA DE HIPÓTESIS 1. Las observaciones son extraídas de poblaciones que tienen
distribuciones normales 2. Las muestras aleatorias pertenecen a poblaciones independientes. 3. Los tamaños de las muestras son grandes. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS A) Prueba de hipótesis para la media poblacional μ I) Plantear las hipótesis Puede haber tres posibilidades:
H0 : μ = μ1 ; μ ≥ μ1 ; μ ≤ μ1 Ha : μ ≠ μ1 ; μ < μ1 ; μ > μ1
II) Establecer el nivel de significación (α) y tamaño de la muestra(n)
III) Elección de la prueba estadística Existen dos posibilidades:
Si la variancia poblacional σ2 es conocida, se usa: x
xZσμ−
=
Si la variancia poblacional σ2 no es conocida, se usa: xS
xt μ−=
P(Error Tipo II) = β
ESTADÍSTICA APLICADA
112
IV) Establecimiento de las zonas de aceptación de la hipótesis nula.
Estas zonas o regiones de aceptación de H0 dependen de la hipótesis alternante, es decir:
• Si la variancia poblacional σ2 es conocida Caso I : Prueba de 2 colas o bilateral.
cuando Ha : μ ≠ μ1
Caso II : Prueba de 1 cola o unilateral izquierda. cuando Ha : μ < μ1
ESTADÍSTICA APLICADA
113
Caso III : Prueba de 1 cola o unilateral derecha. cuando Ha : μ > μ1
• Si la variancia poblacional σ2 no es conocida, entonces en lugar de Ztab se obtiene ttab
V) Calculo de la prueba estadística VI) Decisión estadística y conclusiones El valor de la prueba estadística calculada la ubicamos en la
grafica del cuarto paso y dependiendo donde se ubique aceptaremos o rechazaremos a la hipótesis nula.
B) Prueba de hipótesis para la variancia poblacional σ2 I) Plantear las hipótesis Puede haber tres posibilidades:
H0 : σ2 = 21σ ; σ2 ≥ 2
1σ ; σ2 ≤ 21σ
Ha : σ2 ≠ 2
1σ ; σ2 < 21σ ; σ2 > 2
1σ II) Establecer el nivel de significación (α) y tamaño de la muestra(n) III) Elección de la prueba estadística Existe solo una posibilidad:
2
22 )1(
σχ Sn −
=
ESTADÍSTICA APLICADA
114
IV) Establecimiento de las zonas de aceptación de la hipótesis nula Estas zonas o regiones de aceptación de H0 dependen de la
hipótesis alternante, es decir: Caso I : Prueba de 2 colas o bilateral. cuando Ha : σ2 ≠ 2
1σ
Caso II: Prueba de 1 cola o unilateral izquierda. cuando Ha : σ2 < 2
1σ
ESTADÍSTICA APLICADA
115
Caso III: Prueba de 1 cola o unilateral derecha. cuando Ha : σ2 > 2
1σ
V) Calculo de la prueba estadística VI) Decisión estadística y conclusiones El valor de la prueba estadística calculada la ubicamos en la
grafica del cuarto paso y dependiendo donde se ubique aceptaremos o rechazaremos a la hipótesis nula.
C) Prueba de hipótesis para la homogeneidad de variancias
poblacionales
Los pasos a seguir son los mismos que los casos anteriores, donde el estadístico a usar es la prueba:
D) Prueba de hipótesis para la diferencia de medias poblacionales
Los pasos a seguir son los mismos que los casos anteriores, donde el estadístico a usar es la prueba:
• Si las variancias poblacionales son conocidas
21
22
22
21
σσ
SSF =
21
2121
xx
xxxxZ
−
−−−=
σ
μ
ESTADÍSTICA APLICADA
116
• Si las variancias poblacionales no son conocidas pero
homogéneas:
• Si las variancias poblacionales no son conocidas pero heterogéneas:
Donde:
2
22
1
212
21 nS
nSS xx +=− ; si el muestreo es con reemplazo
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−−
+⎟⎟⎠
⎞⎜⎜⎝
⎛−−
=− 11 2
22
2
22
1
11
1
212
21 NnN
nS
NnN
nSS xx ; si el muestreo es sin
reemplazo
21
)()( 2121
xxSxxt
−
−−−=
μμ
21
)()( 2121*
xxSxxt
−
−−−=
μμ
ESTADÍSTICA APLICADA
117
EJERCICIOS RESUELTOS 1. Con la finalidad de estudiar el tiempo que necesita una cajera
para atender a los clientes de una tienda de auto-servicios, se tomó una muestra de 16 clientes, encontrándose un tiempo promedio de servicios de 4.2 minutos, con una desviación estándar de 1.2 minutos. a) Calcular e interpretar un intervalo del 95% de confianza para
el tiempo medio de servicios a los clientes. b) Calcular e interpretar un intervalo del 90% de confianza para
la variancia de los tiempos de servicios de caja. SOLUCIÓN: Sea x = tiempo de atención a los clientes (minutos) Tenemos que: n = 16, 2.4=x , S = 1.2 a) Se tiene que: 1 - α = 0.95, entonces: α = 0.05 Como la variancia poblacional σ2 no es conocida, usaremos:
αμ −=+<<− 1)( xtabxtab StxStxP Donde: ttab =
)1,2
1( −− nt α = t(0.975,15) = 2.131
09.016
)2.1( 222 ===
nSSx , entonces: 3.0=xS
Reemplazando:
95.0)3.0131.22.43.0131.22.4( =+<<− xxP μ
P(3.5607 < μ < 4.8393) = 0.95
Tenemos un 95% de confianza de que la verdadera media poblacional del tiempo de atención al cliente esta comprendido entre 3.5607 y 4.8393 minutos.
ESTADÍSTICA APLICADA
118
b) En este caso: 1 - α = 0.90, entonces: α = 0.10 Como la media poblacional μ no es conocida:
Para α = 0.10 los chi-cuadrados tabulares para 15 g.l. son:
996.242)15,95.0( =χ y 261.72
)15,05.0( =χ Reemplazando:
90.0)261.7
44.115996.24
44.115( 2 =<<xxP σ
P(0.8641< σ2 < 2.9748) = 0.90
Tenemos un 90% de confianza de que la verdadera variancia poblacional de los tiempos de atención al cliente esta comprendido entre 0.8641 y 2.9748 minutos2.
2. Una compañía produce focos pequeños de 1.5 voltios y desea
analizar la variabilidad del proceso de producción. Se tomo una muestra aleatoria de 16 focos, y se obtuvo una media de la duración igual a 120 horas y un coeficiente de variabilidad igual al 25%. Halle el intervalo de confianza del 98% para la variancia poblacional.
SOLUCIÓN: Sea x = duración de los focos de 1.5 voltios (horas) Tenemos que: n = 16, 120=x , c.v. = 25%
Como 1 - α = 0.98, entonces: α = 0.02 Como la media poblacional μ no es conocida:
αχ
σχ αα
−=−
<<−
−−−
1))1()1(( 2
)1,2
(
22
2
)1,2
1(
2
nn
SnSnP
αχ
σχ αα
−=−
<<−
−−−
1))1()1(( 2
)1,2
(
22
2
)1,2
1(
2
nn
SnSnP
ESTADÍSTICA APLICADA
119
Para α = 0.02 los chi-cuadrados tabulares para 15 g.l. son:
Sabemos que: c.v. = 100xxS = 25% = 0.25 ⇒ S = 30 y S2 = 900
Reemplazando:
98.0)229.590015
578.3090015( 2 =<<
xxP σ
P(441.4939< σ2 < 2581.7556) = 0.98 Tenemos un 98% de confianza de que la verdadera variancia poblacional de la duración de los focos de 1.5 voltios esta comprendido entre 441.4939 y 2581.7556 horas2.
3. Suponga que las notas de los alumnos de Administración se
distribuyen en forma normal con una desviación estándar de 3; se seleccionaron al azar 20 alumnos, registrándose una nota promedio de 14 y una variancia de 4. Calcule e interprete:
a) Un intervalo del 98% de confianza para su verdadera media. b) ¿Con un riesgo del 1%, se puede concluir que la nota media
de los alumnos es superior de 12?
SOLUCIÓN: Sea x = nota de los alumnos Tenemos que: σ = 3, n = 20, 14=x , S2 = 4 ⇒ S = 2
a) Se tiene que: 1 - α = 0.98, entonces: α = 0.02 Como la variancia poblacional σ2 es conocida, usaremos:
ασμσ −=+<<− 1)( xtabxtab ZxZxP Donde: Ztab =
)2
1( α−
Z = Z(0.99) = 2.325
45.020)3( 22
2 ===nxσσ , entonces: 6708.0=xσ
229.52)15,01.0( =χ 578.302
)15,99.0( =χ y
ESTADÍSTICA APLICADA
120
Reemplazando:
98.0)6708.0325.2146708.0325.214( =+<<− xxP μ
P(12.44 < μ < 15.56) = 0.98
Tenemos un 98% de confianza de que la verdadera media poblacional de las notas de los alumnos de Administración esta comprendido entre 12.44 y 15.56.
b) Nos piden que realicemos una prueba de hipótesis para la
verdadera media de las notas con un nivel de significación de 0.01.
I) H0 : μ ≤ 12 Ha : μ > 12 II) α = 0.01 y n = 20 III) Como se conoce a la variancia poblacional, se usara:
IV) Como Ha : μ > 12 Se trata de una prueba de 1 cola o unilateral
derecha.
ESTADÍSTICA APLICADA
121
V) Calculo del estadístico Z
xcal
xZσμ−
= = 9815.26708.0
1214=
−
VI) Como Z calculado esta en la zona de rechazo de la H0 , entonces no se acepta hipótesis nula.
En conclusión, existe evidencia estadística de que la verdadera nota media de los alumnos de Administración es mayor de 12, con un nivel de significación de 0.01.
4. La Dirección General de Transito del Perú usa decenas de focos
para semáforos cada año. La marca que ha sido usada hasta ahora tiene una vida media de 1000 horas y una desviación estándar de 90 horas. Es ofrecida una nueva marca a la Dirección a un precio muy inferior al que ha estado pagando. Se decide que se debe comprar la nueva marca, a menos que su vida media sea menor de 1000 horas. Posteriormente, son probadas 100 focos de esta nueva marca, dando un promedio de 990, suponiendo que la variancia de la nueva marca es la misma que la antigua:
a) Encuentre e interprete según enunciado un intervalo del 95%
de confianza para la vida media de la nueva marca. b) ¿Qué recomendaría a la Dirección General de Transito para
un nivel de significación del 5%?. SOLUCIÓN: Sea x = duración de los focos (horas) Para la marca antigua tenemos: μ = 1000 y σ = 90 Para la nueva marca tenemos: N = 100 , x = 990 y σ = 90
a) Se tiene que: 1 - α = 0.95, entonces: α = 0.05 Como la variancia poblacional σ2 es conocida, usaremos:
ασμσ −=+<<− 1)( xtabxtab ZxZxP
ESTADÍSTICA APLICADA
122
Donde: Ztab = )
21( α−
Z = Z(0.975) = 1.96
81100
)90( 222 ===
nxσσ , entonces: 9=xσ
Reemplazando:
95.0)996.1990996.1990( =+<<− xxP μ P(972.36 < μ < 1007.64) = 0.95 Tenemos un 95% de confianza de que la verdadera media poblacional del tiempo de duración de los focos para semáforo esta comprendido entre 972.36 y 1007.64 horas.
b) Nos piden que realicemos una prueba de hipótesis para la
media de la duración de los focos con un nivel de significación de 0.05.
I) H0 : μ ≥ 1000 Ha : μ < 1000 II) α = 0.05 y n = 100 III) Como se conoce a la variancia poblacional, se usara:
x
xZσμ−
=
IV) Como Ha : μ < 1000 Se trata de una prueba de 1 cola o unilateral izquierda.
ESTADÍSTICA APLICADA
123
V) Calculo del estadístico Z
xcal
xZσμ−
= = 11111.191000990
−=−
VI) Como Z calculado esta en la zona de aceptación de la H0, entonces se acepta hipótesis nula. En conclusión, existe evidencia estadística suficiente de que los focos tienen una duración media verdadera de por lo menos de 1000 horas, por lo tanto se recomendaría a la Dirección General de Transito que compren a la nueva marca de focos, con un nivel de significación del 5%.
5. Se diseña la dimensión de una determinada pieza de 5 cm. para
que dicha pieza encaje con otra. Por experiencia se sabe que la variancia del proceso es de 0.0064 cm2. Si una muestra aleatoria de 49 piezas presenta una media de 5.05 cm:
a) ¿Cuál es el intervalo de confianza del 99% para la verdadera
media de la longitud de las piezas? b) ¿Se debe aceptar que la media de la longitud de la pieza es
igual a 5 cm.? Use 1% de error.
SOLUCIÓN: Sea x = longitud de las piezas (centímetros) Tenemos que: σ2 = 0.0064 ⇒ σ = 0.08, n = 49, 05.5=x
a) Se tiene que: 1 - α = 0.99 ⇒ α = 0.01 Como la variancia poblacional σ2 es conocida, usaremos: ασμσ −=+<<− 1)( xtabxtab ZxZxP Donde: Ztab =
)2
1( α−
Z = Z(0.995) = 2.575
ESTADÍSTICA APLICADA
124
0001306.0490064.02
2 ===nxσσ , entonces: 01143.0=xσ
Reemplazando: 99.0)01143.0575.205.501143.0575.205.5( =+<<− xxP μ P(5.0206 < μ < 5.0794) = 0.99
Tenemos un 99% de confianza de que la verdadera media poblacional de la longitud de las piezas esta comprendido entre 5.0206 y 5.0794 cm.
b) Nos piden que realicemos una prueba de hipótesis para la
verdadera media de la longitud de las piezas con un nivel de significación de 0.01.
I) H0 : μ = 5 Ha : μ ≠ 5 II) α = 0.01 y n = 49 III) Como se conoce a la variancia poblacional, se usara:
IV) Como Ha : μ ≠ 5 Se trata de una prueba de 2 colas o bilateral.
ESTADÍSTICA APLICADA
125
V) Calculo del estadístico Z
xcal
xZσμ−
= = 37445.401143.0
505.5=
−
VI) Como Z calculado esta en la zona de rechazo de la H0 ,
entonces no se acepta hipótesis nula. En conclusión, existe evidencia estadística suficiente para afirmar que la verdadera media de la longitud de las piezas no es de 5 cm., con un nivel de significación del 1%.
EJERCICIOS PROPUESTOS
1. Con la finalidad de estudiar el tiempo que necesita una cajera
para atender a los clientes de una tienda de auto-servicios, se tomó una muestra de 25 clientes, encontrándose un tiempo promedio de servicios de 3.5 minutos, con una desviación estándar de 1.2 minutos. a) Calcular e interpretar un intervalo del 90% de confianza para
el tiempo medio de servicios a los clientes. b) Calcular e interpretar un intervalo del 95% de confianza para
la variancia de los tiempos de servicios de caja. 2. Una compañía produce focos pequeños de 1,5 voltios y desea
analizar la variabilidad del proceso de producción. Se tomo una muestra aleatoria de 20 focos, y se obtuvo una media de la duración igual a 100 horas y un coeficiente de variabilidad igual al 15%. Halle el intervalo de confianza del 95% para la desviación estándar poblacional.
ESTADÍSTICA APLICADA
126
3. Suponga que las notas de los alumnos de Administración se distribuyen en forma normal con una desviación estándar de 5; se seleccionaron al azar 16 alumnos, registrándose una nota promedio de 15 y una variancia de 4. Calcule e interprete: a) Un intervalo del 99% de confianza para su verdadera media. b) Un intervalo del 98% de confianza para su verdadera
variancia. c) ¿Con un riesgo del 5%, se puede concluir que la nota media
de los alumnos es superior de 14? 4. La Dirección General de Transito del Perú usa decenas de focos
para semáforos cada año. La marca que ha sido usada hasta ahora tiene una vida media de 1000 horas y una desviación estándar de 90 horas. Es ofrecida una nueva marca a la Dirección a un precio muy inferior al que ha estado pagando. Se decide que se debe comprar la nueva marca, a menos que su vida media sea menor de 1000 horas. Posteriormente, son probadas 120 focos de esta nueva marca, dando un promedio de 990, suponiendo que la variancia de la nueva marca es la misma que la antigua: a) Encuentre e interprete según enunciado un intervalo del 98%
de confianza para la vida media de la nueva marca. b) ¿Qué recomendaría a la Dirección General de Transito para
un nivel de significación del 1%?. c) Si la verdadera vida media de la nueva marca es de 950
horas. ¿Se estaría cometiendo algún error en la prueba realizada en b)?. ¿De que tipo? Justifique su respuesta.
5. Se diseña la dimensión de una determinada pieza de 5 cm. para
que dicha pieza encaje con otra. Por experiencia se sabe que la variancia del proceso es de 0.0081 cm2. Si una muestra aleatoria de 49 piezas presenta una media de 4.95 cm.:
a) ¿Cuál es el intervalo de confianza del 98% para la verdadera media de la longitud de las piezas?
b) ¿Se debe aceptar que la media de la longitud de la pieza sea por lo menos de 3 cm.? Use 5% de error.
c) Si se selecciona una muestra de 36 piezas. ¿Qué valores debe tomar el estimador para aceptar la hipótesis nula en b)?
ESTADÍSTICA APLICADA
127
6. Una fábrica que produce barras de acero está interesada en saber el contenido de carbono que existen en las barras. Se tomo una muestra al azar de 10 barras obteniéndose una variancia de 1296 y una media de 188. a) Halle un intervalo con un 95% de confianza para el contenido
promedio de carbono de las barras de acero de la fábrica. b) Halle un intervalo con un riesgo del 1% para la verdadera
variancia de carbono en las barras de acero de la fábrica. c) Con un riesgo del 10% se puede afirmar que la variancia del
contenido de carbono es diferente de 1290. 7. Un proceso de ensamblaje está planeado como una actividad que
demora 20 minutos. Estudios anteriores revelan una desviación estándar de 6 minutos para la ejecución del ensamble. Una muestra aleatoria de la realización de 9 ensambles dio como resultado un tiempo medio de 24.3 minutos por ensamble. Calcule e interprete: a) Un intervalo del 90% de confianza para la verdadera media
del tiempo de ejecución del ensamble. b) Un intervalo del 95% de confianza para la verdadera media
del tiempo de ejecución del ensamble. 8. Un saco de patatas fue muestreado para analizar su calidad y se
seleccionaron 11 patatas, registrándose el peso de cada una, con los siguientes resultados: 17, 15, 10, 11, 12, 15, 9, 19, 13, 11, 14. Calcule e interprete un intervalo del 98% de confianza para la media poblacional.
9. Puede mostrarse que las observaciones tomadas de cargamentos
de un cierto producto químico se distribuye normalmente alrededor de la densidad media verdadera y con una desviación estándar de 0.005 g/cm3. ¿Qué tamaño de muestra es necesario para estimar la verdadera densidad media, si se desea tener un error de estimación que no exceda a 0.002 g/cm3 para un intervalo de confianza del 95%?
10. En una muestra de 14 pernos la estimación de la desviación
estándar poblacional de la longitud del perno fue de 0.021 pulgadas. ¿Cuales son los límites del intervalo del 98% de confianza para la verdadera variancia poblacional? ¿Qué suposiciones deben hacerse para hallar el intervalo de confianza?
ESTADÍSTICA APLICADA
128
11. Una fabrica que produce piezas de alta precisión y periódicamente chequea la longitud de las piezas producidas para analizar su variabilidad. Con tal fin se selecciono una muestra aleatoria simple de 9 piezas y se obtuvo los siguientes resultados maestrales:
∑ X1= 13, 05 y ∑ X2 = 24, 92
Sabiendo que la longitud se distribuye normalmente, halle e
interprete un intervalo de 90% para la verdadera variancia del proceso.
12. Un fabricante de pilas para linterna afirma que la vida media de su
producto excederá de 30 horas. Una compañía desea comprar una cantidad muy grande de pilas siempre y cuando la afirmación sea cierta. Se prueba una muestra al azar de 36 pilas, y se encuentra que la vida media de la muestra es de 31 horas. Si la población de pilas tiene una desviación estándar de 5 horas: a) Encuentre el intervalo del 99% de confianza para la
verdadera vida media de ese producto. Interprete según el enunciado.
b) A un nivel a = 0,10. ¿Qué recomendaría al Gerente de la compañía?
c) ¿Para que valores de a la compañía no adquirirá las pilas? 13. Un Agrónomo tiene semillas de una nueva variedad de maíz, las
cuales son sembradas en 6 parcelas de características homogéneas. Los rendimientos en toneladas por hectáreas fueron los siguientes:
361 =∑ X 32)( 21 =−∑ XX
a) Hallar los límites de confianza para el verdadero rendimiento
promedio de la variedad de maíz con el 95% de confianza. Interprete sus resultados.
b) Si el Agrónomo sostiene que la variedad de maíz sometida a experimentación tiene un rendimiento medio diferente de 4 ton/Ha.. y con la información obtenida se puede aceptar lo que afirma el Agrónomo? ( Use α = 0.05)
c) ¿Se puede afirmar que la variabilidad del rendimiento de la variedad de maíz en mención es a lo más 2 (Ton/Ha)?.
Use α = 0.01
ESTADÍSTICA APLICADA
129
14. En una muestra de 25 paquetes distribuidos por una compañía se encontró un promedio de 350 Kg. y una variancia de 2500 Kg. ¿Existen bases para afirmar que el lote de 25 paquetes excederán la capacidad de los camiones de transporte que se sabe que es de 8000 Kg?
Use α = 0.05 15. Una empresa de transportes desconfía de la afirmación de que la
vida útil promedio de ciertos neumáticos es al menos de 28000. Para verificar la afirmación, se colocan 28 neumáticos en sus camiones y se obtiene una vida útil promedio de 27 250 millas, con una desviación estándar de 1 348 millas. ¿Qué puedes concluir con esos datos? a un nivel de significación de 0.01?.
16. Un fabricante de pernos ha tenido últimamente quejas de sus
clientes sobre las dimensiones de los pernos , ya que presentaban una excesiva variabilidad. El productor afirma que la desviación estándar es a lo más 0.3 y desea comprobar lo anterior mediante una muestra. Se selecciona una muestra aleatoria simple de 20 pernos y obtiene los siguientes resultados:
∑ = 362
ix 10=∑ ix
a) ¿ Es correcto lo que afirma el productor? . (Use α = 0.01). b) ¿Para qué valores del estimador se aceptará la hipótesis
planteada en la pregunta a? 17. Una máquina que produce tuercas es detenida periódicamente de
modo que el diámetro de las turcas producidas puede ser analizado . En este caso interesa la variabilidad de los diámetros de las tuercas. Suponga que una muestra aleatoria simple de 30 tuercas proporciona una variancia muestral del diámetro igual a 3.4 milímetros. Si la variancia del diámetro debe ser de 8 milímetros o menos para aceptar la producción de la máquina. a) ¿Existe evidencia significativa para rechazar dicha
producción?. (Use α = 0.02). b) Si la variancia verdadera es de 9 milímetros 2. ¿Qué tipo de
error se cometió?. Justifique su respuesta. 18. Se a propuesto dos métodos para determinar el contenido de
humedad de la semilla del fríjol y en ambos se han empleado muestra de tamaño 21. El método I es más fácil de aplicar , pero parece más variable que el II .
ESTADÍSTICA APLICADA
130
Basándose en los siguientes resultados :
( ) 340221
111 =−∑
=jj xx ( ) 240
21
1
222 =−∑
=jj xx
a) Encuentre un intervalo de 90% de confianza para la
verdadera razón de variancias del modo : entre el método II. Interprete según el enunciado.
b) ¿A que conclusión llegaría Ud. a un nivel de significación α=0.05?
19. Se requiere determinar si existe menos variabilidad en el plateado
realizado por la compañía 1 que el efectuado por la compañía 2. Con tal motivo se tomaron una muestra de tamaño 12 de los trabajos efectuados por la compañía 1 y otra de tamaño 15 de los trabajos desempeñados de la compañía 2, los cuales produjeron las siguientes desviaciones estándares : S1=0.035 mil. y S2=0.062 mil. a) Encuentre un intervalo de confianza de 90% para la
verdadera razón de variancia 22
21
σσ . Interprete según
enunciado. b) ¿A qué conclusión llegaría Ud. a un nivel de significación
α=0.05? 20. Para probar la afirmación de que la resistencia de un alambre
eléctrico puede reducirse en más de 0.005 ohmios , mediante aleaciones, 32 valores obtenidos de alambre ordinario produjeron un promedio de 0.136 ohmios , y 32 valores obtenidos con el alambre fabricado a base de aleaciones produjeron un promedio de 0.083 ohmios . Suponiendo que la desviación estándar de la resistencia para ambos tipos de alambre son iguales a 0.005 ohmios. a) Halle un intervalo de confianza del 95% para la verdadera
diferencia de medias μ1-μ2. Interprete según enunciado. b) ¿Apoyaría Ud. la afirmación a un nivel de significación
α=0.05?. 21. Se utilizaron dos máquinas A y B, para llenar botellas que se
supone deben contener un volumen neto de 5.65 litros. El proceso de llenado de máquina A tiene una desviación estándar de 0.015 litros y el proceso de llenado de la máquina B tiene
ESTADÍSTICA APLICADA
131
una desviación estándar de 0.016 litros . Ha surgido la preocupación de si las dos máquinas están realizando el mismo trabajo. El ingeniero de control afirma que debido al estrecho acuerdo entre las desviaciones estándar y en razón a otras mediciones las máquinas se están llenando con la misma cantidad. Se toma una muestra aleatoria de cada máquina obteniéndose los siguientes resultados:
Máquina A Máquina B nA = 20 nB = 25 6345.5=AX 634.5=BX
a) Encuentre un intervalo de 98% para la verdadera diferencia de medidas μx- μy. Interprete según enunciado.
b) ¿Está Ud. de acuerdo con el ingeniero de control a un nivel α=0.05?.
22. Una empresa ganadora desea comprar dos marcas de alimento: A
y B, y decide experimentar con ellos antes de realizar la compra definitiva. El alimento A fue proporcionado a 10 animales seleccionados aleatoriamente, mientras que el alimento B a 6 animales obteniéndose los siguientes resultados de incremento de pesos:
4=Ax 5=Bx
60)(!1
10
1=−∑
=AA
iA xxx 322
6
1
2 =−−∑=
BBi
xnx
a) Probar si existe diferencias significativas entre los
incrementos medios de pesos producidos por los alimentos a un nivel α=0.02. Sugerencia: pruebe si existe homogeneidad de variancias.
b) Si realmente μA- μg=2. ¿ está Ud. cometiendo algún tipo de error según la conclusión establecida en (a)?. ¿Cuál de los errores sería?
c) Encuentra un intervalo del 98% de confianza para la verdadera diferencia de media μA- μg.
ESTADÍSTICA APLICADA
132
23. Un centro de investigación condujo un experimento para determinar los efectos de la marihuana sobre la sexualidad. Se seleccionaron 11 hombres jóvenes en buen estado de salud que habían fumado marihuana por lo menos 4 días a la semana un mínimo de 6 semanas, sin usar otra droga en ese período.
Se usó un grupo de control de otros 10 jóvenes que jamás habían
fumado marihuana, para hacer la comparación. La medida de la sexualidad fue el nivel de hormona masculina testosterona en la sangre (en unidades de hormona testosterona)
4201 =x 728310
12 =∑
=iix
S1 = 12.22 1.1822)( 22
10
12 =−∑
=
xxi
i
a) ¿Son homogéneas las varianzas? Use α=0.10 b) El uso de la marihuana desminuye en promedio, el impulso
sexual? Use α=0.10. (Considere el resultado de a). 24. Se sabe que la máquina de empacar de una firma de cereales de
secados verte el cereal seco en cajas de tamaño económico con una desviación estándar de 0.6 onzas. Se lleva a cabo verificaciones constantes de los pesos netos de las cajas para mantener el ajuste de la maquinaría que controla el peso neto. Dos muestras tomadas en dos días presentan la siguiente información:
n1=30 n2=35 onzasx 87.181 = onzasx 9.212 = Utilice α= del 5% en todos los siguientes casos:
a) ¿Se puede afirmar que en el primer día, la máquina estaba ajustada para llenar 20 onzas o más?.
b) ¿Se puede afirmar que en el segundo día la máquina estaba ajustada para llenar más de 20 onzas?.
Grupo que ha fumado marihuana (1)
Grupo que jamás ha fumado marihuana (2)
ESTADÍSTICA APLICADA
133
c) Se puede verificar que no existe ningún cambio en el ajuste de la máquina en el primer y segundo día.
25. Un fabricante de motores desea determinar si los combustibles
que se distribuyen en el mercado cumplen con los requerimientos. Para ello se tomaron muestras de ambos combustibles los siguientes resultados para el impulso específico (en libras/seg)
Combustibles n Promedio Variancia A B
21 340.5 19.2 25 348.5 7.7
Uno de los requerimientos para que el fabricante acepte un
combustible es que la variancia del impulso específico sea a lo más de 11 ( lib/seg)2 a) ¿Cumplirá el combustible A con el requerimiento del
fabricante? Use α=0.05 b) ¿Para que valores del estimador no existirá evidencia para
rechazar la Hp. en (a)? c) ¿Con que nivel de significación se aceptaría la Hp. en (a)?
d) ¿Se puede concluir, para α= 10% que el impulso específico medio del combustible B es superior en 10 lib/seg o más que el impulso específico del combustible A?
e) Si la verdaderas medias del impulso específico de los combustibles A y B son μA = 350 lib/seg y μB = 360 lib/seg. ¿se cometió algún error en (d)?
26. Al analizar muestras de tejido hepático de 16 ratas se obtuvo que
tenia en promedio un contenido de 5.2 mgrs de glucógeno/100 mgrs de tejido)2. Si se asume que el contenido de carbohidratos (glicógeno) se distribuye normalmente. a) Calcule e interprete un intervalo del 90% de confianza para la
media del contenido de carbohidrato. b) ¿Se puede afirmar que la media del contenido de
carbohidrato es igual a 4.6 mgrs de glicógeno/100 mgrs de tejido? Use α = 0.10
27. Dos tipos de botellas de vidrio son adecuados para su utilización
en una embotelladora de bebidas gaseosas. La resistencia a la presión interna de un envase es una característica de calidad importante. Se sabe que las desviaciones estándar de las resistencias para cada tipo de botella de vidrio es igual a 3.0 psi.
ESTADÍSTICA APLICADA
134
Se tomaron muestras de cada tipo y se obtuvieron los siguientes resultados:
Tipo 1 Tipo 2 n1 = 16 n2 = 16 psix 8.1751 = psix 3.1812 = La compañía no utilizará el tipo de botella 2 a no ser que su
resistencia a la presión en promedio exceda a la de tipo 1 en, por lo menos 5 psi . ¿Utilizará el tipo 2, con base en los datos muestrales? Use α = 0.05.
28. Una tienda tiene dos planes de crédito disponibles para sus
clientes con cuenta corriente. La administración de la tienda desea recopilar información acerca de cada plan y estudiar las diferencias entre los dos planes. Se seleccionó una muestra de 25 clientes del plan A y de 50 clientes del plan B, con los siguientes resultados en miles de unidades monetarias acerca del saldo mensual.
a) Halle e interprete un intervalo del 98% de confianza para la
desviación estándar del plan B. b) ¿Hay evidencias muestrales para afirmar que existen
diferencias entre los saldos mensuales promedio de los planes? Use α = 0.05.
Plan n Promedio Desviación estándar
A B
2550
202.5 297.0
40.500 38.178
ESTADÍSTICA APLICADA
135
UNIDAD VI
ANÁLISIS DE REGRESIÓN MÚLTIPLE El análisis de regresión consiste en emplear métodos que nos permitan determinar la relación funcional entre las variables en estudio; de forma tal que nos permita predecir el valor de una variable utilizando los valores que correspondan a las otras variables. Por ejemplo al rector de la universidad le interesa conocer cual es el desempeño profesional de sus egresados, es decir, de que depende que los egresados de la UTP tengan éxito, al vice-rector de investigación le interesa saber que temas o trabajos son los que los estudiantes quieren realizar, al decano de la facultad de Administración le interesa saber de que depende, que sus alumnos tengan un buen rendimiento académico, a los profesores nos interesa saber por que motivos desaprueban los estudiantes, etc. Podemos observar que en estos ejemplos están involucradas varias variables, las cuales son estudiadas mediante el análisis de regresión, dejo a los profesores para que discutan con sus alumnos cuales serian las variables dependientes y cuales las independientes. REGRESIÓN LINEAL MÚLTIPLE El análisis de regresión se usa por explicar o modelar la relación funcional entre una variable Y , llamada respuesta, rendimiento o variable dependiente, y una o más variables predictoras, o independientes o explicativas 1, , kX XK . Cuando 1k = , se tiene el caso de regresión lineal simple, si 1k > , se tiene el caso de regresión múltiple. La respuesta debe ser una variable continua pero las variables explicativas pueden ser continuas, discretas o categóricas aunque se deja el manejo de variables explicativas categóricas para otro curso. Los análisis de la regresión tienen varios posibles objetivos los cuales incluyen: 1. La predicción de observaciones futuras. 2. La valoración del efecto de, o relación entre, variables explicativas y
la respuesta. 3. Una descripción general de estructura de los datos.
ESTADÍSTICA APLICADA
136
Es importante entender cómo los datos fueron recogidos. ¿Son los datos de observación o experimentales? ¿Hay falta de respuesta? ¿Hay valores perdidos? ¿Qué representa los datos en cifras?, representadas las variables cualitativas. ¿Cuáles son las unidades de medida? Cuidado con errores en la entrada de datos. Modelo de Regresión Lineal Múltiple El modelo de regresión lineal múltiple con k variables predoctoras x1, x2 , … xk, es de la siguiente forma: Donde: x1, x2 , … xk , son variables independientes, fijadas y medidas sin error. β0 ,β1 ,β2 , . . . βk son parámetros desconocidos. A β0 se le conoce con el nombre de intercepto, y a los β1,β2, . . . βk se les llaman coeficientes de regresión poblacional. ε es una variable aleatoria no correlacionada y no observable tal que:
E(ε) = 0 y V(ε) = σ2
• β0 es la media de “y” cuando x1 = x2 = . . . = xk = 0 • βj , para j = 1, 2, . . . , k indica el cambio promedio en la variable
dependiente “y” por unidad de cambio de “x j” , cuando las demás variables independientes permanecen constantes.
ESTIMACIÓN DE LOS PARÁMETROS βJ Para encontrar los estimadores de los coeficientes de regresión se aplica el método de los mínimos cuadrados a partir de una muestra aleatoria de tamaño n. ECUACIÓN DE LA LINEA DE REGRESIÓN MÚLTIPLE MUESTRAL
y = β0 + β1x1 +β2x2 + . . . +βkxk +ε
ESTADÍSTICA APLICADA
137
Donde: A b0 se le conoce con el nombre de intercepto muestral, y a los b1,b2, b3 , . . . bk se les llaman coeficientes de regresión muestral y e es el término del error o perturbación aleatoria. TEOREMA Las estimaciones de mínimos cuadrados de los coeficientes de regresión múltiple están dadas por: Donde XT es la transpuesta de X y (XTX)-1 es la inversa de XTX Además: 1 x11 x12 …x1k X= 1 x21 x22 …x2k . . . . . . 1 xn1 xn2 …xnk
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
ny
yy
YM
2
1
y
⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
=
∧
∧
∧
k
B
β
β
β
M
1
0
n ∑x1 ∑x2 … ∑xk
∑x1 ∑ 21x ∑x1x2 ... ∑x1 xk
XTX= ∑x2 ∑ x2x1 ∑ 22x ... ∑x2xk
. . . . . . . . . . . . . . . . . . . . . . . . . ∑xk ∑ xkx1 ∑xkx2 ... ∑ 2
kx
B = (XTX)-1XTY
ESTADÍSTICA APLICADA
138
⎟⎟⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝
⎛
=
∑
∑∑∑
yx
yx
yx
y
YX
k
T
L
2
1
COEFICIENTE DE DETERMINACION: R2 Mide la proporción de la variación total que es explicada por un modelo de regresión. El coeficiente de determinación se usa como un indicador del grado de bondad de ajuste, de un modelo de regresión, es decir si el modelo estimado proporciona una buena explicación del comportamiento de la variable en estudio o variable dependiente. Este coeficiente es calculado del siguiente modo:
Donde: SCR = suma de cuadrados de regresión SCT = suma de cuadrados total Donde: SCE = suma de cuadrados del error SCE = YTY - YX TTβ SCR = 2ˆ YnYX TT −β ESTIMACION DE σ POR MAXIMA VEROSIMILITUD
R2 = SCTSCR
SCT = SCR + SCE
nYXBYY TTT −
=σ
ESTADÍSTICA APLICADA
139
Se debe de tener en cuenta que los resultados de las:
iβ ∀ i = 0, 1, 2, . . . , k son combinaciones lineales de las n variables aleatorias independientes yi , tales que las iβ tienen distribuciones normales. Además se cumple que:
iiE ββ =)ˆ( ∀ i = 0, 1, 2, . . . , k
2)ˆ( σβ iii cV = ∀ i = 0, 1, 2, . . . , k Donde: cij es el elemento del i-ésimo renglón y la j-ésima columna de la matriz
1)( −XX T donde i y j toman los valores 0, 1, 2, . . . , k
También: 2)1(2
2
~ˆ−−kn
n χσσ ; 2
2ˆσσn y iβ son independientes
Al combinar todos estos resultados, tenemos que la definición de la distribución “t” de Student nos conduce a: TEOREMA Con las suposiciones del análisis de regresión lineal múltiple:
Son valores de variables aleatorias que tienen la distribución “t” de Student con n - k -1 grados de libertad. PRUEBAS DE HIPÓTESIS Estas pruebas acerca de parámetros se realizan para medir la adecuación del modelo. Tal como se vio anteriormente, una prueba de hipótesis requiere que los términos del error εi del modelo de regresión tengan una distribución normal e independiente con media cero y variancia σ2.
1ˆ
ˆ
−−
−=
kncn
tii
ii
σ
ββ ∀ i = 0, 1, 2, . . . , k
ESTADÍSTICA APLICADA
140
PRUEBA PARA LA SIGNIFICACION DE UNA REGRESION La prueba de la significación de una regresión sirve para determinar si existe una relación lineal entre la variable dependiente “y” y un conjunto de variables independientes x1 , x2 , x3 , . . . , xk . H0 : β1 = β2 = . . . = βk = 0 Ha : Al memos una de las βj es diferente de cero Rechazar H0 implica que al menos una de las variables independientes contribuye de manera significativa al modelo. El estadístico para probar esta hipótesis es el “ F” definido por: Donde: p = número de parámetros Se rechazara H0 si el valor calculado de F es mayor que el Ftabular = F(α, k, n-p) CUADRO DE ANALISIS DE VARIANCIA (ANVA)
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio Fc
Regresión SCR k CMR CMR/CME Error o residual SCE n - p CME Total SCT n - 1 • Cuando se rechaza H0 se tiene que realizar pruebas individuales
para los βj , estas pruebas se realizan con el estadístico “t” de Student.
pnSCE
kSCR
FC
−
=
ESTADÍSTICA APLICADA
141
EJERCICIOS RESUELTOS 1. Los siguientes datos muestran el número de habitaciones, el
número de baños y los precios a los que se vendieron hace poco 8 casas de una muestra aleatoria de un distrito de Lima:
Nº de Habitaciones
(x1) Nº de Baños (x2) Precio (y) (en dólares)
3 2 4 2 3 2 5 4
2 1 3 1 2 2 3 2
78 800 74 300 83 800 74 200 79 700 74 900 88 400 82 900
a) Estime la ecuación de regresión lineal múltiple y prediga el precio
de venta de una casa de tres habitaciones con dos baños. b) Pruebe la hipótesis nula β1 igual a $ 3500 contra la hipótesis
alternante β1 mayor de $ 3500 para un nivel de significación de 0.05.
SOLUCIÓN: a) Sustituyendo ∑∑ ∑ ∑ ∑ ===== 36,55,87,16,25 2
2212121 xxxxxx
y n=8 en la matriz XTX, se obtiene:
8 25 16 XTX = 25 87 55 16 55 36
Después, la inversa de esta matriz puede obtenerse a través de cualquiera de las diferentes técnicas; aplicando una basada en el método de la adjunta, tenemos que:
107 -20 -17
(XTX) -1 = 841 . -20 32 -40
-17 -40 71
ESTADÍSTICA APLICADA
142
donde 84 es el valor de XX T , el determinante de XTX.
Al sustituir ∑∑∑ === 12977002031100,637000 21 yxyyxy en XTY, se obtiene:
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
12977002031100637000
YX T
y por último, reemplazando en: B = (XTX)-1XTY 107 -20 -17 637000
B =841 -20 32 -40 2031100
-17 -40 71 1297700 5476100
841
= 347200
63700 65191.7 = 4133.3 758.3 Entonces la ecuación de regresión lineal múltiple estimada es:
y = b0 + b1x1 + b2x2 Reemplazando:
y = 65191.7 + 4133.3x1 + 758.3x2
ESTADÍSTICA APLICADA
143
Esta ecuación nos permite predecir el precio de venta de una casa de tres habitaciones(x1) con dos baños(x2).
Esto es: y = 65191.7 + 4133.3(3) + 758.3(2) = 79108.2
Es decir una casa con 3 habitaciones y dos baños tienen un precio de 79 100 dólares aproximadamente.
b) Para probar la hipótesis pedida procedemos del siguiente modo:
I) H0 : β1 = 3500 Ha : β1 > 3500 II) α = 0.05 y n = 8 III) El estadístico de prueba es el “t” de Student
1ˆ
ˆ
11
11
−−
−=
kncn
t
σ
ββ
Donde: n
YXBYY TTT −=σ
YTY = 0509070800082900...7430078800 2228
1
2 =+++=∑=i
iy
BTXTY = 50906394166
8.2928
6509063941605090708000ˆ =
−=σ
Entonces: 77.2
1288
8.292
35003.4133
1ˆ
ˆ
8432
11
11 =
−−
−=
−−
−=
kncn
t
σ
ββ
Como este valor es mayor al estadístico tabular(2.015), entonces debe de rechazarse hipótesis nula, por lo que concluimos que en promedio cada habitación adicional suma más de 3500 dólares al precio de venta de una casa de ese tipo, con un nivel de significación del 5%.
ESTADÍSTICA APLICADA
144
2. Una embotelladora de bebidas gaseosas analiza las rutas de servicio de las máquinas expendedoras en su sistema de distribución. Le interesa predecir el tiempo necesario para que el representante de ruta atienda las máquinas expendedoras en una tienda. Esta actividad de servicio consiste en abastecer la máquina con productos embotellados y algo de mantenimiento o limpieza. El ingeniero industrial responsable del estudio ha sugerido que las dos variables mas importantes que afectan el tiempo de entrega “y” son la cantidad de cajas de producto abastecido “x1” y la distancia caminada por el representante “x2”. El ingeniero ha reunido 25 observaciones de tiempo de entrega, que se presentan a continuación:
Nº de
Observación Tiempo de
entrega(min) y Cantidad de
cajas x1 Distancia (pies)
x2 1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
16.68 11.50 12.03 14.88 13.75 18.11 8.00
17.83 79.24 21.50 40.33 21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50
35.10 17.90 52.32 18.75 19.83 10.75
7 3 3 4 6 7 2 7
30 5
16 10 4 6 9
10 6 7 3
17 10 26 9 8 4
560 220 340 80 150 330 110 210
1460 605 688 215 255 462 448 776 200 132 36 770 140 810 450 635 150
a) Estime la ecuación de regresión lineal múltiple b) Construya el cuadro de ANVA y calcule R2.
ESTADÍSTICA APLICADA
145
SOLUCIÓN: a) Sustituyendo
∑∑ ∑ ∑ ∑ ===== 6725688,133899,3055,10232,219 2221
2121 xxxxxx
y n=25 en la matriz XTX, se obtiene
25 219 10232 XTX = 219 3055 133899 10232 133899 6725688
la inversa de esta matriz la obtenemos a través del método de la adjunta; esto es:
0.11321518 -0.00444859 -0.00008367
(XTX) -1 = -0.00444859 0.00274378 -0.00004786
-0.00008367 -0.00004786 0.00000123 Al sustituir
∑∑∑ === 00.33707244.7375,60.559 21 yxyyxy en XTY, se obtiene:
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=
00.33707244.7375
60.559YX T
y por último, reemplazando en:
B = (XTX)-1XTY = ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
01438483.061590712.134123115.2
Entonces la ecuación de regresión lineal múltiple estimada es:
y = b0 + b1x1 + b2x2
ESTADÍSTICA APLICADA
146
Reemplazando:
y = 2.34123115 + 1.61590712x1 + 0.01438483x2 b) CUADRO DE ANALISIS DE VARIANCIA (ANVA)
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrado medio Fc
Regresión 5550.8166 2 2775.4083 261.24 Error o residual 233.7260 22 10.6239 Total 5784.5426 24 Donde: R2 = 0.9596
• Efectúe las pruebas de hipótesis correspondientes.
EJERCICIOS PROPUESTOS 1. Los siguientes datos muestran el número de habitaciones, el
número de baños y los precios a los que se vendieron hace poco 10 casas de una muestra aleatoria de un distrito de Lima:
Nº de Habitaciones
(x1) Nº de Baños (x2)
Precio (y) (en dólares)
3 2 4 2 3 2 5 4 5 3
2 1 3 1 2 2 3 2 2 3
78 800 74 300 83 800 74 200 79 700 74 900 88 400 82 900 84 600 80 200
Estime la ecuación de regresión lineal múltiple y prediga el precio de venta de una casa de cuatro habitaciones con tres baños.
ESTADÍSTICA APLICADA
147
2. Los siguientes datos constan del nivel de ventas que obtuvo la empresa “MACHI SAC” durante cuatro meses del presente año; los gastos de publicidad por televisión; y los gastos por publicidad en periódicos (todo en miles de dólares):
GASTOS PUBL.-TV GASTOS PUBL.-RADIO VENTAS 4 1 7 7 2 12 9 5 17 12 8 20
Determine la ecuación de regresión lineal múltiple estimada y prediga el nivel de ventas de un mes en el cual se piensa invertir 15 y 10 mil dólares en publicidad de televisión y radio respectivamente.
3. Los datos siguientes se refieren a las utilidades semanales (en miles de soles) de 5 restaurantes, sus aforos (en decenas) y el tránsito diario en promedio (en miles de automóviles) que pasan por sus ubicaciones:
AFORO TRANSITO DIARIO UTILIDAD NETA SEMANAL 2 1 3 3 2 4 1 1 2 4 3 5 4 2 2
Analice la información y calcule la línea de regresión múltiple
estimada.
ESTADÍSTICA APLICADA
148
4. Los siguientes datos muestrales los proporciona una compañía de mudanzas sobre los pesos de seis envíos, las distancias que se desplazaron y el daño que se provocó:
Peso (1000 libras) x1
Distancia (1000 millas) X2
Daño (dólares) y
4.0 3.0 1.6 1.2 3.4 4.8
1.5 2.2 1.0 2.0 0.8 1.6
160 112 69 90 123 186
a) Suponiendo que la regresión es lineal, estime β0 , β1 y β2. b) Utilice los resultados del inciso a) para estimar el daño cuando
un cargamento que pesa 2400 libras es desplazado una distancia de 1200 millas.
5. Los datos siguientes se refieren a las utilidades semanales en
promedio (en miles de dólares) de cinco restaurantes, sus aforos y el tránsito diario en promedio (en miles de automóviles) que pasan por sus ubicaciones:
Aforo x1
Tránsitodiario
x2
Utilidad netaSemanal
y 120 200 150 180 240
19 8
12 15 16
23.8 24.2 22.0 26.2 33.5
a) Suponiendo que la regresión es lineal, estime β0 , β1 y β2. b) Utilice los resultados del inciso a) para predecir la utilidad
semanal neta en promedio de un restaurante son una capacidad de asientos de 210 en un sitio donde el tránsito diario promedio es de 14000 automóviles.
ESTADÍSTICA APLICADA
149
6. Los siguientes datos constan de las calificaciones que obtuvieron 10 estudiantes en un examen, su coeficiente intelectual y el número de horas que estudiaron para el examen:
a) Suponiendo que la regresión es lineal, determine β0 , β1 y β2. b) Prediga la calificación de un estudiante con un coeficiente
intelectual de 108 que estudió seis horas para presentar el examen.
7. Los datos siguientes se recolectaron para determinar la relación
existente entre dos variables de proceso y la dureza de cierto tipo de acero:
Dureza (Rockwell 30-T) y
Contenido de cobre (porcentual) x1
Temperatura de recocido(0F) x2
78.9 55.2 80.9 57.4 85.3 60.7
0.02 0.02 0.10 0.10 0.18 0.18
1000 1200 1000 1200 1000 1200
Ajuste una línea recta por el método de mínimos cuadros y utilícela para determinar la dureza promedio de este tipo de acero cuando el contenido de cobre es del 0.14% y la temperatura de recocido es 11000F.
Coeficiente Intelectual
x1
Número de horasde estudio
x2
Calificaciones y
112 126 100 114 112 121 110 103 111 124
5 13 3 7
11 9 8 4 6 2
79 97 51 65 82 93 81 38 60 86
ESTADÍSTICA APLICADA
150
8. Los que siguen son datos a cerca de la efectividad porcentual de un analgésico y las cantidades de tres medicamentos distintos (en miligramos) presentes en cada cápsula:
Suponiendo que la regresión es lineal, determine los coeficientes de regresión.
9. Supóngase que el gerente de ventas de una gran compañía
distribuidora de partes para automóviles, desea calcular desde abril las ventas anuales totales de una región. Según las ventas regionales, también pueden estimarse las ventas totales las ventas totales de la compañía. Si, con base en la experiencia, se encuentra que los estimados de abril de las ventas anuales son razonablemente exactos, entonces en los años futuros podría utilizarse el pronóstico de abril para revisar los planes de producción y mantener el inventario correcto en las tiendas al menudeo. Varios factores parecen estar relacionados con las ventas, incluyendo en número de tiendas al menudeo en la región que almacena las partes comercializadas por la compañía, el número de automóviles registrados en la zona hasta abril 1, y el ingreso personal total para el primer trimestre del año. Finalmente se seleccionaron cinco variables independientes como las más importantes (de acuerdo con el gerente de ventas). Después se recopilaron datos para un año reciente. También se registraron las
Medicamento A x1
Medicamento Bx2
Medicamento Cx3
Efectividad porcentual
y 15 15 15 15 30 30 30 30 45 45 45 45
20 20 30 30 20 20 30 30 20 20 30 30
10 20 10 20 10 20 10 20 10 20 10 20
47 54 58 66 59 67 71 83 72 82 85 94
ESTADÍSTICA APLICADA
151
ventas anuales totales en ese año según cada región. Obsérvese en la tabla anexa que para la región 1 se tuvieron 1739 tiendas al menudeo que almacenan las partes de auto de la empresa, que hubo 9270000 automóviles registrados en la región hasta el 1 de abril, y que las ventas para ese año fueron por $ 37702000(dólares).
Ventas anuales (mdd)
y
Número de tiendas
de menudeos
x1
Número de
automóviles registrados (millones)
x2
Ingreso personal (mmdd)
x3
Antigüedad promedio
de los automóviles
(años) x4
Número de
supervi- sores
x5
37.702 24.196 32.055 3.611
17.625 45.919 29.600 8.114
20.116 12.994
1739 1221 1846 120
1096 2290 1687 241 649
1427
9.27 5.86 8.81 3.81
10.31 11.62 8.96 6.28 7.77
10.92
85.4 60.7 68.1 20.2 33.8 95.1 69.3 16.3 34.9 15.1
3.5 5.0 4.4 4.0 3.5 4.1 4.1 5.9 5.5 4.1
9.0 5.0 7.0 5.0 7.0 13.0 15.0 11.0 16.0 10.0
Nota: mdd indica millones de dólares, y mmdd, miles de millones de dólares. a) Estime la ecuación de regresión lineal múltiple. b) Realice la prueba de hipótesis para los coeficientes de
regresión con un nivel de significación de 0.05. c) Calcule e interprete al coeficiente de determinación.
10. El administrador de un nuevo programa paralegal en Seagate
Techinical Collage desea estimar el promedio de calificaciones en dicho programa. Consideró que el promedio de calificaciones en bachillerato (GPA, de grade Point Average), la puntuación en expresión oral en el examen de Aptitud Académica Superior (SAT, de Scholastic Aptitude Test), y las calificaciones de matemática en el SAT, serían buenos preeditores (o elementos de predicción) del GPA paralegal. Los datos para nueve estudiantes son:
ESTADÍSTICA APLICADA
152
a) Estime la ecuación de regresión lineal múltiple. b) Realice la prueba de hipótesis para los coeficientes de
regresión con un nivel de significación de 0.05. c) Calcule e interprete al coeficiente de determinación.
11. El señor Mike Wilde es presidente de sindicato de profesores del
Distrito escolar de Otsego. Al prepararse para futuras negociaciones, a Mike le gustaría investigar la estructura de los sueldos de personal docente en el distrito. Considera que existen tres factores que afectan el pago laboral de un profesor, años de experiencia, una calificación de la efectividad en la enseñanza (asignada por el director) y si el profesor tiene o no grado de maestría. Una muestra aleatoria de 20 profesores dio como resultado los siguientes datos:
Estudiante GPA Bachillerato
Expresión oralSAT
Matemáticas SAT
GPA Paralegal
1 2 3 4 5 6 7 8 9
3.25 1.80 2.89 3.81 3.13 2.81 2.20 2.14 2.63
480 290 420 500 500 430 320 530 469
410 270 410 600 490 460 490 480 440
3.21 1.68 3.58 3.92 3.00 2.82 1.65 2.30 2.33
ESTADÍSTICA APLICADA
153
Sueldos (mdd),
y
Años de Experiencia
x1
Calificación del director
x2
Maestría *x3
21.1 23.6 19.3 33.0 28.6 35.0 32.0 26.8 38.6 21.7 15.7 20.6 41.8 36.7 28.4 23.6 31.8 20.7 22.8 32.8
*1= si,0=no
8 5 2 15 11 14 9 7 22 3 1 5 23 17 12 14 8 4 2 8
35 43 51 60 73 80 76 54 55 90 30 44 84 76 68 25 90 62 80 72
0 0 1 1 0 1 0 1 1 1 0 0 1 0 1 0 1 0 1 0
Nota: mdd indica miles de dólares.
a) Determine la ecuación de regresión. ¿Qué sueldo estimaría usted para un profesor con cinco años de experiencia, una calificación de 60 dada por el director, y sin maestría?
b) Realice una prueba global de hipótesis para determinar si algunos de los coeficientes de regresión netos difieren de cero. Utilice el nivel de significación de 0.05.
c) Realice una prueba de hipótesis para los coeficientes de regresión. ¿Consideraría eliminar cualesquiera de las variables independientes? Use el nivel de significancia 0.05
d) Si su conclusión para la parte (c) fue suprimir una o más variables independientes, efectué de nuevo el análisis sin esas variables.
ESTADÍSTICA APLICADA
154
12. El gerente de ventas distrital de un importante fabricante de automóviles está estudiando las ventas. Específicamente le gustaría determinar qué factores afectan el número de autos vendidos en una distribuidora. Para investigar, selecciona al azar 12 distribuidores. De ellos obtiene el número de vehículos vendidos el último mes, los minutos de publicidad radiofónica comprados en dicho periodo, el número de vendedores de tiempo completo empleados en la distribuidora, y si ésta se localiza en la ciudad o no. La información es la siguiente:
Automóviles vendidos
el último mes y
Publicidad x1
Fuerza de
ventas x2
Ciudad x3
Automóviles vendidos
el último mes y
Publicidad x1
Fuerza de
ventas x2
Ciudad x3
127 138 159 144 139 128
18 15 22 23 17 16
10 15 14 12 12 12
Si No Si Si No Si
161 180 102 163 106 149
25 26 15 24 18 25
14 17 7 16 10 11
Si Si No Si No Si
a) Determine la ecuación de regresión. ¿Cuántos autos
esperaría que se vendieran en una distribuidora con 20 vendedores, que paga 15 minutos de publicidad y se localiza en una ciudad?
b) Realice una prueba global de hipótesis para determinar si alguno de los coeficientes de regresión neta es diferente de cero. Sea α = 0.05.
c) Efectúe una prueba de hipótesis para los coeficientes de regresión individuales. ¿Consideraría eliminar alguna de las variables independientes? Sea α = 0.05.
d) Si su conclusión en la parte (c) fue suprimir una o más de las variables independientes, efectúe de nuevo el análisis sin esas variables
ESTADÍSTICA APLICADA
155
13. Las tiendas de Fran's Convenience Marts están localizadas en el área metropolitana de Erie, Pennsylvania. A Fran, la dueña, le agradaría la extensión a otras comunidades del noroeste de Pennsylvania y el suroeste de NuevaYork, tales como Jamestown, Corry, Meadville y Warren. Como parte de su presentación al banco local, le gustaría entender mejor los factores que hacen que una tienda en particular sea lucrativa. La propietaria debe hacer todo el trabajo sola, así que no podrá analizar todos sus establecimientos. Selecciona al azar una muestra de 15 tiendas y registra el promedio de las ventas diarias (Y), la superficie de piso (área), el número de lugares de estacionamiento, y el ingreso económico medio de familias en esa región para cada establecimiento. La información de la muestra se presenta enseguida.
Tiendas en muestra
Ventas diarias
Área de tiendas
Lugares de estacionamiento
Ingreso (mdd)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
$1840 1746 1812 1806 1792 1825 1811 1803 1830 1827 1764 1825 1763 1846 1815
532 478 530 508 514 556 541 513 532 537 499 510 490 516 482
6 4 7 7 5 6 4 6 5 5 3 8 4 8 7
44 51 45 46 44 46 49 52 46 46 48 47 48 45 43
Nota : mdd indica miles de dólares.
a) Determine la ecuación de regresión. b) ¿Cuál es el valor de R2? Comente acerca de tal valor. c) Realice una prueba global de hipótesis para determinar si
alguna de las variables independientes es diferente de cero.
ESTADÍSTICA APLICADA
156
d) Realice pruebas individuales de hipótesis para determinar si se pueden suprimir variables independientes.
e) Si se eliminan variables, vuelva a calcular la ecuación de regresión y R2.
14. El señor Steve Douglas fue contratado como gerente en
entrenamiento por una importante empresa financiera. Como primer proyecto, se le pidió que estudiara la utilidad bruta en la industria química.¿Qué factores afectan las utilidades en esa industria? Steve selecciona al azar una muestra de 16 compañías y obtiene datos respecto a la cantidad de empleados, el número de dividendos consecutivos pagados de acciones comunes, el valor total del inventario al inicio del presente año y la ganancia bruta de cada empresa. Sus descubrimientos son:
Compañía Ganancia
bruta (mdd)
y
Número deempleados
x1
Dividendos consecutivos
x2
InventarioInicial (mdd)
x3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
2800 1300 1230 1600 4500 5700 3150 640
3400 6700 3700 6440 1280 4160 3870 980
140 65 130 115 390 670 205 40 480 810 120 590 440 280 650 150
12 21 42 80
120 64 43 14 88 98 44
110 38 24 60 24
1800 320 820 76
3600 8400 508 870 5500 9875 6500 9130 1200 890 1200 1300
Nota : mdd indica miles de dólares.
ESTADÍSTICA APLICADA
157
a) Determine la ecuación de regresión. La Master Chemical Company emplea 220 personas, ha pagado 64 dividendos consecutivos de acciones comunes y tiene un inventario valuado en $1 500000 (dólares) al principio del año. ¿Cuál es la ganancia bruta calculada?
b) Realice una prueba global de hipótesis para determinar si alguno de los coeficientes de regresión neta es diferente de cero.
c) Efectúe una prueba de hipótesis para los coeficientes de regresión individuales. ¿consideraría eliminar alguna de las variables independientes?
d) Si su conclusión para la parte (c) fue eliminar una o más variables independientes, haga de nuevo el análisis sin considerar esas variables.
15.- El Times Observer es un diario en Metro City. Como muchos
periódicos de la ciudad, dicha publicación está pasando por difíciles tiempos financieros. La gerente de circulación está estudiando otros periódicos en ciudades semejantes de Estados Unidos y Canadá. Está particularmente interesada en saber qué variables se relacionan con el número de suscripciones al diario. Ha podido obtener la siguiente información de muestra acerca de 25 periódicos de ciudades similares. Se utilizó la siguiente notación:
Suscr = Número de subscripciones (en miles). Pobl = Población metropolitana (en miles). Public = Presupuesto de publicidad del periódico (en cientos de
dólares). Ingr = Ingreso familiar medio en el área metropolitana (en
miles de dólares)
Diario Suscr Pobl Public Ingr Diario Suscr Pobl Public Ingr 1 2 3 4 5 6 7 8 9
10 11 12 13
37.95 37.66 37.55 38.78 37.67 38.23 36.90 38.28 38.95 39.27 38.30 38.84 38.14
588.9 585.3 566.3 642.9 624.2 603.9 571.9 584.3 605.0 676.3 587.4 576.4 570.8
13.2 13.2 19.8 17.6 17.6 15.4 11.0 28.6 28.6 17.6 17.6 22.0 17.6
35.1 34.7 34.8 35.1 34.6 34.8 34.7 35.3 35.1 35.6 34.9 35.4 35.0
14 15 16 17 18 19 20 21 22 23 24 25
38.39 37.29 39.15 38.29 38.09 37.83 39.37 37.81 37.42 38.83 38.33 40.24
586.5 544.0 611.1 643.3 635.6 598.9 657.0 595.2 520.0 629.6 680.0 651.2
15.4 11.0 24.2 17.6 19.8 15.4 22.0 15.4 19.8 22.0 24.2 33.0
35.5 34.9 35.0 35.3 34.8 35.1 35.3 35.1 35.1 35.3 34.7 35.8
ESTADÍSTICA APLICADA
158
a) Determine la ecuación de regresión. b) Realice una prueba global de hipótesis para determinar si
algunos coeficientes de regresión neta no son iguales a cero. c) Efectúe una prueba para los coeficientes individuales.
¿Consideraría eliminar algunos de ellos? 16. El Toledo Blade (Ohio) hizo recientemente una campaña
indicando que tenía vacantes para mensajeros. "Despierte ante las oportunidades", decía el anuncio. "Con una ruta Blade, usted trabajará cerca de sólo una hora al día en la mañana, cuando tenga tiempo". El anuncio continuaba con una lista de las siguientes rutas de mensajería. La ganancia semanal promedio (en dólares) es la variable dependiente, y el número de clientes diarios, así como el de clientes de domingo, son las variables independientes.
Ruta Ganancia semanal
promedio
Número de clientes
diarios
Número de clientes de domingo
Greenwood Oswald Neveda Forsythe Idaho Valleywood Oak Hill Burbank Burke Glen Penelope
$47.00 70.00 24.00 30.00 25.00 44.00 26.00 19.50 33.20 35.00
66 98 32 42 34 60 40 30 46 48
78 117 45 51 44 76 40 30 57 61
a) Determine la ecuación de regresión. ¿Cuánta ganancia
calcularía para una ruta que tiene 50 clientes diarios y 100 de domingo?
b) ¿Se puede concluir que las dos variables explican toda la variación en la utilidad semanal?
ESTADÍSTICA APLICADA
159
17. Un departamento de hipotecas en un gran banco está estudiando sus préstamos recientes. De particular interés es conocer cómo factores tales como el valor de la casa (en miles de dólares), el nivel de educación y la edad de quien encabeza la familia, el pago actual de hipoteca al mes (en dólares) y el sexo de tal persona (masculino = 1, femenino =0), se relacionan con el ingreso familiar. ¿Son estas variables mecanismos efectivos de predicción del ingreso para el hogar? Se obtiene una muestra al azar de 25 préstamos recientes:
Ingreso (millones
de dólares)
Valor (millones
de dólares)
Años de
educación Edad Pago de
hipoteca Sexo
$40.3 39.6 40.8 40.3 40.0 38.1 40.4 40.7 40.8 37.1 39.9 40.4 38.0 39.0 39.5 40.6 40.3 40.1 41.7 40.1 40.6 40.4 40.9 40.1 38.5
$190 121 161 161 179 99
114 202 184 90
181 143 132 127 153 145 174 177 188 153 150 173 163 150 139
14 15 14 14 14 14 15 14 13 14 14 15 14 14 14 14 15 15 15 15 16 13 14 15 14
53 49 44 39 53 46 42 49 37 43 48 54 44 37 50 50 52 47 49 53 58 42 46 50 45
$230 370 397 181 378 304 285 551 370 135 332 217 490 220 270 279 329 274 433 333 148 390 142 343 373
1 1 1 1 0 0 1 0 0 0 1 1 0 0 1 1 1 0 1 1 0 1 1 0 0
ESTADÍSTICA APLICADA
160
a) Determine la ecuación de regresión. b) ¿Cuál es el valor de R2? Comente acerca del mismo. c) Realice una prueba global de hipótesis para determinar si
algunas de las variables independientes son diferentes de cero.
d) Efectúe pruebas individuales de hipótesis para establecer si se pueden eliminar algunas de las variables independientes.
e) Si se suprimen variables, vuelva a formular la ecuación de regresión y R2.
18. El señor Fred G. Hire es el gerente de recursos humanos del
Centro Médico St. Luke. Como parte de su reporte anual al presidente de dicha institución se le pidió presentar un análisis de los empleados a sueldo. Debido a que hay más de 1000 trabajadores, no tiene e! personal para reunir información respecto a cada uno de los laborantes en cuestión, así que selecciona una muestra aleatoria de 30. Por cada trabajador registra el pago laboral mensual, los meses de servicio en St. Luke, el sexo (1= masculino, 0= femenino), y si el empleado tiene un puesto técnico ó de oficina. Los que hacen trabajos técnicos se codifican como 1, y los que realizan actividades de escritorio, como 0.
ESTADÍSTICA APLICADA
161
Empleado
en la muestra
Salario mensual
(en dólares)
Tiempo de
servicio
Edad
Sexo
Trabajo
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
$1769 1740 1941 2367 2467 1640 1756 1706 1767 1200 1706 1985 1555 1749 2056 1729 2186 1858 1819 1350 2030 2550 1544 1766 1937 1691 1623 1791 2001 1874
93 104 104 126 98 99 94 96 124 73 110 90 104 81 106 113 129 97 101 91 100 123 88 117 107 105 86 131 95 98
42 33 42 57 30 49 35 46 56 23 67 36 53 29 45 55 46 39 43 35 40 59 30 60 45 32 33 56 30 47
1 1 1 1 1 1 1 0 0 0 0 0 0 0 1 0 1 0 1 1 1 1 0 1 1 0 0 0 1 1
0 0 1 1 1 1 0 1 0 1 1 1 0 0 0 1 1 1 1 1 0 0 0 1 1 1 0 1 1 0
a) Determine la ecuación de regresión usando el sueldo como
la variable dependiente, y las otras cuatro variables como variables independientes.
b) ¿Cuál es el valor de R2? Comente respecto a este valor.
ESTADÍSTICA APLICADA
162
c) Realice una prueba global de hipótesis para determinar si algunas de las variables independientes son diferentes de cero.
d) Realice una prueba individual para determinar si se puede eliminar alguna de las variables independientes.
e) Vuelva a establecer la ecuación de regresión utilizando sólo las variables independientes que son significativas. ¿Cuánto más gana al mes un hombre que una mujer? ¿Hay alguna diferencia si el empleado tiene un puesto técnico o uno de oficina?
ESTADÍSTICA APLICADA
163
TABLAS ESTADÍSTICAS
TABLA 1: DISTRIBUCIÓN NORMAL TABLA 2: DISTRIBUCIÓN t DE STUDENT TABLA 3: DISTRIBUCIÓN χ2 TABLA 4: DISTRIBUCIÓN F TABLA 5: PROBABILIDADES BINOMIALES TABLA 6: PROBABILIDADES DE POISSON TABLA 7: TABLA DE NÚMEROS AL AZAR
“Tus padres y tus profesores son tus fieles y desinteresados amigos: ¡Aprovéchalos! por que no
podrán acompañarte por mucho tiempo”.
ESTADÍSTICA APLICADA
164
ESTADÍSTICA APLICADA
165
ESTADÍSTICA APLICADA
166
ESTADÍSTICA APLICADA
167
ESTADÍSTICA APLICADA
168
Z
ESTADÍSTICA APLICADA
169
ESTADÍSTICA APLICADA
170
ESTADÍSTICA APLICADA
171
ESTADÍSTICA APLICADA
172
ESTADÍSTICA APLICADA
173
ESTADÍSTICA APLICADA
174
ESTADÍSTICA APLICADA
175
ESTADÍSTICA APLICADA
176
ESTADÍSTICA APLICADA
177
ESTADÍSTICA APLICADA
178
ESTADÍSTICA APLICADA
179
ESTADÍSTICA APLICADA
180
ESTADÍSTICA APLICADA
181
ESTADÍSTICA APLICADA
182
ESTADÍSTICA APLICADA
183
BIBLIOGRAFÍA
Devore, Jay (1999). Probabilidad para Ingeniería y Ciencias. México, D.F. Reprotló. S.A. de C.V. 697p. Freund, John; Walpole, Ronald (1990). Estadística Matemática con Aplicaciones. Prentice-Hall Hispanoamericana. S.A. EDITORIAL. 617p. Mason, Robert†; Lind, Douglas; Marchal, William (2001). Estadística para Administración y Economía. México, D.F. ALFAOMEGA GRUPO EDITOR, S.A. de C.V. 785p. Montgomery, Douglas; Runger, George (2002). Probabilidad y Estadística. México, D.F. EDITORIAL LIMUSA, S.A. de C.V. 819p. Montgomery, Douglas; Peck, Elizabeth; Vining Geoffrey (2002). Regresión Lineal. México, D.F. GRUPO PATRIA CULTURAL, S.A. de C.V. 567p. Miller, Irwin; Freund, John; Johnson, Richard (1992). Probabilidad y Estadística para Ingenieros. México, D.F. Prentice-Hall Hispanoamericana. S.A. 624p. Rubio Donet, Jorge. Estadística Aplicada. Perú. 179p. Dr. Edgar Acuna http://math.uprm.edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ
“Estudia que la meta que te has trazado se logra estudiando”