2
Unidad I: Estimación de Parámetros.
Estimación de parámetros: Es el empleo de estadísticos para calcular los
respectivos parámetros poblacionales.
Estadísticos: son las medidas correspondientes a la muestra.
Parámetros: son las medidas correspondientes a la población.
Estimación por intervalo: Cuando el parámetro se considere comprendido
entre dos valores θi < θ < θs que se calcula a partir de una muestra
seleccionada, se denomina entonces intervalo de confianza del (1- α) 100%; y
la expresión 1- α: recibe el nombre de coeficiente de confianza “grado de
confianza”, los puntos extremos θs y θi se llaman límite de confianza superior y
límite de confianza inferior.
Estimación de un intervalo de confianza para la media poblacional
conociendo la desviación estándar σ: si x es la media de una muestra
aleatoria del tamaño n, de una población con varianza conocida (σ²), el
intervalo de confianza de (1- α) 100% para μ es:
⁄
⁄
Estimación de un intervalo de confianza para la media poblacional
desconociendo la desviación estándar: si y representan la media
extraída de una población normal con varianza desconocida σ², entonces el
intervalo de confianza del (1 – α) 100% para μ es:
⁄
⁄
Intervalo de confianza para μ con σ conocida:
Ejemplo del Intervalo de confianza para μ con σ conocida:
1. Se determina que la media de los promedios de los puntos de calidad de
una muestra aleatoria de 36 alumnos universitarios en el último año es
de 2.6. Encuentre los intervalos de confianza del 95% y 99% para la
varianza total de alumnos. Asuma una desviación estándar de la
población de 0.3.
3
Datos:
= 2.6
a) 95%
b) 99%
μ=?
σ=?
n=36
a) Intervalo de confianza del 95%
( )
⁄
⁄
b) Intervalo de confianza del 99%
( )
⁄
⁄
4
Intervalo de confianza para μ con σ desconocida:
⁄
⁄
Donde ⁄es un valor de distribución t con v= n-1 grados de libertad lo que
deja un área a la derecha de ⁄ .
Ejemplo:
Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8; 10.2;
10.4; 9.8; 10; 10.2; 9.6 (litros). Encuentre un intervalo de confianza del 95%
para la media de todos los recipientes suponiendo una distribución
aproximadamente normal.
Datos:
n=7
(1 – α) 100% = 95%
μ=?
( )
( )
( )
( )
( )
( )
5
√
( )
⁄
⁄
Intervalo de confianza para la varianza poblacional ( )
Si es la varianza de una muestra aleatoria de tamaño n de una población
normal entonces el intervalo de confianza de (1 – α) 100% para es:
( )
⁄
( )
⁄
Dónde: ⁄
⁄ son los valores de con v= n-1 grados de libertad
respectivamente a la derecha.
Ejemplo:
La varianza muestral de 10 paquetes de semillas de pasto que distribuye
determinada compañía es de 0.286. Se plantea la interrogante de conocer cuál
será el intervalo de confianza del 95% para la varianza de todos los paquetes
de semillas de pasto que distribuyó esta compañía.
6
Datos:
n= 10
( )
Intervalo de confianza para con 95%
( )
⁄
⁄
⁄
( )( )
( )( )
7
Unidad II: Prueba de Hipótesis.
Una hipótesis estadística se considera como una afirmación a cerca de una o
más poblaciones.
Características:
1.- La evidencia de la muestra que es inconsistente con la hipótesis planteada
conduce a un rechazo de la misma.
2.- La evidencia que apoya la hipótesis conduce a su aceptación.
Estructura:
1.- Hipótesis Nula: se refiere a cualquier hipótesis que se desea probar y se
representa (Ho).
2.- Hipótesis Alternativa: en una hipótesis estadística el rechazo de Ho da
como resultado la aceptación de la hipótesis alternativa representada por (Hi).
3.- Estadístico de prueba: se basa en la distribución que permita tomar el
control de la cantidad de elementos en el grupo de prueba. Pueden ser varias
(distribución normal, t, F, etc.).
4.- Error Tipo I: consiste en rechazar la hipótesis nula cuando esta en realidad
es verdadera.
5.- Error Tipo II: consiste en la aceptación de la hipótesis nula cuando en
realidad es falsa.
Clasificación:
{
{
Procedimiento para resolver prueba de hipótesis:
1.- Establecer la hipótesis nula Ho de que θ = θo
2.- Seleccionar la hipótesis alternativa Hi de una de las alternativas siguientes:
; ò .
3.- eleccionar el nivel de significancia de tamaño alfa (α).
8
4.- Seleccionar el estadístico de prueba apropiado y establecer la región criica.
5.- Calcular el valor del estadístico de prueba de los datos muéstrales.
6.- Decisión: Rechazar Ho si el estadístico de prueba tiene un valor en la región
crítica; de otra forma aceptar Ho.
Formulas relacionadas a pruebas con una sola media y varianza
conocida:
Hipótesis
Criterio de Rechazo
Estadístico de Prueba
Ho: M = Mo
Hi: M ≠ Mo
(
⁄
⁄
)
⁄
Ho: M = Mo
Hi: M > Mo
Ho: M = Mo
Hi: M < Mo
Ejemplo:
Un fabricante de equipos deportivos ha desarrollado un nuevo sedal (y lo
sintético basado en nylon para pesca) el cual se considera que tiene una
resistencia a la ruptura de 8kg con desviaciones aproximadas a los 0.5kg.
Pruebe la hipótesis de que la media es 8 (M=8) en contra posición con la
alternativa de que μ es diferente a 8 (M ≠8) si se prueba una muestra aleatoria
de 50 sedales y se determina que la resistencia promedio a la ruptura es de
7.8kg. Utilice un nivel de significancia de 0.01.
9
Datos:
n=50
x = .8kg
α= 0.01
M=8
M ≠8
σ=0.5kg
1) Ho: M=8
2) Hi: M ≠8
3) α= 0.01
4)
= 0.005
⁄
⁄
5) ( )
⁄
= -2.82
6) Decisión:
Se rechaza la hipótesis nula entonces se acepta la hipótesis alternativa.
10
Formulas relacionadas a pruebas con una sola media y varianza
conocida:
Hipótesis
Criterio de Rechazo
Estadístico de Prueba
Ho: M = Mo
Hi: M ≠ Mo (
⁄
⁄
); v= n-1
⁄
Ho: M = Mo
Hi: M < Mo
Ho: M = Mo
Hi: M Mo
Ejemplo:
El Edison electric Institute (EEI) ha publicado cifras a cerca de la cantidad anual
de kwatts/horas consumidos por varias aparatos del hogar. Se afirma que las
aspiradoras consumen un promedio de 46 kW/h al año. Si una muestra
aleatoria de 12 hogares, indican que las aspiradoras consumen un promedio de
42 kW/h al año con una desviación estándar de 11.9kw/h. ¿Sugiere esto que
las aspiradoras consumen un promedio menor de 46kw/h al año? Tómese un
nivel de significancia del 0.05.
Datos:
Mo=46kw/h
n=12
x = 2 kw h
S= 11.9 kw/h
Hi< 46kw/h
α=0.05
11
1) Ho: M=46
2) Hi: M <46
3) α=0.05
4)
5) ( )
⁄
= -1.16
6) Decision:
Aceptamos la Ho (hipótesis nula) y se comprueba que las aspiradoras
consumen 46kw/h al año.
12
Fórmulas para pruebas relacionadas con proporciones:
Hipótesis
Región Critica
Estadístico de
Prueba
Ho: p=po
Hi: p ≠ po
( )
( )
Si P es menor o
igual que se
rechaza Ho. Ho: p=po
Hi: p po
( )
Ho: p=po
Hi: p po
( )
Procedimiento:
1.- Establecer la hipótesis nula p=po.
2.- Establecer la hipótesis alternativa Hi; seleccionando la alternativa más
conveniente p < po; p > po; p ≠ po.
3.- Escoge el nivel de significancia α.
4.- Utilizar el estadístico de prueba la dirección binomial de variable X con
p=po donde b (X, n, p).
5.- Calcular:
a) El número de éxitos de la variable X.
b) El valor apropiado de p.
6.- Decidir: Tomar la decisión en base al valor de p.
13
Ejemplo:
Un constructor afirma que actualmente se instalan bombas de calefacción en
el 70% de todos los hogares en construcción de la ciudad Richmond.
¿Estaría usted de acuerdo con esta afirmación si una investigación aleatoria
de nuevas casas en esta ciudad indica que 8 de cada 15 tienen instaladas
bombas de calefacción? Utilice un nivel de significancia del 0.10.
Datos:
1) Ho: p= 0.70
2) Hi: p ≠ 0. 0
3) α=0.10
4) p= 0.70; n= 15; X=8
Distribución binomial.
5) Cálculos:
Si X < 0 > npo
npo= (15) (0.70)= 10.5
X < npo
8 < 10.5
( )
[ ( )]
[ ( )]
[( )]
[ ]
6) Decisión:
P<α rechaza
0.2622 < 0.10 ɇ
* e acepta Ho porque el valor de p es mayor que el valor de α
0.2622 > 0.10
14
Unidad III: ANOVA
Análisis de Varianza (Anova): se utiliza para comparar varias medias de
tratamiento a fin de ver si provienen de la misma población.
Los supuestos fundamentales de las Anovas son:
1.- Formulas para el cálculo de la suma de cuadrados en muestras iguales
tamaños.
2.- Formulas para el cálculo de la suma de cuadrados en muestras de
diferentes tamaños.
Procedimiento:
1.- Se seleccionan muestras del tamaño n de cada una de las k poblaciones.
2.- Las k poblaciones se clasifican sobre la base de un criterio único
denominado tratamiento.
3.- Se debe asumir que k poblaciones son independientes y tienen una
distribución normal con media, y con una varianza común
.
4.- La hipótesis a probar será la siguiente:
Ho:
Hi: al menos dos de las medias no son iguales.
Tratamiento:
Total T
Media ȳ
5.- Formulas para el cálculo de la suma de cuadrados en muestras de
iguales tamaños:
∑ ∑ ( )
Suma total de cuadrados.
15
∑
Suma de cuadrados de tratamiento.
Suma de cuadrados del error.
Cuadrados de tratamiento medio.
( ) Cuadrados medio del error.
valor de la distribución aleatoria F, con k-1 y k(n-1) grados de
libertad.
*Ho se rechaza cuando [ ( )]
En resumen:
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrados de medios
Calculada
Tratamientos
SSA
K-1
Error
SSE
K(n-1)
Total
SST
n k-1
Ejemplo:
Supóngase que un experimento industrial un ingeniero está interesado en
como varia la absorción media de humedad en el concreto de entre 5
diferente mezclas de concreto. Las mezclas varían en el porcentaje en peso
de cierto ingrediente importante. Se expone a la humedad durante 48 horas
y se deciden probar 6 para cada muestra o mezclar, lo que requiere un total
de 30 muestras.
16
Los datos se registran en la siguiente tabla. Pruebe la hipótesis de que
con un nivel de significancia de 0.05 para los
datos tabulados.
Tabla 1: Absorción de humedad en muestras de concreto.
Mezcla (%de peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
TOTAL 3320 3416 3663 2791 3664 16854
MEDIA 553,333333 569,333333 610,5 465,166667 610,666667 561,8
Datos:
α=0.05
n=6
k=5
1) Ho:
2) Hi: al menos 2 de las medias no son iguales.
3) α=0.05
Distribución F (tabla 6)
( ) ( )
4)
( )
( )( )
17
( )
( )( )
( )
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrados de medios
Calculada
Mezcla
85356.6
4
21339.15
=4.30
Error
124021
25
4960.84
Total
209377
29
26299.99
5) Se rechaza la hipótesis nula Ho
Se acepta que al menos dos mezclas no son iguales.
Análisis de varianza para muestras de tamaños diferentes:
∑∑( )
∑
18
Grados de libertad
SST= N-1
SSA= K-1
SSE= N-K
Ejemplo:
La Universidad Politécnica de Virginia de estados unidos diseño un
sistema para medir los niveles de actividad de fosfatasa alcalina del
suero en niños que padecían ataques convulsivos y quienes habían
recibido terapia anti convulsionante bajo el cuidado de un especialista
privado. Se encontraron 45 sujetos para el estudio y se clasificaron en 4
grupos de acuerdo con la medicina que se les proporciono.
A partir d muestras sanguíneas obtenidas de cada sujeto se
determinaron los niveles de (bessey – Lowry) y se registraron en la tabla
que se muestra. Pruebe la hipótesis con un nivel de significancia de 0.05,
de que el nivel promedio de actividad de fosfatasa alcalina del suero es el
mismo para los 4 grupos.
Nivel de actividad del suero fosfatado alcalino.
Grupo de Medicamento.
19
G-1 G-2 G-3 G-4
49,2 97,07 62,1 110,6
44,54 73,4 94,95 57,1
45,8 68,5 142,5 117,6
95,84 91,85 53 77,71
30,1 106,6 175 150
36,5 0,57 79,5 82,9
82,3 0,79 29,5 111,5
87,25 0,77 78,4
105 0,81 127,5
95,22
97,5
105
58,05
86,6
58,35
72,8
116,7
45,15
70,35
77,4
TOTAL 1459,65 440,36 842,45 707,41 3449,87
MEDIA 72,9825 48,92889 93,60556 101,0586 79,14388
G-1=control (sin anti convulsivos).
G-2= fenobarbital.
G-3= carbamazepina.
G-4= otros anti convulsivos.
Datos:
1) Ho:
2) Hi: al menos 2 de las medias no son iguales.
3) α=0.05
4) Calculo:
20
( )
=
( )
( )
( )
( )
( )
TABLA ANOVA
Fuente de variación
Suma de cuadrados
Grados de libertad
Cuadrados de medios
Calculada
Grupos de Medicamentos
13943.01
3
4647.66
=3.56
Error
53463.9
41
1303.99
Total
67406.91
44
5951.65
21
5) Decisión:
Se rechaza la hipótesis nula Ho se acepta Hi.