Mic sesión 6
-
Upload
metodoscuantitativos -
Category
Education
-
view
83 -
download
0
Transcript of Mic sesión 6
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA
Sesión 6
DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN
FÁTIMA PONCE 1
FÁTIMA PONCE 2
PUNTOS A TRATAR
Sesión 6:
DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN.
Distribución de Muestreo.Estimación Puntual y Estimación por Intervalo.
Propiedades de los estimadoresEjercicios.
FÁTIMA PONCE 3
ESTADÍSTICA INFERENCIAL: IMPORTANCIA DE LA MUESTRA
La estadística inferencial requiere explicitar el vínculo que hay entre la población y la muestra (usualmente a través de un modelo probabilístico).
Por ejemplo, en el contexto inferencial, la edad promedio de los encuestados (muestra) es una estimación de la edad poblacional. ¿Qué tan confiable será esta estimación?, depende de:1) la cantidad de personas encuestadas (tamaño de la
muestra) 2) Qué tan heterogénea es la población? 3) Características del proceso de estimación
(propiedades del estimador).
FÁTIMA PONCE 4
DISTRIBUCION DE MUESTREO Si se quisiera saber la estatura promedio de los niños
peruanos de 10 años. Se podría tomar varias muestras de “n” niños peruanos
de 10 años y calcular en cada una de ellas su valor medio (Xbarra) y su desviación estándar (s).
Las estadísticas resultantes de cada muestra no necesariamente serían iguales, lo más probable es que varíen de muestra en muestra.
Distribución de muestreo de la media: es una distribución de probabilidad de todas las medias posibles de las muestras.
También se puede tener: Distribución de muestreo de la mediana, de las desviaciones, o de una proporción.
FÁTIMA PONCE 5
DISTRIBUCION DE MUESTREO DE LA MEDIA
POBLACIÓN (N)Variable aleatoria X=Estatura
µ2
Muestra 1x1
…
xn
.
.
.
.
.
.
Distribución de Muestreo de la Media
(tiene una media y una variabilidad)
Es una VariableAleatoria
Es una distribución de probabilidad de las medias de todas las muestras posibles.
Muestra 2x1
…
xn
Muestra kx1
…
xn
FÁTIMA PONCE 6
Distribución de la población tiene como parámetros:
(media de la distribución de la población) y, (desviación estándar de la población).
DISTRIBUCIÓN DE MUESTREO DE LA MEDIA
Distribución muestral de la media tiene parámetros: _ = media de la distribución muestral de las medias x _ = error estándar de la media muestral (SE) x
Cada distribución de frecuencia de la muestra tiene: _ su propia media muestral = X y su propia desviación estándar = s
FÁTIMA PONCE 7
Distribución de Muestreode la Media
x1 x2
xkx3
Distribución de las “k” muestrasDistribución de lapoblación
POBLACIÓN Y DISTRIBUCIÓN DE MUESTREO
x
nx
s1 s2
s3 sk
X
FÁTIMA PONCE 8
Cuando la población está distribuida normalmente, la distribución de muestreo de la media también es normal.
1. La media de la distribución de muestreo es igual a la media de la población:
DISTRIBUCION DE MUESTREO (POBLACIÓN NORMAL)
_ = / n X
_ =
X
2. El error estándar de la distribución de muestreo es igual a la desviación estándar de la población entre la raíz cuadrada de n
FÁTIMA PONCE 9
Si la población no tiene distribución normal: Se aplica el Teorema del Límite Central, que muestra una relación entre la forma de la distribución de la población y la forma de la distribución de muestreo:
POBLACIÓN NO NORMAL Y TEOREMA DEL LÍMITE CENTRAL
“La distribución de muestreo de la media se aproxima a la normal al incrementarse el tamaño de la muestra”.
Si n > 30 se emplea la distribución normal.
FÁTIMA PONCE 10
ESTANDARIZACIÓN
Si se quisiera estandarizar la media muestral: _
x - Z = ----------
_ x
_ x -
Z = ------------- / n
_ X N( , 2/n ) para n suficientemente grande
FÁTIMA PONCE 11
1. Distribución Muestral de la media se caracteriza por:
2. Sólo nos basamos en una muestra de la población.3. Pregunta:¿Nuestra media en esa muestra ( ) se encuentra
cerca de la media de la distribución muestral ( )?. Si está cerca tendremos una buena estimación de µ.
RESUMIENDO:
_ = /n
X
_ =
X
xX
4. Para evaluar ello:i) Estimar
ii) Probar hipótesis: - Si la prob. de que nuestra esté cerca a = µ es alta el
investigador podrá generalizar. - Si la prob. de que nuestra esté cerca a = µ es baja dudará
en generalizar.
X
xX
X x
FÁTIMA PONCE 12
ESTIMACIÓN:
“Conjetura educada y en base a datos, acerca de una magnitud desconocida”.
Walter Sosa
FÁTIMA PONCE 13
TIPOS DE ESTIMACIÓN
1. Estimación Puntual: Utiliza un estadístico para obtener Un solo valor puntual
estimado del parámetro a partir de la información de muestreo. _ ^
X ó 2. Estimación por Intervalo o Intervalo de Confianza (IC).
Un IC denota el rango dentro del cual puede encontrarse el parámetro y el nivel de confianza que el intervalo contiene el parámetro. (“Intervalo de confianza de 95% el parámetro tal…”.)
_ _ (LI, LS) = ( X - a , X + a)
FÁTIMA PONCE 14
ESTIMACIÓN PUNTUAL
Parámetro Poblacional
= Media poblacional de X
= Desviación estándar poblacional de X P= proporción poblacional
Estimador Puntual
_ n
X = Media muestral de X = xi / n i=1
_s = Desviación (xi-X)2
estándar = --------- muestral de X (n-1) p = proporción muestral = n1/n
FÁTIMA PONCE 15
PROPIEDADES DE UN BUEN ESTIMADOR
INSESGADEZ: Un estimador es insesgado si la media de su distribución muestral es igual al parámetro correspondiente
EFICIENCIA: Dado un conjunto de estimadores insesgados el estimador más eficiente es el que tiene la menor varianza.
CONSISTENCIA(propiedad cuando n es grande): Para que el estimador sea consistente debe ser insesgado y su varianza debe tender a 0 a medida que n se incrementa.
SUFICIENCIA: Si utiliza tanta información de la muestra que ningún otro estimador puede extraer información adicional acerca del parámetro poblacional que se está estimando.
_ Para la media muestral: E(X) = ^ ^ En general para un estimador : E() =
FÁTIMA PONCE 16
Denota el rango dentro del cual puede encontrarse el parámetro y el nivel de confianza que el intervalo contiene el parámetro poblacional.
ESTIMACIÓN INTERVALO (IC)
_ I.C. para estimar = X margen de error
Estimación puntual
Depende de:i) El nivel de confianza
deseado 100(1-)%, dado por el valor Z, y;
ii) Si conocemos o no .
FÁTIMA PONCE 17
ESTIMACIÓN INTERVALO (IC)
Los IC tienen un Límite Inferior (LI) y un Límite Superior (LS)
_LI= X - margen de error
_ LS= X + margen de error
INTERPRETACIÓN: “Un 100(1-)% de confianza de que la media poblacional desconocida (µ) esté entre el LI y el LS”.
FÁTIMA PONCE 18
_
X Z _
X
IC para estimar
s _ = s /n X
_X Z s _
X
s debe ser estimada
Cuando se conoce : Cuando no se conoce :
_ = /n
X
Z es el valor de la tabla Z al nivel de confianza deseado 100(1-)%,
FÁTIMA PONCE 19
RECORDAR
Nivel de confianza: Probabilidad que asociamos con una estimación de intervalo. 99%
95%
90%
Valores de Z para los niveles de confianza más usados: Nivel de confianza /2 Z/2 90% .10 .05 1.65 95% .05 .025 1.96 99% .01 .005 2.58
FÁTIMA PONCE 20
INTERVALO DE CONFIANZA (resumen)
I.C. de 99% para estimar la media ():Si se conoce _ X 2.58 / n
Si no se conoce _ X 2.58 s/ n
I.C. de 95% para estimar la media ():
Si se conoce _ X 1.96 / n
Si no se conoce _ X 1.96 s/ n
FÁTIMA PONCE 21
Por ejemplo: Se desea calcular un IC para el sueldo anual inicial para graduados de Gestión. No se conoce .
PASOS PARA ESTIMACIÓN IC
_ I.C. para estimar = X Z s _
X
1. Se calcula la media muestral (estimación puntual)2. Como no se conoce se debe calcular la desviación
estándar muestral (s), para obtener s _ = s/n
X
3. Se hace uso de la Regla Empírica para hallar Z.4. Se tiene :
FÁTIMA PONCE 22
EJERCICIOS
FÁTIMA PONCE 23
EJERCICIO 1
Suponga que tiene una muestra aleatoria de 256 gerentes de Lima. Un elemento de interés es su ingreso anual. La media muestral es S/ 45,420 y la desviación estándar muestral es S/ 2,050.
a) ¿Cuál es el ingreso medio estimado de todos los gerentes de Lima?.
b) ¿Cuál es el IC de 95% para la media de la población?.
c) Interprete los resultados.
n=256 media muestral=S/45,420 s=S/ 2,050.
FÁTIMA PONCE 24
a)Ingreso medio estimado de todos los gerentes (la población)? = Es la media muestral =S/ 45,420 = Estimación Puntual para µ.
b) IC de 95% para la media de la población: _ X 1.96 s/ n = 45420 1.96 (2050/ 256 )= 45420 251.125 LI=45168.9 LS=45671.1 Intervalo de Confianza para µ
EJERCICIO 1: Estimación de µ
FÁTIMA PONCE 25
c) Interpretación: Si hubiera tiempo para seleccionar muchas muestras de
tamaño 256 de la población, y calcular sus medias muestrales y los IC, la media poblacional () del ingreso anual se encontraría aprox. en 95 de los 100 IC.
Aprox. 5 de los 100 IC no incluyen a la media poblacional del ingreso anual.
EJERCICIO 1: Estimación de µ
FÁTIMA PONCE 26
Con una muestra de 100 clientes se obtiene un recibo de luz promedio de S/. 80 y una s=10.
a. Hallar IC para la media poblacional al 99% y al 95%.
b. ¿Cuál es más estrecho?
c. ¿Hay alguna relación entre el nivel de confianza y la amplitud del IC?
EJERCICIO 2: Relación entre Nivel de Confianza e IC
FÁTIMA PONCE 27
_
n = 100 clientes, X = 80 y s=10.
Hallar IC para la media poblacional al 99% y al 95%.
EJERCICIO 2: Relación entre Nivel de Confianza e IC
I.C. al 99% para
I.C. al 95% para = 80 1.96 (10/100)
LI LS
El IC del 95% es más estrecho Para > grado de confianza (> exactitud), el margen de error (ancho del IC) debe ser > (se sacrifica precisión en el IC).
77.42 82.58
2.58 (10/100)= 80
78.04 81.96
FÁTIMA PONCE 28
Estimación de una Proporción de la población
A veces se desea estimar una proporción de unidades de una población (P= conteo del número de elementos que poseen la característica de interés con relación al número total) y no necesariamente el parámetro poblacional.
Estimación Puntual: Si el número de éxitos en la muestra es n1 y en la
muestra hay n observaciones Estimación puntual de la proporción de la población (P) es la proporción muestral: p = n1/n
FÁTIMA PONCE 29
I.C. para P = p Z _
p
IC para una Proporción de la población (P)
_ = p(1-p)/n
p
Error estándar de la proporción
p = proporción muestralZ = valor Z que depende de (1-)% elegido.n = tamaño de la muestra.
I.C. para estimar P = p Z p(1-p)/n
FÁTIMA PONCE 30
EJERCICIO 3: Estimación de P
Suponga que el dueño de una gasolinera está interesado en la proporción de mujeres que compran gasolina con tarjeta de crédito. Después de realizar un estudio con 100 mujeres, pudo determinar que 80 de sus clientes pagaban con tarjeta de crédito.
a) ¿Cuál es la proporción estimada puntual de mujeres en la población que pagan sus consumos de gasolina con tarjeta de crédito?
b) Elabore un intervalo de confianza del 95% para la proporción de mujeres que pagan la gasolina con tarjeta de crédito.
FÁTIMA PONCE 31
EJERCICIO 3: Estimación de P
p Z p(1-p)/n
I.C. para estimar P = p Z p(1-p)/n
= 0.8 1.96 (0.8(1-0.8)) / 100
= 0.8 0.0784
LI=0.722 y LS=0.878
b)
a) = 80/100 = 0.8 Estimación Puntual de P.
Estimación por Intervalo o IC para P.
FÁTIMA PONCE 32
CONTROL DEL ANCHO DE UN INTERVALO
Como se ha visto, es preferible un IC más estrecho debido a la precisión que proporciona.
Hay 2 formas para lograr un IC más preciso:i) Reducir el nivel de confianza (1-)% El valor de Z al 99% es 2.58 y el valor de Z al 95% es 1.96.
Por lo que el IC al 95% es más estrecho que al 99%. El costo de mayor precisión del IC es que el nivel de
confianza bajó a 95% (la probab. del error aumentó a 5%).ii) Aumentar el tamaño de la muestra. Al aumentar n se puede reducir el error estándar: /n.
FÁTIMA PONCE 33
PARA MUESTRAS GRANDES
Si n > 30 Se emplea la distribución Normal Estándar: Z
Hay dos casos:
Se conoce
No se conoce , se requiere estimar “s” con los datos de la muestra grande (al menos 30 obs).
_ X - µ Z= --------- s / n
FÁTIMA PONCE 34
PARA MUESTRAS PEQUEÑAS
Si n 30 se emplea la distribución t de Student: t .
En general la t se emplea cuando:
es desconocida. la muestra es pequeña (n 30).
Al utilizar la t suponemos que la distribución poblacional es normal o casi normal.
FÁTIMA PONCE 35
DISTRIBUCIÓN t DE STUDENT
Características:AcampanadaSimétricaMás planaNo se conoce σ
0zt
“t” con 5 grados de
libertad
Normal Estándar
“t” con13 grados de
libertad
FÁTIMA PONCE 36
El estadístico t se calcula como:
_
X - µ s_ x
t =
Estadístico t e IC para muestras pequeñas
IC para estimar la media poblacional () en muestras pequeñas:
_ _I.C. para estimar = X±t(s_) = X ±t/2
(n-1) s/n x
Valor de tabla de la t-student con (n-1) grados de libertad para un nivel de /2.
FÁTIMA PONCE 37
EJERCICIO 4: Estimación IC para µ, con muestra pequeña
Una empresa está considerando un programa asistido por computadora con el fin de capacitar a sus empleados. Para evaluar este programa, el gerente solicita una estimación de la media poblacional del tiempo requerido para que los empleados completen la capacitación. Considere una muestra de 20 empleados que siguen la capacitación.
Halle un IC para la media si tiene la siguiente tabla.Duración de la capacitación, en días (para 20 empleados)
52 59 54 4244 50 42 4855 54 60 5544 62 62 5745 46 43 56
FÁTIMA PONCE 38
EJERCICIO 4: Estimación IC para µ, con muestra pequeña
Datos intermedios: x = 1030
(x- )2 = 889 Media Muestral = 51.5 días. Desv Estándar (s) = 889/19 = 6.84 días. _ _ I.C. para estimar = X ± t0.025 s/n
t/2 con grados de libertad=n-1
= 51.5 2.093 (6.84/20)
= 51.5 3.2
LI = 48.3 y LS = 54.7 días
X
FÁTIMA PONCE 39
Tabla t
2.093
g.De l.
FÁTIMA PONCE 40
BIBLIOGRAFIA
Anderson, D., Sweeney, D. y Williams T. (2008). Cap 7-8.
Levin y Rubin (2010) Cap. 6 y 7.