Fragmento la inferencia en la comprension lectora (inferencia lexica)
Inferencia
-
Upload
bl-romel-torrico -
Category
Documents
-
view
219 -
download
2
description
Transcript of Inferencia
-
31/10/2013
1
La inferencia estadstica busca determinar caractersticas de la poblacin en base a una muestra
Muestra: subconjunto finito y representativo de la poblacin
INFERENCIA ESTADISTICA
Problema: Estimar el total de habitantes en la comunidad: Estudiantes de estadstica de la Maestra en Ingeniera Vial, para el efecto tomar una muestra representativa del 20 % de la poblacin.
1
NnNfcpf
N = Tamao poblacin
n = Tamao muestra
Si (n/N)*100 > 10 % usar factor de correccin por poblacin finita para la desviacin estndar del total
-
31/10/2013
2
Muestreo, Mtodo para obtener un subconjunto REPRESENTATIVO de la poblacin
Tamaos de muestra Para estimar el promedio poblacional por I.C. con m.a.s.
Determinar el tamao de muestra requerido para estimar el promedio poblacional del numero de habitantes por vivienda de la comunidad de estudiantes de estadstica de la maestra en Ingeniera Vial. Los datos al respecto son:
Tamao poblacin N=47Especificaciones de precisin para estimar :
e = 0.5 habitantesNC= 95%
En base a una muestra piloto de n=10, se conoce que:S=1.5 habitantes
-
31/10/2013
3
vs Precision with C.C.=0.95 S=4.219 C.I. Mean
N
Precision
5
6
7
8
9
10
0 1 2 3 4
Tamaos de muestraPara estimacin de la proporcin poblacional por I.C. y m.a.s.
Ejem: Se desea estimar la proporcin poblacional de personas de acuerdo con que se construya el camino por el Tipnis
Las especificaciones previas de precisin son:
N.C. = 95 %
Error admisible 2 %
Determinar el tamao de muestra
-
31/10/2013
4
N vs P with Precision=0.02000 C.C.=0.95 C.I. Mean
N
P
400
500
600
700
800
0.1 0.3 0.5 0.7 0.9
N vs P by Precision with C.C.=0.95 C.I. Mean
0.020.040.060.080.10
N
Prec
isio
n
P
0
200
400
600
800
0.1 0.3 0.5 0.7 0.9
Precision 0.02 to 0.1 by 0.02
P 0.1 to 0.9 by 0.1
-
31/10/2013
5
Determinacin de p por I.C.
En base a una encuesta a 500 personas(representativas de una determinada poblacin), seconoce que la proporcin de personas favorables a laconstruccin del camino por el tipnis es p=70 %, calcularel error de muestreo correspondiente, usar un NC=95 %
PRUEBAS DE HIPOTESIS
P.H. es una regla de decisin para aceptar o rechazar una hiptesis nula
Mtodo de inferencia estadstica:El resultado esperado fue planteado como pregunta
(Intervalo de confianza) o como respuesta (prueba de hiptesis)
Ejem:R.E.: Estimar la proporcin de personas favorables a la
construccion del camino por el Tipnis.
R.E.: La proporcin de personas favorables a que se construya el camino por el Tipnis es mayor o igual a 70 %
-
31/10/2013
6
TIPOS DE PRUEBAS DE HIPOTESIS
P.H. de conformidad de un parmetro
P.H. de comparacin de un parmetro de dos o mas poblaciones
P.H. de bondad de ajuste
P.H. de independencia de variables de tipo cualitativo
PRUEBAS DE HIPOTESIS
Procedimiento general para pruebas de hiptesis:
a) Formular respuestas provisoriasb) Adoptar un alfac) Tomar muestrad) Calcular estadstico de prueba en base a distribucin
muestral del estadstico de interse) Definir regin de aceptacin de H0f) Si pvalue > alfa =>aceptar H0g) Escribir conclusin
-
31/10/2013
7
Prueba de hiptesis de conformidad de un promedio
Ejem: Se estudia la contaminacin por lluvia acida en cierta regin de inters, para el efecto se cuenta con mediciones de los depsitos de sulfatos mostrados en el Cuadro adjunto. Verificar la aseveracin de que la muestra proviene de una poblacin con promedio mayor que 12 Kg/Ha.
Ao 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990Depositos sulfatos (Kg/Ha) 17,59 12,84 11,55 12,72 14,33 12,23 15,16 14,08 10,85 11,87 12,93
Depsitos de sulfatos por lluvia acida (Kg/Ha), observados en zona de estudio
a) Formular respuestas provisorias
Ho : 12 Kg/HaH1 : > 12 Kg/Ha
SOLUCION
b) Adoptar un nivel de significacin = 5%
SOLUCION
c) Tomar muestra, calcular estadsticos de resumen
Promedio 13.29Desv Estandar 1.91
d) Calcular estadstico de prueba en base a distribucin muestral del estadstico de inters
Como n
x
x ~ N
nSxt pru
-
31/10/2013
8
Pruebas de comparacin de un parametro de dos poblaciones distintas
P.H. de dos promedios: muestras independientes Datos pareados
Viviendas Barrio A 50 55 42 35Viviendas Barrio B 32 45 50
P1 P2 P3 P4pre dieta 90 80 92 85post dieta 85 72 86 79
Consumo de agua mes (m3)
Peso (Kg)
Pruebas de comparacin del promedio, muestras independientes
Ho : (A) = (B)H1 : (A) < (B)
Las dos poblaciones al parecer tienen variancias poblacionales distintas y desconocidas
2
22
1
12
21
nn
xxZ p
2
22
1
12
21
nS
nS
xxtp
11
)(
2
2
1
2
2
nB
nA
BA
nS
A1
2
1
nS
B2
2
2
-
31/10/2013
9
Pruebas de comparacin del promedio, muestras independientes
Las dos poblaciones al parecer tienen variancias poblacionales iguales y desconocidas
2
2
1
2
21
nS
nS
xxtpp
p
)2()1()1(
21
222
2112
nnSnSnSp
221 nn
Contraste de igualdad de Variancias
22
22
21
21
//
SSFpr
22
210 : H 2
2
21
SSFpr
22
211 : H 2
2
21
SSFpr
21S Mayor variancia muestral
22S Menor variancia muestral
numeradordellibertaddegrados1 numeradordellibertaddegrados1
-
31/10/2013
10
1) En un terrapln de prueba se ha estado midiendo el peso especifico seco obtenido en la compactacin de una capa de suelo A-2, de 30 cm de espesor, con dos compactadoras sobre neumticos con pesos diferentes. Segn el ejecutor, con el compactador # 1 y 5 pases se logra una adecuada compactacin. Segn el proyectista que realizaba el control de autor, era necesario usar el compactador # 2 tambin con 5 pases. Para el compactador #1 se tomaron 20 muestras, las cuales arrojaron d = 1790 kg/m3. Para el # 2 se tomaron 24 muestras con d = 1739 kg/m3 .Se debe decidir si existe o no diferencia significativa entre el resultado de un compactador y otro para un nivel de significacin del 95 %, las varianzas calculadas son respectivamente
Pruebas de comparacin de un parametro de dos poblaciones distintas
S1 = 10 Kg/m3
S2 = 5 Kg/m3
Pruebas de comparacin de un parametro de dos poblaciones distintas
P.H. de dos promedios, muestras independientes
Ejem. 1: Considerando que el consumo de agua en los barrios A, B y C corresponden a una muestra, determinar si se puede admitir que a nivel poblacional el barrio A tiene un consumo promedio inferior al del barrio C.
En base a las observaciones muestrales, se calcularon los siguientes estadsticos:
Estadsticos de grupo
28 101.1250 9.15313 1.7297828 102.5714 14.75046 2.78758
BARRIO 1=A, 2=B, 3=CAC
concumo emnsualde agua en m3
N MediaDesviacin
tp.Error tp. de
la media
Ho : (A) = (B)H1 : (A) < (B)
-
31/10/2013
11
Pruebas de comparacin de un parametro de dos poblaciones dependientes
P.H. de dos promedios, muestras pareadas
8892
5859
7677
6676
5757
9499
Pre cursoPost curso
Calificaciones
8892
5859
7677
6676
5757
9499
Pre cursoPost curso
Calificaciones
Ho : (d) = 0H1 : (d) > 0 nS
dt
d
dp /
Ejercicio 3: Se miden concentraciones de Zinc en (mg/l), con el fin de decidir si es conveniente plantear obras de captacin del agua subsuperficial, en base a una muestra de 6 puntos indicar si se puede admitir que a nivel poblacional el promedio de agua superficial tiene una concentracin de Zinc mayor que el agua subsuperficial.
Ho : (d) = 0H1 : (d) > 0
LocalAgua
Superficial Agua
Subsuperficial1 0,430 0,4152 0,266 0,2383 0,567 0,3904 0,531 0,4105 0,707 0,6056 0,716 0,609
Concentracion de Zinc (mg/l)
Pruebas de comparacin de un parametro de dos poblaciones dependientes
P.H. de dos promedios, muestras pareadas
-
31/10/2013
12
Pruebas de comparacin de un parmetro de mas de dos poblaciones, ANOVA
Condiciones de aplicacin: muestras independientes, varianciaspoblacionales iguales, distribuciones poblacionales normales.
Se estudia la resistencia a compresin del hormign (Mpa) a 28 das de4 tipos de dosificacin, los valores medidos en los cilindros de prueba,se muestran en el siguiente cuadro. Indicar si el factor dosificacininfluye en la resistencia promedio
Ho : (A) = (B) = (C) = (D)H1 : alguna de las igualdades anteriores no se cumple
Dosifi A Dosifi B Dosifi C Dosifi D42,00 45,00 64,00 56,0039,00 46,00 61,00 55,0048,00 45,00 50,00 62,0043,00 39,00 55,00 59,0044,00 43,00 58,00 60,00
Variabilidad dentro grupos:
11
211 )(
n
ii xxSCD
21
222 )(
n
ii xxSCD
.
.
SCD = SCD1+ SCD2 + + SCDk
kn
SCDCMD
-
31/10/2013
13
Variabilidad entre grupos:
k
ii xxSCE
1
2)(
k
kk
nnnxnxnxnx ...
...21
2211
1 K
SCECME
CMDCMEFpr
Pruebas de comparacin de un parmetro de mas de dos poblaciones, ANOVA
Se desea comparar el consumo promedio de gasolina para tresfabricantes de coches. Se cuenta con 20 conductores a quienes se lesasigna un coche de manera aleatoria, los datos obtenidos se muestranen el cuadro.
Coches A Coches B Coches C22.2 24.6 22.719.9 23.1 21.920.3 22.0 23.221.4 23.5 24.121.2 23.6 22.121.0 22.1 23.420.3 23.5
Rendimiento coches en (km/l)
Ho : (A) = (B) = (C)H1 : alguna de las igualdades anteriores no se cumple
-
31/10/2013
14
Ejercicio 4: El proceso de obtencin de papel necesita grandes cantidades de agua. Una vez preparada la madera, sta es normalmente calentada con agentes reductores y lcalis para disolver las fibras y obtener pulpa. Este proceso es muy contaminante. Se han tomado datos aleatorios a lo largo de un ao de la cantidad de agua usada en el paso inicial de la obtencin de pulpa por tonelada de madera en 4 trituradoras.
Se desea verificar si en promedio las 4 trituradoras consumen la misma cantidad promedio de agua, analizar las diferencias si ellas existen
TA TB TC TD 22,0 18,6 23,1 20,3 18,8 16,0 18,0 18,5 19,5 17,7 20,0 19,6 23,7 14,6 21,0 22,8 21,9 19,9 23,7 23,8 19,9 18,6 22,4 21,4
Ho : (TA) = (TB) = (TC) = (TD)H1 : alguna de las igualdades anteriores no se cumple
Inferencia estadstica prueba de independenciabidimensionales variables cualitativas
herramienta tablas de contingencia
Se consulto una muestra de pobladores de los distritos 1, 2 y 3, respecto a suopinin para implantar o no cierto proyecto en inmediaciones de sujurisdiccin, los datos se muestran en la tabla adjunta, indicar si la opinin delos pobladores es independiente del distrito.
Opinion respecto ala implantacion del
proyectoDistrito 1 Dsitrito 2 Distrito 3
a favor 8 13 12en contra 52 67 48
X2pr = (Oi-Ei)2/Ei
-
31/10/2013
15
Inferencia estadstica prueba de independenciabidimensionales variables cualitativas
herramienta tablas de contingencia
Con los datos de la alcalda, verificar si el genero de las personas es independiente de su categora laboral
Tabla de contingencia Genero * Categora laboral
Recuento
157 27 74 258206 0 10 216363 27 84 474
HombreMujer
Genero
Total
Administrativo Seguridad DirectivoCategora laboral
Total
Regresin desde un punto de vista de inferencia
Profundidad(m)
Oxigeno(mg/l)
p1 15,00 5,50p2 20,00 5,30p3 30,00 4,00p4 40,00 3,00p5 50,00 2,50p6 60,00 1,40p7 70,00 ,50
-
31/10/2013
16
Recordando que se esta trabajando con una muestra estadstica, estimar el contenido de oxigeno para una profundidad PROMEDIO de 43 m
Determinar el contenido de oxigeno a una profundidad concreta y especifica de 43 m
-
31/10/2013
17
Estimacin promedio y estimacin para un valor puntual, va regresin
Modelo de regresin, desde un punto de vista de inferencia con estimaciones por intervalos de confianza
-
31/10/2013
18
Preparar el SPSS para introducir datos de la siguiente boleta
Identificador boleta: bm01
Genero HM
Educacion Formal aos
Categoria laboral Directivo AdministrativoSeguridad
Experiencia previa meses
Filiacion politica sino
Salario actual U$
Salacio inicial U$
GeneroEducacion formal
(Aos)Categoria
laboral
Experiencia previa
(meses)Filiacionpolitica
Salario actual(U$)
Salario inicial(U$)
bm1 Hombre 15 Directivo 144 no $1,140.00 $540.00bm2 Hombre 16 Administrativo 36 no $804.00 $375.00bm3 Mujer 12 Administrativo 381 no $429.00 $240.00bm4 Mujer 8 Administrativo 190 no $438.00 $264.00bm5 Hombre 15 Administrativo 138 no $900.00 $420.00bm6 Hombre 15 Administrativo 67 no $642.00 $270.00bm7 Hombre 15 Administrativo 114 no $720.00 $375.00bm8 Mujer 12 Administrativo 0 no $438.00 $195.00bm9 Mujer 15 Administrativo 115 no $558.00 $255.00
bm10 Mujer 12 Administrativo 244 no $480.00 $270.00
DATOS ALCALDIA
-
31/10/2013
19
Con datos de la alcalda, responder las siguientes preguntas
1. Cual el porcentaje de trabajadores por categora laboral ?
2. Existe una diferencia por genero en funcin de la categora laboral ?
3. Hay diferencias por genero en cuanto al salario y la categora laboral ?
Usar los datos del archivo Consumo_diesel
En este archivo se cuenta con datos del consumo diario de diesel en 3 campamentos camineros, evaluar el comportamiento de esta variable en cuanto a los siguientes aspectos:
a) Valor de la tendencia central
b) Dispersin de los datos
c) Valores extremos
d) Forma de la distribucin
-
31/10/2013
20
1 Cual el proyecto de su preferencia: Proyecto 1
Proyecto 2
Proyecto 3
2 Ciudad en la que vive: Cochabamba
La Paz
Santa Cruz
Anlisis de indepenencia de dos variables cualitativas (Archivo: AFCS_referendum)
Prueba del Chi Cuadrado
Indicar si hay independencia entre la preferencia por un proyecto y la ciudad en que vive
Ho: El proyecto ES INDEPENDIENTE de la ciudad en que vive
H1: El proyecto NO ES INDEPENDIENTE de la ciudad en que vive
-
31/10/2013
21
Ho: El proyecto ES INDEPENDIENTE de la ciudad en que vive
H1: El proyecto NO ES INDEPENDIENTE de la ciudad en que vive
Que proyecto es mas o menos preferido por determinada ciudad ??
Una respuesta al respecto es dada la tcnica del Anlisis Factorial de Correspondencias Simples (AFCS), que permite medir la dependencia entre las categoras de dos variables cualitativas.
Regresin desde un punto de vista de inferenciausar archivo: dispersin _ oxigeno
Profundidad(m)
Oxigeno(mg/l)
p1 15,00 5,50p2 20,00 5,30p3 30,00 4,00p4 40,00 3,00p5 50,00 2,50p6 60,00 1,40p7 70,00 ,50