6. Conceptos básicos -...
Transcript of 6. Conceptos básicos -...
La inferencia estadística
POBLACIÓN Y MUESTRA
Población
Muestra
Elemento o unidad
Censo
vs.
Muestreo
¿Qué proporción de la foto
tendría que estar descubierta para
poder decir de qué objeto se trata
con cierto grado de confianza?
¿4 de 25?
Pero, ¿cuáles son más informativas?
Las elegidas al azar.
Combinaciones posibles de 4 cuadros de 25: 12 650!!
Cuando no se tiene acceso
a toda la información de un fenómeno,
es mejor elegir al azar
que usar cualquier otro método.
Ejemplo:
¿Qué porcentaje de los votantes
votaría por el candidato X?
Imposible preguntarle a todos.
Preguntamos sólo a unos cuántos;
la mejor forma de elegirlos es al azar.
Tipos de muestreo
No probabilístico o no aleatorio
Accidental
Cálculo del tamaño de la muestra
Donde
z Nivel de confianza o seguridad.
E Nivel de precisión o Error máximo de estimación.
p Valor proporcional de la variable en la poblacional. Se puede obtener revisando la literatura o por estudio piloto previos. En caso de no contar con dicha información, se utiliza valor p = 0.5 (50%).
q Valor del complemento de p.Se calcula con: q = 1 - p
n = z2 p q
E2
Patrón circular de la lógica de la
prueba de hipótesis
Planteamiento
de la hipótesis
de investigación
Traducción
a través de
definiciones
operacionales
y estadísticas
Establecimiento
de las hipótesis
estadísticas
Observación y
análisis de los datos
relacionados con la
hipótesis
Confirmación o
rechazo de la
hipótesis
estadística
Traducción de las
conclusiones
estadísticas
a las conclusiones
de investigación
Conclusiones
respecto de la
hipótesis
planteada
*Image via Bing
*Image via Bing*Image via Bing
*Image via Bing
Trabajo estadístico
*Image via Bing
1. Hay un modelo
estadístico que pueda
usarse para entender
ciertos eventos
observados.
Principios de inferencia estadística
3. Pueden considerarse dos explicaciones:
Explicación 1: El evento, aunque es raro,
no es contrario al modelo estadístico; la
rareza del evento es debida al azar.
Explicación 2: El evento es tan raro en
comparación con el modelo estadístico
dado que se concluye que es extraordinario
y que el modelo, por alguna razón, no se
aplica a esta circunstancia.
Principios de inferencia estadística
4. Hay una posibilidad de error al
adoptar cualquiera de las dos
explicaciones. Habrá que
minimizar las posibilidades de
error.
Principios de inferencia estadística
Principios de inferencia estadística
1. Hay un modelo estadístico que pueda
usarse para entender ciertos eventos
observados.
1. No hay diferencia entre los grupos; es
decir, los dos grupos responden en forma
similar.
2. Se observa un evento y éste es el foco
de interés.
2. Observamos las respuestas de los
sujetos de ambos grupos; es el “evento de
interés”.
3. Pueden considerarse dos
explicaciones:
Explicación 1: El evento, aunque es raro,
no es contrario al modelo estadístico; la
rareza del evento es debida al azar.
Explicación 2: El evento es tan raro en
comparación con el modelo estadístico
dado que se concluye que es
extraordinario y que el modelo, por
alguna razón, no se aplica a esta
circunstancia.
3. Hay dos explicaciones:
Explicación 1: Realmente no hay diferencia
entre los dos grupos; cualquier diferencia
observada se debe a las variaciones del
azar.
Explicación 2: El grupo 1 y el grupo 2
difieren en su ejecución. Las respuestas
observadas en los sujetos son tan
extraordinarias que no es probable que se
obtengan únicamente por azar. Deben
haberse obtenido porque ambos grupos
realmente difieren.
4. Hay una posibilidad de error al adoptar
cualquiera de las dos explicaciones.
Habrá que minimizar las posibilidades de
error.
4. La adopción de una explicación u otra
implicará algún riesgo de error, el cual
debe minimizarse.
Principios de inferencia estadística
Ejemplo:
Supongamos que estamos interesados en comparar a hombres y mujeres en el Test de la bayoneta del aceite, el cual consiste en levantar el cofre del coche del participante y pedirle que señale la bayoneta del aceite.
El propósito del estudio es determinar si los hombres y las mujeres difieren en su ejecución del Test de la bayoneta del aceite.
Supóngase que cuatro hombres y cuatro
mujeres son elegidos al azar de la
población de posibles sujetos.
Principios de la inferencia estadística1. No hay diferencias en el Test de la bayoneta del aceite entre hombres y
mujeres, entonces la respuesta de los dos grupos será similar. La
probabilidad de que una mujer pase el test es la misma que la
probabilidad que tiene un hombre de pasarlo.
2. Observaremos la ejecución de ocho personas en el Test de la bayoneta
del aceite. Éste es nuestro “evento de interés”.
3. Se examinan dos explicaciones:
Explicación 1: Realmente no hay diferencia entre hombres y mujeres en el
Test de la bayoneta del aceite; cualquier diferencia en la respuesta de
estas ocho personas se debe sólo a las variaciones del azar.
Explicación 2. Los hombres y las mujeres difieren en el Test de la
bayoneta del aceite. Las respuestas observadas para estos ocho
sujetos son tan extraordinarias que es improbable que hayan sido
obtenidas sólo por azar. Deben haberse obtenido porque los hombres
y las mujeres realmente difieren.
4. La adopción de una explicación o la otra implica algún riesgo de error,
el cual deseamos minimizar.
Todos los posibles resultados (25) que podrían obtenerse de
cuatro hombres (H) y cuatro mujeres (M) que hicieron el Test
de la bayoneta del aceite; cada uno de ellos pasando (P) o
reprobando (R) el test:
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 0 4 M 0 4 M 0 4 M 0 4 M 0 4
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 1 3 M 1 3 M 1 3 M 1 3 M 1 3
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 2 2 M 2 2 M 2 2 M 2 2 M 2 2
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 3 1 M 3 1 M 3 1 M 3 1 M 3 1
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 4 0 M 4 0 M 4 0 M 4 0 M 4 0
¿Cuál configuración nos convencería de que los hombres (H)
y las mujeres (M) difieren en pasar (P) o reprobar (R) el test?
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 0 4 M 0 4 M 0 4 M 0 4 M 0 4
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 1 3 M 1 3 M 1 3 M 1 3 M 1 3
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 2 2 M 2 2 M 2 2 M 2 2 M 2 2
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 3 1 M 3 1 M 3 1 M 3 1 M 3 1
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 4 0 M 4 0 M 4 0 M 4 0 M 4 0
¿Qué tan convincente es?
Probabilidad de error
Si un resultado observado pudiera haber sido obtenido fácilmente sólo por azar cuando en realidad no hay diferencia entre los grupos, obtener ese resultado difícilmente podría ser una prueba convincente de que los grupos sí difieren.
Ejemplo: P RH 2 2M 3 1
Si los resultados del Test de la bayoneta del aceite
fueran:
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 0 4 M 0 4 M 0 4 M 0 4 M 0 4
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 1 3 M 1 3 M 1 3 M 1 3 M 1 3
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 2 2 M 2 2 M 2 2 M 2 2 M 2 2
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 3 1 M 3 1 M 3 1 M 3 1 M 3 1
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 4 0 M 4 0 M 4 0 M 4 0 M 4 0
Si adoptáramos la explicación 2 y
concluyéramos que los hombres y las mujeres
difieren, basaríamos nuestra conclusión en
evidencia poco sólida.
La probabilidad de cometer un error –decir que
existe una diferencia cuando de hecho no la hay–
sería muy alta.
El proceso de inferencia estadística
comúnmente se realiza de tal manera que estos
errores no ocurran.
Podríamos determinar que un resultado como ése probablemente nos convencería de que los grupos difieren. Pero si queremos aplicar el principio 4, debemos ser más precisos.
De los 25 probables resultados, ¿cuántos son tan extremos, o más, que el observado?
Los más extremos son:
P R P RH 4 0 H 0 4M 0 4 M 4 0
Los más extremos:
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 0 4 M 0 4 M 0 4 M 0 4 M 0 4
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 1 3 M 1 3 M 1 3 M 1 3 M 1 3
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 2 2 M 2 2 M 2 2 M 2 2 M 2 2
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 3 1 M 3 1 M 3 1 M 3 1 M 3 1
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 4 0 M 4 0 M 4 0 M 4 0 M 4 0
Los resultados tan extremos como el
observado son:
P R P R P R P R
H 4 0 H 3 1 H 1 3 H 0 4
M 1 3 M 0 4 M 4 0 M 3 1
Juntos hay 2 + 4 = 6 resultados que son tan
extremos como, o más extremos que, el
resultado observado.
La probabilidad de obtener los resultados
observados o resultados más extremos sólo
por azar es 6/25 o 0.24.
Tan extremos como el obtenido:
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 0 4 M 0 4 M 0 4 M 0 4 M 0 4
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 1 3 M 1 3 M 1 3 M 1 3 M 1 3
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 2 2 M 2 2 M 2 2 M 2 2 M 2 2
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 3 1 M 3 1 M 3 1 M 3 1 M 3 1
P R P R P R P R P RH 4 0 H 3 1 H 2 2 H 1 3 H 0 4M 4 0 M 4 0 M 4 0 M 4 0 M 4 0
Siguiente pregunta: Un resultado obtenido que tiene una probabilidad de 24% de ser igualado o sobrepasado meramente por azar, ¿es suficientemente extremo para ser una evidencia convincente de que los hombres en verdad difieren en el Test de la bayoneta del aceite?
Supongamos que consideramos denominar a nuestro resultado observado “convincentemente extremo.”
Esto significaría que rechazaríamos la explicación de “no diferencia” (1) a favor de la explicación de que “los grupos difieren” (2).
¿Cuál es nuestra probabilidad de cometer un error? Si adoptamos la explicación 2 y concluimos que los hombres difieren de las mujeres, la probabilidad de cometer un error es de 0.24 o 24%, lo cual es un riesgo enorme en la investigación científica.
Preferiríamos riesgos más pequeños:
10% o 5% o 1%.
Así que diremos que no podemos
concluir que hay una verdadera
diferencia entre los hombres y las
mujeres en el Test de la bayoneta del
aceite, pues el riesgo de error
asociado con la adopción de la
explicación 2 es demasiado grande,
por lo que debemos refugiarnos en la
explicación 1: no hay diferencias
entre hombres y mujeres.
Errores estadísticos
Cuál es la verdad
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
La hipótesis
nula es
verdadera
Correcto
La hipótesis
nula es
falsa
Qué
decisión
se tomó
Errores estadísticos
Cuál es la verdad
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
Correcto
Qué
decisión
se tomó
Errores estadísticos
Cuál es la verdad
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
Error Tipo I
Qué
decisión
se tomó
Errores estadísticos
Cuál es la verdad
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
La hipótesis
nula es
verdadera
Error Tipo II
La hipótesis
nula es
falsa
Qué
decisión
se tomó
Errores estadísticos
Cuál es la verdad
La hipótesis
nula es
verdadera
La hipótesis
nula es
falsa
La hipótesis
nula es
verdadera
CorrectoError Tipo II
β
La hipótesis
nula es
falsa
Error Tipo I
αCorrecto
Qué
decisión
se tomó
Pasos para la prueba de hipótesis
1. Hipótesis de investigación
La V1 se relaciona con la V2
2. Hipótesis estadísticas:
Hipótesis nula H0 La V1 no se relaciona con la V2
Hipótesis alterna HA La V1 se relaciona con la V2
3. Prueba estadística
4. Regla de decisión
0.05 (0.01, 0.001)
5. Cálculos
6. Decisión
Se rechaza (o no se rechaza) la hipótesis nula
7. Conclusión
La V1 se relaciona con la V2 (o no se relaciona)