Concepción San Luis
La inferencia estadística Conceptualización actual.
El hito de 1995
Concepción San Luis
LA INFERENCIA CLÁSICA.
CONCEPTOS BÁSICOS
Concepción San Luis
Distribución Normal
Concepción San Luis
Conceptos
• Estadístico
• Parámetro
• Muestra
• Distribución Muestral de un Estadístico
Concepción San Luis
DISTRIBUCIÓN MUESTRAL DE UN
ESTADÍSTICO
Supongamos que de una población determinada extraemos, al azar, infinitas muestras todas de tamaño n.
De cada muestra calculamos el valor de un estadístico (proporción, media, etc.).
Se llama distribución muestral al conjunto formado por los valores del estadístico seleccionado, obtenido para cada una de las muestras extraigas de la población.
Concepción San Luis
Inferencia: Distribución muestral
Parámetros
media:
Varianza σ2θ
Concepción San Luis
Principales distribuciones muestrales
• ProporcionesMedia:Error típico:
N desconocida
N conocida
• Medias:Media
Error típico:N desconocida
N conocida
p
np
1
1
1
N
nN
np
x
nx
1
N
nN
nx
Concepción San Luis
Parámetro y Estimador
• Parámetro: Característica descriptiva de la población.
• Estadístico: Propiedad descriptiva de una muestra que no es más que una combinación determinada de los valores de la/s variables.
• Un Estadístico permite “estimar” el valor del parámetro aunque nunca dará su valor exacto.
Concepción San Luis
Estimación Puntual
• Se toma como valor del Parámetro el calculado por el estadístico o estimador muestral.
• Toda función de distribución de una variables viene caracterizada por la variable a la que se refiere y uno o más parámetros que la definen.
Si F (x; β) es una función de distribución que depende del parámetro β que no conocemos, si para estimarlo empelamos un estadístico, dicho estadístico es un estimador de β, que representaremos por b.
Puesto que b es una función de los valores X de la muestra, que son variables aleatorias, b será también una variable aleatoria.
Concepción San Luis
¿Son todos los estadísticos buenos estimadores de sus correspondientes parámetros?.
¿Cómo se calculan los estimadores?
Concepción San Luis
Características de un buen estimador
• Carencia de sesgo:
Valor esperado coincide con el parámetro
• Consistencia: a medida
Aumente n
• Eficiencia:
Varianza máxima
• Suficiencia
Utiliza toda la
información
ˆE
1ˆ p
21ˆˆ VarVar
Concepción San Luis
Métodos de obtención de Estimadores
Hay muchos, pero los de interés son• Mínimos cuadrados: Selecciona como e timador
el que hace mínimo el error entre el valor real y el que predicho.
• Máxima Verosimilitud: Selecciona como estimador aquel que maximiza la probabilidad de la muestra observadaSon los que se utilizan en los procedimientos de análisis más habituales en Ciencias Sociales
Concepción San Luis
ESTIMACIÓN POR INTERVALOS
Concepción San Luis
Estimación por intervalos
Intervalo de probabilidad
(único)
Población Muestra
Parámetro Estadístico
p
Intervalo de confianza
(tantos como muestras)
Muestra Población
Estadístico Parámetro
p x x
Concepción San Luis
Intervalo de probabilidad: proporciones
• Condición de aplicación · n 5
(1 - ) · n 5• IP:
pz 2/
np
1
1
1
N
nN
np
Concepción San Luis
Ejemplo I. Probabilidad de proporciones
• La proporción de personas mayores de 65 años que padecen depresión en la población es de 0,15. ¿Entre que valores estará esta proporción en un centre geriátrico que té 40 residentes? (NC = 95%)
• Es un intervalo de probabilidad por qué tenemos la información de la población y queremos conocer la información para la muestra: = 0,15 ¿ p?
• C.A.: 40 · 0,15 = 6 i 40 · (1 - 0,15) = 34 Sí
• IP:%95261,0039,0
40
85,015,096,115,0
NC
Concepción San Luis
Intervalo de probabilidad: MEDIAS
Se asume normalidad de la variable en la població.
• IP:xz 2/
nx
1
N
nN
nx
Concepción San Luis
Ejemplo Intervalo de Probabilidad de MEDIAS
• ¿Entre qué valores se encontrará la media de edad de un grupo de 30 persones mayores de 65 anys que viven rn Madrid si en la població de origen de la muestra la media es de 72 años con una varianza de 5 años? (NC = 96%)
• De trata de un intervalo de probabilidad para la media de la muestra siendo en la población ( = 72)
• Se asume distribución normal e la edad en la población.
• IP: %9684,7216,71
30
50537,272 NC
Concepción San Luis
Intervalo de confianza: proporciones
• IC:
• Condición de aplicación
pzp 2/
n
ppp
1
1
1
N
nN
n
ppp
5ˆ15ˆ
5ˆ15ˆ
nn
nn
ss
ii
Concepción San Luis
CONTRASTE DE HIPÓTESIS
Concepción San Luis
1.- Se basa en las distribuciones muestrales.(modelos probabilísticos por tanto es un resultado probabilístico)
2.- Son un conjunto de técnicas que permiten comprobar la información que produce una muestra (observaciones) concuerda o no con una determinada distribución (modelo) de probabilidad conocido (distribución muestral). Lo que se prueba es los que denominamos H0.
Concepción San Luis
Como se decide. Criterio
Sea x = (x1,x2,x3…xn) las observaciones (datos obtenidos). Definimos un criterio (estadístico de contraste) que divide la distribución muestral del estadístico en dos partes:
• región Crítica (rechazo): Área de la distribución muestral que corresponde a los valores del estadístico de contraste tan alejados que es poco probable que ocurra (H0 se rechaza). Su probabilidad es α
• Región e Aceptación: Área de la distribución muestral que corresponde a los valores del estadístico de contraste no incluidos en la región crítica. Su probabiliad es 1-α (aceptar H0)
Concepción San Luis
CONSECUENCIAS
• El tamaño de las regiones de rechazo y aceptación quedan determinadas por α nivel de significación.
• Se interpreta como un nivel de error, por tanto su valor debe ser pequeño.
Concepción San Luis
Dado que hemos dividido la distribución en dos regiones dependiendo y que H0 y H1tienen que ser exhaustivas y excluyentes (se trata de tomar una decisión entre dos posibles), dependiendo de cómo formulemos H1 podemos hablar de contrastes bilaterales o unilaterales.
Concepción San Luis
Planteamiento de las hipótesis estadísticas
• Contraste bilateral:
H0: p = H0: =
H1: p H1: •Contraste Unilateral:
• Dcha:
H0: p H0:
H1: p > H1: > •Izda.:
H0: p H0:
H1: p < H1: <
xx
x
x
xx
Concepción San Luis
Procedimiento General para el contraste
1. Plantear la hipótesis nula H0.
2. Seleccionar una muestra (mediante una regla de muestreo).
3. Determinar la distribución muestral del estadístico de interés.
4. Seleccionar y calcular el estadístico de contraste (índice de discrepancia).
5.-Fijar el valor del riesgo .
6.- Comparar el estadístico el contraste con el valor de estadístico para α.
Concepción San Luis
¿Ha funcionado este procedimiento?
Aunque podríamos pensar que sí, todos lo hemos hecho de esta forma, hay varia críticas:Se han mezclado dos procedimientos encontrados: Se toma de Fisher la concepción y la sistemática del contrastar la H0.
Se introduce la H1 de Neyman Pearson y el proceso de toma de decisión entre DOS CONTRARIOS inaceptable en la filosofía de Fisher.CONSECUANCIA
Concepción San Luis
Que ha ocurrido
Se han mezclado dos procedimientos:Fisher: Contrastes de significación.Sólo una de las dos posibles soluciones
Rechazo H0 a un nivel α o decir que ni hay evidencia suficiente. No hay H1
Neyman Pearson: Plantean explícitamente la H1 (contrapuesta a H0) y se centran en un problema de toma de decisiones
Concepción San Luis
Errores asociados a la toma de decisión en la prueba de hipótesis
Carácter de la Hipótesis nula H0
verdadera falsa
No se ref uta la H0 Decisión correcta NC: 1 -
Error tipo I I
Decisión Es refuta la H0 Error tipo I
Decisión correcta
Potencia: 1 -
Concepción San Luis
Errores asociados a la toma de decisión en la prueba de hipótesis
Concepción San Luis
Reducción del error
Riesgo :
- Fijado por el investigador
Riesgo :
- Valor de
-Tamaño de la Muestra
- Tamaño del efecto
Concepción San Luis
Relación entre y
A medida que aumenta disminuye
Concepción San Luis
Relación entre y el tamaño de la muestra
A medida que aumenta el tamaño de la muestra disminuye el error estandar y por lo tanto el
riesgo de
n1 n2
n1 < n2
Concepción San Luis
Relación entre el riego y el valor verdadero de H1
Hay tantos valores de como H1 se hayan enunciado
Concepción San Luis
Todos los elementos contemplados en el cuadro de decisión ha sido sistemáticamente olvidados.
1995 La Taks Force propone como solución.
Añadir la potencia, el tamaño del efecto y los intervalos de confianza.
Concepción San Luis
Para que
Solventar los problemas de integración de resultados (El meta análisis).
Mejorar la comunicación
Facilitar los experimentos cruciales
Dar paso a un planteamiento más cercano a la modelización.
Concepción San Luis
A donde habíamos llegado
La concentración de esfuerzos en las pruebas de significación a llevado a que ne la enseñanza y en la investigación sólo nos preocupe buscar cual es la solución adecuada a nuestra situación de investigación concreta con el único interés en desechar la H0 sin preocuparnos de.
La implicación teórico practica y la búsqueda de explicaciones acumulativas que mejoren la comprensión de la realidad compleja.
Concepción San Luis
ASÍ TRABAJAMOS
Concepción San Luis
ÁRBOL DE DESISIÓN PARA LA ELECCIÓN DEL ESTADÍSTICO DE
CONTRASTE APROPIADO EN INVESTIGACIONES EN CIENCIAS
SOCIALES
¿En relación a cuántas muestras se pretende realizar la inferencia?
1 2 más de 2
Concepción San Luis
Contraste para la media
Contraste para la varianza
Contraste para la proporción
Contraste sobre promedios
SI
Bondad de ajuste
NO
TZ
SIGNOSWILCOXON
2
2
Z
Escala de intervalo y distribución
simétrica
SI
SI
SI
SISI
NO
NO
NO
NO
SI Varianza conocida
NO
Concepción San Luis
SI
SI
NO
NO
NO
NO
NO
NO
¿Muestras relacionadas?
¿Contraste paramétrico?
¿Contraste paramétrico?
T
Z
SI
Varianza conocida
Contraste de medias
SI
SI
Contraste varianzas
Contraste de proporciones
F
SI
SI
Z
Contraste promedios
SI
D NO
Homo-geneidad
SI
2
NO
Funcióndistribución
SI
W
NO
NO
T
Z
SI
Varianza conocida
Contraste medias SI
SI
Contraste varianzas
Contraste de proporciones
T
SI
SIZ
NO
B
NO
SI
Contraste promedios
Escala de intervalo y distribuc. simétrica
Contraste de proporciones
NO
WILCOXON
SI
SIGNOS
Concepción San Luis
NO
SI
2 ó más
NO
1 Nº de factores
¿ Efect. fijos?
¿Cont. paramétrico?
SI
NO
SI
SI
SI
SI
NO
NO
NO
NO
ANOVAunifact. SI
¿ Efect. fijos?
¿Interacción?
NO
¿Mues. depen.?
2 Fac.
SI
ANOVAmultiact.
Med. repe. en:
1 Fact.
K-W Jonckeere
¿ Orden predic.?
V. dicotómic.
Cocran
Friedman
SI
NO
¿Mues. depend.?
¿Muest. depen.?
ANOVA 1Fact.Med.Rep.
ANOVA1Fact. Mues.Ind.
Efect aleat
ANOVA1Fact. Mues.Ind.
Efect fijos ANOVA multifact. Muest ind.
Efect fijos Con interac.
ANOVA multifact. Muest ind.Efect fijos Sin interac.
ANOVA multifact.Muest ind.
Efect aleat.
ANOVA multifact. Med. Rep.ANOVA
multifact. Med. Rep.en 1 Factor
Concepción San Luis
Un nuevo planteamiento
LA MODELIZACIÓN
Concepción San Luis
Top Related