Inferencia estadística copia

24
Inferencia Estadística Población y Muestra Probabilidad Intervalos de Confianza Pruebas de Hipótesis

description

Clase Estadística UDP

Transcript of Inferencia estadística copia

  • Inferencia Estadstica

    Poblacin y Muestra Probabilidad

    Intervalos de Confianza Pruebas de Hiptesis

  • Poblacin

    Coleccin natural, geogrfica o poltica de personas, animales, plantas u objetos.

    Conjunto de elementos que poseen algn atributo comn ubicados espacial y temporalmente.

    Hay poblaciones reales y virtuales

  • Muestra

    Una muestra es un subconjunto de la poblacin que es efectivamente estudiado.

    La forma de eleccin de los elementos se denomina tipo de muestreo, e.g.:

    Accidental Sistemtico Aleatorio simple Estratificado

  • Parmetros y estimadores

    Un estimador es una cantidad numrica calculada sobre una muestra y que esperamos que sea una buena aproximacin de cierta cantidad con el mismo significado en la poblacin (parmetro).

    Ejemplos clsicos:

  • Muestreo e Inferencia

    Poblacin

    muestra

  • Distribuciones muestrales

    4.30 Francisca 4.10 Javiera 6.40 Mara

    4.90 Carla 5.90 Alejandra 6.10 Erica

    5.40 Margarita 5.70 Toms 4.70 Romualdo

    3.70 Felipe 5.60 Francis 6.50 Valentina

    6.10 Loreto 6.80 Dominique 4.30 Jose

    6.00 Grace 4.10 Sebastin 5.50 Camila

    4.00 Mara 5.60 Ximena 4.60 Paulina

    6.20 Camila 4.90 Isabela 4.70 Julliete

    6.70 Nicole 4.90 Francisca 5.10 Jenifer

    7.00 Rosario 3.30 Mara Jess 6.10 Jos Mara

    4.80 Camila 5.20 Mara 4.60 Mara Ignacia

    4.60 Karina 5.90 lvaro 4.20 Bernardita

    6.00 Catalina 5.10 Enzo 6.40 Maite

    5.90 Alejandra 5.50 Consuelo 3.90 Iang

    4.60 Arturo 5.20 Melania 6.10 Gianfranco

    4.90 Anglica 4.30 Beln 4.60 Shannon

    5.30 Isabel 5.40 Carolina 6.10 Nathalie

    5.00 Francisca 5.80 Carolina 4.00 Fernando

    5.60 Patricia 3.90 Rosa 6.00 Alexandra

  • Histograma de notas

    7.00

    6.75

    6.50

    6.25

    6.00

    5.75

    5.50

    5.25

    5.00

    4.75

    4.50

    4.25

    4.00

    3.75

    3.50

    3.25

    12

    10

    8

    6

    4

    2

    0

    Desv. tp. = .88 Media = 5.23 N = 57

  • 100 muestras de tamao 5

    0

    5

    10

    15

    20

    25

    30

    4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7

    notas

    Frec

    uenc

    ia

  • 100 muestras de diferente tamao

    0

    5

    10

    15

    20

    25

    30

    35

    40

    4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7

    n=10

    n=5

    n=15

  • Teorema del lmite central Si una variable sigue una distribucin

    cualquiera con promedio y desviacin ; el promedio de las muestras elegidas al azar siguen una distribucin normal con promedio y desviacin /n

    y

    Muestras elegidas al

    azar

    y

    y

    y

    y

    Promedio de las muestras Variable

    N(,/n)

  • Estimacin puntual y por intervalos

    Una estimacin puntual es un valor (punto) muestral que se usa para determinar un parmetro poblacional.

    El error de muestreo es la diferencia entre un estadgrafo muestral y su parmetro correspondiente

    Una estimacin por intervalo establece la amplitud en la que puede encontrarse un parmetro poblacional. El intervalo dentro del cual se espera que est un parmetro poblacional se llama intervalo de confianza.

  • Cundo son necesarios los IC?

    En cualquier situacin en que se pretenda hacer una inferencia sobre el mundo a partir de los resultados de una parte de l.

    El propsito principal de los intervalos de confianza es indicar la (im)precisin de los estimadores muestrales como valores poblacionales.

  • Nivel de confianza (1-)

    Es la probabilidad de que el intervalo construido contenga el verdadero valor del parmetro.

    La probabilidad de equivocarnos se llama nivel de significancia y se simboliza .

    Los intervalos de confianza ms utilizados son al 90%, 95% y al 99% de confianza.

  • (Im)precisin de un IC

    La imprecisin de un intervalo de confianza es indicada por la amplitud del intervalo. A mayor amplitud, menor es la precisin.

    La amplitud de un intervalo depende de 3 factores:

    Tamao muestral Variabilidad del atributo estudiado Nivel de confianza

  • 50 intervalos al 95%

  • Amplitud de los intervalos

  • Interpretacin de un IC

    Un intervalo de confianza al 95% significa que el 95% de los intervalos igualmente construidos contendrn el parmetro que se quiere estimar

    El perro del hombre invisible...

  • Intervalo de confianza para la media

    Frmula empleada usualmente

  • Pruebas de Hiptesis

    El primer paso es transformar nuestras ideas cientficas a su operacionalizacin numrica.

    As, tenemos dos tipos de hiptesis: Hiptesis Cientfica o de Trabajo: Explicaciones

    tentativas del fenmeno investigado, formuladas a manera de proposiciones.

    Hiptesis Estadstica: Proposicin acerca de uno o ms parmetros poblacionales.

  • Hiptesis Estadsticas

    Hiptesis Nula (H0): Es la que se somete a prueba. Apunta a un valor fijo de un parmetro. Usualmente se expresa como una igualdad.

    Hiptesis Alternativa (H1): Proposicin que niega o contradice una hiptesis nula. Usualmente representa estadsticamente a la

    hiptesis cientfica del estudio. Representa la nica opcin razonable en caso de

    rechazar la hiptesis nula.

  • Prueba a una o dos colas?

    Hiptesis direccionales, 1 cola: Son aquellas en que se seala claramente y de

    antemano que se espera un cambio de un parmetro en una direccin especfica

    Hiptesis no direccionales, 2 colas: Son aquellas en que simplemente se explora si

    existe un cambio en un parmetro. Son las usadas con mayor frecuencia

  • Errores... y aciertos

    H0 verdadera H0 falsa

    Aceptamos H0 Decisin correcta Probabilidad = 1- Error tipo II

    Probabilidad =

    Rechazamos H0 Error tipo I Probabilidad = (nivel de significacin)

    Decisin correcta Probabilidad = 1- (poder estadstico)

  • Nivel de significancia

    Es un valor fijado por decisin del investigador

    Corresponde a la probabilidad de cometer error tipo I, i.e. rechazar la hiptesis nula cuando es verdadera

    Indica que tan extremo debe ser un resultado muestral, para que empecemos a cuestionar la veracidad de la hiptesis nula

  • El valor p

    Es un resultado de la aplicacin de una prueba estadstica a un conjunto de datos

    Es la probabilidad de encontrar un resultado tan desviado (o ms), como el encontrado en un estudio particular, asumiendo que la hiptesis nula es verdadera

    En la prctica, cuando el valor p es menor que , rechazamos la hiptesis nula y hemos encontrado una diferencia estadsticamente significativa