Inferencia estadística copia

Inferencia Estadstica

Poblacin y Muestra Probabilidad

Intervalos de Confianza Pruebas de Hiptesis

Poblacin

Coleccin natural, geogrfica o poltica de personas, animales, plantas u objetos.

Conjunto de elementos que poseen algn atributo comn ubicados espacial y temporalmente.

Hay poblaciones reales y virtuales

Muestra

Una muestra es un subconjunto de la poblacin que es efectivamente estudiado.

La forma de eleccin de los elementos se denomina tipo de muestreo, e.g.:

Accidental Sistemtico Aleatorio simple Estratificado

Parmetros y estimadores

Un estimador es una cantidad numrica calculada sobre una muestra y que esperamos que sea una buena aproximacin de cierta cantidad con el mismo significado en la poblacin (parmetro).

Ejemplos clsicos:

Muestreo e Inferencia

Poblacin

muestra

Distribuciones muestrales

4.30 Francisca 4.10 Javiera 6.40 Mara

4.90 Carla 5.90 Alejandra 6.10 Erica

5.40 Margarita 5.70 Toms 4.70 Romualdo

3.70 Felipe 5.60 Francis 6.50 Valentina

6.10 Loreto 6.80 Dominique 4.30 Jose

6.00 Grace 4.10 Sebastin 5.50 Camila

4.00 Mara 5.60 Ximena 4.60 Paulina

6.20 Camila 4.90 Isabela 4.70 Julliete

6.70 Nicole 4.90 Francisca 5.10 Jenifer

7.00 Rosario 3.30 Mara Jess 6.10 Jos Mara

4.80 Camila 5.20 Mara 4.60 Mara Ignacia

4.60 Karina 5.90 lvaro 4.20 Bernardita

6.00 Catalina 5.10 Enzo 6.40 Maite

5.90 Alejandra 5.50 Consuelo 3.90 Iang

4.60 Arturo 5.20 Melania 6.10 Gianfranco

4.90 Anglica 4.30 Beln 4.60 Shannon

5.30 Isabel 5.40 Carolina 6.10 Nathalie

5.00 Francisca 5.80 Carolina 4.00 Fernando

5.60 Patricia 3.90 Rosa 6.00 Alexandra

Histograma de notas

7.00

6.75

6.50

6.25

6.00

5.75

5.50

5.25

5.00

4.75

4.50

4.25

4.00

3.75

3.50

3.25

12

10

8

6

4

2

0

Desv. tp. = .88 Media = 5.23 N = 57

100 muestras de tamao 5

0

5

10

15

20

25

30

4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7

notas

Frec

uenc

ia

100 muestras de diferente tamao

0

5

10

15

20

25

30

35

40

4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7

n=10

n=5

n=15

Teorema del lmite central Si una variable sigue una distribucin

cualquiera con promedio y desviacin ; el promedio de las muestras elegidas al azar siguen una distribucin normal con promedio y desviacin /n

y

Muestras elegidas al

azar

y

y

y

y

Promedio de las muestras Variable

N(,/n)

Estimacin puntual y por intervalos

Una estimacin puntual es un valor (punto) muestral que se usa para determinar un parmetro poblacional.

El error de muestreo es la diferencia entre un estadgrafo muestral y su parmetro correspondiente

Una estimacin por intervalo establece la amplitud en la que puede encontrarse un parmetro poblacional. El intervalo dentro del cual se espera que est un parmetro poblacional se llama intervalo de confianza.

Cundo son necesarios los IC?

En cualquier situacin en que se pretenda hacer una inferencia sobre el mundo a partir de los resultados de una parte de l.

El propsito principal de los intervalos de confianza es indicar la (im)precisin de los estimadores muestrales como valores poblacionales.

Nivel de confianza (1-)

Es la probabilidad de que el intervalo construido contenga el verdadero valor del parmetro.

La probabilidad de equivocarnos se llama nivel de significancia y se simboliza .

Los intervalos de confianza ms utilizados son al 90%, 95% y al 99% de confianza.

(Im)precisin de un IC

La imprecisin de un intervalo de confianza es indicada por la amplitud del intervalo. A mayor amplitud, menor es la precisin.

La amplitud de un intervalo depende de 3 factores:

Tamao muestral Variabilidad del atributo estudiado Nivel de confianza

50 intervalos al 95%

Amplitud de los intervalos

Interpretacin de un IC

Un intervalo de confianza al 95% significa que el 95% de los intervalos igualmente construidos contendrn el parmetro que se quiere estimar

El perro del hombre invisible...

Intervalo de confianza para la media

Frmula empleada usualmente

Pruebas de Hiptesis

El primer paso es transformar nuestras ideas cientficas a su operacionalizacin numrica.

As, tenemos dos tipos de hiptesis: Hiptesis Cientfica o de Trabajo: Explicaciones

tentativas del fenmeno investigado, formuladas a manera de proposiciones.

Hiptesis Estadstica: Proposicin acerca de uno o ms parmetros poblacionales.

Hiptesis Estadsticas

Hiptesis Nula (H0): Es la que se somete a prueba. Apunta a un valor fijo de un parmetro. Usualmente se expresa como una igualdad.

Hiptesis Alternativa (H1): Proposicin que niega o contradice una hiptesis nula. Usualmente representa estadsticamente a la

hiptesis cientfica del estudio. Representa la nica opcin razonable en caso de

rechazar la hiptesis nula.

Prueba a una o dos colas?

Hiptesis direccionales, 1 cola: Son aquellas en que se seala claramente y de

antemano que se espera un cambio de un parmetro en una direccin especfica

Hiptesis no direccionales, 2 colas: Son aquellas en que simplemente se explora si

existe un cambio en un parmetro. Son las usadas con mayor frecuencia

Errores... y aciertos

H0 verdadera H0 falsa

Aceptamos H0 Decisin correcta Probabilidad = 1- Error tipo II

Probabilidad =

Rechazamos H0 Error tipo I Probabilidad = (nivel de significacin)

Decisin correcta Probabilidad = 1- (poder estadstico)

Nivel de significancia

Es un valor fijado por decisin del investigador

Corresponde a la probabilidad de cometer error tipo I, i.e. rechazar la hiptesis nula cuando es verdadera

Indica que tan extremo debe ser un resultado muestral, para que empecemos a cuestionar la veracidad de la hiptesis nula

El valor p

Es un resultado de la aplicacin de una prueba estadstica a un conjunto de datos

Es la probabilidad de encontrar un resultado tan desviado (o ms), como el encontrado en un estudio particular, asumiendo que la hiptesis nula es verdadera

En la prctica, cuando el valor p es menor que , rechazamos la hiptesis nula y hemos encontrado una diferencia estadsticamente significativa

Inferencia estadística copia

Documents

Transcript of Inferencia estadística copia