Tecnicas de muestreo

Post on 28-May-2015

8.614 views 4 download

Transcript of Tecnicas de muestreo

Técnicas de Muestreo

Héctor Quintero

Guillermo Bianchi

Técnicas de Muestreo

Conceptos básicos Errores de muestreo. Factores que determinan la

representatividad de la muestra. Determinación del tamaño de la muestra. Principales tipos de muestreos

estadísticos.

Universo - Población - Muestra

UniversoPoblación A

Población B

Muestra 1

Muestra 1

Muestra 2

Muestra 3

Muestra 2

Variable 1 Variable 2

Universo - Población - Muestra

5,3 L

6,5 L

Jugadores de la

Vinotintoconvocados

para el amistoso España

Venezuela

Posición de cada uno de

los jugadores convocados

Capacidad Pulmonar Total de cada uno

De los jugadores

5,3 L6,1 L6,7 L7,0 L

Posición de 5

jugadores

Posición de 2

jugadores

Posición de 3

jugadores

PosiciónCapacidad Pulmonar

Total

Universo - Población - Muestra

Dani Hernández Alexander González José Manuel Rey

Oswaldo Vizcarrondo Juan FuenmayorAlejandro Guerra Giácomo Di Giorgi

Edgar JiménezJuan Arango Nicolás Fedor

Daniel Arismendi

ArqueroLateral der.

CentralCentral

Lateral izq.VolantesVolantesVolantesVolantesDelanteroDelantero

5,36,57,06,76,15,46,26,66,37,15,8

5,3 L6,1 L6,7 L7,0 L

VolanteArquero

5,4 L6,5 L7,0 L

VolanteCentralCentralAtaqueArquero

ArqueroCentralCentral

PosiciónCapacidad Pulmonar

Total

Técnicas de

MuestreoInferencia Estadística x

2S

2Estimación

Estadístico y Parámetro

Un estadístico es un valor que describe una característica de una

muestra.

El valor de un estadístico varía de una muestra a otra:

NO TIENE UN VALOR ÚNICO.

Un parámetro es un valor que describe una característica de una

población.

Bajo el enfoque de la estadística clásica el valor de un parámetro poblacional es:

ÚNICO.

Estimación

Estadístico Parámetro

Censo y Muestreo Un parámetro puede ser calculado si se efectúa

un Censo, o puede ser estimado por un estadístico obtenido a partir de una muestra representativa.

CENSO = Implica estudiar las variables de interés en todos los individuos presentes en el universo, en un momento dado.

MUESTREO = conjunto de técnicas que permiten obtener una muestra representativa de la población, que permite estimar el parámetro de interés.

Censo y Muestreo

Dificultades a la hora de emplear censos

Extremadamente costoso. Se requiere gran cantidad de personal

especializado. No siempre se pueden acceder a todos los

individuos del universo. Hay mayor probabilidad de cometer errores en

la manipulación de los datos que en un muestreo.

Razones para efectuar un Muestreo

Disminución de costos ( tiempo, personal, material).

Al disminuir el número de casos, disminuyen también los errores asociados a la manipulación de los datos.

Puede confiarse en la generalización de los resultados si se ha tenido cuidado al seleccionar la muestra.

Conjunto de pasos que

garantizan que un

experimento genere

datos que permita llegar

a conclusiones válidas

en un estudio

Muestreo y Diseño de Experimentos

Técnicas de Muestreo

Conjunto de técnicas

que se basan en el

principio de equiproba-

bilidad y garantizan la

representatividad de la

muestra.

≠ Diseño de experimentos

Muestreo estadístico

Formalmente, un muestreo estadístico es un conjunto de técnicas que satisfacen las siguientes condiciones:  

Se conoce a priori el conjunto de posibles muestras distintas que se pueden obtener.

Cada muestra tiene una probabilidad pi de ser elegida.

Las muestras se seleccionan aleatoriamente. Los estimadores están definidos y conducen a

una única estimación. Son únicos y se conocen a priori.

Muestra

Es una parte o porción de la población. Por tanto, es un subconjunto de medidas de la característica de estudio.

MuestraMuestra por conveniencia

Muestra representativa

Tipos de Muestras

ProbabilísticaProbabilística Por convenienciaPor conveniencia

Todas las unidades tienen igual probabilidad de participar en la muestra.

La elección de cada unidad muestral es independiente de las demás.

Se puede calcular el error muestral

Cada unidad NO tiene igual probabilidad de participar en la muestra.

No se puede calcular el error muestral.

Alto riesgo de invalidez producido por la introducción de sesgos

Tipos de Muestras

ProbabilísticaProbabilística Por convenienciaPor conveniencia

Estimación de parámetros

Contraste de hipótesis

Estudios de casos.

Estudios cualitativos

Errores de muestreo

Error sistemático. Conducen a pérdida de exactitud. Instrumentos descalibrados Contaminación de la muestra. Pérdida de analito por volatilización, oxidación,

adsorción, etc. Error aleatorio, afecta la precisión de los

resultados. Falta de representatividad por heterogeneidad

espacial o variabilidad temporal.

Precisión y exactitud

Precisión

Precisión y exactitud

Exactitud

Error sistemático Error aleatorio

Distribuciones de muestreo

Error sistemático

Error sistemático y aleatorio

Error aleatorio

Muestra representativa

Errores de muestreo

Error sistemático

Error aleatorio

Ajustando el

protocolo

Técnicas de

muestreo

Aspectos a considerar al seleccionar una muestra

representativa Delimitación el problema a resolver.

Selección y delimitación del universo y de la

variables a estudiar

Definición del tamaño de la muestra.

Selección del tipo de muestreo apropiado

Redacción de protocolo para la toma de

muestra.

¿Cuántas muestras necesito?

Tamaño de muestra

El tamaño de la muestra viene dado por:

Dispersión de la variable de interés (varianza)

Concentración del analito.

Magnitud del error tolerado.

Nivel de confianza requerido.

Costos.

Número de muestras.Caso 1: Aproximación Normal

Suponiendo que la variable de interés se distribuye normal, esto es:

),(~ 2NY

Se puede calcular el intervalo de confianza para la media

N

Zx

2/ (6)

Número de muestras. Caso 1: Aproximación Normal.

Si definimos el error máximo tolerable,

xE

2

2

E

ZN

(7)

(8)

Se puede estimar el número de muestras con un determinado nivel de confianza, a partir de (6) y (7)

Número de muestras. Caso 2: Distribución t.

Como generalmente no se conoce la varianza de la población, ésta se puede estima a partir de la descomposición de la varianza total,

222muestraanálisistotal

en poblaciones finitas

222muestraanálisistotal SSS

(9)

(10)

Número de muestras. Caso 2: Distribución t.

Por lo que empleamos la distribución t de Student para estimar el número de muestras

2

,2

E

StN muestra

(11)

Número de muestras.Caso 3: Distribución Poisson.

Si la distribución de la variable de interés es Poisson (por ejemplo, número de anotaciones por unidad de tiempo), el número de muestras puede estimarse mediante

xR

tN

2

2,2

Donde R es la desviación estándar relativa, expresada en porcentaje, asociada al error de estimación del valor real.

Número de muestras.Caso 4: Varianza mayor que la media.

Si la varianza es mayor que la media, se incorpora el índice de agrupamiento en el cálculo del número de muestras.

kxR

tN

112

2 Donde R es la desviación estándar relativa, expresada en porcentaje, y k es el índice de agrupamiento

Estrategia general para la selección de una muestra

Tipos de muestreo estadístico

Tipos de muestreo

Aleatorio

Simple

Sistemático

Estratificado

Conglomerado

Mixtos

Adaptativo

Muestreo aleatorio simple Se debe conocer a priori el marco muestral. Todas las muestras tienen la misma

probabilidad de ser escogidas:

Se emplea cuando se desea efectuar análisis multivariantes

Npi

1

Muestreo aleatorio simple

Se pude calcular el tamaño de muestras par poblaciones finitas a partir de la siguiente ecuación:

2

2

E

SZno

Nnn

no

o

1donde

Muestreo aleatorio simple

1. Se determina el tamaño de muestra n=5.

2. Se define el marco muestral, N=22.

3. Se seleccionan aleatoriamente 5 unidades: 1, 20, 11, 7 y 16.

4. Se evalúa la variable de interés en los jugadores seleccionados.

ID Jugador 1 Hernández, Daniel 2 Feltscher, Rolf 3 Túñez, Andrés 4 Vizcarrondo, Oswaldo 5 Amorebieta, Fernando 6 Mea Vitali, Miguel 7 Fedor, Nicolás 8 Rincón, Tomás 9 Feltscher, Frank 10 Álvarez, Julio 11 González, César 12 Romo, Rafael 13 Seijas, Luis Manuel 14 Quijada, Rubert 15 Flores, Francisco 16 Rosales, Roberto 17 Pérez Greco, Edgar 18 Arango Juan 19 Rondón, Mario 20 González, Alexander 21 Rouga, Andrés 22 Rondón, José Salomón

Estimadores de varianza del muestreo aleatorio simple

n

S

N

nS xx

22 1

La varianza en un muestreo aleatorio simple debe calcularse mediante la expresión

Muestreo aleatorio sistemático La probabilidad de selección de una unidad

es

No requiere de marco muestral. Permite estimar tamaños de muestras para

poblaciones finitas bajo muestreo sistemático repetido.

Su representatividad se ve comprometida cuando existen gradientes

N

npi

Muestreo aleatorio sistemático

1. Se determina el tamaño de muestra n=5.

2. calcula k = N/n=22/5 4

3. Se seleccionan aleatoriamente una unidad inicial: 3.

4. Las restantes unidades se determinan j = U. inicial+k(i) 3, 4,7, 11, 15 y 19 y se toman las muestras correspondientes

ID Jugador 1 Hernández, Daniel 2 Feltscher, Rolf 3 Túñez, Andrés 4 Vizcarrondo, Oswaldo 5 Amorebieta, Fernando 6 Mea Vitali, Miguel 7 Fedor, Nicolás 8 Rincón, Tomás 9 Feltscher, Frank 10 Álvarez, Julio 11 González, César 12 Romo, Rafael 13 Seijas, Luis Manuel 14 Quijada, Rubert 15 Flores, Francisco 16 Rosales, Roberto 17 Pérez Greco, Edgar 18 Arango Juan 19 Rondón, Mario 20 González, Alexander 21 Rouga, Andrés 22 Rondón, José Salomón

Estimadores de la varianza en un muestreo aleatorio sistemático

222 11iwy S

N

nkS

N

NS

La varianza en un muestreo aleatorio simpledebe calcularse, en el caso de muestreos repetidos, mediante

Muestreo estratificadoEstratos: segmentos uniformes internamente, heterogéneos entre si.

1. Se delimitan los estratos.

2. Se determina el número de muestras de muestra total y el número de muestra por estrato mediante:

• Asignación igual.

• Asignación proporcional.

• Asignación óptima.

Jugador Posicion

Dani Hernández Arquero

Alexander González Lateral der.

José Manuel Rey Central

Oswaldo Vizcarrondo Central

Juan Fuenmayor Lateral izq.

Alejandro Guerra Volantes

Giácomo Di Giorgi Volantes

Edgar Jiménez Volantes

Juan Arango Volantes

Nicolás Fedor Delantero

Daniel Arismendi Delantero

Muestreo por conglomerados

Conglomerados: heterogéneos internamente y homogéneos (equivalentes) entre sí.

Seleccionar

conglomerados.

Muestrear dentro de

conglomerados por

cualquier método

Se selecciona uno de dos equipos Equivalentes

Yaracuyanos FC o

Atlético el Vigía

Muestreo polietápico

Muestreo Polietápico Involucran varios pasos de muestreo. Selección de conglomerados, definición de

estratos y muestreo sistemático.

Muestreo Adaptativo (estadística espacial) Implica un muestreo inicial al azar simple, luego

se muestrea en áreas aledañas a las que presentan la condición de interés.

Bibliografia

Sharon, L. 2000. Muestreo: Diseño y análisis. Editorial International Thomsom. Madrid. España.