03 Parámetros de una Población
-
Upload
jcarreto -
Category
Technology
-
view
45.127 -
download
0
Transcript of 03 Parámetros de una Población
Parámetros de una Población
Ing. Julio Carreto
Parámetros de una Población
Medidas de Tendencia Central
Ing. Julio Carreto 3
Parámetros de una Población
Una característica importante de cualquier población es su posición, es decir, donde está situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg.
Ing. Julio Carreto 4
Parámetros de una Población
Una manera de obtener un dato numérico que nos dé idea de la posición de nuestra población es calcular el Promedio o Media de todas las observaciones:
N
XX i
Ing. Julio Carreto 5
Parámetros de una Población
Este importante parámetro nos permite efectuar comparaciones entre distintas poblaciones.
Ing. Julio Carreto 6
Parámetros de una Población
Por ejemplo, si tuviéramos una población formada por mediciones del peso de mujeres de 30 años, otra de peso de varones de 40 años y una tercera de peso de niños de 8 años, es indudable que los promedios van a ser diferentes.
Ing. Julio Carreto 7
Parámetros de una Población
El promedio, entonces, nos está diciendo que las tres poblaciones son diferentes y también en que medida difieren.
Ing. Julio Carreto 8
Parámetros de una Población
Ahora, si tuviéramos una población de varones con peso promedio 70 Kg. y otra población de varones con el mismo promedio ¿Se puede afirmar que ambas poblaciones son equivalentes?
Ing. Julio Carreto 9
Parámetros de una Población
Para responder esta pregunta necesitamos tener medidas de la dispersión de la población de datos.
Ing. Julio Carreto 10
Parámetros de una Población
Medidas de Dispersión
Ing. Julio Carreto 11
Parámetros de una Población
Otra característica muy importante de una población es el grado de dispersión de las observaciones. No es lo mismo si en nuestra población encontramos que todos los valores están entre 75 y 90 Kg. que si están entre 60 y 105 Kg., aunque el promedio sea el mismo.
Ing. Julio Carreto 12
Parámetros de una Población
Si llegara a la tierra un marciano y le dijéramos que el peso promedio de los seres humanos adultos es de 70 Kg, puede llegar a creer que existen hombres de 350 Kg, o de 5 Kg
Ing. Julio Carreto 13
Parámetros de una Población
Es necesario agregar alguna idea de la dispersión de los valores.
Una manera es a través del Rango de las observaciones, es decir, el valor Máximo y el valor Mínimo de los datos de la población.
Ing. Julio Carreto 14
Parámetros de una Población
Entonces, una descripción mas realista acerca de los seres humanos sería decir que pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos).
Ing. Julio Carreto 15
Parámetros de una Población
Una manera mas precisa de dar idea de la dispersión de valores de una población es a través de la Varianza o su raíz cuadrada, que es la Desviación Standard.
Ing. Julio Carreto 16
Parámetros de una Población
Vamos a calcular la varianza y la desviación standard de un número pequeño de datos (Una muestra) para ilustrar el cálculo.
Ing. Julio Carreto 17
Parámetros de una Población
Supongamos que se midió la altura de 10 personas adultas y de sexo femenino, y se obtuvieron los valores siguientes: Altura
Ing. Julio Carreto 18
Parámetros de una Población
165 cm.163 cm. 171 cm. 156 cm. 162 cm. 159 cm. 162 cm. 168 cm.159 cm. 167 cm.
Ing. Julio Carreto 19
Parámetros de una Población
El promedio de estas observaciones es:
.2,163 cmX
Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos:
Ing. Julio Carreto 20
Parámetros de una Población
165 1,8 163 -0,2 171 7,8
156 -7,2
162 -1,2 159 -4,2 162 -1,2 168 4,8 159 -4,2 167 3,8
iX XX i
Ing. Julio Carreto 21
Parámetros de una Población
Los residuos también nos dan una idea de la dispersión de las observaciones individuales alrededor del promedio. Si el valor absoluto (El valor numérico sin el signo) de los residuos es grande, es porque los valores están muy dispersos.
Ing. Julio Carreto 22
Parámetros de una Población
Si el valor absoluto de los residuos es pequeño, significa que las observaciones individuales están muy cerca del promedio, y por lo tanto, hay poca dispersión.
Ing. Julio Carreto 23
Parámetros de una Población
Pero nosotros necesitamos un sólo número que nos provea información acerca de la dispersión de los valores.
Ing. Julio Carreto 24
Parámetros de una Población
Si sumamos los residuos, como algunos son positivos y otros negativos, se cancelarían entre sí, con lo cual perdemos la información acerca de la dispersión. Entonces, los elevamos al cuadrado:
Ing. Julio Carreto 25
Parámetros de una Población
165 1,8 3,24163 -0,2 0,04171 7,8 60,84156 -7,2 51,84162 -1,2 1,44159 -4,2 17,64162 -1,2 1,44168 4,8 23,04159 -4,2 17,64167 3,8 14,44
XX i iX 2XX i
Ing. Julio Carreto 26
Parámetros de una Población
Si ahora sumamos los residuos elevados al cuadrado, tenemos un número donde se condensa toda la información de la dispersión de la población:
CuadradosdeSuma
2260,191 cmXX i
Ing. Julio Carreto 27
Parámetros de una Población
Este número, la suma de cuadrados, es dependiente del número de datos N, y por lo tanto no nos sirve para comparar poblaciones con distinto número de observaciones.
Ing. Julio Carreto 28
Parámetros de una Población
Pero si dividimos la suma de cuadrados por N, tenemos un número que es independiente del número de observaciones, que se denomina Varianza:
Ing. Julio Carreto 29
Parámetros de una Población
NCuadradosdeSuma
Varianza
N
XX i
2
Ing. Julio Carreto 30
Parámetros de una Población
En nuestro caso:
216,1910
60,191cmVarianza
Ing. Julio Carreto 31
Parámetros de una Población
Las fórmulas anteriores son las que se aplican al cálculo de la varianza y desviación standard de una población de datos. Mas adelante veremos que las fórmulas a aplicar en el caso de una muestra son ligeramente diferentes.
Ing. Julio Carreto 32
Parámetros de una Población
La varianza es un número que nos permite comparar poblaciones. Cuando la dispersión de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el promedio) será grande.
Ing. Julio Carreto 33
Parámetros de una Población
Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza. También se utiliza la raíz cuadrada de la varianza:
VarianzaStandardDesviacion
N
XX i
2
Ing. Julio Carreto 34
Parámetros de una Población
Por lo tanto:
216,19 cmStandardDesviacion
cm38,4
Ing. Julio Carreto 35
Parámetros de una Población
La desviación standard o desviación típica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centímetro. Tanto la varianza como la desviación standard nos permiten comparar el grado de dispersión de distintas poblaciones.
Ing. Julio Carreto 36
Parámetros de una Población
Media y Varianza de una Muestra
Ing. Julio Carreto 37
Parámetros de una Población
Hasta ahora hemos visto como se calcula la media o promedio de una población y también como se calcula la varianza y la desviación standard de una población o universo de observaciones.
Ing. Julio Carreto 38
Parámetros de una Población
Cuando tenemos una muestra (Subconjunto de algunos datos extraídos de una población), también podemos calcular su media, su varianza y su desviación standard.
Ing. Julio Carreto 39
Parámetros de una Población
Es muy importante distinguir entre la media, varianza y desviación standard poblacional, de la media, varianza y desviación standard muestral.
Ing. Julio Carreto 40
Parámetros de una Población
La media, varianza y desviación standard de una población o universo se denominan parámetros de la población y en general se designan con letras griegas: para la Media, 2 para la Varianza y para la Desviación Standard poblacionales.
Ing. Julio Carreto 41
Parámetros de una Población
En el caso de una muestra, la media, varianza y desviación standard se denominan estadísticos y se utilizan letras de nuestro alfabeto:
para la Media
s2 para la Varianza
y s para la Desviación Standard muestrales.
X
Ing. Julio Carreto 42
Parámetros de una Población
El cálculo de la varianza y la desviación standard de una muestra de n observaciones se realiza con una fórmula levemente diferente que la ya vista para la varianza y desviación standard de una población:
Ing. Julio Carreto 43
Parámetros de una Población
1
2
n
XXVarianza i
VarianzaStandardDesviacion
1
2
n
XX i
Ing. Julio Carreto 44
Parámetros de una Población
En lugar de dividir por n, el número total de observaciones en la muestra, dividimos por n - 1. Este valor, n - 1, son los Grados de Libertad de la muestra. En general, cuando tenemos una muestra de n observaciones, se dice que la misma tiene n - 1 grados de libertad.
Ing. Julio Carreto 45
Parámetros de una Población
La media, varianza y desviación standard de una muestra, en general, no van a coincidir con los mismos parámetros de la población de la cual se extrajo la muestra (Aunque usemos la misma fórmula para calcular la varianza muestral y poblacional).
Ing. Julio Carreto 46
Parámetros de una Población
Si extraemos n muestras de una población, vamos a obtener n promedios muestrales distintos del promedio de la población y n varianzas muestrales distintas de la varianza de la población.
Ing. Julio Carreto 47
Parámetros de una Población
Esto se debe a que una población o universo tienen un número muy grande de datos, mientras que una muestra son sólo algunos pocos datos extraídos de ese universo.
Ing. Julio Carreto 48
Parámetros de una Población
Cuando sacamos una segunda, tercera, ... etc. muestras, los datos extraídos no tienen por que ser los mismos que en la primer muestra.
Ing. Julio Carreto 49
Parámetros de una Población
Por lo tanto, el promedio y la varianza de las muestras van a ser distintos para las distintas muestras, y distintos de la media y la varianza de la población de la cual se extrajeron las muestras.
Ing. Julio Carreto 50
Parámetros de una Población
Muestreo Aleatorio
Ing. Julio Carreto 51
Parámetros de una Población
En general, no es posible disponer de todas las observaciones de un universo o población, ya sea porque es un universo hipotético o porque el relevamiento de todos los datos resulta una tarea excesiva para nuestras posibilidades.
Ing. Julio Carreto 52
Parámetros de una Población
Normalmente se dispone de una muestra de datos extraídos de un universo, y lo que se pretende es estimar (Conocer de manera aproximada) los parámetros del universo por medio de cálculos realizados sobre la muestra.
Ing. Julio Carreto 53
Parámetros de una Población
En este sentido decimos que la media muestral es una estimación de la media del universo, y que la varianza y desviación standard muestrales son estimaciones de la varianza y desviación standard poblacionales respectivamente.
Ing. Julio Carreto 54
Parámetros de una Población
Veamos algunos ejemplos. Supongamos que un partido político necesita averiguar la cantidad de personas que están dispuestas a votar por su candidato. Entonces, encarga a una empresa la realización de una encuesta el día previo a las elecciones.
Ing. Julio Carreto 55
Parámetros de una Población
El encargado de la encuesta podría pensar en consultar la intención de voto de toda la población de votantes (Mas de 18 millones en la Argentina). Esto, obviamente, es una tarea excesiva que por distintas razones no se puede realizar.
Ing. Julio Carreto 56
Parámetros de una Población
Entonces, el camino que resta es tomar una muestra representativa de esa población de personas y consultar la intención de voto en esa muestra.
Ing. Julio Carreto 57
Parámetros de una Población
Los resultados que se obtengan son solamente una estimación del resultado que se hubiera obtenido si la consulta se hubiera efectuado sobre toda la población de votantes.
Ing. Julio Carreto 58
Parámetros de una Población
Ahora bien ¿Cómo se obtiene una muestra representativa? Para tratar de entenderlo, vamos a trabajar con una población de muy pocos datos. Supongamos que nuestra población son 10 círculos con los siguientes números:
Ing. Julio Carreto 59
Parámetros de una Población
22
2
2
2
9
5
5 2
9
Ing. Julio Carreto 60
Parámetros de una Población
22 222 95 52 9
si ordenamos las círculos de menor a mayor:
Ing. Julio Carreto 61
Parámetros de una Población
inmediatamente comprobamos que nuestra población consta de 6 dos, 2 cincos y 2 nueves:
Ing. Julio Carreto 62
Parámetros de una Población
Dato Frecuencia
2 6
5 2
9 2
Ing. Julio Carreto 63
Parámetros de una Población
El promedio de la población es 4. Supongamos que queremos obtener una muestra de 5 elementos de esa población. Hay varias maneras de hacerlo.
Ing. Julio Carreto 64
Parámetros de una Población
Supongamos que puedo ver los números y elijo 2, 2, 2, 2 y 5 porque me gustan esos números. El promedio de estos 5 números extraídos de la población es 2,6 que difiere sustancialmente del promedio de la población.
Ing. Julio Carreto 65
Parámetros de una Población
2
2
2
2
2
95
52
9 2
22
25
4Promedio
6,2Promedio
Ing. Julio Carreto 66
Parámetros de una Población
Es evidente que dicha muestra no es representativa de la población de la que fue extraída. No se mantiene la misma proporción de cada número que existe en la población.
Ing. Julio Carreto 67
Parámetros de una Población
Una muestra de 5 elementos en la que hay la misma proporción de cada dígito debería tener 3 dos, 1 cinco y 1 nueve, y su promedio es 4, el mismo de la población.
Ing. Julio Carreto 68
Parámetros de una Población
2
2
2
2
2
95
52
9
22
25
4Pr omedio
4Pr omedio
9
Ing. Julio Carreto 69
Parámetros de una Población
En una población de muchos datos, no es posible obtener una muestra eligiendo cada elemento para que figure en la misma proporción que en la población, porque para ello deberíamos disponer de todos los datos de la misma, y en ese caso no sería necesario sacar una muestra.
Ing. Julio Carreto 70
Parámetros de una Población
Si a cada elemento de la población se le da la misma oportunidad de ser elegido, entonces se supone que cada número estará en la muestra en un número proporcional a la cantidad de veces que está en la población.
Ing. Julio Carreto 71
Parámetros de una Población
Por ejemplo, el 2 va a estar en la muestra mas veces que el 5, porque en la población hay 6 dos y sólo 2 cincos. Si metemos las diez círculos en una bolsa y las mezclamos suficientemente, la probabilidad que tiene una bolilla individual de ser extraída es la misma para cualquiera de las círculos.
Ing. Julio Carreto 72
Parámetros de una Población
En esas condiciones, si sacamos cinco círculos sucesivas, mezclándolas previamente en cada oportunidad, es razonable pensar que vamos a extraer el 2 en mas oportunidades que el 5 ó el 9.
Ing. Julio Carreto 73
Parámetros de una Población
Esta forma de obtener la muestra es lo que se conoce como Muestreo Aleatorio.
Ing. Julio Carreto 74
Parámetros de una Población
El muestreo aleatorio no garantiza que la muestra va a ser representativa de la población, pero al eliminar toda influencia externa en el acto de extraer un elemento de la población, la proporción de cada uno estará influída sólo por la cantidad de veces que está presente en la población de la cual se extrae la muestra.
Ing. Julio Carreto 75
Parámetros de una Población
253733262
253733262
Población o Universo de Mediciones
Muestra Representativa
Extracción Aleatoria
Extracción Aleatoria
Ing. Julio Carreto 76
Parámetros de una Población
Entonces, realizando el muestreo en forma aleatoria (al azar), la probabilidad de obtener una muestra representativa de la población es mayor que si en la elección de los elementos de la muestra interviene la voluntad del que efectúa la operación o algún otro factor de influencia.
Ing. Julio Carreto 77
Fin de la
sección