EEstadistica General

53
FACULTAD DE CIENCIAS AGRÍCOLAS CARRERA DE AGRONOMÍA ESTADÍSTICA MAT- 214 Definiciones Medidas de tendencia central Medidas de dispersión Profesor : Marco

Transcript of EEstadistica General

Page 1: EEstadistica General

FACULTAD DE CIENCIAS AGRÍCOLAS

CARRERA DE AGRONOMÍA

ESTADÍSTICAMAT- 214

•Definiciones•Medidas de tendencia central•Medidas de dispersiónProfesor : Marco Koriyama V.

Page 2: EEstadistica General

¿QUÉ ES LA ESTADÍSTICA? Según Allen (1996), Chao (1996), Yule y Kendal ( 1986) y

Rivas González ( 1993) la estadística es una ciencia (un conjunto de métodos) que se encarga de la: - Recolección - Clasificación - Presentación - Organización - Análisis - Interpretación De un conjunto de fenómenos, (naturales, económicos,

políticos o sociales) de manera metódica y numérica, que permitan extraer conclusiones de un hecho, en un momento determinado y así poder tomar decisiones valederas.

Page 3: EEstadistica General

De acuerdo a Reyes (1990), la estadística es el arte y la ciencia de de recoger datos o reunir observaciones cuantificables (medibles o numéricas) y clasificables

TODO LO CONCERNIENTE A LA RECOLECCIÓN DE DATOS

Diseños Experimentales

TODO LO CONCERNIENTE A LA ORGANIZACIÓN, TABULACIÓN E INTERPRETACIÓN DE DATOS

Métodos Estadísticos

Page 4: EEstadistica General

División de la Estadística

Estadística

Descriptiva

Inferencial

Page 5: EEstadistica General

Estadística Descriptiva• Describe, analiza y representa un grupo de datos

utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

• Se puede definirse como aquel método que contiene la recolección, organización, presentación y resumen de una serie de datos.

• El mencionado resumen puede ser tabular, gráfico o numérico.

Page 6: EEstadistica General

Describir

0

10

20

30

40

50

60

70

80

90

1er trim. 2do trim. 3er trim.

EsteOeste

Hombres

Si

No

Page 7: EEstadistica General

Estadística Inferencial Es aquella rama de la estadística que apoyándose en

el cálculo de probabilidades y a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Puede definirse como aquella rama de la estadística que hace posible la estimación de una característica de una población o la toma de una decisión referente a una población, fundamentándose sólo en los resultados de la muestra.

Page 8: EEstadistica General

Inferencial

Muestra Población

Page 9: EEstadistica General
Page 10: EEstadistica General

VARIABLE•La variable es una magnitud que puede tener un valor cualquiera de los comprendidos en un conjunto de valores de un estudio o investigación.

•Son todos aquellos datos u observaciones que pueden ser expresados mediante números, es decir, son características de una población determinada, susceptible de medició, las mismas pueden adoptar distintos valores o ser expresadas en varias categorías.

Page 11: EEstadistica General

VARIBLES CUALITATIVAS O CATEGÓRICASSon aquellas variables cuyos valores son del tipo categórico, es decir; que indican categorías o son etiquetadas numéricamente o con nombres. Son las que se refieren a clasificaciones, como: estado civil, profesión, color de los ojos, preferencia por una marca etc., es decir, son aquellas que no aparecen en forma numérica, sino como categorías o atributos. Esta a su vez, se clasifica en:

CategóricasNominales: . A este

tipo de variable le corresponde las

escalas de medición nominal

Categóricas Ordinales: Presentan

un orden, corresponden las

escalas de medición ordinal.

Page 12: EEstadistica General

Escala Nominal

Hombres - mujeres precoces - tardíasSusceptibles - resistentes docentes - estudiantes

Entre los datos no existe una relación de orden, no se pueden aplicar operaciones aritméticas como suma, multiplicación, etc.

Se pueden establecer frecuencias y proporciones, así como calcular la moda y relaciones de equivalencia.

Las pruebas estadísticas admisibles son las no paramétricas, como la X2 , prueba basada en la Binomial y el coeficiente de contingencia.

Page 13: EEstadistica General

Variable Aleatoria o probabilística: Es aquel valor que asume la variable que han sido antecedidas por una selección aleatoria de los objetos medidos o son resultados de algún proceso al azar, es decir, es la variable que toma diferentes valores como resultado de un experimento aleatorio

Page 14: EEstadistica General

Variable Independiente:Es aquella que se presenta como causa y condición de la variable dependiente. Es la manipulada por el investigador; recibe el nombre de variable experimental.

Variable Dependiente: Es aquella que se presenta como consecuencia de una variable antecedente, que por lo general es la variable independiente.

Page 15: EEstadistica General

Identificar en las siguientes variables cuales son independientes y dependientes

Rendimiento vs Número de vainas/planta

Ingresos vs Egresos

Germinación vs Tiempo de almacenamiento

Vigor vs Días a cosecha

Peso vs Altura

Vigor vs Germinación

D I

I

I

ID

D

D

Page 16: EEstadistica General

Los Parámetros.- Son cualquiera característica que se pueda medir y cuya medición se lleve a cabo sobre todos los elementos que integran una población determinada, los mismos suelen con letras griegas. El valor de un parámetro poblacional es un valor fijo en un momento dado. Ejemplo: La media Aritmética = (miu), La desviación Típica = , (Sigma) etcétera.

Page 17: EEstadistica General

 Los Estadígrafos (Estadísticos o Estimadores).- Son aquellas características medibles, cuya medición se realiza sobre los componentes de una muestra, los mismos se representan con letras del alfabeto castellano. Los estadígrafos no tienen un valor único, sino que pueden tomar distintos valores al ser calculados a partir de muestras diferentes. Ejemplos: Media aritmética = Desviación típica = S.

X

Page 18: EEstadistica General

MEDIDAS DE TENDENCIA CENTRAL

Media aritméticaMedianaModa

Page 19: EEstadistica General

MEDIA ARITMÉTICALa media aritmética o simplemente la media, es el parámetro de posición de más importancia en las aplicaciones estadísticas. Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. Por lo tanto, la medida posicional más utilizada en los estudios estadísticos viene a ser la media.

La media aritmética de una serie de N valores de una variable X1, X2, X3; X4,.........Xn, es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre el número total de ellos. La formula se puede expresar así: .

.

N

XX

n

ii

1

X

Page 20: EEstadistica General

 CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS

Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:

En donde N es el número total de datos y son los valores de la variable.

Ejemplo:– Calcule la media aritmética de los siguientes valores:

Por lo tanto la media es 9.

N

XX

i

iX

14.,.11.,9,.8,.7,.5iX

.96

546

14119875

NX

X i

Page 21: EEstadistica General

LA MEDIANALa mediana (Md) es una medida de posición que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parámetro que esta en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribución en una forma tal que a cada lado de la misma queda un número igual de datos.

iX50% 50%

Page 22: EEstadistica General

Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la posición que esta ocupa en esa serie de datos; para ello hay que determinar si la serie de datos es par o impar

Ejemplo: Datos impares n=7

X1=43; X2=51; X3=37; X4=39; X5=19; X6=24; X7=27

Ordenados en forma creciente:

X1=19; X2=24; X3=27; X4=37; X5=39; X6=43; X7=5

La Mediana es Md=3737

Page 23: EEstadistica General

Ejemplo: Datos pares n= 8

X1=43; X2=51; X3=37; X4=39; X5=19; X6=24; X7=27; X8=62

Ordenados en forma creciente:

X1=19; X2=24; X3=27; X4=37; X5=39; X6=43; X7=5; X8=62

La mediana es el promedio de las dos observacionescentrales, es decir :

La Mediana es Md= 38

382

3937

Mdp

Page 24: EEstadistica General

LA MODA La moda es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las medias de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observación de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.

Page 25: EEstadistica General

;.7;.6;.5;.4,.3 54321 xxxxx

6;.5;.5;.4,.2 54321 xxxxx

5;.4;.3;.3;.2,.2 654321 xxxxxx

La moda Mo, puede no existir para un conjunto de datos o si existe puede no ser única. Por lo tanto puede ser unimodal, bimodal y multimodal.Ejemplos:

a) Mo=5

b) Es amodal

c) Mo=2 y 3; es bimodal

Page 26: EEstadistica General

MEDIDAS DE DISPERSIÓN

• Rango• Varianza• Desviaación estandar• Coeficiente de variación

Page 27: EEstadistica General

MEDIDAS DE DISPERSIÓN  

Las medidas de posición central son los valores que de una manera condensada representan una serie de datos, pero realmente no son suficientes para caracterizar una distribución de frecuencia. Para describir una distribución de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las medidas de posición central. Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promedio de una distribución de frecuencia.

Page 28: EEstadistica General

Bosque A

Bosque B

Page 29: EEstadistica General

Bosque A

Bosque B

Altura en metros

8 4 9 6 3

7 6 8 5 4

65

30X

65

30X

Page 30: EEstadistica General

Clasificación de las medidas de dispersión

La variabilidad es la esencia de la estadística, puesto que las variables y atributos se caracterizan siempre por diferencias de valores entre observaciones individuales; por esto es importante determinar el grado de variación o dispersión de los datos de una serie de valores con respecto al promedio. Las medidas de dispersión se clasifican en dos grandes grupos:

Medidas de dispersión absolutas

Medidas de dispersión relativas

Page 31: EEstadistica General

Las medidas de Dispersión Relativas, vienen expresadas en las mismas medidas que se identifican la serie de datos, las mismas son:

a) Recorridob)Varianzac) Desviación estaándar 

Las Medidas de Dispersión absolutas Son relaciones entre medidas de dispersión absolutas y medidas de tendencia central multiplicadas por 100, por lo tanto vienen expresadas en porcentaje, su función es la de encontrar entre varias distribuciones la dispersión existente entre ellas.la de mayor importancia es el: Coeficiente de variación

Page 32: EEstadistica General

Bosque B

Rango (R) = Dato mayor (XM)Dato Menor (Xm) + Una unidad de medida (1UM):

Bosque A

9 m

8 m

3m

4m

R=9-3=6m

R=8-4=4m

Page 33: EEstadistica General

VarianzaLa varianza es la media aritmética de la desviacion cuadrática respecto de la media aritmética de la distribución y se la denota por:

muestralesdatosparan

XXS i .....,.

1)(

.2

2

lespoblacionadatosparaN

X i ....,)(

.2

2

Page 34: EEstadistica General

6X

8 4

9

6

3

26....

93

0...........93..

42

42..

)(

2

2

2

2

2XX i

0....

363066369

264268)( XX i

2,5526. 2 m2

22 )(.

NX

Page 35: EEstadistica General

DESVIACIÓN TÍPICA O ESTÁNDAR Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas. Se le designa con la letra castellana S cuando se trabaja con una muestra y con la letra griega minúscula (Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace referencia a la población él número de datos se expresa con N y cuando se refiere a la muestra él número de datos se expresa con n. La desviación típica se define como: “La raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos de las observaciones con respecto a su media aritmética . La típica es una forma refinada

de la desviación media”.

Page 36: EEstadistica General

Desviación Estandar

MuestrtalDesviación Estandar

poblacional

1.)(

.2

n

XXs

NXX 2.)(

.

Page 37: EEstadistica General

6X

8 4

9

6

3

26....

93

0...........93..

42

42..

)(

2

2

2

2

2XX i

0....

363066369

264268)( XX i

NXX 2.)(

. m..28,2

526.

Bosque A

Page 38: EEstadistica General

6X

8 4

9

6

3

26....

93

0...........93..

42

42..

)(

2

2

2

2

2XX i

0....

363066369

264268)( XX i

28.2526. mS ..54,2

426

Bosque B

Page 39: EEstadistica General

Bosque A

Bosque B

Altura en metros

8 4 9 6 3

7 6 8 5 4

65

30X

65

30X

65

30X

m..28,2526

m..41,15

10

Page 40: EEstadistica General

Bosque A

Bosque B

65

30X

65

30X

m..28,2526

m..41,15

10

+ 2,28 = 8,28

- 2,28 = 3,72

+ 1,41 = 7,41

- 1,41 = 4,59

Page 41: EEstadistica General

INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA

 La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación

directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.

Page 42: EEstadistica General
Page 43: EEstadistica General
Page 44: EEstadistica General

95,45%

99,73%

34,14% 34,14%13,59%

13,59% 2,14%2,14%Media

68,27%

Page 45: EEstadistica General

DISPERSIÓN RELATIVA O COEFICIENTE DE VARIACIÓN

 Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas muestras, será necesario expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes.

Page 46: EEstadistica General

Bosque A

Bosque B

Page 47: EEstadistica General

Las medidas de dispersión relativas permiten comparar grupos de series distintas en cuanto a su variación, independientemente de las unidades en que se midan las diferentes características en consideración. Generalmente las medidas de dispersión relativas se expresan en porcentajes, facilitando así el estudio con medidas procedentes de otras series de valores La dispersión relativa viene a ser igual a la dispersión absoluta dividida entre el promedio.

Page 48: EEstadistica General

 Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de variación de Pearson, este es un índice de variabilidad sin dimensiones, lo

que permite la comparación entre diferentes distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variación de Pearson se designa con las letras CV. La formula matemática es:

.100xX

CV

Page 49: EEstadistica General

XProducto S Unidades

Bosque 1 8 2,5 m

Bosque 2 8 3,5 m.

Bosque 3 10 3,5 m

Indicar cual de los bosques presenta una mayor variación, o cual es más heterogeneo.

Page 50: EEstadistica General

XProducto S Unidades CV

Bosque 1 8 2,5 m 31,25%

Bosque 2 8 3,5 m 43,75 %

Bosque 3 10 3,5 m 35,00 %

Indicar cual de los bosques presenta mayor variación o es más heterogeneo.

Page 51: EEstadistica General

XProducto S Unidades

Rend. 1 25 12 qq/ha

Rend. 2 40 15 qq/ha

Rend. 3 17 9 qq/ha

Se presenta datos del rendimiento en frejol de las parcelas de tres propiedades. Cuál de ellas tienen una producción más heterogenea entre sus parcelas?

Page 52: EEstadistica General

XProducto S Unidades CV

Bosque 1 25 12 m 31,25%

Bosque 2 40 15 m 43,75 %

Bosque 3 17 19 m 35,00 %

Page 53: EEstadistica General