Estadistica descriptiva

32
ESTADISTICA DESCRIPTIVA

Transcript of Estadistica descriptiva

ESTADISTICA

DESCRIPTIVA

INTEGRANTESMartha Vianney Correa

Estefany Cileni Leal

INTRUCTOREdison Morales

GESTION LOGISTICA29220

ESTADISTICA DESCRIPTIVA

se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos, esencialmente consiste en resumir éstos con uno o dos elementos de información (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadística Descriptiva es el método de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por éstos.

Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una población o de una muestra, cuando en la etapa preliminar de la Inferencia Estadística se conocen los elementos de una muestra.

TIPOS DE VARIABLES

CUALITATIVAS Este tipo de variables representan

una cualidad o atributo que clasifica a cada caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se requiere de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etcétera).

CUANTITATIVAS Estas variables son caracterizadas por

alguna información numérica que se le puede asociar a los individuos de la una población. Esta caracterización puede ser clasificada en discreta y continua. son las que se describen por medio de números, se puede medir, como por ejemplo el peso, altura, edad, etc. Son aquellas que pueden ser medida, ejemplo: distancia, velocidad, entre otros.

CLASIFICACION DE LAS

VARIABLES

UNIDIMENSIONALES

Sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).es una función que asigna un valor numérico a cada suceso elemental del espacio muestral. Es decir, una variable aleatoria es una variable cuyo valor numérico está determinado por el resultado del experimento aleatorio. La variable aleatoria la notaremos con letras en mayúscula X, Y, ... y con las letras en minúscula x, y, ... sus valores.

La v.a. puede tomar un número numerable o no numerable de valores, dando lugar a dos tipos de v.a.: discretas y continuas.

BIDIMENSIONALES

Es estudio de dos variables estadísticas unidimensionales en una misma población.

PLURIDIMENSIONALES

Recogen la información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

VARIABLES DISCRETA

Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ej.: El número de hijos (1, 2, 3, 4, 5).

VARIABLES CONTINUAS

Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,..) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.

INDIVIDUO

Se llama unidad estadística o individuo a cada uno de los elementos que componen la población estadística. El individuo es un ente observable que no tiene por qué ser una persona, puede ser un objeto, un ser vivo, o incluso algo abstracto.

POBLACION Es un término definido desde la Demografía y señala la cantidad de personas que viven en un determinado lugar en un momento en particular. Si bien se trata de un concepto que se define en términos bastante sencillos, el estudio de la población es, sin duda, de gran aporte para múltiples disciplinas.Tener un adecuado conocimiento en torno a la población de determinado territorio tiene fuertes implicancias en las planificaciones y decisiones que se puedan tomar para dicho lugar en cuanto a política, economía, salud, educación, vivienda y conservación del medio ambiente, entre otras

MUESTRAEs un conjunto de medidas u observaciones tomadas a partir de una población dada. las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).

DISTRIBUCION DE FRECUENCIA

Es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.Es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencia

• Frecuencia absoluta: numero de veces que se repite

un valor dentro de un conjunto de datos (f) siempre son números enteros.

• La frecuencia relativa: equivale a la razón de la frecuencia

de cada clase sobre el total de los datos(h).

Es el cocientes obtenidos entre el valor de una determinada frecuencia absoluta y el total de observaciones, son fraccionarios o decimales.La suma de esta frecuencia debe ser igual a 1 o sea 100%

• FRECUENCIA ABSOLUTA ACUMULADA presenta un saldo acumulado de las frecuencias Se obtiene agregando o acumulando frecuencias absolutas.

• FRECUENCIA RELATIVA ACUMULADA: Se obtiene en forma análoga a la frecuencia absolutas acumuladas

Indica la proporción de datos que se encuentra por arriba o debajo de cierto valor o límite de clase

Medidas de tendencia central

• LAS MEDIDAS DE TENDENCIA CENTRAL:

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. (Ellas permiten analizar los datos en torno a un valor central). Entre éstas están la media aritmética, la moda y la mediana.Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total

MEDIA GEOMETRICA

Una distribución de frecuencias  (x, n). La media geométrica, que denotaremos por G. se define como la raíz N-ésima del producto de los N valores de la distribución.

MEDIA ARITMETICA

Es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.es el símbolo de la media aritmética.

X= X1 + X2 + X3 +…+Xn

N

MEDIANAEs el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

MODAEs el valor que tiene mayor frecuencia absoluta.Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

MEDIDAS DE DISPERSION

RANGO

Es el intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos.

Diferencia entre el valor de las observaciones mayor y el menor ej. 80 - 15 = 65 días

VARIANZA

Es una medida de su dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar, la raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas unidades.

DESVICION TIPICA

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.La desviación típica se representa por σ.

Es la raíz cuadrada de la varianza. S = √ 427,61 = 20.67

FORMULA

COEFICIENTE DE VARIACION PEARSON

Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

Medidas de Forma Comparan la forma que tiene la representación gráfica,

bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal.

COEFICIENTE DE ASIMETRÍA PEARSON

El coeficiente de asimetría de Pearson mide la desviación respecto de la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo de medidas. Las fórmulas son:

En una distribución simétrica, el valor del coeficiente de asimetría será siempre de cero, porque la media y la mediana son iguales entre sí en valor En una distribución asimétrica positiva, la media siempre es mayor que la mediana; en consecuencia, el valor del coeficiente es positivo.