ESTADISTICA DESCRIPTIVA
Transcript of ESTADISTICA DESCRIPTIVA
ESTADISTICA DESCRIPTIVA
YESENIA MORALES
INSTRUCTOR: EDISON MORALES
ESTADISTICA DESCRIPTIVA
Se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos, esencialmente consiste en resumir éstos con uno o dos elementos de información (medidas descriptivas) que
caracterizan la totalidad de los mismos.
TIPOS DE VARIABLES ESTADISTICAS
• VARIABLES CUALITATIVAS:
se refieren a características o cualidades que no pueden ser medidas con números.
• VARIABLE CUANTITATIVA
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella
CLASIFICACION DE LAS VARIABLES ESTADISTICAS
VARIABLES CUALITATIVAS
VARIABLE ORDINAL: La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve,
moderado, grave.
VARIABLE NOMINAL:En esta variable los valores no pueden ser sometidos a un criterio de orden como por
ejemplo: los colores o el lugar de residencia.
INDIVIDUOSe llama
individuo a cada uno de los
elementos que componen la
población estadística. El
individuo es un ente observable que no tiene por
qué ser una persona, puede
ser un objeto, un ser vivo, o incluso
algo abstracto.
POBLACIÓNLlamamos población
estadística, universo o colectivo al conjunto de
referencia sobre el cual van a
recaer las observaciones.
MUESTRAsubconjunto de elementos de la
población. Se suelen tomar
muestras cuando es difícil o costosa la
observación de todos los
elementos de la población
estadística.
DISTRIBUCION DE FRECUENCIA
• Es como se denomina en estadística a la agrupación de datos en categorías
mutuamente excluyentes que indican el número de observaciones en cada
categoría. Esto significa una de las cosas más importantes de la matemática, su
estadística con la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que
se pueda ver el número existente en cada clase.
MEDIDAS DE TENDENCIA CENTRAL
LA MEDIA ARITMÉTICA
Es el valor obtenido por la suma de todos sus valores dividida entre el número de
sumandos. La media resume en un valor las características de una variable teniendo en cuenta todos los casos. Solamente puede
utilizarse con variables cuantitativas.
LA MEDIANA
es un valor de la variable que deja por debajo de sí a la mitad de los datos, una
vez que éstos están ordenados de menor a mayor.
Por ejemplo, la mediana del número de hijos de un conjunto de trece familias,
cuyos respectivos hijos son:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos:
1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
LA MODA
• Es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.
Su cálculo es extremadamente sencillo, pues sólo necesita un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-
6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
MEDIDAS DE DISPERSION
• Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una
distribución, indicando por medio de un número, si las diferentes puntuaciones de
una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor
será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos.
RANGO
Es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios.
Requisitos del rangoOrdenamos los números según su tamaño.
Restamos el valor mínimo del valor máximo.Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en
un rango de:Rango = (9-4) =5
VARIANZA
(también denominada variancia, aunque esta denominación es menos utilizada) es
una medida estadística que mide la dispersión de los valores respecto a un
valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media
aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.
DESVIACIÓN TÍPICA
Se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa
sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la
mayoría de los casos por S, dado que es su inicial de su nominación en inglés.
Desviación típica muestral
COEFICIENTE DE CORRELACIÓN DE PEARSON
• permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el producto de las
desviaciones típicas
•
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante
cualquiera de las dos expresiones siguientes:
HISTOGRAMAS ESTADISTICOS
• es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente
señalando las marcas de clase, es decir, la mitad del intervalo en el que están
agrupados los datos.
• En términos matemáticos, puede ser definida como una función inyectiva que
acumula las observaciones que pertenecen a cada sub-intervalo de una
partición. El histograma, como es tradicionalmente entendido, no es más que la representación gráfica de dicha
función.
• Diagramas de barras simples: Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la
frecuencia simple de la categoría que representa.
• Diagramas de barras compuesta: Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra
representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de
cada modalidad.
TIPOS DE HISTOGRAMAS
• Diagramas de barras agrupadas: Se usa para representar la información de
una tabla de doble entrada o sea a partir de dos variables, el cual es
representado mediante un conjunto de barras como se clasifican respecto a las
diferentes modalidades.
• Polígono de frecuencias: Es un gráfico de líneas que se usa para
presentar las frecuencias absolutas de los valores de una distribución en el
cual la altura del punto asociado a un valor de las variables es proporcional a
la frecuencia de dicho valor.
• Ojiva porcentual: Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de
cada valor en una distribución de frecuencias. En los gráficos las barras se
encuentran juntas y en la tabla los números poseen en el primer miembro un corchete y en el segundo un paréntesis,
por ejemplo: (10-20]
• Por medio de esto podemos recolectar e interpretar datos, ya sea para ayudar en la resolución de la toma de decisiones o para
explicar condiciones regulares o irregulares de algún fenómeno o estudio
aplicado
• Es muy importante para la toma de desiciones en empresas o nuestra vida
cotidiana.
• Es un lenguaje importante que permite comunicar información basada en datos
cuantitativos
CONCLUSIONES