Determinísticos DIVISIÓN GENERAL DE LA ESTADÍSTICA.

Post on 28-Jan-2016

240 views 0 download

Transcript of Determinísticos DIVISIÓN GENERAL DE LA ESTADÍSTICA.

DeterminísticosDIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICA

Tipos de

variables

Cuantitativas

Cualitativas

Tipos de

modelos

Son aquellas que se cuentan, pueden tomar valor enteros positivos.

Ejemplos: cantidad de estudiantes inscritos en la materia, cantidad de sillas en el curso, cantidad de focos que tiene el aula, etc.

Tipos de

modelos

Son aquellas que dentro de un intervalo de clase o rango pueden tomar valores infinitos, es decir se pueden medir y los valores pueden estar expresados en fracciones.

Ejemplos: peso de una persona, estatura de un alumno, ventas de una empresa, etc.

DeterminísticosAgrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría.

Ejemplo: AUTOVENTA "SANTA CRUZ"

Precio de venta de vehículos (Ex. en $us)

Cantidad de vehículos

desde 5.000 hasta 10.000 13desde 10.000 hasta 15.000 21desde 20.000 hasta 25.000 35desde 25.000 hasta 30.000 39desde 30.000 hasta 35.000 12desde 35.000 y más 5

TOTAL 125

Tipos de

modelos

DeterminísticosLas clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias están representadas por las alturas de las barras.Ejemplo:

DeterminísticosSimilar al histograma, consiste en unir con una línea los puntos medios de los techos de los rectángulos del histograma.Ejemplo:

Determinísticos

También denominada como «promedio», es la suma de todos los valores, dividido entre el número total de los mismos.

Su principal desventaja es de que está muy afectada por los valores extremos (muy grandes o muy pequeños).

DeterminísticosEs el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. 50% de las observaciones son mayores que la mediana y 50% son menores que ella.

< = Mediana =>

Precios de 5 vehículos ordenados

de menor a mayor

Precios de 5 vehículos ordenados

de mayor a menor$us. 10.000 $us. 32.000$us. 15.000 $us. 28.000$us. 25.000 $us. 25.000$us. 28.000 $us. 15.000$us. 32.000 $us. 10.000

DeterminísticosEs el valor de la observación que aparece con más frecuencia.

¿Cuál es el valor modal de los precios?Precios de 5

vehículos ordenados de menor a mayor

$us. 10.000$us. 15.000$us. 25.000$us. 28.000$us. 32.000

NO hay valor modal

DeterminísticosPosiciones relativas de la media, mediana y moda.

MediaMediana

Moda

Distribución simétrica (sesgo cero)

DeterminísticosPosiciones relativas de la media, mediana y moda.

Asimétrica a la derecha(sesgo positivo)

Moda Mediana Media

Ej: Salarios Mensuales

Asimétrica a la izquierda (sesgo negativo)

Media Mediana Moda

Ej: Notas de un examen

Porque cuando la dispersión es amplia, la medida de tendencia central no es representativa.

Una medida de dispersión se puede utilizar para evaluar la confiabilidad de dos o más promedios.

Ejemplo:Ud. puede invertir en 2 portafolios de acciones, el 1ero tiene una rentabilidad promedio de $us. 10.000 anuales y el 2do de $us. 11.000 anuales. Suponiendo que el monto de la inversión a realizar es el mismo ¿Qué decisión tomaría?

Pero ¿Qué decisión tomaría si el 1er portafolio tiene una desviación estándar histórica de $us. 50, mientras que la desviación del 2do portafolio es de $us. 4.000 ?

La media aritmética de las desviaciones cuadráticas con respecto a la media.

La raíz cuadrática positiva de la varianza.

NOTA: La variancia es difícil de interpretar porque las unidades están al cuadrado, mientras que la desviación estándar se presenta en las mismas unidades que los datos.

Datos con baja dispersión

Media

Datos con alta dispersión

Media

Aplicable solamente a distribuciones simétricas del tipo de campana.

68% = 1 .95% = 2.

99,7% = 3.

Es la ración (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje.

NOTA: Al multiplicar por 100, se convierte la expresión decimal a porcentaje.

Si los datos son ordenados de menor a mayor, o de mayor a menor, los cuartiles dividen las observaciones en cuatro partes iguales, por lo tanto existen 3 cuartiles.

Q 1 Q 3Q 2 = Mediana

25%

25% 25%

25%

Si los datos son ordenados de menor a mayor, o de mayor a menor, los deciles dividen las observaciones en diez partes iguales, por lo tanto existen 9 deciles.

D5 Mediana

D1 D7

10%

D2 D3 D4 D6 D8 D9

10%10% 10%

10%

10%

10%

10%

10%10%

Si los datos son ordenados de menor a mayor, o de mayor a menor, los centiles dividen las observaciones en cien partes iguales, por lo tanto existen 99 centiles.

La asimetría es útil porque indica si la mayor cantidad de datos se encuentran por encima o debajo de la media.

Cuando el coeficiente es igual a cero, la distribución es simétrica.

Cuando el coeficiente es mayor que cero, la distribución es positivamente asimétrica.

Nota: El coeficiente puede variar entre 0 y 3, a medida que más se acerca a 3, la asimetría es mayor.

Cuando el coeficiente es menor que cero, la distribución es negativamente asimétrica.

Nota: El coeficiente puede variar entre 0 y -3, a medida que más se acerca a -3, la asimetría es mayor.

Mide el grado de deformación vertical, es decir, en que medida una curva de frecuencia está deformada hacia arriba o hacia abajo en relación a una curva normal.

4 4

1

1( ) /

n

ii

X X sn

Cuando el coeficiente de curtosis es igual a tres, la distribución es mesocurtica o normal.

Curtosis = 3

Cuando el coeficiente de curtosis es mayor a tres, la distribución es leptocurtica y es más apuntada de la distribución normal.

Curtosis > 3

Cuando el coeficiente de curtosis es menor a tres, la distribución es platicurtica y es menos apuntada de la distribución normal.

Curtosis < 3

Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.

p = coeficiente de correlación de SpearmanD2 = Cuadrado de las diferencias entre X e YN = número de parejas

Ejemplos de grado de correlación:

Correlación = 0(X y Y no tienen relación lineal)

Y

X

.

..

.

...

.

.

.

.

.

.

..

.

..

.....

.

.

.

.

Número de hijos

Sa

lari

o

Correlación negativa (inversa) y débil

(X y Y tienen cierta relación lineal)

....

... .

.

.

.

.

.. ..

..

. .. ... .

..

Y

XPrecio

Ca

ntid

ad

ve

nd

ida

Correlación positiva (directa) y fuerte

(X y Y tienen una relación lineal intensa)

....

....

..

..

.

.

..

......

. ....

Y

XNotas escuela

No

tas

un

ive

rsid

ad

El siguiente cuadro resume la intensidad y la dirección del coeficiente de correlación:

1

Correlaciónnegativaperfecta

-1 0-0,5 0,5

SinCorrelación

Correlaciónpositivaperfecta

Correlaciónnegativa

(inversamente proporcional)

Correlaciónpositiva

(directamente proporcional)

Correlaciónnegativa

moderada Correlaciónnegativa

débil

Correlaciónnegativaintensa

Correlaciónpositiva

moderada Correlaciónpositivaintensa

Correlaciónnegativa

débil

DeterminísticosDIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICA

Valor que describe la posibilidad relativa de que ocurra un evento.

Una distribución de probabilidad muestra todos los resultados posibles de un experimento y la probabilidad de ocurrencia de cada resultado.

Cantidad de vehículos vendidos por día

Probabilidad P(x)

0 0,101 0,202 0,303 0,30

4 y más 0,10TOTAL 1,00

Seleccionar una distribución para un supuesto es uno de los pasos más desafiantes para realizar la simulación con Crystal Ball.

DistribuciónTipo de variable

Parámetros CondicionesAplicaciones y

Ejemplos

Continua - Media - Desviación estándar

- El valor de la media es el más probable. - Es simétrico con relación a la media. - Es más probable que los valores se encuentren cerca de la media.

Fenomenos naturales, alturas de las personas, inflación, cantidad de dias de un ítem en el inventarioetc.

Continua - Valor mínimo - Valor máximo - Valor más probable

- Los mínimos y los máximos están fijos. - La valor más probable se encuentra entre los valores mínimos y máximos, formando una distribución de forma triangular que muestra que los valores cercanos al mínimo y al máximo tienen menos probabilidad de ocurrir.

Es muy útil cuando los datos son limitados, pronostico en ventas y costos cuando se tienen 3 escenarios, etc.

DistribuciónTipo de variable

Parámetros CondicionesAplicaciones y

Ejemplos

Continua - Media - Desviación estándar - Ubicación

- El límite superior es ilimitado; el límite inferior es cero. - La distribución es sesgada positivamente, con la mayor parte de los valores cerca del límite inferior. - El logaritmo natural de la distribución es una distribución normal.

Las situaciones en lasque los valores sonsesgados positivamente,pero no pueden sernegativos, por Eje: Precios de acciones, inmuebles, escalas salariales, etc.

Continua - Valor mínimo - Valor máximo

- El mínimo está fijo. - El máximo está fijo. - Todos los valores en el rango tienen la misma probabilidad.

Cuando se conoce el rangoy todos los valoresposibles tienen lamisma probabilidad. Ej: Costos fijos de una empresa

DistribuciónTipo de variable

Parámetros CondicionesAplicaciones y

Ejemplos

Discreta - Valor mínimo - Valor máximo

- El mínimo está fijo. - El máximo está fijo. - Todos los valores en el rango tienen la misma probabilidad.

Cuando se conoce el rangoy todos los valoresposibles tienen lamisma probabilidad. Ej: La cantidad de camiones en un almacén.

Continua - Probabilidad - Iteraciones o experimentos

- Para cada ensayo, sólo 2 resultados son posibles; generalmente, el éxito o fracaso. - Los iteraciones son independientes. - La probabilidad es la mismade ensayo en ensayo. - La distribución Si-No es equivalente a la distribución Binomial.

Probabilidad de éxitoo fracaso (verdadero/falso).

DistribuciónTipo de variable

Parámetros CondicionesAplicaciones y

Ejemplos

Discreta - Probabilidad - Iteraciones o experimentos

- Para cada ensayo, sólo 2 resultados son posibles; generalmente, el éxito o fracaso. - Los iteraciones son independientes. - La probabilidad es la mismade ensayo en ensayo. - La distribución Binomial es equivalente a la distribución Sí-No.

Cantidad de carasen 10 tiradas de unamoneda a cara o cruz,probabilidad de éxitoo fracaso.

- La distribución muy flexible, utilizada para representar una situación que no pueda describir otro tipo de distribución. - Puede ser continua o discreta o una combinación de ambas. - Se utiliza para ingresar un conjunto entero de puntos de datos de un rango de celdas.

¿Qué distribuciones se pueden usar?• Usar Distribuciones basándose

en datos históricos o en principios físicos (Normal, Lognormal).

• Usar la Opinión de Expertos junto con la Distribución Triangular:

– Mínimo

– Máximo

– Más Probable

• Usar límites con la Distribución Uniforme:

– Límite inferior

– Límite superior

MIN MAX

M/L

MEAN

LOWERBOUND

UPPERBOUND

More Realistic,Less Conservative

Less Realistic,More Conservative

DISTRIBUCIÓN UNIFORME

• Todos los valores dentro del rango factible tienen la misma densidad de probabilidad.

• Parámetros : Uniform (min,max)• Aplicaciones: Se usa en la generación de los

valores de todas las demás distribuciones de probabilidad en el muestreo aleatorio.

• Es una aproximación muy cruda para usar como estimación de la incertidumbre percibida de un parámetro

EJEMPLO UNIFORME

• Una compañía de inversiones esta interesada en comprar un centro comercial de gran magnitud. Esta compañía piensa gastar al menos $ 500.000 pero no más de $ 900.000. El gerente piensa que cualquier monto que este dentro de este rango, tiene igual probabilidad de ocurrencia.

• Graficar la distribución de probabilidad para esta variable.

GRÁFICO UNIFORME

DISTRIBUCIÓN TRIANGULAR

• Aplicaciones: estimar subjetivamente la distribución de la variable aleatoria cuando todo lo que puede precisarse de la misma es el valor mínimo, el valor más probable y el valor máximo.

• Parámetros: Triang (min, +prob, max).

• Variando la posición más probable con relación a los extremos, la distribución puede ser simétrica o no.

EJEMPLO TRIANGULAR

• El propietario de una estación de gasolina que vendió por semana para abastecer su estación. Sus ventas pasadas indican que vendió un mínimo de 3.000 litros y un máximo de 7.000 litros por semana, pero en la mayoría de las semanas las ventas fueron de 5.000 litros.

• Graficar la distribución de probabilidad para esta variable.

GRÁFICO TRIANGULAR

• Se caracteriza por su forma acampanada.• Es simétrica y tiene la propiedad de que la

mediana, la moda, la media aritmética coinciden.• Aplicaciones: una variedad de situaciones, como

se desprende del Teorema Central del Límite.• Es útil en finanzas pues la suma o diferencia de

distribuciones Normales resulta también en una distribución Normal con parámetros que pueden ser determinados a partir del TCL.

DISTRIBUCION NORMAL

EJEMPLO NORMAL

• Un gerente de recursos humanos estima que la distribución de los salarios de todos los empleados están distribuidos normalmente con una media de $ 800 y una desviación estándar de 30 $.

• Graficar la distribución de probabilidad para esta variable.

GRÁFICO NORMAL

DISTRIBUCIONES TRUNCADAS

• Un vendedor de casas sabe que los precios de venta de los inmobiliarios tienen una distribución normal con media igual a $ 100.000 y desviación estándar de $ 15.000. Sin embargo, no existe posibilidad de vender una casa en menos de $ 80.000.

• Graficar la distribución de probabilidad para esta variable.

GRÁFICO DISTRIBUCIÓN TRUNCADA

DISTRIBUCIÓN PERSONALIZADA (CUSTOM)

• Es posible una distribución “personalizada” para representar una situación única que no puede ser modelada por ninguna de las distribuciones de probabilidad conocidas.

• Ejemplos: describir valores simples, rangos discretos, continuos.

EJEMPLO DISTRIBUCIÓN PERSONALIZADA (CUSTOM)• Una empresa desea describir el costo probable de

producir un nuevo producto. La compañía decide que el costo podría ser $5, $8 o $ 10.

Elección de una distribución que se ajuste a las entradas del modelo

• Cuando existe información empírica: Para muchos inputs de un modelo de simulación podría existir información empírica disponible, a través de registros históricos o recopiladas especialmente al efecto.

• Este enfoque tiene sus desventajas:– Por un lado, la información histórica podría no

representar adecuadamente la verdadera población debido a un error de muestreo.

– Adicionalmente el uso de información empírica impide el uso de valores fuera del rango original.