ESTADISTICA y Probabilidad

59
¿QUE ES LA ESTADISTICA MODERNA? Hace cien años H. G. Wells comentó que “el pensamiento estadístico algún día será tan necesario para la ciudadanía eficiente como la capacidad de leer y escribir”. Cada día estamos expuestos a una amplia variedad de información numérica relativa a fenómenos como la actividad del mercado de valores, los hallazgos de estudios de mercados, los resultados de encuestas de opinión, las tasas de desempleo, los pronósticos de éxito futuro de industrias específicas y datos deportivos. El tema de la estadística moderna abarca la recolección, presentación y caracterización de información para ayudar tanto en el análisis de datos como en el proceso de la toma de decisiones. En términos de áreas funcionales de negocios, la estadística puede aplicarse en: Contabilidad Para seleccionar muestras con propósitos de auditoría. Para comprender los derroteros de costos en contabilidad de costos. Finanzas Para estar al tanto de medidas financieras en el transcurso del tiempo. Para desarrollar formas de pronosticar valores de estas medidas en momentos futuros. Administración Para describir características de empleados dentro de una organización. Para mejorar la calidad de los productos fabricados o de los servicios procurados por la organización. Mercadeo Para estimar la proporción de clientes que prefieren un producto en vez de otro y la razón de esto. Para sacar conclusiones respecto a la estrategia de publicidad que sería más útil para el incremento de las ventas de un producto. ESTADISTICA DESCRIPTIVA:

description

estadistica y probabilidad

Transcript of ESTADISTICA y Probabilidad

Page 1: ESTADISTICA y Probabilidad

¿QUE ES LA ESTADISTICA MODERNA?

Hace cien años H. G. Wells comentó que “el pensamiento estadístico algún día será tan necesario para la ciudadanía eficiente como la capacidad de leer y escribir”. Cada día estamos expuestos a una amplia variedad de información numérica relativa a fenómenos como la actividad del mercado de valores, los hallazgos de estudios de mercados, los resultados de encuestas de opinión, las tasas de desempleo, los pronósticos de éxito futuro de industrias específicas y datos deportivos.

El tema de la estadística moderna abarca la recolección, presentación y caracterización de información para ayudar tanto en el análisis de datos como en el proceso de la toma de decisiones.

En términos de áreas funcionales de negocios, la estadística puede aplicarse en:

ContabilidadPara seleccionar muestras con propósitos de auditoría.Para comprender los derroteros de costos en contabilidad de costos.

FinanzasPara estar al tanto de medidas financieras en el transcurso del tiempo.Para desarrollar formas de pronosticar valores de estas medidas en momentos futuros.

AdministraciónPara describir características de empleados dentro de una organización.Para mejorar la calidad de los productos fabricados o de los servicios procurados por la organización.

MercadeoPara estimar la proporción de clientes que prefieren un producto en vez de otro y la razón de esto.Para sacar conclusiones respecto a la estrategia de publicidad que sería más útil para el incremento de las ventas de un producto.

ESTADISTICA DESCRIPTIVA:

Históricamente el crecimiento y desarrollo de la estadística moderna puede trazarse desde dos fenómenos separados: la necesidad del gobierno de recabar datos sobre sus ciudadanos y el desarrollo en las matemáticas, de la teoría de las probabilidades.

A lo largo de la historia registrada se han recabado datos. Durante las civilizaciones egipcia, griega y romana, los datos se obtenían principalmente con propósitos de impuestos y reclutamiento militar. En la Edad Media, las instituciones eclesiásticas a menudo mantenían registros de nacimiento, muertes y matrimonios. En América, durante la época colonial, se mantuvieron diversos registros, y comenzando en 1790, la Constitución de diverso países establece la realización de censos de población y viviendas cada 10 años.

Estas y otras necesidades de datos a nivel nacional estuvieron estrechamente vinculadas al desarrollo de la estadística descriptiva.

Page 2: ESTADISTICA y Probabilidad

¿Qué es la estadística descriptiva?

La estadística descriptiva puede definirse como aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto de datos.

EXPLORACION DE LOS DATOS:

Con el fin de introducir las ideas importantes de este capítulo, analicemos el siguiente caso:“Un investigador de una compañía de servicios de asesoría colegial desea estudiar las colegiaturas cobradas a residentes fuera del distrito por colegios y universidades de diferentes regiones del país. En particular se seleccionan tres provincias para su inmediata evaluación. Supongan, con propósitos exploratorios, que nuestro analista investigador debe empezar seleccionando una muestra aleatoria de seis escuelas del listado de poblaciones de 90 colegios y universidades del país.

Población (o universo) es la totalidad de elementos o cosas bajo consideraciónMuestra es la porción de la población que se selecciona para su análisis.

Escuelas del país Colegiaturas (M$)

Escuela No. 1 10.3Escuela No. 2 4.9Escuela No. 3 8.9Escuela No. 4 11.7Escuela No.5 6.3Escuela No. 6 7.7

Observen que las seis escuelas (registradas en el orden en que fueron seleccionadas) fueron presentadas en la tabla anterior. ¿Qué puede aprenderse de estos datos que ayude a nuestro analista investigador en su evaluación?

1. Los datos están expresados en una forma sin procesar, es decir, estos datos recolectados parecen estar en un orden aleatorio sin un patrón aparente respecto a la manera en que se enumeran las observaciones individuales.

2. Cada una de las colegiaturas ocurre sólo una vez, es decir, ninguna de ellas se observa con más frecuencia que cualquier otra.

3. La extensión de las colegiaturas varía entre 4.9 y 11.7 miles de pesos.4. No parece haber ninguna colegiatura inusual o extraordinaria en esta muestra.

PROPIEDADES DE LOS DATOS NUMERICOS:

Veamos ahora cómo podemos aumentar nuestra comprensión de lo que los datos nos dicen al examinar de manera más formal tres propiedades de los datos numéricos.

Las tres mejores propiedades de una serie numérica de datos son:1. Tendencia central.2. Variación.3. Forma.

2

Page 3: ESTADISTICA y Probabilidad

En cualquier análisis y/o interpretación puede usarse una variedad de mediciones descriptivas que representan las propiedades de tendencia central, variación y forma para extraer y resumir las principales características de la serie de datos. Si estas mediciones de descriptivas de resumen se calculan a partir de una muestra de datos, se denominan estadísticas; si se calculan a partir de una población completa de datos, se denominan parámetros.

MEDICIONES DE LA TENDENCIA CENTRAL:

La mayor parte de las series de datos muestran una clara tendencia a agruparse alrededor de un cierto punto central. Así pues, dada cualquier serie de datos particular, por lo general es posible seleccionar algún valor o promedio típico para describir toda la serie de datos. Este valor descriptivo típico es una medición de tendencia central o de ubicación.

Cinco tipos de promedios a menudo usados como mediciones de tendencia central son:

La media aritmética. La media ponderada. La media geométrica. La mediana. La moda.

LA MEDIA ARITMETICA:

La media aritmética (también llamada la media) es el promedio o medición de tendencia central de uso más común.

Se calcula sumando todas las observaciones de una serie de datos y luego dividiendo el total entre el número de elementos involucrados.

Para una muestra que contiene una serie de n observaciones X1, X2, … , Xn, la media aritmética (se representa por el símbolo X y se lee “X barra”) puede escribirse como:

X1 + X2 + … + Xn

X = n

Para simplificar la notación y por comodidad se usa convencionalmente el término:

n

Xi i=1

(que significa la sumatoria de todos los valores XI) siempre que deseemos sumar una serie de observaciones. Es decir n XI = X1 + X2 + … + Xn

i=1 Por lo tanto: n

Xi

i=1

X = (1) nEn la ecuación (1):X es la media aritmética de la muestra.n es el tamaño de la muestra.

3

Page 4: ESTADISTICA y Probabilidad

Xi es la iésima observación de la variable aleatoria. n

XI es la sumatoria de todos los valores Xi de la muestra. i=1

Es importante señalar que cuando se trabaja con la muestra de una población, se calcula la media aritmética de la muestra (X). En cambio, cuando se trabaja con todos los datos de una serie, es decir, con la población, entonces se calcula la media aritmética de la población (). Por tanto:

n

Xi i=1

= (2) N

Donde:N es el número de elementos de la población. es la media aritmética de la población.

Cálculo de la media aritmética a partir de datos no agrupados.

Para la muestra del ejemplo de nuestro analista investigador, las colegiaturas cobradas a residentes fuera del distrito (en miles de pesos) son:X1 = 10.3 en la Escuela No. 1.X2 = 4.9 en la Escuela No. 2.X3 = 8.9 en la Escuela No.3.X4 = 11.7 en la Escuela No. 4.X5 = 6.3 en la Escuela No. 5.X6 = 7.7 en la Escuela No.6.

La media aritmética para esta muestra se calcula como:

n

Xi i=1 10.3 + 4.9 + 8.9 + 11.7 + 6.3 + 7.7X = = = 8.3 miles de pesos. N 6

Aquí observamos que la media se calcula como 8.3 miles de pesos aún cuando ninguna escuela en particular de la muestra tenía realmente esa colegiatura. Además, si se construye una escala de puntos para esta serie de datos, observarán que tres observaciones son menores que la media y tres son mayores. La media actúa como punto de equilibrio de tal forma que las observaciones menores compensan aquellas que son mayores.

Puesto que su cálculo se basa en cada observación, la media aritmética se ve afectada en gran medida por cualquier valor extremo. En estos casos, la media aritmética presenta una representación distorsionada de lo que los datos están transmitiendo; así pues, la media no sería el mejor promedio a usarse para describir o resumir esta serie de datos.

Noten que para calcular esta media, se han sumado los valores de la muestra por separado, sin ningún orden especial. A esto los estadísticos le llaman datos no agrupados.

4

Page 5: ESTADISTICA y Probabilidad

Cálculo de la media aritmética a partir de datos agrupados.

En el ejemplo anterior los cálculos no fueron difíciles puesto que el tamaño de la muestra fue pequeño. Pero supongan ahora que están trabajando con el peso de 5,000 cabezas de ganado y prefieren no sumar por separado las observaciones de datos. O supongan que sólo tienen acceso a la distribución de frecuencia de los datos, no a cada observación individual. En tales casos, necesitarán otro método para calcular la media aritmética.La siguiente tabla responde a una distribución de frecuencia sobre el promedio de los saldos mensuales de las cuentas de cheques de 600 clientes en una sucursal.

CLASE (EN DOLARES) FRECUENCIA

0 - 49.99 7850.00 - 99.99 123

100.00 - 149.99 187150.00 - 199.99 82200.00 - 249.99 51250.00 - 299.99 47300.00 - 349.99 13350.00 - 399.99 9400.00 - 449.99 6450.00 -499.00 4

TOTAL 600

Con la información contenida en esta tabla se puede calcular fácilmente una estimación del valor de la media aritmética de los datos agrupados. Se trata de una estimación porque no se utilizan las 600 observaciones de datos de la muestra.

Pasos para encontrar la media aritmética de los datos agrupados:

1. Se calcula el punto medio de cada clase (marca de clase).2. Redondear las marcas de clase a centenas enteras.3. Multiplicar cada marca de clase por la frecuencia de observaciones en la clase.4. Sumar los resultados obtenidos en la operación anterior.5. Dividir el total hallado entre el número total de observaciones de la muestra.

La ecuación que se utiliza para el cálculo de la media aritmética de datos agrupados es la siguiente:

n

fi Xi i=1

X = (3) NEn esta ecuación:X es la media muestral. es el símbolo que significa "la suma de".f es la frecuencia (número de observaciones) en cada clase.Xi representa la marca de clase de cada clase de la muestra.n es el número de observaciones de la muestra.

Utilizando una tabla como la que se ofrece a continuación, es muy fácil de realizar el cálculo de la media aritmética para los datos agrupados.

5

Page 6: ESTADISTICA y Probabilidad

Cálculo de la media muestral aritmética con datos agrupados.

CLASE (EN DOLARES)(1)

MARCAS DE CLASE (X)(2)

FRECUENCIA(f) (3)

f X(3) (2)

0 - 49.99 25.00 78 = 1,95050.00 - 99.99 75.00 123 = 9,225

100.00 - 149.99 125.00 187 = 23,375150.00 - 199.99 175.00 82 = 14,350200.00 - 249.99 225.00 51 = 11,475250.00 - 299.99 275.00 47 = 12,925300.00 - 349.99 325.00 13 = 4,225350.00 - 399.99 375.00 9 = 3,375400.00 - 449.99 425.00 6 = 2,550450.00 -499.00 475.00 4 = 1,900

600 85,350 n

fi Xi

i=1 85,350 X = = = 142.25 n 600

El valor de 142.25 (en dólares) corresponde a la media muestral.

Ventajas de la media aritmética:

La media aritmética, en cuanto a número individual que representa un conjunto entero, ofrece grandes ventajas:

1. La media es un concepto conocido por casi todas las personas y es intuitivamente claro.2. Todo conjunto de datos posee una media. Es una media calculable, y es especial porque todo

el conjunto de datos tiene una y sólo una media.3. La media es utilizada para realizar procedimientos estadísticos como la comparación de las

medias a partir de varios conjuntos de datos.

Desventajas de la media aritmética:

Por ser una medida estadística, la media aritmética tiene desventajas que es preciso conocer:

1. Aunque es confiable porque refleja todos los valores en el conjunto de datos, puede ser afectada por los valores extremos que no sean representativos del resto de ellos.

2. Un segundo problema de la media es el encontrado en el ejemplo de los 600 saldos de las cuentas de cheques: es tediosa de obtener debido a que se utilizan todas las observaciones de datos al hacerlo (a menos que se aplique el método rápido consistente en emplear datos agrupados para aproximar la media).

3. La tercera desventaja consiste en que no es posible calcular la media para un conjunto de datos que tengan clases abiertas en el extremo superior o inferior de la escala (200 en adelante, por ejemplo).

Necesidad de utilizar los promedios prudentemente.

6

Page 7: ESTADISTICA y Probabilidad

Una de las anécdotas más antiguas sobre el empleo incorrecto de los promedios es el de un reclutador cuya misión consistía en seleccionar pilotos para la Fuerza Aérea. Debía asegurarse de que el piloto promedio midiera 1.82 m de altura.

Se cuenta que salió en busca de reclutas y que encontró a dos bastante extraños: uno medía apenas 1.21 m y el otro 2.43 m. Desde luego que ninguno de los dos cumplía con los requisitos, pues el más pequeño no alcanzaba a ver por encima del tablero de instrumentos en la cabina; el más alto, ni siquiera cabía en ésta. Pero pese a todo lo anterior, tenían un promedio de altura de 1.82 m.

Se ha de ser sensible ante este tipo de casos cada vez que se use una medida de tendencia central para describir los datos.

LA MEDIA (PROMEDIO) PONDERADA

La media ponderada permite obtener un promedio que tiene en cuenta la importancia de cada valor para el total global.

Analicen el siguiente ejemplo, el caso de una compañía que utiliza tres grados de mano de obra (no calificada, semicalificada y calificada) para fabricar dos productos finales. La compañía quiere conocer el costo promedio de la mano de obra por hora de cada uno de los productos.

Horas de trabajo en el proceso de fabricación.

Horas de trabajo por unidad por unidad de producción

Grado de trabajo Sueldo por hora (x) Producto 1 Producto 2No calificado $4.00 1 4Semicalificado $6.00 2 3Calificado $8.00 5 3

$18.00 8 10

Sería incorrecto calcular el promedio aritmético de las tarifas de mano de obra (4 + 6 + 8)/3 = 6 para posteriormente calcular el costo de la mano de obra de los productos 1 y 2 como:Producto 1: $6(1 + 2 + 5) = $48Producto 2: $6(4 + 3 + 3) = $60Para que las respuestas sean correctas, han de tener en cuenta el hecho de que se recurre a diferentes cantidades de cada grado.Producto 1: ($4 1) + ($6 2) + ($8 5) = 56, y como hay ocho horas de mano de obra, el costo promedio de ella por hora será $56/8 = $7.00 por hora. De igual forma:Producto 2: ($4 4) + ($6 3) + ($8 3) = $58 y el costo promedio de mano de obra por hora será $58/10 = $5.80 por hora.

Cálculo de la media ponderada

En forma simbólica, la ecuación que se utiliza para calcular la media (promedio ponderado) es:

(w x) Xw = (4) w

donde:Xw es la media o promedio ponderado.

7

Page 8: ESTADISTICA y Probabilidad

W es el peso asignado a cada observación.(w x) es la suma del peso de cada elemento multiplicado por ese elemento.w es la suma de todos los pesos.

Si aplican la ecuación (4) al producto 1 en el ejemplo del costo de la mano de obra, obtendrán:

(w x) (1/8 $4) + (2/8 $6) + (5/8 $8) $7Xw= = = = w 1/8 + 2/8 + 5/8 1

= $7.00 /hora.

Adviertan que la ecuación (4) establece de modo más formal algo que ya se había realizado antes. Al calcular la media aritmética de los datos agrupados, en realidad se obtuvo la media ponderada utilizando las marcas de clase para los valores de x y las frecuencias de cada clase como los pesos. Este producto se divide entre la suma de todas las frecuencias, que fue lo mismo que dividirla entre la suma de todos los pesos.

LA MEDIA GEOMETRICA

Cuando se trabaja con cantidades que cambian a lo largo de un período, se necesita conocer una tasa promedio de cambio, como el crecimiento promedio a través de un período de varios años. En tales casos, la media aritmética no es apropiada, porque no proporciona las respuestas correctas. En estos casos se necesita encontrar la media geométrica, a veces abreviada simplemente como M.G.

Consideren, por ejemplo, el crecimiento de una cuenta de ahorros. Supóngase que se depositan $100 inicialmente y se deja que el interés se acumule a diferentes tasas por cinco años. El crecimiento se resume en la siguiente tabla, en la cual el rótulo "factor de crecimiento" es igual a:

100 + tasa de interés

100

Año Tasa de interésFactor de crecimiento Ahorros al final del año

1 7% 1.07 $107.002 8 1.08 115.563 10 1.10 127.124 12 1.12 142.375 18 1.18 168.00

El factor de crecimiento es la cantidad por la cual se multiplican los ahorros al inicio del año para obtener los ahorros al final del año.

Este simple factor de crecimiento de la media aritmética será (1.07 + 1.08 + 1.10 + 1.12 + 1.18) / 5 = 1.11, que corresponde a una tasa promedio de interés de 11% al año. Si el banco otorga intereses a una tasa constante de 11% anuales, un depósito de $100 crecerá en cinco años en :

$100 1.11 1.11 1.11 1.11 1.11 = $168.51

Sin embargo, en la tabla anterior se muestra que la cifra real es $168.00. Así pues, el factor de crecimiento será ligeramente menor que 1.11.

8

Page 9: ESTADISTICA y Probabilidad

Cálculo de la media geométrica

Para encontrar el factor correcto del crecimiento promedio, se multiplican los factores de crecimiento correspondientes a los cinco años y, después se le calcula la raíz quinta al producto.

El resultado que se obtiene es la tasa de crecimiento de la media geométrica, la cual es el promedio que se debe utilizar en el ejemplo.

La ecuación que se utiliza para calcular la media geométrica de una serie de datos es:

n

M.G. = Producto de todos los valores de x (5)

Si se aplica la ecuación anterior al ejemplo de la cuenta de ahorros, se podrá determinar que 1.1093 es el factor correcto de crecimiento promedio.

5 5

M.G. = 1.07 1.08 1.10 1.12 1.18 = 1.679965 = 1.1093

Factor de crecimiento

Nótese que la tasa correcta de interés promedio de 10.93% al año, obtenida mediante la media geométrica, se acerca mucho a la tasa promedio incorrecta del 11% calculada con la media aritmética. Ello se debe a que las tasas de interés son relativamente pequeñas, pero no sucumban ante la tentación de recurrir a la media aritmética en vez de a la media geométrica, ya que un incremento considerable de las tasas, los conducirá a resultados muy distantes numéricamente. Un ejemplo de ello se aprecia en las economías muy inflacionarias, en las cuales los bancos se ven obligados a pagar altas tasas de interés para poder captar ahorros.

LA MEDIANA

La mediana es una medida de tendencia central diferente de las medias que se han analizado y estudiado hasta ahora. La mediana es un solo valor del conjunto de datos que mide el elemento central de los datos. Ese elemento es el más central en la serie de datos. La mitad de los elementos se encuentran por encima de ese punto y la otra mitad cae por debajo de él.

Cálculo de la mediana a partir de datos no agrupados.

Para calcular la mediana de un conjunto de datos recolectados, es necesario seguir el siguiente procedimiento: Organizar los datos recolectados en un arreglo por orden ascendente o descendente. Se calcula el punto de posicionamiento utilizando la ecuación:

n + 1 (6)

2

9

Page 10: ESTADISTICA y Probabilidad

Para determinar el lugar del arreglo ordenado que corresponde al valor de la mediana, se sigue una de las dos siguientes reglas:

Regla 1: Si el tamaño de la muestra es un número impar, la mediana se representa mediante el valor numérico correspondiente al punto de posicionamiento, es decir, la mediana será el valor central de la serie de datos ya ordenados.Regla 2: Si el tamaño de la muestra es un número par, entonces la mediana se calculará como el promedio de los valores numéricos centrales.

Para calcular la mediana de una serie de datos con un número impar de elementos, analicen el siguiente ejemplo:

En la tabla que aparece a continuación se dan los tiempos de los miembros del equipo de pista en la carrera de la milla. Si se quisiera determinar la mediana de dicha serie de datos, se tendría:

Miembro 1 2 3 4 5 6 7Tiempo en minutos 4.2 4.3 4.7 4.8 5.0 5.1 9.0

Si se aplica la ecuación para determinar el punto de posicionamiento se tendrá que: (7 + 1) / 2 = 4 to

elemento en el arreglo. Por tanto, para el ejemplo de los corredores del equipo de pista en la carrera de la milla, el tiempo correspondiente a la mediana es 4.8 minutos.

Adviértase que, a diferencia de la media aritmética, la mediana no se deforma por la presencia de valores extremos (último valor). Este valor pudo haber sido 15.0 e incluso 50.0 minutos, y la mediana hubiera sido igual.

Para calcular la mediana de una serie de datos con un número par de elementos, analicen los datos que aparecen en la siguiente tabla:

Pacientes atendidos en la sala de urgencias durante 8 días consecutivos.

Elemento en el arreglo de datos 1 2 3 4 5 6 7 8Número de pacientes 86 52 49 43 35 31 30 11

mediana

Si se determina el punto de posicionamiento (8 + 1) / 2 = 4.5. Dado que la mediana es el 4.5 -ésimo elemento del arreglo, es necesario promediar los elementos cuarto y quinto: (43 + 35) /2 = 39, o sea, 39 es la mediana de los datos de pacientes atendidos en la sala de urgencias por día durante un período de 8 días.

Cálculo de la mediana a partir de datos agrupados.

A menudo se tiene acceso a los datos después de haberlos agrupado en una distribución de frecuencia.

Por ejemplo, no se conocen todas las observaciones que fueron necesarias para construir la tabla de los datos sobre 600 clientes del banco a quienes nos referimos anteriormente. Por el contrario, se tienen diez intervalos de clase y un registro de la frecuencia con que la observación aparece en cada intervalo.

CLASE (EN DOLARES) FRECUENCIA

10

Page 11: ESTADISTICA y Probabilidad

0 - 49.99 7850.00 - 99.99 123

100.00 - 149.99 187 mediana de clase150.00 - 199.99 82200.00 - 249.99 51250.00 - 299.99 47300.00 - 349.99 13350.00 - 399.99 9400.00 - 449.99 6450.00 -499.00 4

TOTAL 600

Para abreviar este procedimiento, los estadísticos aplican una ecuación que les permite determinar la mediana de los datos agrupados. En el caso de una muestra, dicha ecuación será:

(n + 1) 2 - (F + 1)

m = w + Lm (8) fm

donde:m es la mediana de la muestra.n es el número total de elementos de la distribución.F es la suma de todas las frecuencias de clase hasta la mediana de clase, pero sin incluirla.fm es la frecuencia de la mediana de clase.W es la amplitud de intervalo de las clases.Lm es el límite inferior del intervalo de mediana de clase.Si se aplica la ecuación (8) para calcular la mediana de la muestra de saldos de las cuentas de cheques, entonces :

n = 600; F = 201; fm = 187; w = $50 y Lm = $100

(600 + 1) / 2 - (201 +1) 300.5 - 202m = $50 + $100 = $50 + $100

187 187

m = (0.527)($50) +$100

m = $126.35

Ventajas de la mediana.

La mediana ofrece varias ventajas sobre la media. Entre ellas podemos considerar las siguientes:

1. La más importante, demostrada en el ejemplo de los tiempos del equipo de pista en la carrera de la milla, consiste en que los valores extremos no la afectan tan profundamente como a la media.

2. La mediana es fácil de entender y puede ser calculada con cualquier clase de datos (aún a partir de datos agrupados con clases abiertas, a menos que la mediana caiga dentro de una clase abierta.

3. Se puede obtener la mediana aún cuando los datos sean descripciones cualitativas, como el olor o la nitidez, en vez de números.

11

Page 12: ESTADISTICA y Probabilidad

Desventajas de la mediana.

La mediana tiene también desventajas. Entre las mismas se pueden citar las siguientes:

1. Ciertos procedimientos estadísticos que se sirven de ella son más complejos que los que utilizan la media.

2. Como la mediana es un promedio de posición, los datos deben organizarse antes de realizar los cálculos.

3. Para cualquier conjunto de datos que tenga un vasto número de elementos, el cálculo de la mediana será un proceso lento.

LA MODA

La moda es una medida de tendencia central que difiere de la media, pero que se parece un poco a ella porque realmente no se calcula por medio de los procesos ordinarios de la aritmética.

La moda es el valor que en una serie de datos aparece con mayor frecuencia.

Cálculo de la moda a partir de datos no agrupados.

La moda de una serie cualquiera de datos no agrupados tiene un uso limitado.

Como en cualquier otro aspecto de la vida, el azar interviene de manera importante en la ordenación de los datos. Algunas veces hace que un elemento no representativo se repita bastante a menudo y sea el valor más frecuente en la serie de datos. Por tal razón, rara vez se utiliza la moda como una medida de tendencia central de datos no agrupados.

Ejemplo de lo anterior, lo constituyen los datos de la tabla que aparece a continuación y que corresponden al número de viajes de reparto que diariamente realizó una planta de concreto.

Viajes de reparto por día en un período de 20 días.

Viajes dispuestos por orden ascendente0 2 5 7 150 2 5 7 151 4 6 8 151 4 6 12 19

Para los valores de la tabla anterior, el valor modal es 15 por ocurrir con más frecuencia que los demás (tres veces). Una moda de 15 implica que la actividad de la planta es mayor de 6.7 (esta cifra corresponde a la respuesta que obtendrían si calcularan la media).

La moda para el caso antes señalado indica que 15 es el número más frecuente de viajes, pero no permite conocer que la mayor parte de los valores son menores que 10.

Cálculo de la clase modal a partir de datos agrupados.

A continuación aparecen los datos de la tabla precedente agrupados en una distribución de frecuencia.

12

Page 13: ESTADISTICA y Probabilidad

Distribución de frecuencia de los viajes de reparto.

Clase en el número de viajes 0 - 3 4 - 7 8 - 11 12 y más

Frecuencia 6 8

clase modal

1 5

Si seleccionan la clase con el mayor número de observaciones, a la cual se le llama clase modal, podrán seleccionar ""4 - 7" viajes. Esta clase es más representativa de la actividad de la planta que la moda de 15 viajes por día. Por tal razón, siempre que se utilice la moda como medida de tendencia central de una serie de datos, habrán de calcularla a partir de los datos agrupados.

La moda en distribuciones simétricas y asimétricas (sesgadas).

Cuando la distribución de frecuencias es simétrica y sólo existe una moda, las tres medidas de tendencia central (la moda, la mediana y la media) coinciden con el punto más alto de la gráfica.

Cuando la distribución de frecuencias está sesgada a la derecha, la moda está todavía en el punto más alto de la gráfica, pero la mediana está a la derecha de ese punto y la media cae a la derecha de la mediana.

Cuando la distribución es asimétrica a la izquierda, la moda se encuentra en el punto más alto de la gráfica, la mediana se sitúa a la izquierda de la moda y también la media se sitúa a la izquierda de la mediana. Cualquiera que sea la forma de la curva, la moda siempre está situada en el punto más alto.

13

Page 14: ESTADISTICA y Probabilidad

Cálculo de la moda a partir de datos agrupados.

Cuando los datos ya están agrupados en una distribución de frecuencia, se debe suponer que la moda se encuentra en la clase que tenga más elementos, es decir, que posea la frecuencia más elevada. ¿Pero cómo se puede determinar un solo valor de la moda con esta clase modal? Se dispone de dos métodos para ello. El primero, permite estimar la moda en una gráfica. El segundo método se sirve de una ecuación.

Para demostrar estas dos formas de calcular la moda de datos agrupados, se pueden usar los datos correspondientes al ejemplo de los saldos de las cuentas de cheques. Primero, se puede construir un histograma con dichos datos como se aprecia en la gráfica anterior. Después, por ser la clase modal el rectángulo más alto, se encuentra la moda:

14

Page 15: ESTADISTICA y Probabilidad

Trazando una línea del ángulo superior derecho del rectángulo más alto al ángulo superior derecho del rectángulo situado inmediatamente a su izquierda.

Trazando una segunda línea del ángulo superior izquierdo del rectángulo más alto al ángulo superior izquierdo del rectángulo situado inmediatamente a su derecha.

Trazando una línea perpendicular al eje horizontal por el punto donde se cruzan las líneas dibujadas en los pasos anteriores.

Un segundo método de calcular la moda cuando se cuenta con datos agrupados consiste en aplicar la ecuación (9):

d1

Mo = LMo + w (9) d1 + d2

donde:

LMo es el límite inferior de la clase modal.d1 es la frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente debajo de ella.d2 es la frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente encima de ella.W es la amplitud del intervalo de la clase modal.

Si mediante la ecuación (9) calculan la moda de los saldos de las cuentas de cheques, entonces:

LMo = $100; d1 = 187 - 123 = 64; d2 = 187 - 82 = 105 y w = $50.

64Mo = $100 + $50 = $100 + (0.38)($50) = $100 + $19 = $119

64 + 105 ModaDistribuciones bimodales.

¿Qué sucede cuando se tienen dos valores diferentes de manera que cada uno aparece mayor número de veces que todos los valores en el conjunto de los datos?

La siguiente tabla muestra los errores de facturación durante un período de 20 días en la oficina de un hospital. Adviertan que tanto 1 como 4 aparecen el mayor número de veces dentro del conjunto de datos. Cada uno lo hace tres veces. De ahí que esa distribución tenga dos modas y reciba el nombre de distribución bimodal.

Errores de facturación por día en un período de 20 días.

Errores dispuestos por orden ascendente

0 2 6 90 4 6 9

1 4 Moda 7 10 1 Moda 4 8 12

1 5 8 12

La distribución de la siguiente figura también se llama bimodal, aún cuando los dos puntos más altos no sean iguales. Por supuesto, esos puntos sobresalen por encima de los valores contiguos debido a la frecuencia con que se observan.

15

Page 16: ESTADISTICA y Probabilidad

Ventajas de la moda.

1. La moda, a semejanza de la mediana, puede usarse como una localización central para datos cualitativos y también cuantitativos.

2. Como a la mediana, a la moda tampoco le afectan demasiado los valores extremos. Aún cuando los valores superiores sean muy altos y los valores inferiores sean muy bajos, se decide que el valor más frecuente del conjunto de datos sea el valor modal.

3. La moda puede utilizarse sin importar la magnitud o la dispersión de los valores en el conjunto de datos.

4. Una cuarta ventaja de la moda consiste en que puede emplearse cuando una o más clases son abiertas.

Desventajas de la moda.

A pesar de las ventajas que fueron señaladas anteriormente, la moda se utiliza menos para medir la tendencia central que la media y la mediana, ya que:

1. Algunas veces no existe un valor modal porque el conjunto de datos no contiene valores que ocurran más de una vez. Otras veces, todos los valores son la moda ya que ocurren el mismo número de veces.

2. Cuando los conjuntos de datos contienen dos, tres o muchas modas, son difíciles de interpretar y comparar.

MEDIDAS DE DISPERSION.

Una segunda propiedad importante que describe una serie de datos numéricos es la variación.

La variación es la cantidad de dispersión o propagación en los datos.

Dos conjuntos de datos pueden tener la misma localización central y, no obstante, ser muy distintos si uno se encuentra más disperso que el otro. En la siguiente gráfica, la media de las tres curvas es la misma, pero la curva A tiene mayor dispersión que (o variabilidad) que la curva B, y ésta a su vez presenta menor variabilidad que la curva C. Si se mide sólo la media de estas tres distribuciones, no se podría captar una importante diferencia que existe entre las tres curvas. Como en cualquier serie de datos, la media, la mediana y la moda indican sólo parte de lo que se necesita conocer en torno a las características de los datos. Para mejorar el conocimiento del patrón de datos, es preciso que se mida además su dispersión, o sea, su variabilidad.

16

Page 17: ESTADISTICA y Probabilidad

Cinco mediciones de variación son el rango, el rango intercuartil, la varianza, la desviación estándar y el coeficiente de variación.¿Por qué la dispersión de la distribución es una característica tan importante de entender y de medir?

Primero, suministra información complementaria que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos están ampliamente dispersos, como en la curva C de la gráfica anterior, la localización central será menos representativa de los datos en su conjunto de lo que sería en el caso de datos que se acumulen más alrededor de la media, como sucede en la curva A.

Segundo, puesto que se trata de problemas típicos de datos sumamente dispersos, se requiere la capacidad de reconocer que los datos están muy dispersos pues de lo contrario no se podrían abordar dichos problemas.Tercero, tal vez sea necesario comparar las dispersiones de varias muestras. Si no conviene tener una amplia dispersión de valores respecto al centro o si esa dispersión entraña un riesgo inaceptable, entonces se debe ser capaz de reconocerlo y no escoger las distribuciones que presentan la máxima dispersión.

Aplicaciones financieras.

A los analistas financieros les interesa la dispersión de las ganancias de una empresa. Las utilidades con una fuerte dispersión, o sea las que incluyen desde niveles extremadamente altos hasta los muy bajos e incluso negativos, indican un riesgo mayor para los accionistas y acreedores que las utilidades que permanecen relativamente estables.

Uso del control de la calidad.

De manera análoga, los expertos en control de la calidad analizan la dispersión de los niveles de calidad de un producto.

Un medicamento que tiene una pureza promedio pero que fluctúa entre muy alto grado de pureza e impureza puede constituir un peligro para la vida del paciente.

EL RANGO

La dispersión puede medirse en términos de la diferencia existente entre dos valores seleccionados de una serie de datos.

17

Page 18: ESTADISTICA y Probabilidad

El rango es la diferencia entre la mayor y la menor observación en una serie de datos. En forma de ecuación, esto puede expresarse como:

Rango = Xmayor - Xmenor (10)

Para la siguiente serie de ordenada de datos:

6.3 7.7 8.9 10.3

El rango es 11.7 - 4.9 = 6.80.

El rango es fácil de entender y calcular, pero es escasa su utilidad como medida de dispersión. El rango incluye únicamente los valores máximo y mínimo de una distribución, sin tener en cuenta ninguna otra observación dentro de la serie de datos. De ahí que ignore la naturaleza de la desviación entre todas las demás observaciones, siendo afectado profundamente por los valores extremos. Mide sólo dos valores, por lo cual el rango tiende a cambiar drásticamente entre una muestra y la siguiente en una población dada, pese a que los valores que caen entre el valor más alto y el más bajo pueden ser muy similares.

EL RANGO INTERCUARTIL

El rango intercuartil (también llamado propagación media) mide aproximadamente la distancia de la mediana que se debe recorrer en ambos lados antes de poder incluir una mitad de los valores de la serie de datos. Para calcular este intervalo, se dividen los datos en cuatro partes, cada una de las cuales contiene 25% de los elementos de la distribución. Los cuartiles son, pues, los valores máximos en las cuatro partes, y el rango intercuartil es la diferencia entre los valores del primer cuartil y tercer cuartiles:

Rango intercuartil = Q3 - Q1 (11)

Rango intercuartil

1/4 de elementos 1/4 de elementos

Observación 1er. Cuartil 2do. Cuartil 3er. Cuartil Observación más baja más alta

Q1 Q2 Q3

Para la serie de datos:

6.3 7.7 8.9 10.3

Rango intercuartil = Q3 - Q1 = 10.3 - 6.3 = 4.0

LA VARIANZA Y LA DESVIACION ESTANDAR

18

11.74.9

11.74.9

Page 19: ESTADISTICA y Probabilidad

Aunque el rango es una medición de la propagación total y el rango intercuartil es una medición de la propagación media, ninguna de estas mediciones de variación toma en consideración cómo se distribuyen o agrupan las observaciones. Dos mediciones de variación comúnmente usadas que sí toman en cuenta cómo se distribuyen todos los valores en los datos son la varianza y su raíz cuadrada, la desviación estándar. Estas mediciones evalúan la forma en que los valores fluctúan alrededor de la media.

Definición de la varianza de muestra.

La varianza de muestra es aproximadamente (o casi) el promedio de las diferencias cuadradas entre cada una de las observaciones en una serie de datos y la media.

Para una muestra que contiene n observaciones, X1, X2, ... , Xn, la varianza de muestra (representada por el símbolo S2) puede escribirse como:

(X1- X)2 + (X2- X)2 + ... + (Xn- X)2 S2 = (12) n - 1

Usando la notación de sumatoria, la ecuación (12) puede expresarse de manera más simple como

n

(Xi- X)2

i=1

S2 = (13)n - 1

Donde:X es la media aritmética de la muestra.n es el tamaño de la muestra.Xi es el iésimo valor de la variable aleatoria X. n

(Xi - X) es la sumatoria de todas las diferencias cuadradas de Xi y X.i=1

Definición de la desviación estándar de la muestra.

La desviación estándar de la muestra (representada por S) es simplemente la raíz cuadrada de la varianza. Es decir:

n

(Xi - X)2

i=1

S = n -1

Para calcular S2 y S se procede de la siguiente forma:

1. Se obtiene la diferencia entre cada observación y la media.2. Se eleva al cuadrado cada diferencia.3. Se suman los resultados de elevar al cuadrado las diferencias entre las observaciones y la

media.4. Se divide la sumatoria entre n - 1.

19

Page 20: ESTADISTICA y Probabilidad

Para calcular la desviación estándar, simplemente se extrae la raíz cuadrada de la varianza.

Para la serie de datos correspondiente a: 4.9 ; 6.3 ; 7.7 ; 8.9 ; 10.3 y 11.7, la y la desviación media se calcularían como:

Media aritmética: X = (4.9 + 6.3 + 7.7 + 8.9 + 10.3 + 11.7) / 6 = 8.3

Varianza de muestra: n

(Xi- X)2

i=1 (4.9 - 8.3)2 + (6.3 - 8.3)2 + ... + (11.7 - 8.3)2 S2 = = = 6.37 n - 1 6 - 1

Desviación estándar:

S = S2 = 6.37 = 2.52

Usos de la desviación estándar.

La desviación estándar permite determinar, con mayor grado de precisión, dónde se sitúan los valores de una distribución de frecuencia en relación con la media, es decir, cómo los valores mayores fluctúan por encima de ésta y cómo los valores menores se distribuyen por debajo de ésta. Lo antes expresado es posible realizarlo conforme al teorema formulado por el matemático ruso, P. L. Chebyshev (1821-1894).

El teorema de Chebyshev establece "que cualquiera que sea la forma de la distribución, por lo menos 75% de los valores caerán dentro de dos desviaciones estándar positivas y negativas respecto de la media de distribución, y un mínimo de 89% de los valores se hallará a tres desviaciones estándar positivas y negativas respecto a la media".

Se puede medir con mayor precisión aún el porcentaje de elementos que caen dentro de intervalos específicos bajo la curva simétrica en forma de campana como la de la gráfica siguiente. En tales casos se puede afirmar que:

1. Cerca del 68% de los valores de la población caerán dentro de una desviación estándar más o menos respecto a la media.

2. Cerca del 95% de los valores se encontrarán dentro de dos desviaciones estándar positivas y negativas respecto de la media.

3. Cerca del 99% de los valores se hallarán en un intervalo que fluctúa entre tres desviaciones estándar debajo de la media y tres desviaciones estándar por encima de la media.

EL COEFICIENTE DE VARIACION

A diferencia de las mediciones previas que ya se han estudiado, el coeficiente de variación es una medición relativa de variación.

El coeficiente de variación, representado por CV, mide la dispersión de los datos relativa a la media.

20

Page 21: ESTADISTICA y Probabilidad

El coeficiente de variación se calcula a través de la expresión:

S CV = 100%

X

Donde:

S es la desviación estándar de una serie de datos numéricos.X es la media aritmética de la serie de datos numéricos.Si regresan a la serie de datos: 4.9 ; 6.3 ; 7.7 ; 8.9 ; 10.3 y 11.7, el coeficiente de variación es:

2.52CV = 100% = 30.4% 8.3

Es decir, para esta muestra el tamaño relativo de la dispersión promedio alrededor de la media con respecto a la media es 30.4%.

Como una medición relativa, el coeficiente de variación es particularmente útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas unidades de medición.

El coeficiente de variación también es muy útil al comparar dos o más conjuntos de datos que son medidos en las mismas unidades pero difieren hasta tal punto que una comparación directa de las respectivas desviaciones estándar no es muy útil.

PROBABILIDAD BASICA

Si fuera posible tomar todas las decisiones empresariales en condiciones de certidumbre, la única justificación válida para una mala decisión sería no considerar todos los hechos pertinentes. Si hay certidumbre, se puede hacer un pronóstico perfecto. Por desgracia, es casi imposible que un gerente actúe en un mundo de certidumbre, ya que por lo general se ve obligado a tomar

21

Page 22: ESTADISTICA y Probabilidad

decisiones en las que hay incertidumbre acerca de lo que sucederá después de tomarlas. En esta situación existe una herramienta, la teoría matemática de la probabilidad, que puede ser de gran utilidad para el decisor.

En este capítulo se presentará una parte de la notación y de las relaciones básicas de la teoría de las probabilidades que se aplicarán en la formulación y análisis de modelos bajo condiciones de incertidumbre.

TRES TIPOS DE PROBABILIDAD

Se distinguen tres formas fundamentales de clasificar la probabilidad. Representan enfoques conceptuales bastante diferentes en el estudio de la teoría de las probabilidades; de hecho, los expertos no coinciden en cuál enfoque es el más adecuado.

Enfoque clásico. Enfoque objetivo. Enfoque subjetivo.

PROBABILIDAD CLASICA:

La probabilidad clásica define la probabilidad de que un evento ocurra como:

Número de resultados donde ocurre el eventoProbabilidad de un evento = Número total de posibles resultados

Debe recalcarse que, a fin de que sea válida la expresión anterior, cada uno de los resultados posibles debe tener la misma probabilidad.

PROBABILIDAD OBJETIVA:

La probabilidad objetiva es aquella que se fundamenta en la información histórica definitiva, la experiencia común (evidencia objetiva) o en el análisis riguroso.

Para comprender mejor lo antes expresado, veamos el siguiente ejemplo:

Si alguna persona nos pregunta cuál es la probabilidad de que caiga cara al lanzar una moneda, la respuesta será "la mitad", es decir, 0.50. Esta respuesta es el resultado de la experiencia que se tiene con las monedas y se supone que se trata de una moneda "legítima"

INTERPRETACIONES DE LA PROBABILIDAD OBJETIVA:

Existen dos interpretaciones de la probabilidad objetiva: Simetría de los resultados. Frecuencia relativa.La primera se basa en la simetría de los resultados e implica que los resultados idénticos en los aspectos esenciales deben tener la misma probabilidad.

Una moneda legítima se define como una que está equilibrada correctamente y tiene dos lados idénticos (exceptuando las pequeñas diferencias en las imágenes). Entonces, cada lado debe tener la probabilidad de 50% (si se omite la posibilidad de que la moneda caiga sobre el canto). Si la moneda estuviera doblada o cargada, la respuesta sería diferente.

22

Page 23: ESTADISTICA y Probabilidad

Otro ejemplo:

Supongan que hay una caja que contiene tres bolas rojas y siete negras (todas del mismo tamaño, iguales al tacto e idénticas en todos los demás aspectos, excepto en el color) y que todas están bien mezcladas. La interpretación de la simetría de resultados asignaría una probabilidad de 0.10 a cada bola y, por lo tanto, habría una probabilidad de 0.30 de extraer una bola roja y 0.70 de extraer una bola negra.

La interpretación como frecuencia relativa de la probabilidad objetiva se basa en la experiencia histórica en situaciones idénticas.

Se ha lanzado una moneda 10,000 veces y en 4,998 ocasiones cayó cara. Se llegaría a la conclusión de que la probabilidad de que cayera cara la siguiente vez que se lanzara la moneda de igual manera sería de 0.50, es decir, 4,998/10,000, redondeado.

INTERPRETACION SUBJETIVA DE LA PROBABILIDAD

La probabilidad subjetiva es aquella que toma como base la experiencia personal para la asignación de probabilidades.

La interpretación subjetiva de la probabilidad muchas veces es útil para la toma de decisiones empresariales, ya que no siempre se dispone de evidencia objetiva confiable.

Supongan que un gerente trata de decidir si debe comprar o no una nueva fábrica y que el éxito de la fábrica depende en gran medida de que se presente una recesión en los próximos cinco años.

No existe una historia larga y común que pueda proyectarse con confianza hacia el futuro, como sucedió en los ejemplos de la moneda y de las bolas. Sin embargo, puede ser apropiado, de hecho necesario, considerar el suceso "ocurrencia de una recesión" y después de obtener pruebas y utilizar el juicio empresarial, el gerente podrá asignar una probabilidad al suceso y usarla para la toma de decisiones.

ENUNCIADOS BASICOS DE LA PROBABILIDAD.

Los dos enunciados básicos de las probabilidades son:

La suma de las probabilidades de todos los resultados posibles de un ensayo debe ser igual a uno.

Las probabilidades siempre son mayores o igual a cero, es decir, las probabilidades nunca son negativas) y son menores o igual a uno. Cuanto menor es la probabilidad, menos posible es el suceso.

El primer enunciado indica que si A y B son los únicos candidatos para un puesto, la probabilidad de que gane A más la probabilidad de que gane B deberán sumar uno (suponiendo que no es posible un empate).

El segundo enunciado da como resultado las siguientes interpretaciones:a) Si un suceso tiene probabilidad positiva, puede ocurrir.b) El suceso puede ser imposible y entonces la probabilidad será cero.c) Es seguro que ocurra el suceso y en este caso la probabilidad será igual a uno.

Sin importar si las probabilidades se interpretan como probabilidades objetivas o subjetivas, es práctico pensar en función de una escala de ponderación que va de cero a uno.

Si alguien lanza 500 veces una moneda de características desconocidas para obtener una estimación de las probabilidades objetivas y los resultados son 225 caras y 275 escudos, se puede

23

Page 24: ESTADISTICA y Probabilidad

convertir el intervalo de resultados posibles a una escala de cero a uno dividiéndolo entre 500. Los resultados reales son 225/500 = 0.45 caras y 275/500 = 0.55 escudos.

SUCESOS MUTUAMENTE EXLUYENTES.

Dos o más suceso son mutuamente excluyentes si sólo puede ocurrir uno de ellos en un ensayo.

Las probabilidades de los sucesos mutuamente excluyentes se pueden sumar para obtener la probabilidad de que ocurra uno de los sucesos de un conjunto dado de sucesos.

Suceso: Elección Probabilidad

Candidato demócrata A 0.18Candidato demócrata B 0.42Candidato republicano C 0.26Candidato republicano D 0.14

1.00

Las probabilidades de la tabla anterior indican la estimación subjetiva del editor de un periódico con respecto a la posibilidad relativa de cuatro candidatos para ocupar un cargo público (supongan que no se contempla la posibilidad de empates).

Estos sucesos son mutuamente excluyentes, ya que en una elección (ensayo) sólo puede ocurrir un suceso; por lo tanto, las probabilidades son aditivas. La probabilidad de una victoria demócrata es de 0.18 + 0.42 = 0.60; para la victoria republicana es 0.26 + 0.14 = 0.40; de que gane B 0 C, 0.42 + 0.26 = 0.68. La probabilidad de que ganen tanto B como C es cero, ya que en cualquier ensayo sólo puede ocurrir uno de los sucesos mutuamente excluyentes.

SUCESOS INDEPENDIENTES.

Dos sucesos son independientes (estadísticamente) cuando la ocurrencia de un suceso no afecta la probabilidad de que ocurra el segundo.

Cuando dos o más sucesos son independientes, la probabilidad de que ocurran los dos (o más de dos) es igual al producto de las probabilidades de los sucesos individuales. Es decir:

(1)

donde:P(A y B) es la probabilidad de que ocurran los sucesos A y B.P(A) es la probabilidad de que ocurra el suceso A.P(B) es la probabilidad de que ocurra el suceso B.

Si A es la probabilidad de que caiga cara la primera vez que se lanza una moneda y B es la probabilidad de que caiga cara en el segundo lanzamiento, entonces:

P(A) = 1/2 P(B) = 1/2 P(A y B) = 1/2 ∙ 1/2 = 1/4

La probabilidad de que ocurra A y luego B (dos caras) es un cuarto.

P(A y B) es la probabilidad conjunta de los sucesos A y B. La conjunción "y" se puede omitir para que la notación sea más sencilla y escribir entonces la probabilidad conjunta como P(AB).

24

P(A y B) = P(A) ∙ P(B)

Page 25: ESTADISTICA y Probabilidad

Para definir la independencia en forma matemática se utiliza el símbolo P(B|A), que se lee como "la probabilidad del suceso B, dado que ya ocurrió el suceso A". Es decir, P(B|A) es la probabilidad condicional del suceso B si ya tuvo lugar el suceso A.

Con sucesos independientes:

si A y B son independientes (2)

De manera similar:

(3)

SUCESOS DEPENDIENTES.

Dos sucesos son dependientes si la ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del segundo.

Lancen una moneda legítima y determinen si el resultado es cara o escudo. Si es cara, lancen de nuevo la moneda; si es escudo, lancen una moneda que no sea legítima, con probabilidad de 3/4 de que caiga cara y con probabilidad de 1/4 de que sea escudo. ¿Afectará de alguna manera el resultado del primer lanzamiento a la probabilidad de que caiga cara en el segundo? La respuesta es "sí", ya que el resultado del primer lanzamiento determina cuál será la moneda (legítima o ilegítima) que se lance la segunda vez.

Otro ejemplo de suceso dependientes comprende los suceso mutuamente excluyentes:

Si los sucesos A y B son mutuamente excluyentes, entonces son dependientes. Puesto que ya ocurrió el suceso A, la probabilidad condicional de que ocurra B debe ser cero, ya que son sucesos mutuamente excluyentes, es decir, P(A|B) = 0 si los sucesos A y B son mutuamente excluyentes.

PROBABILIDADES CONDICIONAL, MARGINAL Y CONJUNTA.

Probabilidad conjunta P(AB) de los sucesos A y B es la probabilidad de que ocurra el suceso A y luego el suceso B.

P(AB) = P(B|A) P(A) (1)

Probabilidad condicional P(A|B) es la probabilidad de ocurrencia de un suceso A dado que el suceso B ya ocurrió.

P(A|B) = P(A) (2)

Probabilidad incondicional o marginal de los sucesos A y B P(A) y P(B) es la probabilidad de ocurrencia de los sucesos A y B que no está condicionada por la ocurrencia de los sucesos B y A respectivamente.

Veremos ahora un ejemplo que ilustra:a) Las probabilidades incondicionales (marginales). El término marginal se refiere al hecho de

que las probabilidades se encuentran en los márgenes de una tabla de probabilidades conjuntas y suman uno.

b) Probabilidades condicionales como P(A|B) = P(A) y P(B|A) = P(B).

25

P(B|A) = P(B)

P(A|B) = P(A)

Page 26: ESTADISTICA y Probabilidad

c) Probabilidades conjuntas como P(A y B) o P(AB).

EJEMPLO 1: Supongan que hay tres cajas que contienen bolas rojas y negras, de la siguiente manera:

Caja 1: 3 rojas y 7 negras.Caja 2: 6 rojas y 4 negras.Caja 3: 8 rojas y 2 negras.

Supongan que se extrae una bola de la CAJA 1; si es roja, se extrae una bola de la CAJA 2. Si la bola extraída de la CAJA 1 es negra, entonces se extrae una de la CAJA 3. Consideren las siguientes preguntas relacionadas con las probabilidades en este juego:

1. ¿Cuál es la probabilidad de extraer una bola roja de la CAJA 1?Esta probabilidad es incondicional o marginal e igual a 3/10 = 0.30 (la probabilidad marginal de sacar una negra es 7/10 = 0.70).

2. Supongan que se extrae una bola de la CAJA 1 y es roja; ¿cuál es la probabilidad de sacar otra bola roja de la CAJA 2 en la segunda extracción?La respuesta es 6/10 = 0.60. Este es un tipo de probabilidad condicional, es decir, la probabilidad de extraer una bola roja la segunda vez si se saca una bola roja de la CAJA 1 es una probabilidad condicional.

3. Supongan que la primera bola que se sacó es negra; ¿cuál es la probabilidad condicional de que la segunda bola (esta vez de la CAJA 3) sea roja?La probabilidad es 8/10 = 0.80.

4. Supongan que antes de extraer bolas se plantea la pregunta: ¿cuál es la probabilidad de sacar dos bolas rojas?Aquí la probabilidad es conjunta y el suceso sería una bola roja en ambas extracciones. El cálculo de la probabilidad conjunta sería:

P(AB) = P(B|A) P(A) = 0.30 0.6 = 0.18

Las probabilidades conjuntas del ejemplo anterior se pueden resumir en la siguiente tabla:

Marginal Condicional = Conjunta

Suceso P(A) P(BA) = P(AB)

RR P(R)=0.30 P(RR)=0.60 P(RR)=0.18RN P(R)=0.30 P(NR)=0.40 P(RN)=0.12

26

3 rojas 7 negras CAJA 1 si es roja si es negra

6 rojas 8 rojas 4 negras 2 negras

CAJA 2 CAJA 3

Page 27: ESTADISTICA y Probabilidad

NR P(N)=0.70 P(RN)=0.80 P(NR)=0.56NN P(N)=0.70 P(NN)=0.20 P(NN)=0.14

1.00

MODIFICACION DE PROBABILIDADES. TEOREMA DE BAYES.

Supongan que no se sabe si una moneda es legítima. Si lo es, la probabilidad de que caiga cara es de 0.50; si la moneda no es legítima, la probabilidad de que caiga cara es 0.10. Supongan además, que se asigna una probabilidad a priori de 0.80 de que la moneda sea legítima y una de 0.20 de que no lo sea. Al suceso "moneda legítima" se le designará A1, mientras que A2 corresponde al suceso "moneda ilegítima". La moneda se lanza una vez y digamos que el resultado es cara. ¿Cuál es la probabilidad de que la moneda sea legítima?

La siguiente figura muestra que la probabilidad condicional de una cara es 0.50, si la moneda es legítima, es decir, P(caraA1) = 0.50. Si la moneda no es legítima, la probabilidad de que caiga cara es 0.10; P(caraA2) = 0.10.

P(caraA1) = 0.50 P(caraA2) = 0.10

P(A2) = 0.20 A2 (moneda ilegítima)

P(A1) = 0.80 A1 (moneda legítima)

Si calculan ahora la probabilidad conjunta P(cara y A1), tendrán que tener en cuanta que existe una probabilidad inicial de 0.80 de que A1 sea el estado verdadero; si A1 es el estado verdadero, hay una probabilidad condicional de 0.50 de que caiga cara. La probabilidad conjunta de que el estado A1 sea verdadero y de que se obtenga cara es:

P(cara y A1) = P(A1) P(caraA1) = 0.80 0.50 = 0.40

La probabilidad conjunta de cara y A2 es igual a:

P(cara y A2) = P(A2) P(caraA2) = 0.20 0.10 = 0.02

La cara puede ocurrir en combinación con el estado "moneda legítima" o con el estado "moneda ilegítima". La probabilidad de la primera combinación es 0.40; para la segunda es 0.02. La suma de las probabilidades equivale a la probabilidad incondicional de que el primer lanzamiento resulta cara, es decir, P(cara) = 0.40 + 0.02 = 0.42.

P(cara y A2) = 0.02P(cara y A1) = 0.40

P(cara) = 0.42

27

Page 28: ESTADISTICA y Probabilidad

Si cae cara y no se conoce el estado verdadero, la probabilidad condicional de que el estado A1

sea el verdadero, basado en la ecuación (1) es:

P(cara y A1) 0.40 P(A1cara) = = = 0.95 P(cara) 0.42

Entonces, 0.95 es la probabilidad modificada o a posteriori de A1 supuesto que haya caído cara en el primer lanzamiento.

Análogamente:

P(cara y A2) 0.02 P(A2cara) = = = 0.05

P(cara) 0.42

Utilizando símbolos más generales:

P(A i y B) P(A iB) =

P(B)

A la probabilidad condicional expresada en esta forma se le conoce como teorema de Bayes.

VARIABLES ALEATORIAS

Una función de probabilidad es una regla que asigna probabilidades a cada elemento de un conjunto de sucesos que pueden ocurrir. Si se puede asignar un valor numérico específico a cada elemento del conjunto de sucesos, a la función que asigna estos valores numéricos se le llama variable aleatoria.

El valor de la variable aleatoria es el resultado general de un experimento aleatorio (o de probabilidad).

Es conveniente establecer la diferencia entre la variable aleatoria y los valores que puede asumir. El valor de una variable aleatoria se desconoce hasta que ocurre el suceso. Sin embargo, se conoce anticipadamente la probabilidad de que la variable aleatoria sea un valor específico.

La probabilidad de cada valor de una variable aleatoria es igual a la suma de las probabilidades de los sucesos asignados a dicho valor de la variable aleatoria. En la siguiente tabla se muestran algunos ejemplos de variables aleatorias.

Variable aleatoria (representada con una letra

mayúscula)

Descripción de los valores de la variable aleatoria

Valores de la variable aleatoria

UResultados posibles al lanzar un par de dados.

2, 3, 4,..., 12

XNúmero posible de caras al lanzar cinco veces una moneda.

0, 1, 2, 3, 4, 5

28

Page 29: ESTADISTICA y Probabilidad

YVentas posibles de un periódico, donde S representa el inventario.

0, 1, 2,..., S

Las variables aleatorias se pueden agrupar en distribuciones de probabilidad. En este caso, la suma de las probabilidades debe ser igual a 1.

VALOR ESPERADO DE UNA VARIABLE ALEATORIA

El valor esperado o expectativa de una variable aleatoria es la suma de los valores de la variable, ponderados por la probabilidad de que la variable aleatoria asuma ese valor. Entonces, el valor esperado es la media o valor promedio ponderado. Consideren el ejemplo de la siguiente tabla:

Valores de la variable aleatoria X(demanda de mañana) Probabilidad de Xi

P(Xi)

Demanda ponderada por la probabilidad,

Xi P(Xi)X1 = 25 unidades P(X1) = 0.05 1.25X2 = 26 unidades P(X2) = 0.10 2.60X3 = 27 unidades P(X3) = 0.15 4.05X4 = 28 unidades P(X4) = 0.30 8.40X5 = 29 unidades P(X5) = 0.20 5.80X6 = 30 unidades P(X6) = 0.20

1.00

6.00

E(X) = 28.10

En este caso la demanda media o esperada, es de 28.10, lo cual se escribe como:

E(X) = 28.10

El valor esperado se calcula, ponderando cada valor de la variable por su probabilidad y luego sumando dichos productos.

n

E(X) = XiP(Xi) i = 1

Xi es el iésimo valor de la variable aleatoria.P(Xi) es la probabilidad del iésimo valor.n

es la sumatoria de todos los elementos desde i = 1 hasta i = n.i = 1

SUMAS DE VARIABLES ALEATORIAS

El valor esperado de la suma de variables aleatorias es la suma de los valores esperados de dichas variables:

E(X + Y + Z) = E(X) + E(Y) + E(Z)

CONSTANTE MULTIPLICADA POR UNA VARIABLE ALEATORIA

29

Page 30: ESTADISTICA y Probabilidad

El valor esperado de una constante multiplicada por una variable aleatoria es igual a la constante multiplicada por el valor esperado de la variable:

E(cX) = cE(X)

VARIANZA DE UNA VARIABLE ALEATORIA

Con frecuencia es necesario saber la forma en que los valores de la variable aleatoria se dispersan con respecto a la media. La varianza y la desviación estándar son medidas de esta dispersión.

La varianza es la suma de los cuadrados de las desviaciones de los valores de la variable aleatoria con respecto a la media, ponderados por la probabilidad de la desviación: n

Var (X) = Xi - E(X)2 P(Xi) i = 1

E(X) es la media.Xi es el iésimo valor de la variable aleatoria.P(Xi) es la probabilidad del iésimo valor.

Observen que al aumentar la dispersión de todos los valores, desde i=1 hasta i = n es mayor el valor de Xi - E(X)2 y aumenta la varianza.

La varianza de una constante multiplicada por una variable aleatoria es igual al cuadrado de la constante multiplicado por la varianza de la variable aleatoria:

Var (cX) = c2 Var (X)

La varianza de la suma de las variables aleatorias independientes es igual a la suma de las varianzas:

Var (X + Y + Z) = Var (X) + Var (Y) + Var (Z);

si X, Y y Z son independientes

Si el valor de la variable aleatoria X es constante, entonces la media es un valor constante también y Xi - E(X)2 sería cero para toda Xi y la varianza también sería cero, lo que indica que no hay dispersión respecto a la media.

DESVIACION ESTANDAR DE UNA VARIABLE ALEATORIA

La desviación estándar es la raíz cuadrada de la varianza.

El siguiente ejemplo muestra cómo se obtiene información acerca de una variable aleatoria con las reglas de probabilidad que se obtuvieron antes. Supongan que tienen un producto que intentan vender a dos clientes. En el caso de "Tiendas Grandes", ustedes determinan que hay un 20% de probabilidad de vender 200 cajas, 40% de vender 100cajas y 40% de que no vendan nada. Para "Mercados Pequeños", ustedes opinan que las probabilidades son 40% para un pedido de 100 cajas y 60% de que no haya pedido. Ustedes consideran también que las ventas a ambos mercados son dependientes. Si "Tiendas Grandes" compra 200 cajas, la probabilidad de que

30

Page 31: ESTADISTICA y Probabilidad

"Mercados Pequeños" compre 100 cajas sería del 50% (y 50% de probabilidad de no vender nada). Si "Tiendas Grandes" no compra nada, la probabilidad de que "Mercados Pequeños no compre nada sería del 50%.

Supongan que les interesa la variable aleatoria X, las ventas totales a ambos clientes. Para ello es necesario entonces, obtener la distribución de probabilidades para esta variable aleatoria. El primer paso es elaborar la tabla de probabilidades conjuntas, e incluir la información que se posee.

Ventas a "Mercados Pequeños"

(cajas)

Ventas a "Tiendas Grandes" (cajas)Probabilidad

marginal

200 100 0

100 0.5 0.1

0.4

0

0.5 0.2

0.6

Probabilidad marginal 0.2 0.4 0.4 1.0

Observen que en el margen inferior de la tabla anterior se muestran las probabilidades globales de vender 200, 100 y 0 cajas a "Tiendas Grandes". Asimismo, en la columna derecha se presentan las probabilidades marginales de ventas a "Mercados Pequeños". Saben además, que P(ventas "Mercados Pequeños" = 100ventas "Tiendas Grandes" = 200) = 0.5; esta probabilidad condicional se incluye en la esquina superior del cuadro de la parte superior izquierda. Saben también que P(ventas "Mercados Pequeños" = 0ventas "Tiendas Grandes" = 0) = 0.5, lo cual se muestra en la esquina superior del cuadro de la parte inferior derecha.

Para calcular la probabilidad conjunta, utilicen la ecuación P(AB) = P(AB) P(B):

P(Mercados=100 y Tiendas=200) = P(Mercados=100Tiendas=200) P (Tiendas= 200) = 0.5 0.2 = 0.1

Análogamente:

P(Mercados=0 y Tiendas=0) = P(Mercados=0Tiendas=0) P(Tiendas=0) = 0.5 0.4 = 0.2

Estas probabilidades conjuntas se muestran en los cuadros respectivos de la tabla anterior.

Ahora se puede terminar de llenar el resto de la tabla anterior, a partir del hecho de que el total de las probabilidades conjuntas de cualquier fila o columna debe ser igual a las probabilidades marginales.

Ventas a "Mercados Pequeños"

(cajas)

Ventas a "Tiendas Grandes" (cajas)Probabilidad

marginal

200 100 0

100 0.1 300

0.1 200

0.2 100

0.4

0 0.1 200

0.3 100

0.2 0

0.6

Probabilidad marginal 0.2 0.4 0.4 1.0

31

Page 32: ESTADISTICA y Probabilidad

Las esquinas de la parte inferior derecha los cuadros de la tabla anterior contienen los valores de la variable aleatoria X, ventas totales, que es igual a la suma de las ventas a "Tiendas Grandes" y a "Mercados Pequeños". La distribución de probabilidad de X se indica en las columnas 1 y 2 de la siguiente tabla:

Ventas en cajas Xi

(1)

ProbabilidadP(Xi)(2)

Xi P(Xi)

(3)

Desviación cuadrada con respecto a la media

de 120 Xi - E(X)2

(4)

Desviación cuadrada ponderada por la probabilidad

Xi - E(X)2P(Xi)(5)

0 0.2 0 (0 - 120)2 = 14,400 2,880100 0.5 50 (100 - 120)2 = 400 200200 0.2 40 (200 - 120)2 = 6,400 1,280300 0.1

1.0

30

E(X) = 120

(300 - 120)2 =32,400 3,240

Var(X)=7,600

El cálculo del valor esperado de esta distribución se muestra en la columna 3 de la tabla anterior, es decir, E(X) = 120 cajas. También se podría determinar el valor esperado de las ventas totales si se hubiera aplicado la ecuación:

E(X+Y+Z) = E(X) + E(Y) + E(Z) (*)

para las sumas de las variables aleatorias. Si la variable aleatoria B representa las ventas a"Tiendas Grandes" y L corresponde a las ventas a "Mercados Pequeños", entonces:

E(B) = (0.2 200) + (0.4 100) + (0.4 0) = 80

E(L) = (0.4 100) + (0.6 (0) = 40

Observen que X = B + L. Entonces utilizando la ecuación (*) tendrán:

E(X) = E(B) + E(L) = 80 + 40 = 120

¡

USO DEL VALOR ESPERADO EN LA TOMA DE DECISIONES

En la sección precedente, calcularon el valor esperado de una variable aleatoria y se señaló que puede tener un valor significativo para los encargados de tomar las decisiones. Ahora van a analizar cómo esas personas combinan las probabilidades de que una variable aleatoria asuma ciertos valores con la ganancia o pérdida monetaria que se producirán cuando los adopte. Al hacer eso podrán llegar a decisiones inteligentes en condiciones de incertidumbre.

Combinación de probabilidades y de valores monetarios

Analicen como ejemplo el caso de un mayorista de frutas y verduras que vende fresas. Este producto tiene una vida útil muy breve. Si no se vende el mismo día de la entrega, pierde todo su valor. Una caja de fresas cuesta $20 y el mayorista recibe $50 por la venta de ella. El mayorista no

32

Page 33: ESTADISTICA y Probabilidad

puede especificar el número de cajas que los clientes adquirirán en un día, pero su análisis de los registros anteriores ha producido la información que contiene la siguiente tabla:

Tabla 1: Ventas durante 100 días.

Ventas diarias Número de días de venta Probabilidad de que se venda cada número.

10 15 0.1511 20 0.2012 40 0.4013 25

1000.25

1.00

Definición de los tipos de pérdidas.

El mayorista incurre en dos clases de pérdidas:

1. Pérdidas ocasionadas por almacenar demasiada fruta en un día cualquiera y tener que deshacerse de ella al día siguiente.

2. Pérdidas por desaprovechar la oportunidad, cuando se queda sin fresas y los clientes las piden. (Los clientes no esperan más de un día después de pedir una caja).

La tabla 2 es un cuadro de las pérdidas condicionales. Cada valor en ella incluido está condicionado a cierto número de cajas que se guardan y a un número particular que piden los clientes. Los valores de esta tabla no comprenden sólo las pérdidas por las fresas que se pudren, sino además las resultantes de los ingresos no recibidos cuando el mayorista no puede satisfacer las peticiones de sus clientes.

Tabla 2: Tabla de pérdidas condicionales.

Peticiones posibles de

fresas

Acciones posibles de almacenamiento

10 11 12 1310 $ 0 $20 $40 $6011 30 0 20 4012 60 30 0 2013 90 60 30 0

No se incurre en ninguno de estos dos tipos de pérdida cuando el número de cajas almacenadas un día cualquiera es igual al número de las que se venden. Cuando eso sucede, el mayorista vende todo cuanto ha guardado y no sufre pérdida alguna. Esta situación se indica con un cero en la columna correspondiente. Las cifras por encima de la diagonal de ceros representan las pérdidas atribuibles a las fresas podridas. En cada caso, el número de las cajas que se almacenan es mayor que el de las que se piden. Por ejemplo, si el mayorista almacena 12 cajas y recibe pedidos por 10 solamente, perderá $40 (o sea, $20 por caja de fresas podridas).

Los valores por debajo de la diagonal de ceros representan pérdidas de oportunidad debidas a pedidos que no pudieron ser surtidos. Si en un día se guardan apenas diez cajas y se reciben once pedidos, el mayorista pierde una oportunidad de percibir $30 por caja que no puede vender ($50 de ingresos por caja que habría recibido menos $20 del costo de ella es igual a $30).

Cálculo de las pérdidas esperadas.

33

Page 34: ESTADISTICA y Probabilidad

Si examinan cada acción posible de inventario, podrán calcular la pérdida esperada. Y ello lo pueden hacer ponderando las cuatro cifras de la pérdida posible en cada columna de la tabla anterior según las probabilidades dadas en la tabla inicial.

Las pérdidas condicionales de la tabla 3 se toman de la primera columna de la tabla 2 relativa a la acción de almacenamiento de 10 cajas. El total de la cuarta columna de la tabla 3 muestra que, si en un día se guardan diez cajas, en un período largo el promedio o la pérdida esperada será de $52.50 al día. No hay garantía de que la pérdida del día siguiente sea $52.50 exactamente.Las tablas 4, 5 y 6 muestran los cálculos de la pérdida esperada que resulta de las decisiones de almacenar once, doce y trece cajas, respectivamente. La ación óptima de almacenamiento es aquella que minimiza las pérdidas esperadas. Esta acción exige guardar doce cajas cada día, punto en el cual la pérdida esperada se reduce a un mínimo de $17.50. El problema, también se pudo haber resuelto adoptando un enfoque alternativo, es decir, maximizar la ganancia esperada ($50 recibidos por cada caja menos $20 del costo por caja) en vez de minimizar la pérdida esperada. La respuesta hubiera sido la misma: 12 cajas.

Tabla 3: Pérdida esperada al almacenar 10 cajas.

Peticiones posibles.

Pérdida condicional.

Probabilidad de esta cantidad de peticiones.

Pérdida esperada.

10 $ 0 0.15 = $ 0.0011 30 0.20 = 6.0012 60 0.40 = 24.0013 90 0.25

1.00= 22.50

$ 52.50

Tabla 4: Pérdida esperada al almacenar 11 cajas.

Peticiones posibles.

Pérdida condicional.

Probabilidad de esta cantidad de peticiones.

Pérdida esperada.

10 $ 20 0.15 = $ 3.0011 0 0.20 = 0.0012 30 0.40 = 12.0013 60 0.25

1.00= 15.00

$ 30.00

Tabla 5: Pérdida esperada al almacenar 12 cajas.

Peticiones posibles.

Pérdida condicional.

Probabilidad de esta cantidad de peticiones.

Pérdida esperada.

10 $40 0.15 = $ 6.0011 20 0.20 = 4.0012 0 0.40 = 0.0013 30 0.25

1.00= 7.50

$17.50Pérdida mínima esperada

Tabla 6: Pérdida esperada al almacenar 13 cajas.

34

Page 35: ESTADISTICA y Probabilidad

Peticiones posibles.

Pérdida condicional.

Probabilidad de esta cantidad de peticiones.

Pérdida esperada.

10 $ 60 0.15 = $ 9.0011 40 0.20 = 8.0012 20 0.40 = 8.0013 0 0.25

1.00= 0.00

$ 25.00

En esta breve exposición del valor esperado, se han hecho muy pocas suposiciones. Para nombrar tan sólo dos de ellas, se ha supuesto que la demanda del producto puede asumir cuatro valores únicamente y que las fresas no valen nada un día después.

DISTRIBUCIONES DE FRECUENCIA Y PROBABILIDAD

Distribución de frecuencia es un listado de las frecuencias observadas de todos los resultados de un experimento que, en realidad se han presentado cuando se llevó a cabo el experimento.

Distribución de probabilidad es un listado de las probabilidades de todos los resultados posibles que podrían presentarse si se efectuara el experimento.

Las distribuciones de probabilidad pueden basarse en consideraciones de carácter teórico (los lanzamientos de una moneda) o en una valoración subjetiva de la probabilidad de ciertos resultados. También, las distribuciones de probabilidad pueden estar basadas en la experiencia. Por ejemplo, los actuarios de las compañías de seguros determinan el monto de las primas de seguros valiéndose de sus largos años de experiencia con los índices de mortalidad, a fin de establecer las probabilidades de fallecimiento entre los diversos grupos de edad.

35

Page 36: ESTADISTICA y Probabilidad

TIPOS DE DISTRIBUIONES DE PROBABILIDAD

Las distribuciones de probabilidad se clasifican en: Discretas. Continuas.

En una distribución de probabilidad discreta, las variables en estudio pueden asumir únicamente un número limitado de valores.

En una distribución de probabilidad continua, las variables en estudio pueden asumir cualquier valor dentro de determinados límites.

PROCESO DE BERNOULLI

Se puede describir un proceso de Bernoulli de la siguiente manera:

1. Los resultados de cada ensayo del proceso se caracterizan por corresponder a uno de dos tipos de resultados posibles:a) Éxito o fracasob) Sí, no.c) Cara, escudo.d) Cero, uno.

2. La probabilidad del resultado en cualquier ensayo es "estable" y no varía durante el proceso. Por ejemplo, la probabilidad de que caiga cara, con una moneda legítima, es de 0.50 y no cambia, no importa cuántas veces se lance la moneda.

3. El resultado de cualquier ensayo es independiente del resultado de los ensayos anteriores.En otras palabras, la historia anterior del proceso no cambia la probabilidad asignada al siguiente ensayo.

4. El número de ensayos es discreto y se puede representar con un número entero como 1, 2, 3, etc.

Dado un proceso, se puede saber que es de Bernoulli, pero puede haber incertidumbre acerca de la probabilidad estable, característica del proceso. En el ejemplo de una moneda legítima, se podría saber que el proceso es de Bernoulli, con probabilidad de éxito de 0.50 (por ejemplo, cara) y 0.50 de probabilidad de fracaso (escudo). Sin embargo, si la moneda no es legítima, el proceso (lanzar la moneda) podría ser de tipo Bernoulli, aunque no se conoce la característica de probabilidad. Por lo tanto, se puede tener un proceso de Bernoulli con característica de probabilidad conocida o desconocida.

Para fines de análisis, se pueden caracterizar muchos procesos empresariales como de Bernoulli, aún cuando no sean realmente de Bernoulli en todos los aspectos. Si el ajuste es bastante aproximado, se puede suponer que el proceso de Bernoulli es una caracterización razonable. Analicen los siguientes ejemplos:

Ejemplo 1: Supongan que les interesa un proceso de producción en el cual se produce determinada parte (o producto) en una máquina. El punto focal de interés puede ser clasificar las partes como "buenas" o "defectuosas"; en este caso el proceso puede ser de Bernoulli. Si la máquina no se desgasta con rapidez, es decir, si la situación permanece igual para un gran número de partes, la probabilidad de producir partes buenas puede ser lo suficientemente estable para que el proceso se pueda considerar de Bernoulli. Si, por otra parte, ocurren más defectos al final de la sesión, el proceso no es de Bernoulli.

36

Page 37: ESTADISTICA y Probabilidad

Ejemplo 2: Un ejemplo distinto de un proceso de Bernoulli es una encuesta para determinar si los consumidores prefieren detergente líquido o en polvo. El resultado de una encuesta podría clasificarse como respuesta "sí" (éxito) o "no" (fracaso) a la pregunta. Si la muestra de los consumidores tuviera la aleatoriedad suficiente (no existe ningún patrón con respecto a la manera en que ocurren las respuestas afirmativas y negativas), se podría describir el proceso como de tipo Bernoulli (con probabilidad desconocida).

Observen que si la probabilidad de éxito en un proceso de Bernoulli es de 0.50, la probabilidad de fracaso también será de 0.50 (ya que las probabilidades de que ocurra el suceso y de que no ocurra suman 1). Si la probabilidad de éxito es p, la probabilidad de fracaso es q, que es igual a (1 - p).

DISTRIBUCION DE PROBABILIDAD BINOMIAL

Una distribución de probabilidad ampliamente utilizada de una variable aleatoria discreta es la distribución binomial. Esta describe varios procesos de interés para los decisores.

La distribución binomial describe datos discretos, no continuos, resultantes de un experimento denominado proceso de Bernoulli, en honor al matemático suizo Jacob Bernoulli, quien vivió en el siglo XVII.

La distribución binomial goza de numerosas aplicaciones: En juegos de azar:

¿Cuál es la probabilidad de que el rojo salga 15 o más veces en 19 giros de la rueda de la ruleta?

En control de la calidad de productos:¿Cuál es la probabilidad de que en una muestra de que una muestra de 20 aros del mismo tipo, ninguno salga defectuoso si el 8% de tales aros producidos en una planta particular son defectuosos?

En educación:¿Cuál es la probabilidad de que un estudiante pueda pasar un examen de diez preguntas de selección múltiple (cada pregunta conteniendo cuatro opciones) si el estudiante adivina en cada pregunta? (Pasar se define como obtener el 70% del total de puntos, es decir, obtener al menos siete de diez puntos).

En finanzas:¿Cuál es la probabilidad de que un valor particular muestre un incremento en su precio de cierre diariamente durante las siguientes diez sesiones consecutivas de negocios, si el precio del mercado de valores realmente cambia aleatoriamente?

Para analizar un proceso de Bernoulli, es necesario conocer la característica de probabilidad del proceso, p, y el número de ensayos, n.

Los símbolos y las relaciones que se presentan en la siguiente tabla son de utilidad.

Relación o símbolo Interpretación

P(R = rp, n) Probabilidad de que un número desconocido de éxitos, R (la variable aleatoria) sea igual que un número específico, r (digamos 10), dado un número de ensayos específico, n (por ejemplo, 20) y una probabilidad específica, p, de éxito en cada ensayo.

37

Page 38: ESTADISTICA y Probabilidad

P(R rp, n) Probabilidad de que el número de éxitos sea mayor o igual que un número específico, r, dados valores para p y n. A esto se le conoce como probabilidad acumulada. La tabla C (en el apéndice al final del libro "Análisis Cuantitativo para la Toma de Decisiones") contiene los valores de las probabilidades acumuladas.

P(R rp, n) Probabilidad de que el número de éxitos sea mayor que un número específico. Esta desigualdad es exclusiva, es decir: P(R 10)Excluye a 10 e incluye a los números 11 y mayores.

P(R rp, n) Probabilidad de que el número de éxitos sea menor o igual que un número específico (por ejemplo, 10).

P(R rp, n) Probabilidad de que el número de éxitos sea menor que un número específico.

P(R = 10) = P(R 10) - P(R 11) La probabilidad de que ocurran exactamente 10 éxitos puede obtenerse del apéndice C restando dos probabilidades acumuladas. Si se resta P(R 11) a P(R 10), el resultado es la probabilidad de que ocurran precisamente 10.

P(R 10) = 1 - P(R 10) Como las probabilidades suman 1, si se resta a 1 la probabilidad de obtener 10 éxitos o más, el resultado es la probabilidad de que ocurran menos de 10 éxitos.

P(R 10) = 1 - P(R 11) Puesto que menor o igual que 10 incluye a 10, resten a 1 la probabilidad de 11 éxitos o más.

P(R 10) = P(R 11) Para leer una desigualdad estricta de la tabla C del apéndice, sumen 1 al número deseado.La relación P(R 10) excluye a 10, por lo que esta probabilidad es igual a P(R 11), que incluye a 11 pero excluye a 10.

FUNCION DE PROBABILIDAD BINOMIAL

Si se cumplen la hipótesis del proceso de Bernoulli, y la probabilidad de éxito en un ensayo es p, entonces la distribución de probabilidad de un número de éxitos, R, en n ensayos, es una distribución binomial.

La función de distribución de probabilidad binomial es:

n! P(rp, n) = pr(1 - p)n - r (3) r! (n - r)!

Donde:

38

Page 39: ESTADISTICA y Probabilidad

El símbolo ! significa factorial, el cual se calcula como por ejemplo, 3! significa 3 2 1 = 6. Los matemáticos definen 0! como igual a 1.p es la probabilidad característica o probabilidad del éxito.q = 1- p es la probabilidad del fracaso.r es el número de éxitos deseados.n es el número de ensayos efectuados.

Los cálculos aplicando la ecuación anterior pueden ser tediosos si el número de ensayos es grande. Por esta razón se presentan las tablas de distribución binomial acumulada.

Ejemplo: Supongan que una moneda legítima se lanzará tres veces y que se desea calcular las siguientes probabilidades:

a) La probabilidad de tres caras en tres lanzamientos.b) La probabilidad de dos o más caras en tres lanzamientos.c) La probabilidad de menos de dos caras en tres lanzamientos.

Antes de responder a las preguntas acerca de las probabilidades, se presentan a continuación todos los resultados posibles de los tres ensayos y se calculan las probabilidades ((vean la tabla 7; C = cara, E = escudo).

Probabilidades Interpretación

a) P(r=3 | p=0.50, n=3) = 1/8 La probabilidad de tres caras en tres ensayoses 1/8. Esta es la probabilidad de CCC; vean la tabla 7.

b) P(r2 | p=0.50, n=3) = 4/8 La probabilidad de dos caras o más es de 4/8. Esta es la probabilidad de dos caras más la probabilidad de tres y se calcula sumando las probabilidades de las siguientes combinaciones: CCC, CE, CEC, ECC.

c) P(r<2 | p=0.50, n=3) = 4/8 La probabilidad de que ocurran menos de dos caras es la probabilidad de cero o una cara y se calcula sumando las probabilidades de las siguientes combinaciones: EEC, ECE, EEE.

Tabla 7. Resultados posibles y sus probabilidades.

Resultados posibles Probabilidad de cada resultado

CCC 1/8CCE 1/8CEC 1/8ECC 1/8EEC 1/8ECE 1/8CEE 1/8EEE 1/8

1

39

Page 40: ESTADISTICA y Probabilidad

Las probabilidades también pueden calcularse con la ecuación (3), como se presenta en el siguiente ejemplo correspondiente al punto a):

En este ejemplo, la p del proceso de Bernoulli es 0.50 y se considera un éxito cuando caiga cara. El número de ensayos n es tres. La probabilidad deseada para el punto a) puede representarse de la siguiente manera:

3!P(r=3|p=0.50, n=3) = × (0.5)3 (1 - 0.5)3-3

3! (3 - 3)!

1 × 2 × 3P(r=3|p=0.50, n=3) = × 0.125 × 1 = 0.125

1 × 2 × 3 (1)

Por último, las probabilidades también se pueden obtener de la tabla de distribución binomial acumulada.

Cálculos Explicación

a) P(r=3|p=0.50, n=3) = 0.125 Consulten la tabla de distribuciones binomiales bajo n = 3, p = 0.50; busquen en la columna P(r3) = 0.125 y luego resten a esto: P(r4) = 0 (es imposible que ocurran cuatro éxitos en tres ensayos). La respuesta es 0.125 0 1/8.

b) P(r2 | p=0.50, n=3) = 0.50 Busquen en la tabla de distribuciones binomiales bajo n = 3, p = 0.50 y lean el valor para r2; la respuesta es 0.50. Si desearan obtener P(r=2), se calcularía de la siguiente manera: P(r2 0.50; 3) = 0.50Menos P(r30.50; 3) = 0.125 P(r=2 0.50; 3) = 0.375

c) P(r2 p=0.50; n=3) = 0.50 Esta probabilidad es igual a:1 - P(r2) = 1 - 0.50 = 0.50

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION PARA LA DISTRIBUCION BINOMIAL

La distribución binomial tiene un valor esperado o media (), y una desviación estándar () que se pueden calcular utilizando las siguientes ecuaciones:

En forma simbólica, se puede representar la media de una distribución binomial como:

= n p (4)Donde:n es el número de ensayos.p es la probabilidad de éxito.

La desviación estándar distribución binomial se calcula mediante la ecuación:

= n p q (5)

40

Page 41: ESTADISTICA y Probabilidad

Donde:n es el número de ensayos.p es la probabilidad de éxito.q es la probabilidad de fracaso: q = 1 - p

LA DISTRIBUCION DE POISSON.

La distribución de probabilidad de Poisson, al igual que la distribución de probabilidad binomial, es una distribución de probabilidad discreta y se llama así en honor de Simeón Dennis Poisson (1781-1840), un francés que desarrolló esta distribución basándose en estudios efectuados en la última parte de su vida.

La distribución de probabilidad de Poisson se emplea para describir varios procesos, entre otros:

La distribución de las llamadas telefónicas que llegan a un conmutador. La demanda (necesidades) de servicios en una institución asistencial por parte de los

pacientes. Los arribos de camiones y automóviles a la caseta de cobro de peaje. El número de accidentes en un cruce de calles.

Los ejemplos antes citados tienen un elemento en común: pueden ser descritos por una variable aleatoria discreta que asume valores enteros (0, 1, 2, 3, 4, 5 y así sucesivamente).

CARACTERISTICAS DE LOS PROCESOS QUE PRODUCEN UNA DISTRIBUCION DE PROBABILIDAD DE POISSON.

El número de vehículos que pasan por una caseta de cobro de peaje en las horas de mayor tráfico puede servir como ejemplo de las características de una distribución de Poisson:

1. El promedio (media) de los arribos de vehículos por hora de gran tráfico puede estimarse a partir de los datos anteriores del tráfico.

2. Si se dividen las horas de gran tráfico en períodos (intervalos) de un segundo cada uno, se encontrará que los siguientes enunciados son verdaderos:a) La probabilidad de que exactamente un vehículo llegue por segundo a una caseta

individual es un número muy pequeño y es constante para cada intervalo de un segundo.b) La probabilidad de que dos o más vehículos lleguen en un intervalo de un segundo es tan

reducida que se le puede asignar un valor cero.c) El número de vehículos que llegan en determinado intervalo de un segundo es

independiente del momento en que el intervalo de un segundo ocurre durante la hora de gran tráfico.

d) El número de llegadas en cualquier intervalo de un segundo no depende del número de arribos en cualquier otro intervalo de un segundo.

Partiendo de las cuatro condiciones que se han descrito anteriormente, se puede generalizar y aplicar estas condiciones a otros procesos.

CALCULO DE LAS PROBABILIDADES MEDIANTE UNA DISTRIBUCION DE POISSON.

La distribución de probabilidad de Poisson, como se ha señalado antes, se refiere a ciertos procesos que pueden ser descritos con una variable aleatoria discreta. La letra X suele representar esa variable y puede además asumir valores enteros (0, 1, 2, 3, ...). Se utiliza la

41

Page 42: ESTADISTICA y Probabilidad

letra x para designar un valor específico que puede asumir la X. La probabilidad de exactamente x ocurrencias en una distribución de Poisson se calcula mediante la ecuación:

x e-

P(x) = (5) x!

Analicen más detenidamente cada parte de esta ecuación:

x e-

P(x) = x!

EJEMPLO DE APLICACIÓN DE LA DISTRIBUCION DE POISSON.

Supongan que se está investigando la seguridad de un cruce muy peligroso. Los archivos de la Dirección de Tránsito indican una media de 5 accidentes por mes en él.. El número de accidentes está distribuido conforme a la distribución de Poisson, y la División de Seguridad en Carreteras quiere calcular la probabilidad de exactamente 0, 1, 2, 3 y 4 accidentes en un mes determinado. Apliquen la fórmula (5) y utilicen la tabla del apéndice para el cálculo de las e elevadas a potencias negativas.

x e-

P(x) = x!

Probabilidad de exactamente cero accidentes:

42

Probabilidad de exactamente x ocurrencias.

Lambda (número medio de ocurrencias por intervalo de tiempo) elevada a la potencia x.

e, o sea, 2.71828... (base del sistema de logaritmos naturales o neperianos), elevado a la potencia de lambda.

x factorial

Page 43: ESTADISTICA y Probabilidad

(50) (e-5) (1) (0.00674)P(0) = = = 0.00674 0! 1

Probabilidad de exactamente un accidente:

(51) (e-5) (5) (0.00674)P(1) = = = 0.03370 1! 1

Probabilidad de exactamente dos accidentes:

(52) (e-5) (25) (0.00674)P(2) = = = 0.08425 2! 1 2

Probabilidad de exactamente tres accidentes:

(53) (e-5) (125) (0.00674)P(3) = = = 0.14042 3! 1 2 3

Probabilidad de exactamente cuatro accidentes:

(54) (e-5) (625) (0.00674)P(4) = = = 0.17552 4! 1 2 3 4

Las respuestas obtenidas para P(0) = 0.00674; P(1) = 0.03370; P(2) = 0.08425; P(3) = 0.14042 y P(4) = 0.17552 responderán varias preguntas que se hagan los analistas:

Si se desea conocer la probabilidad de que haya 0, 1y 2 acidentes en un mes cualquiera, dicha probabilidad se obtiene sumando las probabilidades de exactamente 0, 1 y 2 accidentes de la siguiente manera:

P(0) = 0.00674P(1) = 0.03370P(2) = 0.08425

P(0, 1, 2) = 0.12469

Supongan que se tomarán medidas para mejorar la seguridad del cruce si la probabilidad de más de tres accidentes por mes rebasa 0.65. ¿Ha de tomarse medidas en el caso que se analiza?

Para resolver el problema, necesitan calcular la probabilidad de que haya 0, 1, 2 ó 3 accidentes y luego restarle la suma a 1.0 para obtener la probabilidad de más de 3 accidentes:

P(0) = 0.00674P(1) = 0.03370P(2) = 0.08425P(3) = 0.14042

P(3 o menos) = 0.26511

43

Page 44: ESTADISTICA y Probabilidad

Dado que la probabilidad de Poisson de que ocurran 3 0 menos accidentes es de 0.26511, la probabilidad de que ocurran más de tres accidentes será (1 - 0.26511) = 0.73489.

Como 0.73489 excede 0.65, entonces tendrán que tomarse medidas para mejorar la seguridad del cruce.

LA DISTRIBUCION NORMAL: UNA DISTRIBUCION DE UNA VARIABLE ALEATORIA CONTINUA.

La distribución de probabilidad normal es una de las más importantes distribuciones de probabilidad continuas. Varios matemáticos intervinieron en su desarrollo, pero especialmente entre los mismos figura el matemático-astrónomo del siglo XVIII Karl Gauss. En honor a sus trabajos, la distribución de probabilidad normal en ocasiones recibe el nombre de distribución de Gauss.

Hay dos razones fundamentales por las cuales la distribución de probabilidad normal ocupa un lugar tan prominente en la estadística.

1. Tiene algunas propiedades que la hacen aplicable a muchísimas situaciones donde es preciso hacer inferencias al seleccionar muestras.

2. Esta distribución llega a encajar muy bien en las distribuciones observadas de frecuencia de multitud de fenómenos, entre ellos las características humanas (peso, talla y coeficiente intelectual), la producción de procesos físicos (dimensiones y rendimientos) y otras medidas de interés para los gerentes, tanto en el sector público, como en el privado.

CARACTERISTICAS DE LA DISTRIBUCION DE PROBABILIDAD NORMAL.

44

Page 45: ESTADISTICA y Probabilidad

Observen por unos momentos la figura 1. Este diagrama sugiere varias características importantes de una distribución de probabilidad normal:

1. La curva tiene un solo pico; por consiguiente, es unimodal. Presenta una forma de campana.2. La media de una población distribuida normalmente se encuentra en el centro de su curva

normal.3. A causa de la simetría de la distribución de probabilidad normal, la mediana y la moda también

se encuentran en el centro, por tanto, en una curva normal, la media, la mediana y la moda poseen el mismo valor.

4. Las dos colas (extremos) de una distribución de probabilidad normal se extienden de manera indefinida y nunca tocan el eje horizontal.

45