Estadistica

167
Curso Estadística • Profesor Marcelo Cuevas

description

resumen conceptos importantes estadistica

Transcript of Estadistica

Page 1: Estadistica

Curso Estadística

• Profesor Marcelo Cuevas

Page 2: Estadistica

Programa

• Estadística Descriptiva• Probabilidades • Variables aleatorias y modelos de probabilidades• • Se describen datos, como se ubican y como se comportan • Es poder determinar, cuantificar un resultado incierto• Los datos según como se comporten tendrán un modelo

determinando

Page 3: Estadistica

Estadística Descriptiva

• Introducción:• Existe un método científico en la investigación, que nos introducirá a

solucionar los problemas. Este método consta de 5 etapas:• Observación: lo primero es observar y tratar de explicar porque sucede • Hipótesis: Luego de la observación se plantean proposiciones con el fin de

determinar si son ciertas o no • Recolección y análisis de información: Se recoge información necesaria

que pueda confirmar o refutar las hipótesis planteadas, también puede darse que se decida tomar una muestra representativa de la población y su correspondiente análisis, estudio.

• Conclusión: A partir de la información recolectada podemos obtener resultados sobre nuestro planteamiento que nos dirán su nuestra hipótesis es verdadera o falsa.

Page 4: Estadistica

• La estadística se aplica en los ptos 3 y 4. La conclusión sobre la investigación esta buena, lo que puede estar malo es la muestra representativa. La estadística nos enseña a explicar la información

• • Estadísticas: Tiene como objetico obtener conclusiones validas

acerca del fenómeno en estudio. La MP de la estadística son los datos que pueden tener diferentes características.

• Definición Variable: Es un conjunto de datos, es la característica que toma el fenómeno en estudio o la unidad experimental que se estudia. (edad, sexo, nivel socio-económico)

Page 5: Estadistica

• De acuerdo a las características de las variables las podemos clasificar en:

• Categóricas o Cualitativas: Son aquellas que representan categoría o clase excluyente ej: sexo, estado civil, etc.

• Numéricas o Cuantitativas: Están representadas por números dentro de estas podemos clasificar en:

• Discretas: es aquella cuyos valores posibles son finitos o infinito numerable. Ej: finito: n° alumnos regulares año 1995.

• Infinito numerable: n° llamadas central telefónica en 3 min. Los resultados se conocen cuando haya pasado el tiempo de estudio

• Continuas: cuando toma infinitos valores en intervalo determinado Ej: edad: 18-19-20

Page 6: Estadistica

• Pueden darse varias edades en dicho intervalo. El promedio de edad esta entre 19 y 20 años (alguien puede tener 19 ½ años)

• En el caso de las variables discretas no pueden darse que hayan valores intermedios Ej: n° hermanos: 0 – 1 – 2 – 3

• Nadie puede tener 2 ½ hermanos, o tienen 2 i tienen 3.

• De acuerdo a las características existen variadas formas de medirlo (escalas).

Page 7: Estadistica

• VARIABLES• Categóricas: son excluyentes • Escala nominal: no existe posibilidad de orden. Ej: Estado civil,

profesiones.• Escala ordinal: Existe ordenación. Ej: nivel socioeconómico (alto,

medio, bajo) , categoría hoteles (cantidad de estrellas)• • Numéricas: • Escala de intervalo: consiste en agrupar la información en ciertos

intervalos• Escala de razón: permite comparación y referencia de un dato con

otro. Ej: una empresa produce más que otra.

Page 8: Estadistica

Datos

Recoleccion

Analisis de la informacion (tablas, graficos, etc)

¿Los datos representan una

muestra o la poblacion?

Interferencia estadistica

Conclusiones acerca de la poblacion

Page 9: Estadistica

ESTADISTICA DESCRIPTIVA:

• Distribución o tablas de frecuencia: El objetivo de estas tablas es el poder resumir una gran cantidad de información que permita un mejor análisis de esta.

• • Notación: • X: Variable• X1, X2, Xn : denotan los datos de la variable• n : Tamaño de la muestra• Ejemplo: • X = edad de los alumnos• n = 6• X1 = 15 • X2 = 14• X3 = 13 • X4 = 16• X5 = 15• X6 = 16• La tabla de frecuencia tiene el siguiente formato:

Page 10: Estadistica

Cat. o Clases Marca de clase Xi

Frecuencia Absoluta ni

Frecuencia Relativa fi

% 100*fi

Frecuencia Absoluta Acum. Ni

Frecuencia Relativa Acum Fi

% acumulado 100*Fi

C1

C2

C3

.

Ck

n 1 100 n 1 100

Page 11: Estadistica

• La marca de clase es solo para variables cuantitativas y corresponde al punto medio del intervalo.

• Frecuencia absoluta (ni) representa al n° de observaciones que corresponde a cada clase

• • • Frecuencia relativa (fi) es el cociente entre la

frecuencia absoluta y la frecuencia total • fi= ni/n

• Al multiplicar fi*100 obtenemos la frecuencia porcentual.

Page 12: Estadistica

• Frecuencia absoluta acumulada (Ni)

• Frecuencia relativa acumulada (Fi) es acumular las frecuencias relativas.

Page 13: Estadistica

• Para el caso de una variable categórica medida en escala nominal las columnas 2, 6, 7 y 8 carecen de sentido, ya que no hay ningún orden.

• En el caso de una variable categórica medida en escala ordinal la columna 2 carece de sentido.

• En el caso de una variable cuantitativa discreta la columna 2 carece de sentido, pues cada clase es equivalente a la marca de clase.

• En el caso de variables cuantitativas continuas utilizaremos todas las columnas 963.

• • • La inversión anual real de un grupo de industrias pesqueras

se detalla a continuación:

Page 14: Estadistica

10 8 6 10 2 6

16 25 30 30 6 18

13 21 6 14 15 27

0 6 9 13 18 30

12 5 6 7 15 39

12 40 8 30 8 14

20 28 26 4 10 17

17 7 8 7 19 22

14 8 11 15 20 60

6 5 8 12 36 52

Millones de dólares

Page 15: Estadistica

• Construya una tabla de frecuencia con intervalos (clase) de igual amplitud.

• Primeramente es conveniente ordenar los datos, generalmente de menor a mayor, una formula rápida de hacer esto es construir en tabligrama, también llamado diagrama de tabla y hoja

• TABLIGRAMA

0 0 6 8 6 5 7 8 5 6 6 9 6 8 8 8 7 4 7 2 6 8 6

1 0 6 3 2 2 7 4 1 0 4 3 5 2 5 8 5 0 9 8 4 7

2 0 5 1 8 6 0 7 2

3 0 0 0 6 0 9

4 0

5 2

6 0

Page 16: Estadistica

CONSTRUCCION TABLA DE FRECUENCIAS

• Determinar n° de intervalos = K. Ej = 8• Determinar amplitud del intervalo = a

• a = Rec/K ; Rec = max Xi – min Xi = 60 – 0 = 60

• a = 60/8 =7.5 8

• Intervalo (8) * Amplitud (8) = 64 rango table• Recorrido 60 4

Page 17: Estadistica

• Construir intervalos de clase

Page 18: Estadistica

• Li1 = Min Xi - / 2

• Ls1 = Li1 + a

• Li2 = Ls2

• Ls2 = Li2 + a

Inversion Real Xi ni fi % Ni Fi % Acum

[0 – 8[ 4 15 0.25 25 15 15/60 25

8 – 16 12 22 0.37 37 37 37/60 62

16 – 24 20 10 0.16 16 47 47/60 78

24 – 32 28 8 0.13 13 55 55/60 91

32 – 40 36 2 0.033 3.3 57 57/60 94.3

40 – 48 44 1 0.016 1.6 58 58/60 95.9

48 – 56 52 1 0.016 1.6 59 59/60 97.5

[56 – 64[ 60 1 0.016 1.6 60 1 100

60 1 100

Page 19: Estadistica

• n=3 • f2 = 0.37 ; por una empresa 37 invierten entre 8 y 16 millones • 100* f2 = 37%• N4 = 55 ; 55 empresas tienen inversiones inferior a 32 millones• F2 = 0,62 • 100*F2 = 62% ; el 62% tienen inversiones inferiores a 16

millones US$

Como complemento a las tablas están los gráficos, que pueden explicar mejor los datos.

Page 20: Estadistica

TIPOS DE GRAFICOS

• Histograma :

8 16 24 32 40 48 56 640

5

10

15

20

25

Histograma

n° empresas

Page 21: Estadistica

TIPOS DE GRAFICOS

8 16 24 32 40 48 56 640

5

10

15

20

25

Poligono de Frecuencia Absoluta

n° empresas

Page 22: Estadistica

MEDIDAS DE RESUMEN DE INFORMACION

• MEDIDAS DE TENDENCIA CENTRAL: Son medidas de un conjunto de datos que nos proporcionan un valor simple, que resume en gran volumen de información. Este valor tiende a ubicarse en el centro del conjunto.

Las medidas de tendencia central más conocidas son: • Media aritmética o promedio• Mediana • Moda• Percentiles • Media geométrica• Media armónica

Page 23: Estadistica

• Media aritmética o promedio:• Sea X una variable • X1, X2, ….. Xn sus respectivos valores• La media aritmética para este conjunto de datos

está dada por:

• Datos no agrupados:

Page 24: Estadistica

• Datos agrupados:

Page 25: Estadistica

• Para el caso de la inversión real para las 60 empresas son:

• X = 16.266.666,67 US$• X = 16,266666667 Millones de US$ (8

decimales)

Page 26: Estadistica

Propiedades de la media aritmética

• Definición

M.A de una constante

M.A de una cte. Por una variable

Page 27: Estadistica

• Ej: Sueldo promedio de los trabajadores de una empresa = $150000

• X= sueldo trabajadores • X= 150000• La empresa decide otorgar un reajuste de un 15%

determine nuevo sueldo promedio

• Y = nuevo sueldo • Yi = 1,15 xi• Y = 1,15 x =172.500

Page 28: Estadistica

• M.A de una constante ± variable

• Se le utiliza cuando a un promedio se le agrega o disminuye una cierta cantidad

• Yi = Xi + 30.000• Y = X + 30.000

Page 29: Estadistica

• Sean a y b constantes y x variable

• M.A ponderada: Supongamos tener n datos divididos en subgrupos o estratos, de tal manera que el grupo 1 tiene n1 obj con promedio

• X1, el grupo 2 tiene n2 obj con promedio

• X2, el grupo k tiene nk obj con promedio

• Xk

Page 30: Estadistica

• Luego el promedio total de las n observado esta dado por

• Donde n = n1 + n2 + … nk

Page 31: Estadistica

Mediana

Es el valor central de un conjunto de “n” observaciones• X1, X2 . . . Xn que han sido ordenados de menor a

mayor • Para datos no agrupados• Si n es impar existe un único valor de la mediana

ME = X

Page 32: Estadistica

• Si n es par la mediana es un promedio de los valores centrales

Page 33: Estadistica

• Ejemplo:• Para n impar: 4 – 5 – 6 – 6 – 7 (notas alumno) • Para n par: ingresos semanales • 5.000• 6.000 n=6• 6.000• 8.000• 10.000• 55.000

Page 34: Estadistica

• La mediana no se ve afectada por valores extremos como en el caso del promedio. Sin embargo, no utiliza gran parte de la información contenida en la muestra. A pesar de ello constituye una medida útil dando se trabajo con pequeños conjuntos de datos, en especial si estos contienen uno o más valores extremos.

• Datos agrupados

• Metodología:• Determinar el intervalo mediano, es decir, aquel primer

intervalo que se cumple Ni ≥ n/2 (intervalo “J”)

Page 35: Estadistica

• Ej: Ni ≥ 60/2 =30 → J = (8 – 16)

• Donde:• Li = límite inferior del intervalo mediano Ej: Li = 8 • A = amplitud del intervalo Ej: a = 8 • N(J-1) = frecuencia absoluta acumulada anterior al intervalo

mediano . Ej: N(J-1) = 15

• nj = frecuencia absoluta del intervalo mediano. Ej: n j = 22

Page 36: Estadistica

Moda (Mo):

• La moda de un conjunto de n datos es el valor de la variable que presenta mayor frecuencia o que más veces se repite.

• Ej: notas alumno: 4 – 5 – 6 – 6 – 7 • Moda = 6

• La moda no es única, puede ser bimodal, trimodal, etc.• Ej.: 4 – 4 – 5 – 6 – 6 – 7 • Moda = 4 y 6

Page 37: Estadistica

• Datos no agrupados• Metodología

• Determinar el intervalo modal• El intervalo con “ni” mayor.• Denotaremos el intervalo por “y”

Page 38: Estadistica

• Donde: • Δ1 = ny – n(y-1) = 22 – 15 = 7

• Δ2 = ny – n(y-1) = 22 – 10 = 12

• Mo = 8 + 8 = 10.95 . . . . millones de US$

Page 39: Estadistica

• Percentiles (Pk ; k = 1, 2, . . . 99)• El k-esimo percentil es un valor tal que

después de ordenar los datos x1, x2 . . . xn de menos a mayor, al menos el k% de los datos estará a la izquierda o bajo este valor y al menos el 100-k% de los datos estará a la derecha o sobre este valor

Page 40: Estadistica
Page 41: Estadistica

• Observaciones:Cuartiles (Qk ; k = 1, 2, 3)

Divide la distribución en 4 partes, 25% c/u

Page 42: Estadistica

• Deciles (dk ; k = 1, 2, . . . 9)

Divide la distribución en 10 partes iguales d1 = P10

d2 = P20

.

.

.d9 = P90

Page 43: Estadistica

• Datos agrupados MetodologíaDeterminar el 1er intervalo que se cumpla

• Se aplica la formula𝑁𝑖≥

𝑛∗𝑘100

Page 44: Estadistica

• Ejemplo: P75 ← Calcular → K =75

• El 75% tienen un valor inferior o igual a 22.4 millones de US$

• El 25% tiene un valor igual o superior a 22.4 millones de US$

Page 45: Estadistica

• Ejemplo: ¿Qué porcentaje de empresas realizo una inversión inferior a 27 millones de US$? ¿Cuantas empresas invirtieron entre 15 y 35 millones de US$?

Page 46: Estadistica

• El 83,3% de las empresas realizo una inversión inferior a 27 millones de US$

Page 47: Estadistica

• Media geométrica (Mg):• Datos no agrupados: sea Mg de 1 conjunto de x datos X1, X2 . . .Xn

se define como la raíz n-esima del producto de los n valores

Datos agrupados:

Se utiliza frecuentemente para promediar porcentajes o proporciones •

Page 48: Estadistica

MEDIDAS DE DISPERSION• Hay muchos casos en los que para un conjunto de datos se

necesita más información que la contenida en una medida de tendencia central. Ej.: consideremos los siguientes 3 conjuntos de datos

• C1 =

• C2 =

• C3 = Medidas de tendencia central para estos conjuntos

• C1: x = 4 Me = 4

• C2: x = 4 Me = 4

• C3: x=4 Me = 4

Page 49: Estadistica

• Esto demuestra que es necesario obtener indicadores que complementen las medidas de tendencia central.

• La dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central, generalmente el promedio.

• Las medidas de dispersión más conocidas son la varianza, deviación estándar (desviación típica), desviación media y coeficiente de variación.

Page 50: Estadistica

• Varianza (S2):• Datos no agrupados: La varianza de un

conjunto de n datos se define de la siguiente manera:

Page 51: Estadistica

C1:

C2:

C3: → Aquí están más concentrados los datos luego en el conjunto C1 y finalmente en el C2

La medida de tendencia central está mejor representada en C3

Page 52: Estadistica

• Observaciones• Se puede demostrar que la S2 para efectos de

cálculos también se puede calcular así:

Page 53: Estadistica

• Datos agrupados:

Ej.: x = 16,26

Page 54: Estadistica

• Observaciones

Page 55: Estadistica

Desviación estándar: (S)

Page 56: Estadistica

Desviación media: (D.M)

• Tiene como objetivo ver el grado de dispersión de un conjunto de datos.• Datos no agrupados

• C1:

• C2:

• C3:

• Datos agrupados

Page 57: Estadistica

Coeficiente de variación (cv):

• Nos entrega un índice de la proporción que representa la deviación estándar con respecto al promedio. Este coeficiente es útil cuando se trata de comparar variables que tienen distintas unidades de medida y esto definido por:

• La multiplicación por 100 tiene como motivo representar un %

Page 58: Estadistica

Propiedad de la varianza

• Def: V(x) = • Varianza de una constante: si tenemos un conjunto de datos iguales, la S2 = 0 no existe dispersión

• Varianza de una constante ± una variable: la dispersión se mantiene, ya que, al sumar o restar una constante la varianza sigue siendo igual

• Varianza de una constante por una variable

• Sean a y b constantes y x variable

NOTA: no existen varianzas ponderadas

Page 59: Estadistica

• Ejemplo: Un grupo de 40 cerdos tienen un peso medio de 85kg. Se decide alimentarlos mediante una dieta proteica que permite que cada cerdo suba de peso 1,2 kg. Por semana. Calcule el nuevo peso promedio y desviación estándar al cabo de la segunda semana, si se sabe que la desviación estándar al inicio es de 10 kg.

X = peso cerdo al inicio de la dieta (kg)Y = peso cerdo al cabo de la primera semana de dieta

• Z = peso al cabo de la segunda semana de dieta

• z = 2.4 + x = 87.4

Sz = 10 kg

Page 60: Estadistica

MEDIDAS DE FORMA:• Además de la tendencia central y de la dispersión se puede tratar de caracterizar la

forma de una distribución de frecuencia mediante un índice resumido (un indicador).Los índices F1 y F2 de Fisher son medidas de la asimetría y del aplastamiento,

respectivamente de una distribución de frecuencia.Cuando una distribución es simétrica la media aritmética, la mediana y la moda

son iguales.Una distribución de frecuencia es asimétrica sino es simétrica alrededor de la

media • F1 > 0

• F1 = 0

• F1 < 0

Page 61: Estadistica

Momento Muestral

Sea X1, X2 . . . Xn ; un conjunto de n medidas. Se define el n-esimo momento muestral respecto a la media como sigue:

• Datos no agrupados

• Datos agrupados

Observaciones• M1 = 0, M2 = S2

n

Page 62: Estadistica

Coeficiente de Asimetría (F1)

• F1=

Page 63: Estadistica

Coeficiente Aplastamiento (F2)

• Se define como:

• Este coeficiente mide la altura de la distribución. La constante 2 se elige de modo que el coeficiente sea 0 cuando la distribución es la normal. El coeficiente >0 si la distribución esta menos aplastada que la normal y negativo en caso contrario.

Page 64: Estadistica

Cuadros o tablas estadísticas.

• Resulta conveniente en algunas oportunidades distribuir la información en cuadros o tablas que permiten relacionar varias variables simultáneamente, logrando de esta forma una rápida apreciación de la información reunida.

• Para la mejor interpretación del contenido de un cuadro, debe procurarse que su lectura se haga sin recurrir al título y el titulo sea interpretado de manera tal que no sea necesario ver el contenido. Conforme a este criterio el titulo debe aparecer en cada página donde se extienda el cuadro, y así mismo el número que lo identifica.

Page 65: Estadistica

El formato del cuadro es el siguiente:

Columnamatriz

Total Categoría variable “B”B1, B2 . . . B

C V A1

A A A2

T R .E I .G A .O B .R L AiI E .A ”A” Ak

III. Casilla Casilla

IV. Cuerpo del cuadro III. Casilla

•Titulo

•Numero de cuadro

V. Nota

VI. Llamada

VII. Fuente de información

Page 66: Estadistica

• Numero del cuadro: Corresponde a una enumeración correlativa al momento de su publicación a objeto de referenciarlo con la interpretación y análisis de los datos

• Titulo: Debe ser lo más claro, breve y conciso y además debe responder a lo menos a las siguientes preguntas:

¿De qué se trata la información?(numero de alumnos, pacientes, etc.); ¿a quienes representa la información?(universidad, hospital, etc.) ¿lugar donde se realizo el estudio?(ciudad, país, región, etc.) y periodo que abarco el estudio (semana, mes, año, etc.)

Al confeccionar el titulo se utiliza la palabra “por” para referirnos a la o las variables incluidas en el encabezado y la palabra “según” , para las variables señaladas en la columna matriz. • Casilla: Es el cruce entre una columna de la variable B con una línea de la variable A.

La casilla nunca debe estar en blanco, en ella deberá aparecer una cifra o un símbolo convencional (generalmente un guion)

Page 67: Estadistica

• Cuerpo del cuadro: Corresponde al conjunto de columnas o líneas que contiene el cuadro en orden vertical u horizontal, es donde se colocan los datos sobre el hecho observado.

• Nota: Es la información de carácter general destinada a ofrecer conceptos o definiciones empleados o utilizados que aclaran el contenido de los cuadros o indican la metodología adoptada de los datos.

• Llamada: Es la información de carácter especifico que se aplica a determinada parte del cuadro

• Fuente de información: Es la indicación de la publicación o entidad responsable de la información o de la elaboración de los datos

Page 68: Estadistica

Ejemplo

• Titulo: número de alumnos facultad de ciencias económicas y administrativas, clasificados por carrera y según años de estudio aprobados. Universidad de Valparaíso. – año 1995 (a)

Carreras: Ing. Comercial y Auditoria. Años de estudio aprobados:12345

• Matricula al 21/03/95• Fuente: Sec. Estudio fac. cs. Ec. Y adm.• Se incluyo a 3 personas que rindieron examen de grado en marzo y titulación en tramite

Años de estudio aprobados

Total N° alumnos Fac. Cs. Econ. Y administrativas UV

TOTAL Ing. Comercial Auditoria1 2 3 4 5 15(b)

Page 69: Estadistica

Confección tabla estadística

• Titulo: n° alumnos facultad cs. Ec. Y adm. Clasificados por carrera y sexo, y según años de estudio aprobado y jornada de clase. Universidad de Valparaíso.- año 1995

• Sexo : Masculino/ FemeninoJornada: Diurna /Vespertina

Años de estudio aprobados

Total alumnos N° alumnos Fac. Cs. Econ. Y administrativas UV

Ing. Comercial AuditoriaTOTAL Total MF Sub

totalMasc. Fem. Sub

totalMasc. Fem.

1 2 3 4 5 Jorn. diurna 1 2 3 4 5 Jorn. Vespertina 1 2 3 4 5

Page 70: Estadistica

ANALISIS DE REGRESION:

• ELEMENTOS DE REGRESION LINEAL SIMPLE: El objetivo principal del análisis de regresión lineal simple es establecer una relación cuantitativa (en forma de una ecuación) entre dos variables relacionadas. Una vez que esta relación ha sido establecida es posible predecir el valor de una de las variables si se conoce el valor de la otra.

• El valor de aquella variable que se predice se denomina variable de respuesta o variable dependiente y se denota por la letra “y” en tanto que la variable conocida se llama variable independiente y se denota por “x”.

• Para estableces una relación entre x e y es necesario disponer de cierta información muestral. Esta información consiste en un conjunto de pares de observaciones de x e y, que denotaremos por (x1, y1); (x2, y2);…; (xn, yn) → como pares ordenados, donde n denota el tamaño de la muestra.

• Ejemplo: Una compañía fabrica cierto producto. Los lotes de producción varian cuando la demanda fluctúa. La tabla siguiente contiene el tamaño del lote de producción y el numero de horas hombre de trabajo para las corridas de producción en condiciones similares.

Page 71: Estadistica

ANALISIS DE REGRESION:

Corrida de producción Tamaño del lote (x) HH

1 30 73

2 20 50

3 60 128

4 80 170

5 40 87

6 50 108

7 60 135

8 30 69

9 70 148

10 60 132

Page 72: Estadistica

Diagrama de Dispersion

10 20 30 40 50 60 70 80 900

20

40

60

80

100

120

140

160

180

Diagrama de Dispersion

Page 73: Estadistica

El análisis de regresión simple se supone que la media de la ∆y (μy) depende de x es decir:μy= f(x)

La curva μy = f(x) es llamada CURVA DE REGRESION DE Y SOBRE X.En el caso de regresión lineal simple: μy = α +βx, llamada LINEA DE REGRESION DE Y SOBRE X. Es decir si ponemos el siguiente modelo lineal simple:Yi =α+βxi + εi i = 1, 2, 3,. . . nDonde ε1, ε2,…, εn son componentes de una desconocidos, los cuales son variables aleatorias no correlacionadas con Me = 0 y varianza = G2

Los α y β son parámetros desconocidos. Para conocer los valores de α y β se utiliza el método de min cuadrado que consiste en minimizar la suma de los errores al cuadrado, es decir:

Page 74: Estadistica

• Los valores de α y β que minimizan los errores al cuadrado, se llama ESTIMADORES MINIMOS CUADRATICOS, y están dados por

• n = 10

Page 75: Estadistica

Luego, la recta de regresión estimada es:

Asi, por ejemplo si el tamaño del lote es de 55(u), estimamos que la distribución de y para este lote tiene 1 medida:

Page 76: Estadistica

• Además tenemos que: • se conoce como VARIACION TOTAL la que se puede descomponer en dos partes: • • = variación explicada de la línea de regresión.• = variación no explicada o “error”• Para determinar que tan bueno es el modelo de la línea recta ajustada, utilizamos un

índice que considera la siguiente proposición:•

• • Donde

A este indicador se le conoce con el nombre de coeficiente de determinación y representa la proporción de la variabilidad en y explicada por la relación lineal con x.Nuestro ej: R2 = 0.9956 de la variabilidad total en hh es explicada en un 99.56% por los tamaños de lotes de producción.

Page 77: Estadistica

Observaciones:

• Frecuentemente el análisis de regresión es utilizado para hacer predicciones. En aplicaciones de este tipo es importante recordar que la validez de las aplicaciones de regresión dependen de las condiciones del periodo futuro, pues estas deben ser similares al periodo en el cual se basó el estudio.

• Otra precaución necesaria es con las inferencias relativas a niveles del predictos (x), fuera del rango de las observaciones.

• Existen relaciones entre variables que no son lineales.

Page 78: Estadistica

Correlación

El análisis de regresión es apropiado cuando una variable y depende de uno o mas variables x, entonces se estudia el efecto y la habilidad de x para predecir a y.Sin embargo, en primer término se puede estudiar el grado de asociación entre dos variables, sin considerar que una de las variables depende de la otra.

El conjunto de datos consiste de mediaciones de x e y basados en una muestra de n observaciones: (x1, y1); (x2, y2),…, (xn, yn)

Page 79: Estadistica

COEFICIENTE DE CORRELACION DE PEARSON:

• Una medida de regulación entre 2 variables es el coeficiente de correlación de Pearson que está definido por:

Page 80: Estadistica

Análisis de r • r = 1

• Relación más perfecta

• r = -1

• Relación menos perfecta • r = 0

• Variables no correlacionadas

Page 81: Estadistica

NÚMEROS ÍNDICES• Un número índice es una forma general una cifra relativa (expresada en términos de

porcentaje), que representa las variaciones medias en precios, cantidades o valor, de uno o más itemes en un periodo dado, respecto del periodo base que se elige como referencia. Debe quedar bien en claro, que los índices tratan de cuantificar variaciones y no expresar si los precios son altos o si se ha producido mucho. Solo pretenden comparar dichas cantidades con otras que se consideran como referencia. Estos índices se utilizan para comparaciones en el tiempo y en el espacio (entre dos o más ciudades o países).

Como en el caso de los estadígrafos ya estudiados, los números índices proporcionan una idea o estimación sobre los cambios en la matriz a en que indica, sin que se pueda decir que ellos miden algo. Un mismo fenómeno (producto, comercio exterior, precios) se puede cuantificar mediante dos o más formulas, bases, ponderaciones o números de componentes diversos, lo que da lugar a diferentes índices o valores para un mismo fenómeno como la selección de los elementos que conforman un índice, en última instancia, provienen de una selección o muestreo y debe tratarse que dicha selección sea constantemente representativa, que lo que indica periódicas revisiones del índice.

Page 82: Estadistica

SELECCIÓN PERIODO BASE• Para cuantificar las variaciones de una serie durante un periodo determinado es necesario

calcular el correspondiente número índice. Para ello se requiere homogeneizar los datos, pues, por ejemplo, los precios se expresan en diferentes unidades (pesos por unidad, por kg, por docena, etc.)

Esta situación se puede obviar mediante el uso de precios relativos, que resultan al comparar por cociente los precios de cada uno de los correspondientes artículos con los del periodo utilizado como base y que se emplea como referencia.

La determinación del periodo base depende del destino del índice. Si únicamente interesa conocer como han variado los precios (o cantidad) entre dos años extremos de un periodo determinado, basta tomar como base el año inicial del periodo.

En cambio, para una serie continua de índices anuales o mensuales, es de gran importancia ubicar un periodo que no presente anomalías. Es conveniente que el año base no esté muy lejano y que sea “normal”. Sin embargo, es difícil encontrar un año donde no exista un fenómeno externo o interno que repercuta en la economía de un país: sequias, inundaciones, guerras, baja o alza del precio externo de un artículo preponderante en el comercio exterior del país, etc. Además en la determinación del periodo base suelen intervenir muchos factores que escapan al control del estadístico o economista.

Page 83: Estadistica

TIPOS DE ÍNDICES:

• Índices simples: Si se desea expresar todas las cifras de una serie anual o mensual de valores en función de otra que se considera como base, entonces se trata de índices simples, que no es otra cosa que el porcentaje que representa cada valor observado, respecto del valor observado en el periodo base.

Al calcular el índice de cada valor de la serie respecto del periodo base, se dice que es un índice de base fija.

Si al calcular el índice se considera como base el periodo inmediatamente anterior, se dice que es un índice de base variable

Page 84: Estadistica

Ejemplo

• Precios de un artículo

Mes (t) Precio (xt) Indicé mes 1=100 (It) Indicé base variable

1 150 100 ---

2 165 110 110

3 160 106.7 96.96

4 170 113.3 106.3

5 171 114 100.5

6 165 110 96.5

7 174 116 105.5

8 174 116 100

9 175 116.7 100.6

10 170 113.3 97.14

Page 85: Estadistica

• • Variación del índice = • • Si disponemos de información únicamente respecto a un índice de base fija,

entonces la variación se obtienen de la siguiente manera:•

• • Variación de precios del mes 10 con respecto del mes 3•

Page 86: Estadistica

Cambio base• De una base fija a otra base fija: se divide cada índice de la serie, por el índice del nuevo periodo base. Por

ejemplo: si se desea un índice con base en el mes 5 = 100, debo dividir todos los valores de la serie por 114. • Cambio de base fija a base variable: Se obtiene dividendos con índice de base fija por el índice del periodo

inmediatamente anterior

• Cambio de base variable a base fija:

Ejemplo:Base = mes 1 = 100

Base = Mes 5 = 100

• *100

Page 87: Estadistica

Índices agregativos simples

Productos Precios ($ x quintal) Precios relativos*100

Cosecha (miles qq) Cantidades relativas*100

1990 p0 1994 pt 1990 q0 1994 qt

Trigo 7700 18030 234.2 11158 13044 116.9

Cebada 7480 19850 265.4 1196 1357 113.5

Avena 8220 15830 192.6 1111 1326 119.4

Maíz 8150 23030 282.6 1460 1840 126.0

Frijoles 27110 44030 162.4 859 997 116.1

Arroz 8270 18920 228.8 1106 870 78.7

Garbanzos 15920 53830 338.1 41 59 143.9

Papas 9380 20590 219.5 6686 7978 119.3

Lentejas 26690 42140 157.9 204 202 99.0

Sumas 118920 256250 2081.5 23821 27673 1032.7

Page 88: Estadistica

Índices agregativos simples• Si se tienen los precios de diversos artículos, podría calcularse, como

primera aproximación, un índice de precios agregativo simple, sumando los precios para el periodo y dividiendo cada total por la suma de los correspondientes precios en el periodo base, es decir:

• • El precio de estos artículos aumentó en 115,48% respecto del ’90.

Page 89: Estadistica

• De igual forma es posible obtener un índice de cantidad agregativo simple en este caso:

• Las cantidades producidas en el ’94 aumentaron en 16.17% respecto del ’90.

Ahora bien, si calculamos los precios relativos para cada artículo, podemos obtener el índice de precios de SAVERBECK, promediando los precios relativos. El precio relativo se obtiene para cada artículo mediante el cociente: Pt / P0

• S

• De igual forma obtenemos el índice de cantidad de SAVERBECK que corresponde al

promedio de las cantidades relativas. • SQt =

Page 90: Estadistica

ÍNDICES PONDERADOS• Un índice de precios es un promedio relativo (precios o cantidades). Pero los

precios de un grupo de artículos, y especialmente sus variaciones, no tiene igual importancia desde el punto de vista de un producto, un consumidor, el gobierno o de una dueña de casa. Un aumento de $50 en el precio del kilo de pan y en el kilo de té, tienen el mismo efecto en el índice agregativo simple, pero la incidencia es distinta en el índice de SAVERBECK, ya que en este ultimo los índices del té y del pan varían en distinta proporción. Es indudable que en un presupuesto familiar, las variaciones absolutas o relativas de los distintos productos representen en diferente forma. Por lo tanto para calcular adecuadamente el promedio de los precios relativos, debe establecerse la importancia o “ponderación” de cada artículo en dicho presupuesto, ya que varía según el nivel económico, los gustos, y los gastos de la familia. Los índices calculados mediante fórmulas en las cuales no aparece explícitamente una ponderación (como los mencionados), no pueden reflejar adecuadamente la realidad económica.

Existen numerosas fórmulas de índices ponderados (139), pero aquí veremos las más importantes.

Page 91: Estadistica

INDICE DE LAS PEYRES:

• De precios:

• L I t =

• Mide la variación de precios en el periodo actual respecto del periodo base considerando las cantidades conseguidas en el periodo base.

• De cantidades:

• L Q t =

Page 92: Estadistica

INDICE DE PAASCHE:

• De precios:

• p I t =

• De cantidades:

• L Q t =

Page 93: Estadistica

• ÍNDICE DE LAS PEYRES

• L I 90 = 100

• L I 94 =

• INDICE DE PAASCHE:

• p I 90 = 100

• p I 94 =

Page 94: Estadistica

INDICE DE PRECIOS AL CONSUMIDOR (IPC)

• El primer índice que se construyo fue en el año 1923 y que utilizo como año base 1913, cuya canasta contenía 45 artículos.El segundo índice fue en el año 1928, que incluyo a empleado y la mano obrera, contenía 54

artículos. Y utilizo la fórmula de Las Peyes.En 1958 se realizó la primera encuesta de presupuestos familiares, y cuya información permitió

crear la canasta familiar, que podemos dividir en 4 rubros: alimentación, vivienda, vestuario y otros.En 1968 se realiza una segunda encuesta de presupuesto familiar luego se realizó una tercera

encuesta en 1978 y una cuarta en 1988. La tercera encuesta se realizó con una muestra de 5000 familias aproximadamente usando como base 1978 = 100. La misma cantidad de familias se utilizó en la cuarta encuesta que se realizó entre diciembre 1987 y noviembre de 1988 utilizando como base abril de 1989 = 100.

Formula de Las Peyres: (Se utiliza esta fórmula porque utiliza una base, ya que no sería posible calcularlo mes a mes. Además esta fórmula es utilizada en toda Latinoamérica, por lo tanto es posible realizar comparaciones).

• Reemplaza a

Page 95: Estadistica

NOCIONES DE PROBABILIDADES• Es cuantificar un hecho incierto. La teoría y el cálculo de probabilidades tuvieron su origen en los juegos de azar

en el siglo XVII. Los juegos de azar incluyen acciones en las cuales el resultado de la prueba es incierto, sin embargo, aun cuando el resultado de una prueba particular es incierto, existe un resultado que se puede predecir a largo plazo. Es decir, al repartir la prueba un gran número de veces, la regularidad de los resultados permite predecir alguno en particular, con cierto grado de confiabilidad. En la ciencia experimental se presenta también un tipo similar de incertidumbre y regularidad a largo plazo. Por

ejemplo en genética, es incierto saber si un descendiente será macho o hembra, pero en un plazo largo se conoce aproximadamente el porcentaje de descendientes que serán machos y el de aquellos que serán hembras. También podemos darnos cuenta que una compañía de seguros de vida, fija sus aranceles de acuerdo a la edad del asegurado, ya que, si viene cierto no puede predecir cuales son las personas de una determinada caracteristica que morirán a la edad de 65 años, si puede predecir en forma bastante satisfactoria cuantas de ellas morirán a los 65 años.

El concepto de probabilidad puede ser enfocado desde distintos puntos de vista, pero para cada uno de ellos es necesaria la definición de los siguientes términos:

• DEF: Experimento, Espacio muestral y sucesos • Experimento: Cualquier situación que se investigara cuyo resultado es incierto • Suceso posible: Conjunto de los resultados • Espacio muestral: Subconjunto del universo.

Page 96: Estadistica

• Entenderemos por experimento al proceso o actividad que tiene una gama de posibles resultados que pueden clasificarse y especificarse de antemano y cuyo resultado en particular es incierto. Así por ejemplo, un experimento puede ser lanzar una moneda para ver qué lado resulta al caer; o bien, examinar un cilindro de gas licuado de 15 kg. Que llegan a la planta envasadora de Lipigas, para verificar su estado de uso, o, tal vez medir las alturas alcanzadas por ciertas plantas que han sido tratadas por diferentes fertilizantes, con el objeto de comparar la efectividad de estos últimos, etc. El experimento lo denotamos con la letra ε

• Al conjunto de todos los resultados posibles de un experimento lo denominaremos espacio muestral y lo denotaremos por la letra S (Ω)

• Experimento → no determinístico o aleatorio• Espacio muestral → conjunto de todos los resultados posibles del experimento.

Page 97: Estadistica

• Ejemplo:• • E1 = Lanzar una moneda y observar el lado que muestra al caer• S = {Cara, Sello}• E2 = Lanzar un dado y observar el número que muestra la cara superior• S = {1, 2, 3, 4, 5, 6}• E3 = Encender una ampolleta y observar su estado• S = {Buena, Mala}• E4 = Encender una ampolleta y registrar su tiempo de duración hasta que se queme• S = {t / t ≥ 0} • E5 = Tomar la producción del día y contar el número de artículos defectuosos producidos• S = {0, 1, 2, 3,…, n}• E6 = Averiguar el número de hijos varones en las familias con 5 hijos en la V región• S = {0, 1, 2, 3, 4, 5}• E7 = Controlar la producción de una maquina verificando los artículos producidos hasta que salga un

artículo defectuoso• S = {1, 2, 3, 4…}

Page 98: Estadistica

• Llamaremos suceso a cualquier subconjunto del espacio muestral. Al conjunto 5 se le denomina suceso seguro. A los recesos formados por uno de los posibles resultados del experimento se les llama sucesos elementales.

• Ejemplo: Consideremos el experimento que consiste en seleccionar 3 piezas de la producción diaria de una máquina y observar si están defectuosas (D) o no defectuosas , si el interés es saber cuántas de estas piezas están en malas condiciones de venta, entonces S seria:

E = se eligen 3 piezas de la producción diaria para verificar su condición (D o )S = {0, 1, 2, 3}

Ahora bien, si el interés fuera identificar que piezas no están en condiciones de venta, entonces el espacio muestral adecuado será el siguiente • S = { DDD,, DD, DD,D,, D, }

Sucesos Sea A1 = { a lo mas una pieza defectuosa}

• A1 ≤ S

• A1 = {0, 1}

• A1 = {,D,, D }

Page 99: Estadistica

• Una vez que el experimento se ha desarrollado, solo puede ocurrir un suceso elemental. Diremos que un suceso A ocurre si ocurre alguno de los sucesos elementales contenidos en él.

• DEF: Sea E un experimento y S un espacio muestral asociado al experimento. Sean A y B

dos sucesos (es decir, A es un ≤ S, B < S) entonces AB y AB también son sucesos, ya que ambos son subconjuntos de S.

• Si AB = , entonces diremos que A y B son mutuamente excluyentesEjemplo:• A = {Todos productos buenos}• B = {Todos productos defectuosos}

• Si AB = , y además AB = S entonces diremos que son sucesos complementarios en S y los anotaremos por B = ( A complemento Ac)

(B es complemento de A en S), o bien, A = o Bc (A es complemento de B en S)

Page 100: Estadistica

Ejemplo

• E = Lanzar un dado• S = {1, 2, 3, 4, 5, 6} • A = {el resultado es par} = {2, 4, 6}• B = {el resultado es impar} = {1, 3, 5}

• AB = ,• AB = S• A = • B = Ac

Page 101: Estadistica

Probabilidades

• DEF: Sea E un experimento y S el espacio muestral asociado a ese experimento con cada suceso A<S (subconjunto)

• Asociamos un número real, llamando la probabilidad de A y denotado P(A) que satisface las siguientes condiciones.

• La probabilidad de A se encuentra entre:

• P(S) = 1

• Si A y B son dos sucesos mutuamente excluyentes, entonces P(AB) = P(A) + P(B)

• Si A1, A2 … An Son n sucesos excluyentes de par en par, entonces P(A1UA2U… UAn)

Page 102: Estadistica

Teoremas:

• Si es el conjunto vacio → P() = 0• Si es el complemento del suceso A, entonces

P() = 1 – P(A) o P(A) = 1 - P()• Si A y B son dos sucesos cualquiera, entonces

P(AB) = P(A) + P(B) - P(AB)• Si A, B y C son 3 sucesos cualquiera, entonces P(ABC) = P(A) + P(B) + P(C) – P(AB) – P(AC) – P (BC) + P(ABC)

Page 103: Estadistica

Espacio Muestral finito y resultados equiprobables

• Cuando alguna característica propia del experimento asigna que cualquier resultado elemental (es decir, cada resultado posible del experimento) tiene la misma probabilidad de ocurrir que cualquier otro suceso elemental, entonces se dice que el espacio muestral es equiprobable.

• Además si el espacio muestral consta de k sucesos elementales, igualmente probables, es decir, S = {a1, a2,…, ak}

• P(ai) = C i = 1, 2, 3,…, k , entonces P(S) = 1, lo que significa decir si uno todos los sucesos elementales P(a1Ua2U… U ak) = 1

Page 104: Estadistica

• Si A es un suceso subconjunto del S ACS, de tal manera que contiene r sucesos elementales, entonces P(A) = R/K

P(A) = numero de resultados favorables de

Ejemplo : Un lote consta de 16 artículos, 10 buenos, 4 con pequeños defectos y 2 con defectos graves, se elige un articulo al zar, determine las siguientes probabilidades:• El art. Es bueno • El art. Tienen un defecto grave• El art. Es defectuoso • E = elegir un articulo al azar

• A = {el articulo es bueno} P(A) =

• B = {el articulo tienen un defecto grave} P(B) =

• C = {el articulo es defectuoso} P(C) =

Page 105: Estadistica

• Un control de las fichas medicas de hombres diabéticos que concurrieron a una clínica proporciono los siguientes porcentajes

Suponga que un paciente es elegido del azar desde este grupo, y que los sucesos A, B y C se definen de la siguiente manera: • A = {el paciente presenta un estado grave}• B = {el tiene sobre 40 años}• C = {sus padres son diabéticos}

EdadDelPaciente

Estado de salud Leve Grave Padres diabéticos Padres diabéticos Si No si No

Mayor de 40 años 15 10 8 2 35Menor de 40 años 15 20 20 10 65Total 30 30 28 12 100

Page 106: Estadistica

• Calcule P(A), P(B), P(BC), y P(ABC)• Describa los siguientes sucesos verbalmente y encuentre sus probabilidades: (), (), () • P(A) = P(BC) = • P(B) = P(ABC) = • () = estado leve, menos de 40 años = • P() = • = • = • P() = • P() =

Page 107: Estadistica

Métodos de enumeración

• Un lote consta de 100 artículos, de los cuales 80 son buenos y 20 son defectuosos, se eligen 10 artículos al azar, sin sustituir un artículo antes que sea elegido el próximo. ¿Cuál es la probabilidad de que exactamente la mitad de tales artículos sea defectuoso? (siempre se asumirá sin sustitución)

• E = elegir 10 artículos al azar sin sustitución• A = {La mitad de los artículos elegidos son defectuosos}• S = {BBBBBBBBBB,DBBBBBBBBB…}• Al resolver el problema nos encontramos con que cada uno de los

elementos del espacio muestral consta de 10 artículos (i1 ,i2 ,i10 )¿ Cuantos hay de tales resultados?, y entre estos resultados

• ¿Cuántos tienen la característica de que exactamente la mitad sean defectuosos.

Page 108: Estadistica

Principio multiplicativo• Supongamos que un procedimiento designado como 1 puede

ocurrir de n1 maneras. Supongamos que un segundo procedimiento designado como 2 puede ocurrir de n2 maneras. También supongamos que cada una de las maneras de efectuar n1 puede ser seguida por cualquiera de las maneras de efectuar n2. Entonces el procedimiento que consta de 1 seguido por 2 se puede hacer de n1*n2 maneras.

• Un producto se arma en 3 etapas. En la primera etapa hay 5 líneas de armado, en la segunda etapa hay 4 líneas de armado y en la tercera etapa hay 6 líneas de armado. ¿De cuantas maneras puede moverse el producto en el proceso de armado?

5*4*6 =120 maneras.

Page 109: Estadistica

Principio aditivo

• Supongamos que un procedimiento, puede ocurrir de n1 maneras y que un procedimiento 2 se puede hacer de n2 maneras. Supongamos además que no es posible que ambos procedimientos se hagan juntos. Entonces el numero de maneras que se puede hacer 1 o 2 es n1 + n2.

• Proyectamos un viaje y debemos elegir entre el transporte por bus o por tren, si hay 3 rectas para el bus y dos para el tren, entonces hay 3+2=5 rutas posibles para el viaje.

Page 110: Estadistica

Permutaciones• "n” objetos diferente: de cuantas maneras se pueden ordenar (permutar) estos n objetos.

Observación: 0! = 1 Ejemplo Cuantos números diferentes de tres cifras puedo formar con los números 1-2-3 • 3! = 1*2*3 = 6 • {123, 132, 213, 231, 312, 321} Supongamos obtener n objetos diferentes. Deseamos escoge de estos objetos y permutar el r elegido, entonces, ¿de cuantas maneras puedo permutar esos r objetos? • N objetos diferentes → se eligen r → se permutan r • n Ejemplo: de una enciclopedia que consta de 8 tomos se eligen 4 tomos al azar y se ordenan. Determine el número de maneras de efectuar esta permutación.

• 8 = 1680

Page 111: Estadistica

Combinaciones

• Supongamos tener n objetos diferente. Estamos interesados en contar el número de maneras en que podemos escoger r de esos objetos con 0 < r ≤ n

Sin considerar el orden

Ejemplo: se dispone una enciclopedia con 8 tomos, de cuantas maneras se pueden elegir 4 de ellos.

Page 112: Estadistica

Permutaciones cuando no todos los objetos son diferentes

• supongamos tener n objetos tal que hay n1 objetos pertenecientes a la clase 2 y nk objetos pertenecientes a la clase k, donde

• n = n1+n2…+nk.• • Luego el numero de ordenar estos n objetos esta dado:•

• • Ejemplo: ¿Cuántos números de 4 dígitos se pueden formar con

1123 → 1123•

Page 113: Estadistica

• E = elegir 10 artículos • A = {exactamente la mitad son defectuosos}

BBBBBDDDDD

Page 114: Estadistica

• Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos graves. Se eligen dos artículos al azar sin sustitución, encuentre las siguientes probabilidades:

• Ambos sean buenos• Ambos tengan defectos graves• A lo menos 1 sea bueno• A lo más 1 sea bueno • Exactamente 1 sea bueno• Ninguno tenga defecto grave• Ninguno sea bueno

E = elegir 2 artículos sin sustitución • A = {ambos artículos son buenos}

E = {exactamente 1 bueno}

Page 115: Estadistica

PROBABILIDAD CONDICIONAL E INDEPENDIENTE

• probabilidad condicional: Sea E un experimento y S el espacio muestral. Sean A y B dos sucesos cualquiera, se define P(B/A), llamado la probabilidad de que B ocurra dado que el suceso A haya ocurrido, como sigue:

O bien

para un valor fijo de A satisface los postulados de probabilidad, es decir: • 0 ≤ ≤ 1• = 1

• = se lee probabilidad de B sobre A

Page 116: Estadistica

• Suponga que una oficina tienen 100 maquinas de escribir. Algunas son eléctricas (E) y otras manuales (M). además algunas son nuevas (N), mientras que otras son usadas (U). una persona entra a la oficina, escoge una maquina al azar y descubre que es nueva. ¿cual es la probabilidad de que la maquina sea eléctrica?

S E M

N 40 30 70

U 20 10 30

60 40 100

Page 117: Estadistica

• Si se sabe que al lanzar 5 monedas aparecieron al menos 2 caras, ¿Cuál es la probabilidad de que el número exacto de caras fuese 3?

• E = lanza 5 monedas• A = {Aparecer al menos 2 caras}• B = {El número exacto de caras es 3}

• #S = 2n → #S = 25 = 32

• S = {CCCCC, CCCCS, CCCSS, CSSS, CSSSS, SSSSS}

Page 118: Estadistica

• Se lanza un dado 2 veces. Determine la probabilidad de que:• La suma sea 7• Si la suma resulto ser 7, que uno de los lados muestre un nº2• Si uno de los lados es un nº2, que la suma sea 7

E = lanzar un par de dados#S = 6n → 62 = 36

• A = {la suma de los dados es 7}• B = {una de las caras es 2}

S 1 2 3 4 5 6

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Page 119: Estadistica

TEOREMA DE MULTIPLICACIÓN DE PROBABILIDADES

• La consecuencia más importante de la definición de probabilidad condicional se obtiene escribiéndola de la siguiente manera:

• O bien

Ejemplo:• Una caja contiene 4 tubos malos y 6 buenos, se sacan 2 a la vez, ¿Cuál es la probabilidad

de que ambos sean defectuosos?

• A = {en el primer tubo sea malo}• B = {en el segundo tubo sea malo}

Page 120: Estadistica

• 3 estudiantes: Pedro, Juan y Diego desean pedir un libro a José, pero este posee solo una copia. Para resolver el problema se hace la siguiente proporción: “voy a pensar un número del 1 al 3: y Pedro adivinara primero, si adivina le presto el libro. En caso contrario Juan tratara de adivinar; si adivina le presto el libro. En caso contrario le presto el libro a Diego. ¿Es correcto el método propuesto? En otras palabras ¿tienen todos igual probabilidad de que le presten el libro?

• A = {Prestan el libro a Pedro}• B = {Prestan el libro a Juan}• C = {Prestan el libro a Diego}

• D1 = {Pedro adivina}

• D2 = {Juan adivina}

Page 121: Estadistica

• Observaciones: Se puede generalizar el teorema anterior a más de los sucesos de la siguiente manera:

• Ejemplo:• 4 tubos malos se confunden con 6 buenos. Se eligen los tubos 1 a 1 hasta encontrar los 4 defectuosos.

¿Cuál es la probabilidad de encontrar el último tubo defectuoso?• En la cuarta prueba• En la quinta prueba• En la decima prueba 4M6B10• P(DDDD) = 4/10*3/9*2/8*1/7• P(BDDDD) = 6/10*4/9*3/8*2/7*1/6 = • BBBBBB DDDD

• P(BBBBBBDDDD) *

Page 122: Estadistica

• Definición: Se dice que los sucesos B1, B2, …, Bk representan una parición al espacio muestral S si

• Sea “A” un suceso respecto al espacio muestral S. por lo tanto podemos escribir

• Donde y son mutuamente excluyentes

• Por lo tanto

• Por teorema multiplicación de probabilidades.

• Por lo tanto (

• Llamado “teorema de probabilidad total”

Page 123: Estadistica

• Ejemplo: Una caja contiene 5 fichas rojas y 4 blancas. Una segunda caja contiene 6 fichas rojas y 5 blancas. Se traslada una ficha de la primera a la segunda caja al azar y posteriormente se extrae una ficha al azar de la segunda caja. ¿Cuál es la probabilidad de que la ficha extraida de la segunda caja sea blanca?

• C1 1ficha C2 1ficha• 5R 6R• 4B 5B

• A = {la ficha extraída de la segunda caja es blanca}• B = {la ficha trasladada fue roja}• C = {la ficha trasladada fue blanca}

• (

Page 124: Estadistica

Teorema de Bayes

• Supongamos que para el ejercicio anterior se traslada una ficha de la primera a la segunda urna y posteriormente se elige una ficha de la segunda urna la cual resulto ser de color blanco. ¿Cuál es la probabilidad de que la ficha trasladada desde la primera a la segunda urna también haya sido blanca?

Page 125: Estadistica

Ejercicios• Todas las noches el sr. X llega tarde a su casa. La Sra. X, que es una buena

esposa, le deja encendida la luz de entrada a la casa. La probabilidad de que el sr x llegue borracho es 0.60. si llega borracho hay una probabilidad de 0.90 de que olvide apagar la luz en tanto de que esta es solo 0.05 si llega sobrio.

• ¿Cuál es la probabilidad de que el sr. X apague la luz una noche cualquiera?• Dado que el sr. X apago la luz una cierta noche, ¿cuál es la probabilidad de que

haya llegado borracho? B = {el señor x llega borracho una noche cualquiera}A = {el señor x apaga la luz una noche cualquiera}

• Definición: Sean B1, B2,…, Bk una partición del espacio muestral S sea A un

nuevo suceso asociado a S. sin deseamos obtener probabilidad de (Bi dado A):

Page 126: Estadistica

SUCESOS INDEPENDIENTES• se dice que los sucesos A y B son independientes sin la probabilidad de la intersección es igual al

producto de las probabilidades:• • Nota: Se dice que los sucesos A, B y C son independientes si:

• (si ocurre el suceso A y no altera la probabilidad de ocurrencia de B) → Cada reposición

• Ejemplo: La probabilidad de que el hombre sobreviva a los 70 años es de 3/8 y que la mujer sobreviva a los 70 años es 5/7. ¿Cuál es la probabilidad de que una pareja que contrajo matrimonio a los 20 años celebre sus bodas de oro?

*son sucesos independientes

Ejemplo: (Sucesos Independientes)• Lanzamiento dado • Lanzamiento moneda

Page 127: Estadistica

VARIABLES ALEATORIAS INDEPENDIENTES

• Definición de variable aleatoria: Sea E un experimento y S el espacio muestral asociado al experimento. Una función x que asigna a cada uno de los elementos es un número real x(S) se llama variable aleatoria.

• Definición: El espacio Rx que es el conjunto de todos los valores posibles de x se llama el recorrido de x.

Ejemplo: Se lanza una moneda 3 veces y se define la variable aleatoria x como el numero de caras que aparecen. E = lanzar una moneda 3 vecesS = {SSS, SSC, SCS, CSS, CCS, CSC, SCC, CCC}X = número de caras que aparecen • X (SSS) = 0• X (SSC) = X(SCS) = X(CSS) =1• X (CCS) = X(CSC) = X(SCC) = 2 • X (CCC) = 3

• Rx = {0, 1, 2, 3}

Page 128: Estadistica

VARIABLES ALEATORIAS DISCRETAS (V.A.D)

• Definición: sea X una variable aleatoria si el número de resultados posibles de x, esto es el recorrido de x, es finito o infinito numerable, entonces llamamos a x una variable aleatoria discreta. Esto es, que se pueden anotar los valores posibles de x como:

• X1, X2 … Xn en el caso finito la lista continua indefinidamente.

La variable aleatoria significa que a los distintos elementos le asigno un número • Definición: Sea x una variable aleatoria discreta por lo tanto el recorrido de x consta a lo

mas de un numero de valores X1, X2, … Xn, … infinito numerable con cada resultado Xi asociamos un numero p(xi) = P(X=xi), llamado la probabilidad de xi. Los números p(xi); i=1, 2, 3 … (infinito numerable) deben satisfacer las condiciones siguientes.

• La función p definida anteriormente se llama función de probabilidad de la variable

aleatoria x • La colección de pares (xi, p(xi), i = 1,2 … se llama algunas veces distribución de

probabilidades de x o función de cuantía.

Page 129: Estadistica

Ejercicio:

• Una persona depositar US$ 1 si uno de los siguientes sucesos ocurre un cierto dia, US$2 si ambos ocurren y US$0 si ninguno ocurre.

• A = {llueve en Coquimbo}• B = {nacen mellizos en Santiago}

• Si P(A) = 1/5 y P(B) = 1/10

• Encuentre la distribución de probabilidades de x definida como el número de dólares depositados

• X = numero de dólares depositados

• Rx = {0, 1, 2}

Xi 0 1 2 ∑P(xi) 36/50 13/50 1/50 1

Page 130: Estadistica

Ejercicio• Una caja contiene 20 artículos, de los cuales 5 defectuosos y 15 buenos,

se eligen 4 artículos al azar y se define la variable aleatoria x como número de artículos defectuosos encontrados. Encuentre la distribución de probabilidades de x si:

• Los artículos se eligen sin sustitución• Los artículos se eligen con sustitución • X = número de artículos defectuosos encontrados • Rx = {0, 1, 2, 3, 4}

• Combinatoria

También considerando como distribución de probabilidades.

Page 131: Estadistica

Ejercicio

• Rx = {0,1,2,3,4}

Page 132: Estadistica

VARIABLES ALEATORIAS CONTINUAS (V.A.C)

• DEF: sea x una variable aleatoria continua supongamos que el recorrido de x está formado por un gran número de valores en un determinado intervalo. Se dice que x es una variable aleatoria continua si existe una función f llamada función de densidad de probabilidad (f.d.p) que satisface las siguientes condiciones.

• Para cualquier valor a, b Rx , a < b

• P(a < x < b) = • Ejemplo Sea x r.a.c con f.d.p • f(x) = 2x 0 < x < 1• 0 en otro caso

Page 133: Estadistica

FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA

• Sea x una variable aleatoria, discreta o continua. Definimos F como la función de distribución acumulativa de la variable aleatoria x como sigue:

Si x es una variable aleatoria discreta, entonces la distribución acumulativa es la ∑ de las probabilidades que me están dando. • Si X es v.a.d → • Si X es una v.a.c →

Ejemplo: (caso discreto)X = nº de dólares depositados

Xi 0 1 2 ∑

P(xi) 36/50 13/50 1/50 1

Page 134: Estadistica

• Caso continuo

= 0 en otro caso • →

Page 135: Estadistica

• Suponga que X definida como la duración en minutos de las llamadas telefónicas que llegan a una central, es una variable aleatoria con función de densidad de probabilidad. Dado por

• En otro caso • Si Encuentre la probabilidad de que:• Una llamada dure a lo más 3 min. • Una llamada dure más de 4 min.• Una llamada dure entre 3 y 6 min.• Si se sabe que una llamada duro 3 minutos determine la probabilidad

de que dure a lo mas 5 min.

X

0

Page 136: Estadistica

Page 137: Estadistica

FUNCIONES DE VARIABLE ALEATORIA

• DEF: sea C un suceso (subconjunto) asociado con un recorrido y (Ry). Se define B subconjunto del recorrido de x como sigue:

Si B y C están relacionados de esta manera, entonces los llamamos sucesos equivalentes.

Sea x una variable aleatoria en el espacio muestral S. sea Rx el recorrido de x. sea H una función real y consideremos la variable aleatoria y = H(x) con Ry. Para cualquier valor y suceso C e Ry definimos probabilidades de C como sigue:

Page 138: Estadistica

FUNCIONES DE VARIABLE ALEATORIA DISCRETA

• Caso 1: Si x es una v.a.d e y = H(x), entonces se deduce de inmediato que y también es una v.a.d

• Si x1,x2…, xn… son los valores posibles de x; p(xi) = P(x = xi) y H es una función tal que a cada valor posible “y” le corresponde exactamente un valor posible de x, entonces la distribución de probabilidades de y se obtiene como sigue:

A la función H es posible que para varios valores de x den el mismo valor de y

Page 139: Estadistica

EjemploSea y =2x + 3Ry ={-1, 1, 3, 5, 7, 9} → se obtienen reemplazando los valores de x en la función y

Sea y = x2

Ry= {0, 1, 4, 9}

Xi -2 -1 0 1 2 3 ∑

P(xi) 2/15 4/15 3/15 1/15 3/15 2/15 1

Yi -1 1 3 5 7 9 ∑

P(yi) 2/15 4/15 3/15 1/15 3/15 2/15 1

Page 140: Estadistica

• Caso 2: Puede suceder que x sea una v.a.c mientras que y es discreta.

Por ejemplo: Supongamos que x puede tomar todos los valores reales, mientras que se define:

Para obtener la distribución de probabilidades de y determinamos simplemente el suceso equivalente (en el recorrido de x) que corresponde a los diferentes valores de y.En el caso anterior la probabilidad de que y=1 es equivalente a la probabilidad de x ≥ 0 P(y=1) = P(x≥0) y prob y=-1 equivalente a probabilidad x<0 P(y=-1) = P(x<0)En el caso general si Y = yi es equivalente a un suceso a en el Rx entonces

Page 141: Estadistica

Ejemplo: Sea x la duración en minutos de las llamadas telefónicas que llegan a una central, cuya función de densidad de probabilidad está dada.

= 0 en otro caso Y la f.d.a

Si una llamada dura hasta 3 minutos, el valor de esta es de $100m si dura hasta 6 min el costo es de $300, y si dura más de 6 min el costo es de $1000

Yi 100 300 1000 ∑P(yi) 1

Page 142: Estadistica

Valor esperado de una v.a (esperanza matemática)

• Sea x una v.a.d con valores posibles x1,x2… xn sea p(xi) = p(x=xi) con y tomando valores y1, y2 … yn.

• El valor esperado de x denotado E(x), se define como:

Page 143: Estadistica

Ejemplo:

• Un jugador lanza una moneda 2 veces y gana $100 o $200 según si aparece 1 o 2 caras respectivamente mientras que pierde $ 150 si no aparece ninguna cara. ¿Cuál es la ganancia esperada del jugador? ¿ es favorable a el?

• x : numero de caras Rx = {0, 1, 2}

• y: ganancia Ry = { -150, 100, 200}

• DEF: Si x es v.a.c →

Xi 0 1 2 ∑P(xi) 1/4 1/2 1/4 1

Yi -150 100 200 ∑P(yi) 1/4 1/2 1/4 1

Page 144: Estadistica

PROPIEDADES VALOR ESPERADO

• Sea C = cte. → E(c) = C • Sea C = cte. Y X v.a • E(c ± x) = C ± E(x)• E(c * x) = C * E(x)

• Sean a y b constantes y x v.a → E(a ± bx) = a ± bE(x)

• Sea y = H(x) → E(y) = E(H(x))• Si x es v.a.d → E (H(x)) = • Si x es v.a.c → E(H(x)) =

Page 145: Estadistica

VARIANZA DE UNA V.A

Sea x una v.a • Se define varianza de x denotada V(x) (Gx

2)•

• Observación:

• PROPIEDADES DE LA VARIANZA: • Sea c = cte → V(c) = 0 • Sea c = cte y X v.a • V(c ± x) = V(x)• V(cx) = C2V(x)• Sean a y b constantes y x v.a →

Page 146: Estadistica

Distribución Benoulli

• Sea x una v.a.d que toma los valores posibles 0 y 1. Sea A un suceso cualquiera asociado a un experimento y S su espacio muestral.

• Se define x como:• X = {1 si el suceso A ocurre}• { 0 si el sucesi A no ocurre}

• Donde P(A) = p , cte. Si la función de cuantía de x es de la forma:

• Entonces se dice qe x tiene una distribución Bernoulli con parámetro p.

• Notación:

• TEOREMA: si

Page 147: Estadistica

Distribución Binomial• Consideremos un experimento E y sea A un suceso asociado con el experimento.

Supongamos que P(A) = p y por lo tanto • Consideremos n repeticiones del experimento en forma independiente.

Supongamos que P(A) = p, cte. Para las n repeticiones del experimento.• Definamos la v.a x como el número de veces que el suceso A ocurre con recorrido de x: • Rx = {0, 1, 2,…n} • Bajo estas características se llama a x como una v.a con distribución binomial con

parámetros n y p y cuya función de cuantía está dada por:

• Las repeticiones independientes del experimento se llaman ensayos de Bernoulli • Notación:

• TEOREMA: Si

Page 148: Estadistica

Ejemplo • Un examen de estadística consta de 10 preguntas cada una de las cuales tiene 4

alternativas. Si un estudiante desconoce completamente la materia, determine la probabilidad de que responda correctamente.

• Exactamente dos preguntas.• Ninguna pregunta • Al menos 1 pregunta

• A = {responder correctamente}

• P(A) = ¼ cte n = 10 preguntas

• X = numero de respuestas correctas • Rx = {0, 1, 2, 3,…,10}

Page 149: Estadistica

Distribución de Poisson

• Sea x una v.a.d que toma todos los valores posibles: 0,1,2… (infinito numerable)

• Si

Entonces se dice que x tiene una distribución de Poisson con parámetro (x > 0)𝞴

• Notación:

• TEOREMA: Si

Page 150: Estadistica

Ejemplo:

En Chile en promedio hay un terremoto cada 10 años. Determine la probabilidad de que:• Hayan dos terremotos en los próximos 10 años• No haya ningún terremoto el próximo año

• X = numero de terremotos en Chile en los próximos 10 años.

• Y = número de terremotos en Chile en un año

Page 151: Estadistica

Aproximación Binomial a Poisson

• Sea x una v.a.d distribuida

• Bajo estas condiciones se dice que x tiene aproximadamente una distribución de Poisson con parámetros = np𝞴

Page 152: Estadistica

Ejemplo:• Una compañía de seguros tiene 10 mil asegurados. La prob de que

uno de ellos fallezca en un accidente automovilístico durante un año es 0.01%.

• Determine la probabilidad de que en un año la compañía tenga que pagar 5 pólizas.

• X= número de asegurados fallecidos por accidentes de tránsito.

• np → 𝞴• P → 0

Page 153: Estadistica

Distribución Geométrica• : Sea E un experimento y supongamos que estamos interesados solo en la

ocurrencia o no de un suceso particular A. Supongamos que las repeticiones son independientes y que P(A) = P

• → (1 – p) constante para las n repeticiones.• Supongamos que repetimos el experimento hasta que el suceso A ocurre

por primera vez.• Sea x numero de repeticiones hasta que A ocurre por primera vez, con Rx

= {1,2…}• Luego p(x) = P(X = x) = qx-1 p x=1,2… • Luego p(x) es la distribución de cuantía de una distribución geométrica.

• TEOREMA: si x se distribuye geométrica → E(x) =1/p → V(x) = q/p2

Page 154: Estadistica

EjemploSe lanza un dado hasta que aparezca un 6. Determine la probabilidad de efectuar.• Exactamente 3 lanzamientos • Al menos 2 lanzamientos

• P = 1/6 q = 5/6

• X = numero de lanzamiento hasta que aparezca un 6

Page 155: Estadistica

Distribución Hipergeometrica• Supongamos tener N artículos de los cuales r pertenecen a la clase A (por

ejemplo defectuosos) y N – r no pertenecen a la clase A (no defectuosos). Se elige al azar y sin sustitución n de esos artículos (n < N), y se define la variable aleatoria x como numero de artículos elegidos pertenecientes a la clase A.

Luego la función de cuantía es:

• Entonces se dice que x tiene una distribución Hipergeometrica.

• TEOREMA: Si x hipergeometrica entoncesE(x) = npV(x) =

Page 156: Estadistica

Ejercicio prueba

• N = 12 x = numero de formularios con deducciones ilegitimas

n = 5 r = 4

Page 157: Estadistica

Distribución Uniforme• La v.a x que toma todos los valores posibles en el intervalo (a,b) en

donde a y b son finitos y si la f.d.p. de x está dada por:

= 0

• Entonces se dice que x uniformemente en (a,b) • Notación:

• TEOREMA: si entonces

Page 158: Estadistica

EjercicioSuponga que x la edad en años de los administradores de edificio es una v.a • Calcule la probabilidad de que un administrado de edificio tena menos de 58 años • Si se eligen 3 administradores de edificios al azar determine la probabilidad de que

exactamente dos de ellos tengan más de 64 añosX = edad de los administradores

• f(x) = 1/10 55 < x < 65= 0

• Y = numero de administradores mayores de 64 años

Page 159: Estadistica

Distribución exponencial

• Suponga que x es una v.a.c que toma todos los valores no negativos. Si la función de densidad de probabilidad de x está dada por:

• = 0 Entonces se dice que x está distribuida exponencialmente con parámetro α (α > 0)• Notación: • TEOREMA:

Page 160: Estadistica

Distribución normal

• La v.a x que toma todos los valores posibles reales, , tiene una distribución normal (Gaussiana) si su f.d.p. es de la forma

• Notación: • TEOREMA: Si

Page 161: Estadistica

Propiedades

• Simétrica respecto a μ

Page 162: Estadistica

Propiedades• Si μ = 0 y G2 = 1 no se llama normal estandarizada y su importancia radica

en que se encuentra tabulada su función de distribución acumulativa (F(x))

SI C > 0 →

Page 163: Estadistica

Propiedades

• TEOREMA: Sea Sea • COROLARIO: Sea y sea EJERCICIO• Sea

Page 164: Estadistica

VARIABLES ALEATORIAS BIDIMENSIONALES DISCRETAS

• Sea E un experimento y S el espacio muestral asociado al experimento. Sean: x=x(s) e y=y(s) dos funciones que asignan un numero real a cada uno de los resultados posibles s=S entonces llamamos a (x,y) v.a.b.

Definición: (x,y) es una v.a.b.d si los valores posibles de x, y son finitos o infinitos numerables. Es decir, los valores (x, y) se pueden representar como:• (xi,yi) , i=1,2…, j=1,2, …Definición: Sea (x,y) una v.a.b.d. con cada resultado posible (xi, yi) asociamos un número real P(xi,yi) que representa: P(X=xi , Y = yi) que satisfacen las siguientes condiciones:

Page 165: Estadistica

DISTRIBUCION MARGINAL Y CONDICIONAL

• Distribución marginal:

Xi 0 1 2 3 ∑

P(xi) 10/84 40/84 30/84 4/84 1

Yj 0 1 2 ∑

P(Yj) 35/84 42/84 7/84 1

Page 166: Estadistica

DISTRIBUCION MARGINAL Y CONDICIONAL

Distribución Condicional: El concepto de probabilidad condicional se puede presentar de la siguiente manera:• Ej: En general:

O bien

Page 167: Estadistica

VARIABLES ALEATORIAS INDEPENDIENTES

Definicion: Sea (x,y) una v.a.b.d. se dice (x, y) son v.a independientes si:

• Se debe cumplir en todas

VALOR ESPERDO (v.a.b)• Definición: Sea (x, y) una v.a.b.d. y sea