Modulo de estadística para la educacion superior

92
MODULO: METODOS ESTADÍSTICO PARA LA EDUCACIÓN SUPERIOR Del 20/05 al 10/06 del 2013 Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. En Educación Superior [email protected] fmartinezsolaris … cuenta de skype ESCUELA MILITAR DE INGENIERIA EMI UNIDAD DE POSTGRADO SANTA CRUZ

Transcript of Modulo de estadística para la educacion superior

MODULO: METODOS ESTADÍSTICO PARA LA EDUCACIÓN SUPERIOR

Del 20/05 al 10/06 del 2013

Por: Ing. M.Sc. Francisco Martínez Solaris

Mgs. En Educación Superior [email protected]

fmartinezsolaris … cuenta de skype

ESCUELA MILITAR DE INGENIERIA EMI

UNIDAD DE POSTGRADO SANTA CRUZ

METODOS ESTADÍSTICO PARA LA EDUCACIÓN SUPERIOR

Por: Ing. M.Sc. Francisco Martínez Solaris 23/05/2013

Evaluación •Evaluación escrita de acuerdo a cronograma

Por: Ing. M.Sc. Francisco Martínez Solaris 23/05/2013

Para tomar en cuenta •“La verdadera ignorancia no es la ausencia de conocimientos, sino el hecho de rehusarse a adquirirlos" (Karl R. Popper)

METODOS ESTADÍSTICO PARA LA EDUCACIÓN SUPERIOR

ESTADISTICA APLICADA

¿Por qué un maestrante debe saber Estadística?

POR QUÉ ESTUDIAR ESTADÍSTICA

• Porque los datos estadísticos y las conclusiones obtenidas aplicando metodología estadística ejercen una profunda influencia en casi todos los campos de la actividad humana.

• Este crecimiento, probablemente relacionado con el interés por aumentar la credibilidad y confiabilidad de las investigaciones, no garantiza que en todos los casos la metodología estadística haya sido correctamente utilizada, o peor aún, que sea válida.

6

POR QUÉ ESTUDIAR ESTADÍSTICA

• Todos los puntos expuestos anteriormente indican que la Estadística es una herramienta que ayuda a conocer la realidad. Sin embargo, también puede servir para distorsionar la verdad si no se tiene cuidado al usar los métodos estadísticos adecuadamente y si la interpretación de los resultados lo hacen incorrectamente.

• La mayor parte toma decisiones con información parcial.

7

POR QUÉ ESTUDIAR ESTADÍSTICA

8

Según Mark Twain hay tres clases de mentiras:

• La mentira • La maldita mentira • Las Estadísticas

ESTADÍSTICA

DESCRIPTIVA

PROPOSITO

METODOS

INFERENCIAL

PROPOSITO

METODO

• TABULARES • GRAFICOS • NUMERICOS

PROBABILISTICO

¿Qué es?...

ESTADISTICA APLICADA

Nociones Generales

Características

Ciencia encargada de la Recolección, Manipulación, Organización y Presentación de información de manera tal que ésta tenga una Confiabilidad determinada

ESTADISTICA APLICADA Nociones Generales

Población N Parámetros µ, σ2, p, etc

Muestra n=? Estadísticos Estadígrafos

Deducción

TECNICAS DE MUESTREO

INFERENCIA

ESTIMACION

ESTADISTICA APLICADA Nociones Generales

CENSO

MUESTREO

ESTADISTICA APLICADA Nociones Generales

MUESTRA Tipos

Probabilística

No Probabilística

Azar

Arbitraria

MUESTREO

Probabilístico

No Probabilístico

MAS, MAP y MAE

POBLACION

ESTADISTICA APLICADA Nociones Generales (Búsqueda de Información)

MUESTRA

Atributo (Información)

Variable

Cambiar

• Nombre

• Definición

• Rango de Valores

• Clasificación

Elementos

Tipos

Cualitativas

Cuantitativas

Categorías

Discretas

Continuas

ESTADISTICA APLICADA Nociones Generales (Búsqueda de información)

Variable

• Nombre

• Definición

• Rango de Valores

• Clasificación

Elementos

Medirse

Escalas de Medición

Nominal

De Razón

+

Ordinal

De Intervalo

ESTADISTICA APLICADA Métodos Tabulares

DESCRIPTIVA

METODOS

TABULARES

Sea X y Y dos variables y sea x1, x2, … xn y y1, y2, … yn, valores que toman las variables X y Y, y sean “a” y “b” dos constantes. Entonces:

Sumatoria

Propiedades

x1 + x2 + x3 + …xn y1 + y2 + y3 + …yn

n

iyi

1

n

ixi

1

ESTADISTICA APLICADA Propiedades de Sumatoria

ESTADISTICA APLICADA Métodos Tabulares/Ordenamiento

17

18

18

16

21

15

17

19

20

18

16

18

Edad (años)

Ordenándolo

15

16

16

17

17

18

18

18

18

19

20

21

Edad (años)

Valores extremos

Valores mas frecuente

Valores extremos

Desventaja

ESTADISTICA APLICADA Cuadro de Frecuencia

Edad (años)

fi fr Fia Fra

15 1 8.3 1 8.3

16 2 16.7 3 25.0

17 2 16.7 5 41.7

18 4 33.3 9 75.0

19 1 8.3 10 83.3

20 1 8.3 11 91.7

21 1 8.3 12 100

Total 12 100

Cuadros de Frecuencia

ESTADISTICA APLICADA Cuadro de Frecuencia

Lugar de realización del Diplomado

n %

Extranjero 19 13.87

Universidad Objeto de Estudio 87 63.50

Otras universidades bolivianas 31 22.63

Total 137 100

ESTADISTICA APLICADA Cuadro de Frecuencia

67.7 39.2 52.5 42.3 69.8 61.2

63.9 37.2 45.7 41.7 69.1 55.5

64.9 38.9 52.4 41.9 69.2 58.9

68.3 39.2 52.6 42.7 70.0 61.9

68.3 39.2 53.3 45.5 70.1 63.2

Cuadro de Frecuencia

La Estadística ofrece otra alternativa Tablas de Frecuencias Absolutas y Relativas

ESTADISTICA APLICADA Tabla de Frecuencia Absoluta y Relativa

Procedimiento

Definir el Número de Intervalos

K = 1 + 3.33* log n

≥ 5 ó ≤ 20 ó 25

Sturges

Tipo de Intervalos (Li - LS]

Ac = A/k A = Valor Máx.- Valor Mín.

Ac = Ajustada

MD = (RI – A)/2

RI = Ac*K > A

Construir la Tabla

ESTADISTICA APLICADA Tabla de Frecuencia

Intervalos de Clases PMC fi fr Fia Fra

37.1 a 42.6 39.85 8 0.27 8 0.27

42.6 a 48.1 45.35 3 0.10 11 0.37

48.1 a 53.6 50.85 4 0.13 15 0.50

53.6 a 59.1 56.35 2 0.07 17 0.57

59.1 a 64.6 61.85 4 0.13 21 0.70

64.6 a 70.1 67.35 9 0.30 30 1

30 1

ESTADISTICA APLICADA Métodos Gráficos

Métodos Gráficos Clásicos

Diagrama de Puntos

Histograma

Polígono de Frecuencias

Ojiva

Diagrama de Sectores

ESTADISTICA APLICADA Diagrama de Puntos

15 16 17 18 19 20 21

Edad (años)

ESTADISTICA APLICADA Histograma

ESTADISTICA APLICADA Polígono de Frecuencias

ESTADISTICA APLICADA Ojiva

ESTADISTICA APLICADA Diagrama de Sectores

137-------360

19 ------- x

(19*360)

X= = 49.9

137

Lugar de realización de estudios Postgraduales

fi Grados

Extranjero 19 49.927

Universidad de Interés 87 228.613

Otras universidades bolivianas 31 81.460

Total 137 360

ESTADISTICA APLICADA Diagrama de Sectores

ESTADISTICA APLICADA Métodos Numéricos

Cuando se desea comparar dos o más poblaciones o bien muestras, y si las variables de interés son de carácter numérico …

Los métodos tabulares no son los más recomendables

La Estadística oferta otra herramienta

llamada Métodos Numéricos

ESTADISTICA APLICADA Métodos Numéricos

Métodos Numéricos

Medidas de Tendencia Central

Medidas de Dispersión

Localizan el centro de una base de datos numérica

Cuantifican cuánto se dispersan los datos alrededor de una medida de tendencia central

ESTADISTICA APLICADA Medidas de Tendencia Central

Medidas de Tendencia Central

Promedio

Moda

Media Ponderada

Mediana

ESTADISTICA APLICADA Medidas de Tendencia Central/Promedio

Promedio

Población

Muestra

Media µ Poblacional

Es la sumatoria de las observaciones que toma una variable dividido entre el total de éstas

Se interpreta como el punto de equilibrio de una base de datos numéricas

Media Muestral x

Tiempo (minutos)

52.6

38.9

68.3

67.2

63.9

64.9

68.3

39.2

42.3

61.9

567.5

56.75

Suma

Promedio

Desviaciones

-4.15

-17.85

11.55

10.45

7.15

8.15

11.55

-17.55

-14.45

5.15

0 Suma

Propiedad

ESTADISTICA APLICADA Medidas de Tendencia Central

01

n

i

xxi

xxi

ESTADISTICA APLICADA Medidas de Tendencia Central

Media en datos tabulados

Si la tabla no presenta clases abierta es posible hacer una estimación de la media tomando en cuenta lo siguiente:

• PMC es el promedio de las observaciones de las observaciones que caben dentro del intervalos.

• PMC*fi proporciona una estimación de la suma de las observaciones que caben en el intervalo y como una tabla tiene k-ésimo intervalos entonces:

ESTADISTICA APLICADA Medidas de Tendencia Central

Intervalos de Clases PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

30

PMC*fi

318.8

136.05

203.4

112.7

247.4

606.15

1624.5

1624.5 = = 54.15 30 x

ESTADISTICA APLICADA Medidas de Tendencia Central

Cargo fi Salario

Rector 1 2000

Asesores 2 1200

Vic. Académico 1 1150

Vic. Administrativo 1 1250

Jefe de Carrera C.S 2 1000

Jefe de Carrera 5 800

Administrativo 2 600

Secretarias 9 120

Cuando los datos tienen diferente peso dentro de la base de datos, si desea obtener el promedio, la media aritmética no es la más indicada

ESTADISTICA APLICADA Medidas de Tendencia Central

Cargo fi (wi) Salario

(xi)

Rector 1 2000

Asesores 2 1200

Vic. Académico 1 1150

Vic. Administrativo 1 1250

Jefe de Carrera C.S 2 1000

Jefe de Carrera 5 800

Administrativo 2 600

Secretarias 9 120

Xiwi

2000

2400

1150

1250

2000

4000

1200

1080

15080

15080 = = 655.65 23

wx

ESTADISTICA APLICADA Medidas de Tendencia Central

Mediana (Me)

Datos sin tabular

Datos tabulados

Si los datos no se distribuyen simétricamente (curva simétrica) el promedio no es la mejor medida para localizar el centro de los mismos

(b-a)(0.5- c) Me = a + d

Me = xn/2 + 0.5

Impar

•Ordenar

Par

n

Me = (xn/2 + x n/2 + 1 )/2

ESTADISTICA APLICADA Medidas de Tendencia Central

Tiempo (minutos)

39.2

38.9

52.6

42.3

61.9

63.9

68.3

67.2

64.9

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

n es impar

Me

Me = xn/2 + 0.5

ESTADISTICA APLICADA Medidas de Tendencia Central

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

68.3

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

68.3

n es par

Me = (xn/2 + x n/2 + 1 )/2

61.9 + 63.9 Me = = 62.9 2

62.9

Mediana es aquella medida de tendencia central que antes y después de ella no existe más del 50% de la información

ESTADISTICA APLICADA Medidas de Tendencia Central

(b-a)(0.5- c) Me = a + d

a = Límite inferior de la clase de la Me

b = Límite superior de la clase de la Me

c = Fra una clase antes de la clase de la Me (Nj-1)

d = fr de la clase de la Me

Clase de la Mediana

• Complete la columna Fia

• Localice la menor Fia > n/2

• La clase a la que pertenece esta frecuencia es la clase de la mediana (Nj)

• La Clase antes de Nj es Nj -1

Intervalos

de Clases PMC fi fr Fia Fra

37.1 a 42.6 39.85 8 0.27 8 0.27

42.6 a 48.1 45.35 3 0.10 11 0.37

48.1 a 53.6 50.85 4 0.13 15 0.50

53.6 a 59.1 56.35 2 0.07 17 0.57

59.1 a 64.6 61.85 4 0.13 21 0.70

64.6 a 70.1 67.35 9 0.30 30 1

ESTADISTICA APLICADA Medidas de Tendencia Central

(b-a)(0.5- c) Me = a + d

a = Límite inferior de la clase de la Me

b = Límite superior de la clase de la Me

c = Fra una clase antes de la clase de la Me (Nj-1)

d = fr de la clase de la Me

n = 30

n/2 = 15

Nj = 17… (53.6 – 59.1)

Nj- 1 = (48.1 – 53.6)

(59.1-53.6)(0.5- 0.5) Me = 53.6 + = 53.6 0.07

Ubicación de la clase de la Me

ESTADISTICA APLICADA Medidas de Tendencia Central

Connotancia de Moda (Mo) en Estadística

En caso de existir es la (s) observación (nes) que más se repiten en una base de datos

Tiempo (minutos)

38.9

39.2

42.3

52.6

61.9

63.9

64.9

67.2

68.3

68.3

Distribuciones:

Unimodales

Bimodales

Etc.

Mo

ESTADISTICA APLICADA Medidas de Tendencia Central

(ficmo- ficpremo)

Mo = Licmo + Acmo

(ficmo-ficpremo) + (ficmo – ficpostmo)

Donde:

Licmo: Límite inferior de la Clase Modal

Acmo: Ancho de clase de la Clase Modal

Ficmo: Frecuencia absoluta de la Clase Modal

Ficpremo: Frecuencia absoluta de la Clase Premodal

Ficpostmo: Frecuencia absoluta de la Clase Postmodal

Clase Modal es la (s) que tiene(n) la mayor (es) fi

Intervalos

de Clases PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

ESTADISTICA APLICADA Medidas de Tendencia Central

(ficmo- ficpremo)

Mo = Licmo + Acmo

(ficmo-ficpremo) + (ficmo – ficpostmo)

(9 - 4)

Mo = 64.6 + 5.5 = 66.56

(9 - 4) + (9 – 0)

ESTADISTICA APLICADA Medidas de Dispersión

Medidas de Dispersión

Rango/Distancia/Amplitud o Recorrido

Varianza (Variancia)

Desviación Típica o Estándar

Coeficiente de Variación

Una medida de tendencia central por si sola no es tan importante. Por esta razón debe estar acompañada de una medida de dispersión

ESTADISTICA APLICADA Medidas de Dispersión

Rango Rango = Valor Máximo – Valor Mínimo

Varianza

Población ( σ²)

Muestra (S²)

Es el promedio de las desviaciones al cuadrado de las observaciones que toma una variable respecto a su media

2

12

N

xiN

i

ESTADISTICA APLICADA Medidas de Dispersión

xi (Desviaciones)2

52.6 17.2225

38.9 318.6225

68.3 133.4025

67.2 109.2025

63.9 51.1225

64.9 66.4225

68.3 133.4025

39.2 308.0025

42.3 208.8025

61.9 26.5225

Sumatoria 567.5 1372.725

Promedio 56.75

1372.725

S² = = 152.525mi²/est²

10 - 1

Desventaja

Desviación Típica S = √S²

S = √152.525 = 12.35 min/est

Interpretación x ± S

56.75 ± 12.35 min/est.

ESTADISTICA APLICADA

Intervalos de Clases

PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

Si la tabla no presenta clases abierta es posible hacer una estimación de la varianza de la siguiente forma:

𝑆2 = 𝑃𝑀𝐶 − 𝑥 ² ∗ 𝑓𝑖𝐾𝑖=1

𝑛 − 1

𝑆2 = 𝑃𝑀𝐶² ∗ 𝑓𝑖 −

(𝑃𝑀𝐶 ∗ 𝑓𝑖)2𝑘1

𝑛𝑘𝑖=1

𝑛 − 1

ESTADISTICA APLICADA Medidas de Dispersión

Intervalos de Clases

PMC fi

37.1 a 42.6 39.85 8

42.6 a 48.1 45.35 3

48.1 a 53.6 50.85 4

53.6 a 59.1 56.35 2

59.1 a 64.6 61.85 4

64.6 a 70.1 67.35 9

PMC*fi

PMC2*fi

318.8 12704.18

136.05 6169.8675

203.4 10342.89

112.7 6350.645

247.4 15301.69

606.15 40824.203

1624.5 91693.475

5103448.128130

30

5.1624475.91693

2

2

S

33624033.115103448.128S

𝑆2 = 𝑃𝑀𝐶 − 𝑥 ² ∗ 𝑓𝑖𝐾𝑖=1

𝑛 − 1

ESTADISTICA APLICADA Medidas de Dispersión

Todas las medidas de dispersión expuestas anteriormente son dimensionales (toman las unidades de medidas de las variables)

Existe otra medida de dispersión pero adimensional llamadas Coeficiente de Variación o Dispersión Relativa

x

SVC. 100*.

x

SVC

ESTADISTICA Deformación de Curvas Unimodales

Las medidas de dispersión cuantifican cuánto se dispersan los datos alrededor de una medida de tendencia central, pero, ¿Para donde se desvían los datos?, a la izquierda de la media, a la derecha o se distribuyen simétricamente.

Existen otras medidas aplicable solo a curvas unimodales que tratan de las deformación de curvas tanto de forma horizontal como vertical

ESTADISTICA Deformación de Curvas Unimodales

Asimetría

Asimetría Negativa

Asimetría Positiva

Curvas Simétricas

> Me > Mo x

< Me < Mo x

= Me = Mo x

ESTADISTICA Deformación de Curvas Unimodales

ESTADISTICA APLICADA Deformación de Curvas Unimodales

Curtosis

Curva Platicúrtica

Curva Leptocúrtica

Curva Mesocúrtica

Kur > 3

Kur < 3

Kur = 3

ESTADISTICA APLICADA Regresión Lineal Simple

Y

X1

X2 .

.

.

Xi

En el desarrollo de los eventos, puede ser que una variable sea afectada por el comportamiento de otra (s) variable (s)

Es de interés poder cuantificar este tipo de relación de manera que se pueda predecir una variable en función de otra

En Regresión Lineal Simple es de interés cuando una variable afecta el comportamiento de otra variable

Y: Variable Dependiente

X: Variable Independiente

Y = f(X) Propósito de la R.L.S: Predicción

ESTADISTICA APLICADA Regresión Lineal Simple

Por análisis de regresión se entiende al conjunto de métodos estadísticos que tratan con la formulación de modelos matemáticos que describen la relación entre variables y el uso de estas relaciones modeladas con el propósito de predecir e inferir.

Por Regresión Lineal Simple se entiende …

Supuestos del Análisis de Regresión Lineal Simple

“Y” es una variable aleatoria cuya distribución probabilística depende de “X”

Modelo de la Línea Recta

Homogeneidad de Varianza

Normalidad

Independencia

ESTADISTICA APLICADA Regresión Lineal Simple/Diagrama de Dispersión

Llamado también Ploteo de Datos, tiene como propósito mostrar la posible tendencia (en caso de existir) entre las variables “X” y “Y”.

Consiste en llevar los pares de valores “x, y” a un sistema de coordenadas (bidimensional)

Y

X

(x, y)

Rango de Sueldo (X) Inasistencias (Y) 11 18 10 17 8 29 5 36 9 11 9 26 7 28 3 35 11 14 8 20 7 32 2 39 9 16 8 26 6 31 3 40

ESTADISTICA APLICADA Regresión Lineal Simple/Diagrama de Dispersión

0

5

10

15

20

25

30

35

40

45

0 2 4 6 8 10 12

Inasi

stencia

Rango de Salario

ESTADISTICA APLICADA Regresión Lineal Simple/Métodos de Mínimos Cuadrados

El supuesto No 2 de RLS plantea que de existir una relación entre “X” y “Y”, ésta es una línea recta, por lo tanto se puede pensar en una ecuación de la siguiente forma:

De tal manera que se llegue a obtener una ecuación de la siguiente naturaleza:

Parámetros

Estimación

ESTADISTICA APLICADA Regresión Lineal Simple/Métodos de Mínimos Cuadrados

Uso de la Técnica de Mínimos Cuadrados (Carl Gauss)

A partir de muestras (x1, y1), (x2, y2), …(xi, yi) de las variables “X” y “Y”, se trata de obtener los estimadores . Para ello la Técnica de Mínimos Cuadrados minimiza la suma de cuadrado de las distancias entre los valores observados y los estimados de tal manera que :

Y

X

ESTADISTICA APLICADA Regresión Lineal Simple/Recta de Estimación

Estimada una vez la recta de Predicción y teniendo en cuenta que el propósito de la R.L.S es la predicción, se hace necesario estar seguro que la ecuación estimada es capaz de predecir.

Por esta razón es necesario validar la ecuación estimada

ESTADISTICA APLICADA Regresión Lineal Simple/Validación de la Recta de Estimación

Validación

Cálculo de Coeficiente de Determinación R²

Análisis de Varianza de la Regresión “ANARE”

Cuantifica la cantidad de la variabilidad de “Y” que puede ser explicada por “X”

R² ≥ 70%

ESTADISTICA APLICADA Regresión Lineal Simple/Validación de la Recta de Estimación/ANARE

Por análisis de Varianza se entiende, de forma general, a la partición de la variación total en fuente de variación conocida que en el caso de R.L.S son de acuerdo al siguiente modelo aditivo lineal:

xi= Variación debida a Regresión

εi = Variación debida al Error

FV gl SC CM Fc Ft (α, 1 glerror)

Regresión 1 SCRegresión CMRegresión CMRegresión/

CMError

Error n-2 SCError CMError

Total n.1 SCTotales

Regla de Decisión

NRHo : Fc ≤ Ft

RHo : Fc > Ft

ESTADISTICA APLICADA Regresión Lineal/Dibujo de la Recta de Estimación

La Recta de Estimación debe pasar por dos puntos obligados dentro del área de exploración, Las coordenadas de estos puntos son las siguientes:

y = -2.9274x + 47.348

R² = 0.7896

0

10

20

30

40

50

0 5 10 15

Ina

sist

enc

ia

Nivel Salarial

Diagrama de Dispersión y Recta de

Estimación

Dispersión

Lineal (Dispersión)

ESTADISTICA Regresión Lineal Simple/Bandas de Confianza

¿Hasta dónde es capaz de predecir la recta de predicción estimada?

0

10

20

30

40

50

60

0 5 10 15

Ina

sist

enc

ia

Nivel Salarial

Diagrama de dispersión, recta de estimación y

bandas de confianza

Diagrama de

Dispersión

Recta de Estimación

Banda Inferior

Banda Superior

ESTADISTICA Correlación Lineal Simple

Así como existen técnicas que cuantifican los cambios de una variable dependiente por un único cambio de la variable independiente, existen técnicas que cuantifican la asociación lineal entre dos variables, esta técnica es llamada Correlación Lineal Simple que se exprese como el coeficiente de correlación (r)

Este coeficiente indica el sentido de la asociación como también la magnitud de ésta, partiendo del hecho que el coeficiente de correlación lineal simple toma valores en el rango de: r es -1 ≤ r ≤ 1. Entre más se acerca a 1 el valor de r mayor es la asociación entre dichas variables.

ESTADISTICA Correlación Lineal Simple

Regresión Lineal Simple Correlación Lineal Simple

Mide la cantidad de cambios en “Y” por un único cambio en “X”.

Mide asociación lineal entre dos variables

Existe una variable dependiente y otra independiente

Es indistinto x, y ó y, x

β1 puede tomar cualquier valor en la recta numérica

El coeficiente de correlación toma valores en el intervalo -1 ≤ r ≤ 1

ESTADISTICA APLICADA Correlación Lineal Simple

-1 ≤ r < -0.8 Asociación

fuerte y

negativa

0 ≤ r < 0.4 No hay

asociación

-0.8 ≤ r < -0.4 Asociación

débil y

negativa

0.4 ≤ r < 0.8 Asociación

débil y

positiva

-0.4 ≤ r ≤ 0 No hay

asociación

0.8 ≤ r ≤ 1 Asociación

fuerte y

positiva

ESTADISTICA Correlación Lineal Simple

𝒓 =𝟐𝟔𝟖𝟖 −

(𝟏𝟏𝟔 ∗ 𝟒𝟏𝟖)𝟏𝟔

(𝟗𝟓𝟖 −𝟏𝟏𝟔 𝟐

𝟏𝟔 )(𝟏𝟐𝟏𝟗𝟎 −(𝟒𝟏𝟖)𝟐

𝟏𝟔 )

= −𝟎. 𝟖𝟖𝟖𝟔𝟎

𝒓 = 𝒙𝒚 −

( 𝒙𝒊 ∗ 𝒚𝒊)𝒏

( 𝒙𝒊𝟐− 𝒙𝒊 𝟐

𝒏 )( 𝒚𝒊𝟐−( 𝒚𝒊)𝟐

𝒏 )

Probabilidad

PROBABILIDADES

Experimentos Aleatorios

Espacio Muestral,Eventos y Sucesos

Tipos de Experimentos Aleatorios

Relaciones entre Eventos

Enfoques de Probabilidad/Teoremas Básicos de Probabilidad

Eventos Dependientes/Independientes

Probabilidad Total/Teorema de Bayes

Experimentos

Determinísticos

No Determinísticos

Sus resultados se conocen con anticipación sin necesidad de realizar el experimento

Sus resultados se conocen una vez que el experimento ha finalizado

Es un proceso planificado a través del cual se obtiene una observación (o una medición) de un fenómeno

Se pueden describir los posibles resultados pero no se puede decir cuál de ellos ocurrirá

Experimentos Aleatorios Son experimentos no determinísticos cuyos resultados están regidos por el azar

PROBABILIDADES

Supóngase que se lanzan dos monedas legales al mismo tiempo y que a una cara de cada moneda se la llama “Cara” a la otra “Sol” entonces:

={CC, CS, SC, SS}

Supóngase ahora que se lanza un dado legal. Entonces:

={1, 2, 3, 4, 5, 6,}

Experimentos Aleatorios

Son aquellos experimentos no determinísticos cuyos resultados están regidos por la casualidad (azar)

PROBABILIDADES

M = {CC, CS, SC, SS}

O bien en el caso del lanzamiento del dado

M = {1, 2, 3, 4, 5, 6,}

Espacio Muestral

Retomando el caso del lanzamiento de las dos monedas, ¿hay otro posible resultado en este experimento?.

Son todos los resultados que están asociados a un experimento aleatorio

Supóngase que el lanzamiento del dado se está interesado en la ocurrencia de una cara impar

A = {1,3,5} Evento

Es subconjunto del espacio muestral, es decir, sus resultados pertenecen al espacio muestral

PROBABILIDADES

Espacio Muestral

Evento

2

1

3

4

5

6

M

A

Suceso (wi)

Letras Mayúsculas del Alfabeto

A= (wiεA /wi ε M)

PROBABILIDADES

Experimentos

Aleatorios

Simples

Compuestos

Un solo experimento aleatorio

Cuando ocurren dos o más experimentos simples al mismo tiempo o bien uno después del otro

Unidos por la partícula “ó” (v)

Unidos por la partícula “y” ( )

Los experimentos simples que lo componen ocurren de forma sucesiva

Los experimentos simples que lo componen ocurren al mismo tiempo

M = {M1∩M2…Mi} M = {M1UM2U…Mi}

PROBABILIDADES

Experimentos

Aleatorios

Simples

Compuestos

Un solo experimento aleatorio

Cuando ocurren dos o más experimentos simples al mismo tiempo o bien uno después del otro

M = {1, 2, 3, 4, 5, 6,}

M = {CC, CS, SC, SS}

PROBABILIDADES

M2

M1 C S

C CC CS

S SC SS

Experimentos compuestos unidos por la partícula “y”

M3

M1*M2 C S

CC CCC CCS

CS CSC CSS

SC SCC SCS

SS SSC SSS

El espacio muestral es el producto cartesiano de los espacios muestrales simples que lo conforman

PROBABILIDADES

Experimentos compuestos unidos por la partícula “y”

C

S

C

S

C

S

C

S

C

S

C

S

C

S

M

CCC

CCS

CSC

CSS

SCC

SCS

SSC

SSS

Diagrama del Árbol

Diagrama de Senderos

1ra Moneda

2da Moneda

3era Moneda

PROBABILIDADES

De acuerdo a cómo ocurren los eventos se pueden establecer algunas relaciones entre ellos tales como:

AUB

A B M

AUB

A B M

AΠB

A B M M

A A´

PROBABILIDADES

Enfoques de

Probabilidades

Clásico

Frecuencia Relativa

Probabilidad A priori. Llamada También Probabilidad de Laplace

Probabilidad A posteriore

Subjetivo

PROBABILIDADES

Probabilidad

Clásica

Supuesto

Frecuencia Relativa

Probabilidad A posteriore

Subjetivo

Todos los sucesos de un experimento aleatorio tienen la misma posibilidad de ocurrir, entonces:

M

naAP

10 AP

Si en la realización de experimento aleatorio aparece un evento A “n veces ≤ N”,entonces:

N

nAP

PROBABILIDADES

Teoremas Básicos de

Probabilidades

P[AUB] = P [A] + P [B]

P[AUB] = P [A] + P [B] – P[AΠB]

P[Ø] = 0

P[M] = 1

%1000/10 APAP

APAP c 1

PROBABILIDADES

Cuando la ocurrencia de un evento está en dependencia de otro evento, se dice que éste es dependiente.

Sea A y B dos eventos en el espacio muestral “M”, se dice que A es un evento dependiente de B sí;

Estas probabilidades se pueden calcular de dos formas:

• Respecto al espacio muestral original

• Respecto al espacio muestral del evento condicionante

0;

BPBP

BAPB

AP

0;

APAP

ABPA

BP

PROBABILIDADES Eventos Dependientes

En una institución de Educación Superior se tiene 300 docentes, de los cuales 100 son casados y 30 divorciados. En dicha institución hay 200 hombres, 85 de los cuales son casados y 95 son solteros. Determinar cual es la probabilidad de seleccionar un docente al azar: a. Que sea mujer b. Que sea soltero (a) c. Que sea un hombre y esté casado (a) d. Que sea una mujer divorciada e. Dado que el docente es casado (a), ¿cuál es la probabilidad que

sea hombre? f. Si el docente seleccionado es hombre, ¿cuál es la probabilidad que

sea casado?

PROBABILIDADES

En una universidad el 70% de los estudiantes son de Ciencias, 30% de Letras. De los estudiantes de Ciencias el 60% son varones y los de Letras son varones el 40%. Si se elige al azar un estudiante, calcule la probabilidad que: a. Sea mujer b. Se estudiante varón dado si es de Ciencias c. Sea estudiante de Ciencias dado que es varón d. Sea estudiante de Ciencias y varón.

PROBABILIDADES

Cuando la ocurrencia de un evento no está en dependencia de la ocurrencia de otro evento, se dice que éstos son independientes.

Sea A y B dos eventos en el espacio muestral “M”, se dice que A es un evento independiente de B sí se cumple con cualquiera de las siguientes condiciones:

BPAPBAP *

0;

APBPAP

ABPA

BP

0;

BPAPBP

BAPB

AP

PROBABILIDADES Eventos Independientes

Sea A1, A2, …, Ak, eventos que forman una partición del espacio muestral M y sea B, un evento en M. Si las probabilidades P[A1], P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak] son probabilidades conocidas entonces:

]/[][...]2/[]2[1/1 AkBPAkPABPAPABPAPBP

Probabilidad Total = AkBPAkPBPk

i/

1

PROBABILIDADES Probabilidad Total

Sea A1, A2, …, Ak, eventos que forman una partición del espacio muestral M y sea B, un evento en M. Si las probabilidades P[A1], P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak]. Si B ya ha ocurrido y se está interesado en saber a cual de los eventos que forman la partición muestral se ha debido su ocurrencia, entonces se usa el denominado Teorema de Bayes

k

i AkBPAkP

AkBPAkP

BAkP

1

PROBABILIDADES Teorema de Bayes