Download - 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

Transcript
Page 1: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

1

ESTADÍSTICA

DEPARTAMENTO DE MATEMÁTICA APLICADA

Page 2: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

2

TEMA 1: ESTADÍSTICA DESCRIPTIVA

1.1 CONCEPTOS GENERALES.1.2 DISTRIBUCIÓN DE FRECUENCIAS.1.3 REPRESENTACIONES GRÁFICAS.1.4 MEDIDAS DE TENDENCIA CENTRAL.1.5 MEDIDAS DE DISPERSIÓN.1.6 MEDIDAS DE ASIMETRÍA.1.7 EL MODELO DE REGRESIÓN SIMPLE.

PRÁCTICAS

1. ESTADÍSTICA DESCRIPTIVA.2. MODELOS DE REGRESIÓN.

Page 3: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

3

PLANTEAMIENTO DEL PROBLEMA

OBTENCIÓN DE LA MUESTRA

TRATAMIENTO DE LA INFORMACIÓN

PLANTEAMIENTO DEL MODELO

ESTIMACIÓN Y CONTRASTE

CRÍTICA DE RESULTADOS

TEORÍA DE MUESTRAS

ESTADÍSTICA DESCRIPTIVA

CÁLCULO DE PROBABILIDADES

INFERENCIA ESTADÍSTICA

TOMA DE DECISIONES

Page 4: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

4

ESTADÍSTICA DESCRIPTIVATRATA DE DESCRIBIR CONJUNTOS DE DATOS RESUMIENDO LA INFORMACIÓN QUE ESTOS PROPORCIONAN, UTILIZANDO:

• TABLAS DE FRECUENCIAS•TÉCNICAS GRÁFICAS •TÉCNICAS ANALÍTICAS: MEDIDAS DE

POSICIÓN, DISPERSIÓN Y FORMA

Page 5: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

5

CONCEPTOS FUNDAMENTALES

• POBLACIÓN: conjunto de elementos o individuos de los que interesa estudiar alguna característica.

• MUESTRA: subconjunto de elementos de una población.

RAZONES PARA ESTUDIAR UNA MUESTRA

• Coste

• Tiempo

• Personal cualificado

• Procesos destructivos

Page 6: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

6

•Llamamos CARÁCTER a la cualidad objeto de nuestro estudio. Los caracteres pueden ser:

•Cuantitativos: la característica toma valores numéricos (número de peticiones a un servidor, tiempo entre peticiones consecutivas,etc)

•Cualitativos:la característica no toma valores numéricos (sexo, color de pelo, etc)

• Los caracteres cuantitativos se llaman VARIABLES ESTADÍSTICAS. Los caracteres cualitativos se llaman VARIABLES CUALITATIVAS.

• Las variables estadísticas pueden ser de dos tipos:

•DiscretasDiscretas: si la característica toma valores aislados (finitos o infinito numerable).

•ContinuasContinuas: si toma cualquier valor de uno o varios intervalos.

Page 7: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

7

1.2 DISTRIBUCIÓN DE FRECUENCIASSea una muestra de tamaño n; supongamos que X toma como valores distintos x1, x2 ,..., xk .

•FRECUENCIA ABSOLUTA DE xi: Es el número, ni , de veces que se repite xi. nn

k

ii

1

•FRECUENCIA RELATIVA DE xi: es el cociente entre la frecuencia absoluta y n.

n

NF

nN

ii

i

jji

1

•FRECUENCIA ABSOLUTA(RELATIVA) ACUMULADA DE xi. Si llamamos x*

1, x*2 ,..., x*

k a los valores ordenados de menor a mayor:

1,1

k

ii

ii f

n

nf

Frecuencia absoluta acumulada de x*i

Frecuencia relativa acumulada de x*i

Page 8: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

8

Se llama tabla o distribución de frecuenciastabla o distribución de frecuencias al conjunto de valores que toma la variable acompañados de sus respectivas frecuencias.

Distribución de frecuencias de la variable: nº de llamadasrecibidas en una centralita en períodos de un minuto

xi Frecuencia Frec. relativa0 40 0’441 26 0’292 14 0’163 6 0’074 3 0’035 0 0’006 1 0’01

Total 90 1

Distribución del motivo de compra de teléfono móvil (1999)Característica Frecuencia Frec. relativaEstar localizado 47 0’47

Llamar a mi familia 25 0’25Hablar con mis clientes 12 0’12

Sólo en caso de emergencia 11 0’11Charlar con los amigos 3 0’03

Enviar mensajes por pantalla 2 0’02

Total 100 1

Page 9: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

9

•Estas tablas son útiles para resumir la información de una variable cuando:

•El estudio está basado en pocas observaciones, a lo sumo 20

•El estudio está basado en muchas observaciones de una variable que toma pocos valores distintos, a lo sumo 20.

•Si el número de valores distintos que toma la variable es grande (mayor que 20), se agrupan los datos en intervalos para construir la tabla de frecuencias.

•Llamaremos a estas variables VARIABLES AGRUPADAS. Al resto nos referiremos como VARIABLES NO AGRUPADAS o sin agrupar.

Page 10: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

10

A estos intervalos se les llama intervalos de clase.

Al punto medio de cada clase se le denomina marca de clase.

El número de intervalos de clase lo determina la persona que está realizando el estudio, aunque una posibilidad razonable es tomar el entero más próximo a 1+3.3log10(n).

Si los valores que toma la variable están repartidos de manera homogénea, todos los intervalos se toman con la misma amplitud; en otro caso se tomarán intervalos de amplitud variable, procurando que no queden intervalos con menos del 5% de los datos ni con más del 30%.

VARIABLES AGRUPADAS EN INTERVALOS

Page 11: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

11

Los datos siguientes corresponden al consumo mensual de litros de leche de 40

familias:

10.1 20.1 60.3 20.1 40.3 67.4 21 80 10 2040 58 58 10 20 40 10 10 20 2010 20 10 20 85 60 43 21.4 22 22

42.8 30 40 80.2 72 20 42.7 59.8 103.3 20.1

N=40, 1+3’3log40=6’29, luego tomamos 6 intervalos. Como R=103’3-10=93’3 y 93’3:6=15’55, podemos tomar 6 intervalos de amplitud 16 repartiendo el exceso (2’7) entre el primer intervalo y el último. De este modo la agrupación en intervalos quedaría:

[xi xi+1) ni [9,25) 21

[25,41) 5 [41,57) 3 [57,73) 7 [73,89) 3 [89,105] 1

Como podemos observar hay intervalos con menos del 5% de los datos y con más del 30%, por lo que habría que optar por una agrupación en intervalos de amplitud variable.

Page 12: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

12

Una posible agrupación en intervalos de amplitud variable es la siguiente:

[xi xi+1) ni Amplitud[9,15) 7 6

[15,21) 10 6[21,40) 8 19[40,59) 6 19[59,70) 4 11[70,105] 5 35

Como puede observarse todos los intervalos contienen más del 5% y menos del 30% de los datos.

Page 13: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

13

1.3 MÉTODOS GRÁFICOS

•VARIABLES CUANTITATIVAS:Diagrama de barrasHistogramaPolígono de frecuenciasDiagrama de caja o box-plotDiagrama de sectores

•VARIABLES CUALITATIVAS:

Diagrama de rectángulosDiagrama de sectores

•OTRAS REPRESENTACIONES.

Page 14: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

14

DIAGRAMA DE BARRAS

NÚMERO DE LLAMADAS xi Frecuencia 0 40 1 26 2 14 3 6 4 3 6 1

Total 90

Sobre cada valor de la variable se levanta una barra cuya altura es proporcional a su frecuencia (absoluta o relativa)

La suma de las alturas de las barras es 90 porque hemos representado frecuencias absolutas

Número de llamadas

frec

uenc

ias

0

10

20

30

40

0 1 2 3 4 5 6

Page 15: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

15

HISTOGRAMA

Cada clase se representa mediante un rectángulo cuyo área es proporcional a su frecuencia (absoluta o relativa)

La altura de cada rectángulo es el cociente entre el área (frecuencia) y la base (amplitud del intervalo) o proporcional a dicho cociente

Page 16: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

16

22

20

18

16

14

12

10

8

6

4

2

10 20 30 40 50 60 70 80 90 100 110

[xi xi+1) ni [9,25) 21

[25,41) 5 [41,57) 3 [57,73) 7 [73,89) 3 [89,105] 1

En el ejemplo del Consumo de litros de leche, si agrupamos en intervalos de la misma amplitud:

Page 17: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

17

Y si los intervalos son de amplitud variable, el histograma queda:

2.2

2.0

1.8

1.6

1.4

1.2

1.0

0.8

0.6

0.4

0.2

10 20 30 40 50 60 70 80 90 100 110

[xi xi+1) ni Amplitud[9,15) 7 6

[15,21) 10 6[21,40) 8 19[40,59) 6 19[59,70) 4 11[70,105] 5 35

Page 18: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

18

POLÍGONO DE FRECUENCIASSi la variable es sin agrupar, el polígono de frecuencias se obtiene uniendo los extremos superiores de las barras en el diagrama de barras

Número de llamadas

frec

uenc

ias

0

10

20

30

40

0 1 2 3 4 5 6

Page 19: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

19

POLÍGONO DE FRECUENCIAS

Si la variable está agrupada en intervalos, el polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de cada rectángulo

2.2

2.0

1.8

1.6

1.4

1.2

1.0

0.8

0.6

0.4

0.2

10 20 30 40 50 60 70 80 90 100 110

Page 20: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

20

POLÍGONO DE FRECUENCIAS ACUMULADAS

Se obtiene levantando sobre el extremo superior de cada intervalo de clase una perpendicular al eje de abscisas cuya altura sea proporcional a la frecuencia acumulada (absoluta o relativa) del intervalo.

Sobre el diagrama de barras que se forma se construye el polígono de frecuencias acumuladas partiendo del extremo inferior del primer intervalo y uniendo los extremos de las barras del diagrama de barras

4.4

4.0

3.6

3.2

2.8

2.4

2.0

1.6

1.2

0.8

0.4

10 20 30 40 50 60 70 80 90 100 110

Page 21: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

21

DIAGRAMA DE SECTORES

El total de una característica se representa en un círculo.

El área de cada sector circular representa el porcentaje sobre el total de cada categoría.

Número de llamadas

valores012346

44,44%

28,89%

15,56%

6,67%3,33% 1,11%

Page 22: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

22

Cada categoría o modalidad se representa por un rectángulo cuya altura es proporcional a su frecuencia. Todos los rectángulos tienen la misma base.

Si se ordenan las categorías o clases por sus frecuencias (de mayor a menor frecuencia) se suele llamar a este gráfico diagrama de Pareto

DIAGRAMA DE RECTÁNGULOS

Page 23: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

23

0.5

0.4

0.3

0.2

0.1

Localizado Familia Clientes Emergencias Amigos Mensajes

Distribución del Motivo de compra de teléfono móvilCaracterística Frecuencia Frec. relativaEstar localizado 47 0’47

Llamar a mi familia 25 0’25Hablar con mis clientes 12 0’12

Usar en caso de emergencia 11 0’11Charlar con los amigos 3 0’03

Enviar mensajes por pantalla 2 0’02

Total 100 1

Page 24: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

24

DIAGRAMA DE SECTORES

Motivos para la compra de teléfono móvil

LocalizadoFamiliaClientesEmergenciasAmigosMensajes

47,00%

25,00%

12,00%

11,00%3,00% 2,00%

Page 25: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

25

Otras representaciones Otras representaciones gráficasgráficas

Page 26: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

261000 2000 5000 10000 15000 25000 50000

14.0

12.0

10.0

8.0

6.0

4.0

2.0

Población

blanca

Población

negra

Indice de

integración = 0.71

Ingresos

Polígonos de frecuencias porcentuales correspondientes a las

distribuciones de ingresos en familias de población blanca y

negra en los EE.UU. (1970)

Page 27: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

27

alfabet

PIB_capmort_inf

Diagrama de estrella llave o perfil radial

Page 28: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

28

ArgentinaBarbados Bolivia Brasil Colombia

Costa Rica Cuba Chile EcuadorEl Salvador

Estados UnidoGuatemala Haití Honduras México

Nicaragua Panamá Paraguay PerúRep. Dominica

UruguayVenezuela

Comparación de diagramas llave de distintos países

Page 29: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

29

Page 30: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

30

CUADRO GRÁFICO DE LA TEMPERATURA EN GRADOS RÈAMUR POR DEBAJO DE CERO

220006000

-30º 7-12 -24º 1-12-20º 28-11

-11º-21º 14-11

-9º 9-10

422000

33000

10000

60000

50000

20000

175000

37000

100000

98000

55000

MOSCÚ

28000

4000

Moskowa

Dniéper

Bèrérzina

Nièmen

Kowno Wuna

WuebokSmolensk

Chjab

Mojaisk

14000

LA CAMPAÑA DE RUSIA DE NAPOLEÓN. (E.J. Marey. 1885)

Page 31: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

31

MÉTODOS ANALÍTICOSMEDIDAS DE TENDENCIA CENTRAL• Moda• Media• Mediana • Cuantiles: cuartiles, deciles y percentiles

MEDIDAS DE DISPERSIÓN

• Rango o recorrido• Recorrido intercuartílico• Varianza y desviación típica• Desviación media• Coeficientes de variación

MEDIDAS DE FORMA

• Coeficientes de asimetría

Page 32: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

32

1.4 MEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMÉTICA: n

nx

xn

xx

k

jjj

n

ii

11

Por ejemplo, con los datos muestrales: 2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 se tienen dos modas: 4 y 6.

515

2827365342322

515

887766654443322

x

x

MODA, Mo: Es el dato que más se repite. Puede haber más de una moda.

Con los datos anteriores, se tiene:

Page 33: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

33

CUANTIL DE ORDEN , C: Es un valor tal que, ordenados en magnitud los datos, el 100% es menor que él y el resto mayor.

Utilizaremos los cuartiles cuartiles Q1, Q2, Q3 , los decilesdeciles D1,...,D9 y los

percentilespercentiles P1,...,P99 que corresponden a cuantiles con = 0.25, 0.5,0.75, = 0.1,...,0.9 y = 0.01,...,0.99 respectivamente.

MEDIANA Me: Es un valor tal que, ordenados en magnitud los datos, el 50% es menor que él y el 50% mayor.

2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

Page 34: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

34

Cálculo de cuantiles:Cálculo de cuantiles: (mediana, cuartiles y percentiles)

• Se ordenan los datos de menor a mayor.

• Se determina el valor n.

Donde n es el numero de datos

el orden del cuantil que queremos calcular

• Si n no es enterono es entero, se redondea al siguiente entero y el dato que ocupe ese lugar es el cuantil buscado.

• Si n = k es enteroes entero el cuantil buscado es la media entre xk y xk+1.2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 en este ejemplo n=15

La mediana será: Me = C0.5, es decir n=15*0.5 = 7.5, luego la mediana ocupa el lugar 8, x8 =Me=5

El segundo decil D2 = C0.2, es decir n=15*0.2=3, luego D2 es la media entre x3 y x4, D2=3

Page 35: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

35

ROBUSTEZ DE LA MEDIANA

Consideremos los datos del ejemplo anterior:

2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

Si añadimos un nuevo dato x16 = 34 y calculamos de nuevo la media y la mediana, obtenemos:

• Nueva media: = 6.8

• Nueva mediana: Me = 5.5

x

Page 36: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

36

COMPARACIÓN MEDIA-MEDIANA

• La media contiene más información porque usa los valores de todos los datos.

• La mediana es más robusta frente a los cambios en los datos.

• La media es más sencilla de calcular y se presta mejor a los cálculos algebraicos.

• Deben calcularse ambas pues proporcionan información complementaria.

Page 37: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

37

1.5 MEDIDAS DE DISPERSIÓN

Las medidas de centralización proporcionan una información incompleta del conjunto de datos.

Ejemplo: sean X e Y las notas de dos grupos de cuarenta alumnos, con distribuciones de frecuencias:

xi ni

0 20

10 20

yi ni

4.5 3

5 34

5.5 3

Para ambas variables la media es 5, pero en el segundo caso 5 es un valor más representativo de los datos que en el primero.

Las medidas de dispersión nos permiten valorar si el valor de la medida de tendencia central es , o no es , representativo.

Page 38: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

38

MEDIDAS DE DISPERSIÓN

Partimos de una muestra de tamaño n=15, 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

• RANGO O RECORRIDO: R = Max-Min =

7

1jj

2j

n

1i

2i nxx

15

1xx

n

1 V

7

1jj

2j

n

1i

2i

2 nxx14

1xx

1-n

1 s

Dt V2ss

8 - 2 = 6

7 -3 = 4

3.87

4.14

= 1.97

= 2.04

• RECORRIDO INTERCUARTÍLICO: RQ = Q3 - Q1 =

• VARIANZA:

• CUASIVARIANZA:

• DESVIACIÓN TÍPICA:

• CUASIDESVIACIÓN TÍPICA:

Page 39: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

39

• DESVIACIÓN MEDIA:

j

7

1jj

n

1ii nMex

15

1Mex

n

1Dm

• COEFICIENTE DE VARIACIÓN DE PEARSON:

DtCV

x

• COEFICIENTE DE VARIACIÓN MEDIA:

DmCVm

Me

= 1.73

= 0.394

= 0.347

Page 40: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

40

Ejemplo de cómo la varianza no sirve para comparar Ejemplo de cómo la varianza no sirve para comparar la dispersión de dos variables distintas:la dispersión de dos variables distintas:

Sea X el peso en Kg de una población de lagartos

Sea Y el peso en Kg de una población de tiburonesxi ni

0.4 3

0.45 4

0.5 6

0.55 2

yi ni

400 3

403 4

405 4

410 2

0.34 CV

0.026V ,473.0

x

0.0076 CV

9.846V 404,y

Page 41: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

41

DESIGUALDAD DE CHEBYCHEV

Entre la media y k veces la desviación típica se encuentran, como

mínimo el de los datos.%k

1-1100

2

Por ejemplo, si la media es 500 y la desviación típica es 20, en el intervalo:

estarán, como mínimo, el de las observaciones.

560,4403dtx 3dt,-x

%89%9

1-1100

Page 42: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

42

1.6 MEDIDAS DE ASIMETRÍA

•COEFICIENTE DE ASIMETRÍA DE FISHER:

3

13

1( )

( )

n

ii

x xn

CAFDt

•COEFICIENTE DE ASIMETRÍA DE PEARSON:

3( )x MeCAP

Dt

Page 43: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

43

Para ambos coeficientes, si:

•CAF>0 o CAP>0, la distribución es asimétrica a la derecha.

•CAF=0 o CAP=0, la distribución es simétrica.

•CAF<0 o CAP<0, la distribución es asimétrica a la izquierda.

CAF>0, CAP>0 CAF=0, CAP=0 CAF<0, CAP<0

Page 44: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

44

Información que se puede extraer Información que se puede extraer de un histograma:de un histograma:

Page 45: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

45

Renta familiar Longitud de piezas

Tamaño de partículasGasto en transporte

A B Longitud de piezas Tiempo entre accidentes

Page 46: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

46

DIAGRAMA DE CAJA (BOX-PLOT)

Se construye del siguiente modo:

•Con los datos ordenados se obtienen los tres cuartiles

•Se dibuja un rectángulo cuyos extremos son Q1 y Q3 y se indica la posición de la mediana mediante una línea.

•Se calculan los límites de admisión ( los valores que queden fuera se consideran atípicos)

)QQ(5'1QLS

)QQ(5'1QLI

133

131

•Se dibuja una línea desde cada extremo del rectángulo hasta el valor más alejado no atípico.

•Se marcan todos los datos considerados como atípicos.

Page 47: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

47

DIAGRAMA DE CAJA (BOX-PLOT)

Dato menor no atípicoMedia

Mediana

Dato mayor no atípico

Dato atípico

Box-and-Whisker Plot

Altura150 160 170 180 190 200

Dato atípicoQ1

Q3

Page 48: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

48

EJEMPLO: P.I.B.

Frequency Tabulation for PIB_cap

-------------------------------------------------------------------------------- Lower Upper Relative Cumulative Cum. Rel.Class Limit Limit Midpoint Frequency Frequency Frequency Frequency-------------------------------------------------------------------------------- at or below 0,0 0 0,0000 0 0,0000 1 0,0 2777,78 1388,89 53 0,4862 53 0,4862 2 2777,78 5555,56 4166,67 16 0,1468 69 0,6330 3 5555,56 8333,33 6944,44 15 0,1376 84 0,7706 4 8333,33 11111,1 9722,22 1 0,0092 85 0,7798 5 11111,1 13888,9 12500,0 3 0,0275 88 0,8073 6 13888,9 16666,7 15277,8 6 0,0550 94 0,8624 7 16666,7 19444,4 18055,6 11 0,1009 105 0,9633 8 19444,4 22222,2 20833,3 2 0,0183 107 0,9817 9 22222,2 25000,0 23611,1 2 0,0183 109 1,0000above 25000,0 0 0,0000 109 1,0000--------------------------------------------------------------------------------Mean = 5859,98 Standard deviation = 6479,84

Page 49: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

49

Summary Statistics for PIB_cap

Count = 109Average = 5859,98Median = 2995,0Variance = 4,19883E7Standard deviation = 6479,84Minimum = 122,0Maximum = 23474,0Lower quartile = 1000,0Upper quartile = 7467,0Skewness = 1,14565Coeff. of variation = 110,578%

Page 50: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

50

Box-and-Whisker Plot

PIB_cap0 4 8 12 16 20 24

(X 1000)

Histogram for PIB_cap

PIB_cap

frequ

ency

0 5 10 15 20 25(X 1000)

0

10

20

30

40

50

60

Page 51: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

51

Histogram for PIB_cap Europa

PIB_cap Europa

freq

uenc

y

0 5 10 15 20 25(X 1000)

0

2

4

6

8

10

Histogram for PIB_cap Africa

PIB_cap Africa

freq

uenc

y

0 1 2 3 4 5(X 1000)

0

3

6

9

12

15

Page 52: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

52

Summary Statistics for PIB_cap

Count = 13Average = 15854,1Median = 17500,0Variance = 1,70491E7Standard deviation = 4129,05Minimum = 8060,0Maximum = 22384,0Lower quartile = 13047,0Upper quartile = 18277,0Skewness = -0,713347Coeff. of variation = 26,0441%

Histogram for PIB_cap Europa Occidental

PIB_cap Europa Occidental

freq

uenc

y

7 10 13 16 19 22 25(X 1000)

0

1

2

3

4

Page 53: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

53

Summary Statistics for PIB_cap

Count = 21Average = 9434,0Median = 6680,0Variance = 4,28824E7Standard deviation = 6548,46Minimum = 2340,0Maximum = 23474,0Lower quartile = 4500,0Upper quartile = 15877,0Skewness = 0,833416Coeff. of variation = 69,4134%

Histogram for PIB_cap Europa no Occidental

PIB_cap Europa no Occidental

freq

uenc

y

0 5 10 15 20 25(X 1000)

0

2

4

6

8

10

Page 54: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

54

Box-and-Whisker Plot

PIB_cap

Europ

a

0

1

0 4 8 12 16 20 24(X 1000)

Page 55: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

55

Distintos diagramas de dispersión

Page 56: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

56

ESTUDIO DE REGRESIÓN: INFLUENCIA DE LA EDAD DE LA MUJER EN LA TASA DE ACIERTO EN LA REPRODUCCIÓN

ASISTIDA

30 2533 2632,5 2730 2834 2931 3034,5 3132 3231 3330 3429 3528 3627 37

24 3821 3920,5 4018 4115 4211 438 447 453 462 470 480 49

Tasa de acierto Edad

Tasa de acierto Edad

Page 57: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

57

Edad Tasa_de_acierto ------------------------------------------------------------Count 25 25 Average 37,0 21,26 Median 37,0 27,0 Mode 30,0 Variance 54,1667 142,711 Standard deviation 7,3598 11,9462 Minimum 25,0 0,0 Maximum 49,0 34,5 Lower quartile 31,0 11,0 Upper quartile 43,0 31,0 Skewness 0,0 -0,678661 ------------------------------------------------------------

Page 58: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

58

Plot of Fitted Model

Edad

Tasa

_de_

acie

rto

25 29 33 37 41 45 490

10

20

30

40

Dependent variable: Tasa_de_aciertoIndependent variable: Edad

Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------Intercept 77,4573 4,50004 17,2126 0,0000Slope -1,51885 0,119377 -12,7231 0,0000-----------------------------------------------------------------------------

Correlation Coefficient = -0,935732R-squared = 87,5594 percent

Page 59: 1 ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICA APLICADA.

59

Polynomial Regression Analysis-----------------------------------------------------------------------------Dependent variable: Tasa_de_acierto

Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -29,3195 10,4661 -2,80137 0,0104Edad 4,48076 0,580531 7,71839 0,0000Edad^2 -0,0810758 0,00781552 -10,3737 0,0000----------------------------------------------------------------------------- R-squared = 97,8884 percentR-squared (adjusted for d.f.) = 97,6964 percent

Plot of Fitted Model

Edad

Tasa

_de_

acie

rto

25 29 33 37 41 45 490

10

20

30

40