Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del Dia 2016-1/Cl… ·...

31
Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 2016-1 Universidad de Sonora Departamento de Matemáticas Área Económico A dministrativa Hermosillo, Sonora, a 09 de febrero de 2016.

Transcript of Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del Dia 2016-1/Cl… ·...

Materia: Estadística I

Maestro: Dr. Francisco Javier Tapia Moreno

Semestre: 2016-1

Universidad de SonoraDepartamento de Matemáticas

Área Económico Administrativa

Hermosillo, Sonora, a 09 de febrero de 2016.

En esta presentación, mostramos cómo elaborar una tabla de

distribución de frecuencias para variables cualitativas (no

numéricas) usando Excel y usar esta distribución para

representar en forma gráfica a las variables de estudio.

También se muestra cómo elaborar una tabla de distribución

de frecuencias para variables cuantitativas (numéricas) usando

Excel y usar esta distribución para representar en forma

gráfica a las variables de estudio.

Para hacer esto, usaremos los datos que se recopilaron en la

encuesta de los propósitos de principio de año 2016 y que

puedes tener acceso al documento Excel en mi página Web en

el apartado Prácticas de Laboratorio en la liga “Práctica 2”.

Introducción

Distribuciones y Gráficos para

Variables Cualitativas o Variables

NO Numéricas

Para saber el sexo predominante del grupo que contestó laencuesta, usamos la función de Excel:

=CONTAR.SI (rango, criterio).

Para conocer el número de Mujeres escribimos

=CONTAR.SI(B2:B30, "F") Ver documento Excel

El resultado que nos da Excel = 20.

Para conocer el número de Hombres escribimos

=CONTAR.SI(B2:B30, “H") Ver documento Excel

El resultado que nos da Excel = 9

Elaboración de Tablas de Distribución

Con la información anterior, podemos construir la distribución defrecuencias del sexo. Esto es,

Elaboración de Tablas de Distribución

SexoFrecuencia

absoluta

Frecuencia

relativa

Frecuencia

porcentual

Femenino 20 0.689655172 68.97%

Masculino 9 0.310344828 31.03%

Total 29 1 100%

Una vez construida la tabla de distribución de frecuencias ya

podemos representar gráficamente la variable cualitativa Sexo

del grupo encuestado.

TABLA 1. DISTRIBUCIÓN DE FRECUENCIAS DEL SEXO DE LOS ENCUESTADOS.

Para hacer la representación gráfica de una variable cualitativa,

en Excel se tienen varias opciones: (diagrama de barras,

diagrama de columnas, diagrama circular o de anillos)

Por ejemplo, si seleccionamos en Excel las celdas Femenino,

Masculino y las respectivas frecuencias absolutas e insertamos un

gráfico de barras, se tiene el gráfico de la figura 1.

Ejemplo introductorio

Tipo de diagrama

Barras

Columnas

Circular

Elaboración de gráficos en Excel

0 5 10 15 20 25

Femenino

Masculino

Número de encuestados.

Sexo

Femenino

Masculino

Figura 1. Sexo de los encuestados

En la figura 1 se observa que el sexo predominante de los encuestados es

el femenino con un 68.97%.

Elaboración de distribuciones en Excel.

Similarmente podemos procesar los datos de la pregunta 2,

relativa a la carrera que estudian los encuestados.

CarreraFrecuencia

relativa

Frecuencia

relativa

Frecuencia

porcentual

Administración 2 0.068965517 6.90%Contaduría 1 0.034482759 3.45%Finanzas 6 0.206896552 20.69%Mercadotecnia 17 0.586206897 58.62%Negocios y

Comercio Int. 3 0.103448276 10.34%Total 29 1 100.00%

TABLA 2. DISTRIBUCIÓN DE FRECUENCIAS DE LA CARRERA DE LOS ENCUESTADOS.

En esta ocasión se eligió insertar un diagrama de sectores.

Elaboración de gráficos en Excel.

LA7% CP

3%

FIN21%

MER59%

NCI10%

FIGURA 2. CARRERA DE LOS ENCUESTADOS

En la figura 2 se observa que el 59% de los encuestados pertenece a la

carrera de Mercadotecnia, 21% a la carrera de Finanzas, un 10% a la

carrera de Negocios y Comercio Internacionales, un 7% a la carrera de

administración y un 3% a la carrera de contaduría.

Distribuciones y Gráficos para

Variables Cuantitativas o

Numéricas

Para las variables numéricas discretas, el procedimiento para

construir la tabla de distribución de frecuencias es similar al de

las variables no numéricas. Por ejemplo, consideremos la

pregunta 3 de la encuesta relativa a la edad de los encuestados.

Primero ubicamos la edad menor con la función de Excel

=MIN(Rango)

Y después ubicamos la edad mayor con la función

=MAX(Rango)

Para =MIN(D2:D30), Excel calcula 18 años, y

Para =MAX(D2:D30), Excel calcula 22 años.

Ahora usamos la función =CONTAR.SI (rango, criterio). Para

calcular el número de encuestados de cada edad.

Distribuciones de variables no numéricas.

Siguiendo esta indicación, la distribución de las edades

del grupo de encuestados es la siguiente:

Construcción de Distribución de frecuencias

Edad Frecuencia

absoluta

Frecuencia

relativa

Frecuencia

porcentual

18 13 0.448275862 44.83%19 8 0.275862069 27.59%20 3 0.103448276 10.34%21 3 0.103448276 10.34%22 2 0.068965517 6.90%

Total 29 1 100.00%

En esta tabla se puede ver que: el 44.83% de los encuestados tiene 18

años, el 27.59% tiene 19, un 10.34% tiene 20 años, un 10.34% tiene 21

años y un 6.9% tiene 22 años.

TABLA 3. DISTRIBUCIÓN DE FRECUENCIAS DE LAS EDADES DE LOS ENCUESTADOS.

Para construir el histograma de las edades, sólo

seleccionamos las celdas donde se encuentran las

frecuencias absolutas. Una vez seleccionadas dichas

frecuencias, insertamos un gráfico de columnas (ver

diapositiva 6). Al seleccionar este gráfico se abren una

ventana importante que presenta distintas opciones de

color y de forma, seleccionas el color y la forma que mejor

te guste.

Construcción del histograma de variable

discreta.

Otra opción que aparece en la ventana es “el diseño

rápido”

Construcción del histograma de variable

discreta.

Diseño rápido.Opción con

títulos

Eliges una opción con títulos y con columnas separadas ya que se

trata de una variable discreta.

Para colocar las edades en el eje de las “x” se procede de

la manera siguiente: 1) se da un clic sobre las columnas del

gráfico y se presiona el botón derecho del mouse y aparece

una ventana con opciones. 2) se elige la opción

“seleccionar datos” y aparece otra ventana. 3) se elige

“editar” (el del lado derecho) y 4) se seleccionan las celdas

con las edades y se cierran las ventanas.

Construcción del histograma de variable

discreta.

Por último, para variar los colores de las columnas se hace

lo siguiente: 1) se da un clic sobre las columnas del gráfico

y se presiona el botón derecho del mouse y aparece una

ventana con opciones. 2) se elige la opción “Dar formato a

la serie de datos” y aparece otra ventana(al lado derecho

de la pantalla) 3) se da un clic en el “bote con pintura” y

se elige la opción relleno. 4) se palomea la opción “variar

colores” y listo.

Construcción del histograma de variable

discreta.

Gráfico de variables numéricas

0

2

4

6

8

10

12

14

18 19 20 21 22

Núm

ero

de e

ncuest

ados

Edad del encuestado.

Una vez que llevamos a cabo las indicaciones anteriores,

el histograma de las edades queda como se muestra en

la figura 3

Figura 3. Histograma de las edades de los encuestados.

Para las variables numéricas continuas, el procedimiento

para construir la tabla de distribución de frecuencias es

distinto al de las variables numéricas discretas. Por

ejemplo, consideremos la pregunta 6 de la encuesta

relativa al tiempo en que encuestados tienen pensado

llevar a cabo sus metas de 2016. Se tienen 5 categorías:

Distribuciones de variables no numéricas.

Intervalo de claseFrecuencia

absoluta

Frecuencia

relativa

Frecuencia

porcentual

Menos de 10 semanas 0 0 0.00%

de 10 a menos de 20 semanas 3 0.1875 18.75%

de 20 a menos de 30 semanas 2 0.125 12.50%

de 30 a menos de 40 semanas 5 0.3125 31.25%

más de 40 semanas 6 0.375 37.50%

Total 16 1 100.00%

TABLA 4. DISTRIBUCIÓN DE FRECUENCIAS DEL TIEMPO DE REALIZACIÓN DE METAS.

Para construir el histograma del tiempo en que los encuestadosllevarán a cabo sus metas, omitimos las clases o intervalos confrecuencia “cero”. Es decir, sólo graficamos los datos de la tablasiguiente:

Esta distribución muestra que el 37.5% de los encuestados requieremás de 40 semanas para llevar a cabo las metas propuestas del 2016,un 31.25% necesita de 30 a 40 semanas para lograrlas, un 12.5%requiere de 20 a menos de 30 semanas para lograrlas y un 18.75%requiere de 10 a menos de 20 semanas.

Histograma para variables continuas.

Intervalo de claseFrecuencia

absoluta

Frecuencia

relativa

Frecuencia

porcentual

De 10 a menos de 20 semanas 3 0.1875 18.75%

de 20 a menos de 30 semanas 2 0.125 12.50%

de 30 a menos de 40 semanas 5 0.3125 31.25%

más de 40 semanas 6 0.375 37.50%

Total 16 1 100.00%

TABLA 5. DISTRIBUCIÓN DE FRECUENCIAS DEL TIEMPO DE REALIZACIÓN DE METAS.

Una vez que seleccionamos las frecuencias absolutas de

frecuencia distinta de cero, insertamos un gráfico de

columnas y elegimos la opción con títulos y con columnas

pegadas ya que se trata de una variable continua.

Construcción del histograma de variable

discreta.

Diseño rápido.

Opción con

títulos

Ahora se repites el procedimiento de las diapositivas 15 y 16 para

realizar cambios en la escala del eje “x” y para varias los colores

de las columnas.

Figura 4. Histograma del tiempo del logro de metas.

Construcción de un histograma de

variable continua

0

1

2

3

4

5

6

´10-20 20-30 30-40 Más de 40

Núm

ero

de e

ncuest

ados

Número de semanas

Histograma de tiempo para el logro las metas

Construcción de

histogramas con variables

continuas abiertas

Para las preguntas abiertas de variables numéricas continuas, elprocedimiento para construir la tabla de distribución defrecuencias se construye de manera diferente. Se tiene quedeterminar primero los intervalos de clase. Por ejemplo,consideremos la pregunta 7 de la encuesta relativa a la cantidadde dinero requerida por los encuestados para lograr sus metas:

Primero ubicamos la cantidad de dinero menor con la función deExcel =MIN(Rango)

Y después ubicamos la edad mayor con la función =MAX(Rango)

Para =MIN(H2:H30), Excel calcula 395 pesos, y

Para =MAX(H2:H30), Excel calcula 80,000 pesos.

Ahora calculamos el RANGO = 80,000 − 395 = $79,605

Luego calculamos la AMPLITUD DEL INTERVALO =79,605

5=15,921

Distribuciones de variables continuas.

Elegimos la AMPLITUD DEL INTERVALO un poco más grande

que el valor dado en la división. Por ejemplo: 15921.5 y

construimos una tabla con los intervalos de clase y

aplicamos la función de Excel =CONTAR:SI:CONJUNTO para

calcular las frecuencias absolutas de cada clase de la

manera siguiente:

Distribuciones de variables no numéricas.

Intervalo de clase Función de Excel para calcular la frecuencia absoluta

394.5 a menos de 16316 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=394.5",$H$2:$H$30,"<16316")

16316 a menos de 32237.5 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=16316",$H$2:$H$30,"<32237.5")

32237.5 a menos de 48159 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=32237.5",$H$2:$H$30,"<48159")

48159 a menos de 64080.5 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=48159",$H$2:$H$30,"<64080.5")

64080.5 a menos de 80002 =CONTAR.SI.CONJUNTO($H$2:$H$30,">=64080.5",$H$2:$H$30,"<80002")

Aplicando las funciones dadas en la diapositiva anterior

obtenemos la distribución siguiente:

Distribuciones de variables no numéricas.

Intervalo de claseFrecuencia

absoluta

Frecuencia

relativa

Frecuencia

porcentual

394.5 a menos de 16316 11 0.78571429 78.57%

16316 a menos de 32237.5 1 0.07142857 7.14%

32237.5 a menos de 48159 0 0 0.00%

48159 a menos de 64080.5 1 0.07142857 7.14%

64080.5 a menos de 80002 1 0.07142857 7.14%

Para poder graficar el histograma necesitamos eliminar las clases con

frecuencia cero.

Eliminando las clases de frecuencia cero, se tiene la

distribución de frecuencias de la tabla 6.

TABLA 6. DISTRIBUCIÓN DE FRECUENCIAS DE LA CANTIDAD REQUERIDA POR

LOS ENCUESTADOS PARA CUBRIR SUS METAS DEL 2016.

Distribuciones de variables no numéricas.

Intervalo de claseFrecuencia

absoluta

Frecuencia

relativa

Frecuencia

porcentual

394.5 a menos de 16316 11 0.78571429 78.57%

16316 a menos de 32237.5 1 0.07142857 7.14%

48159 a menos de 64080.5 1 0.07142857 7.14%

64080.5 a menos de 80002 1 0.07142857 7.14%

Una vez eliminadas las clases con frecuencia cero, el histograma

queda de la manera siguiente:

Elaboración del histograma de variable

continua

0

2

4

6

8

10

12

[394.5, 16316) [16316, 32237.5) [48159, 64080.5) [64080.5, 80002)

Núm

ero

de e

ncuest

ados.

Miles de pesos

Figura 5. Histograma de la cantidad de dinero requerida por los encuestados para lograr sus metas.

En la figura 5 se observa que un 78.57% de los encuestados requiere

menos de 16,316 pesos para cubrir sus metas del año 2016. El resto

está distribuido equitativamente con un 7.14% en cada clase.

Construcción de diagramas

comparativos.

Para realizar comparaciones entre dos o más variables, usamos lafunción de Excel:

=CONTAR.SI.CONJUNTO (rango1, criterio1; rango2, criterio2; …).

Por ejemplo, para conocer el número de Mujeres (pregunta 1) que necesitan más de 40 semanas para llevar a cabo sus metas, en una celda de Excel escribimos:

=CONTAR.SI.CONJUNTO(B2:B30,"F",G2:G30,"E") Ver documento Excel

El resultado que nos da Excel = 5.

Para conocer el número de Hombres con la misma característica escribimos:

=CONTAR.SI.CONJUNTO(B2:B30,“M",G2:G30,"E") Ver documento Excel

El resultado que nos da Excel = 1

Elaboración de Tablas de Distribución

Tabla comparativa de distribución.

Sexo/Tiempo Menos

de 10

10-20 20-30 30-40 Más de 40 Total

Femenino 0 0 2 4 5 11

masculino 0 3 0 1 1 5

Total 0 3 2 5 6 16

Llevando a cabo todas las operaciones, obtenemos la tabla siguiente:

TABLA 7. DISTRIBUCIÓN DE FRECUENCIAS COMPARATIVA DEL SEXO Y

EL TIEMPO (EN SEMANAS) DE REALIZACIÓN DE METAS.

En la tabla 7 se puede ver que los hombres que se propusieron metas para

este 2016, son un 31.25% de los encuestados. Un 31.25% de las mujeres

necesita más de 40 semanas para lograr sus metas mientras que un 25%

requiere de 30 a 40 semanas.

Figura 6. Diagrama comparativo del sexo y el número de semanas

para llevar a cabo las metas de 2016.

Diagrama comparativo

En la figura 6 se puede ver que son pocos los hombres que se propusieron

metas para este 2016, sólo un 15.35% de los encuestados lo hizo. De las

mujeres, un 45.45% necesita más de 40 semanas para lograr sus metas,

mientras que un 36.36% requiere de 30 a 40 semanas.

0

1

2

3

4

5

0-10 ´10-20 20-30 30-40 Más de 40

Núm

ero

de e

ncuest

ados

Número de semanas

Diagrama comparativo del sexo con el tiempo para el logro de metas.

Femenino

Masculino