Proyecto Final Estadistica

12
Encuesta sobre el uso de software libre en las empresas de Chiclayo Para proceder a la realización de la presente investigación es necesaria la determinación de la muestra hacia la cual nos vamos a dirigir y que se calculará a partir del total de ciudadanos de Chiclayo cuya edad oscila entre 14 y 26 años para conocer acerca de su acceso y empleo de redes sociales. La fórmula a emplear es la siguiente: Donde: Z: Distribución de Gauss. En este caso emplearemos un intervalo de confianza del 95%. Por ende, el valor de esta variable es 1.96. p: Prevalecencia del parámetro a evaluar. q: Es equivalente a 1 menos la prevalecencia del parámetro a evaluar (1-p). i: Error que se prevee cometer. Tomaremos como margen de error 4%. Entonces: n= ( 1.96) 2 ∗( 0.05)∗( 0.95 ) ( 0.04 ) 2 =114 La muestra de ciudadanos que será encuestada es 114. La metodología a emplear es la siguiente: A. Se planteará una hipótesis de investigación, la cual deberá ser rechazada o no al final de la misma. B. En un documento Excel se procederá a realizar la base de datos a partir de los resultados de las encuestas y con ayuda de Megastat los gráficos respectivos para cada variable involucrada.

description

Estadistica

Transcript of Proyecto Final Estadistica

Page 1: Proyecto Final Estadistica

Encuesta sobre el uso de software libre en las empresas de Chiclayo

Para proceder a la realización de la presente investigación es necesaria la determinación de la muestra hacia la cual nos vamos a dirigir y que se calculará a partir del total de ciudadanos de Chiclayo cuya edad oscila entre 14 y 26 años para conocer acerca de su acceso y empleo de redes sociales.La fórmula a emplear es la siguiente:

Donde:Z: Distribución de Gauss. En este caso emplearemos un intervalo de confianza del 95%. Por ende, el valor de esta variable es 1.96.p: Prevalecencia del parámetro a evaluar.q: Es equivalente a 1 menos la prevalecencia del parámetro a evaluar (1-p).i: Error que se prevee cometer. Tomaremos como margen de error 4%.

Entonces:

n=(1.96)2∗(0.05)∗(0.95)

(0.04)2=114

La muestra de ciudadanos que será encuestada es 114.

La metodología a emplear es la siguiente:

A. Se planteará una hipótesis de investigación, la cual deberá ser rechazada o no al final de la misma.

B. En un documento Excel se procederá a realizar la base de datos a partir de los resultados de las encuestas y con ayuda de Megastat los gráficos respectivos para cada variable involucrada. Asimismo, se hallarán la media, desviación estándar y otras medidas aplicadas a cualquier encuesta.

C. En el presente documento se mostrarán los resultados analizados y comentados del conjunto de encuestas realizadas.

D. La hipótesis será evaluada en base a esos resultados y se emitirá una respuesta.

PRIMER CASO

Page 2: Proyecto Final Estadistica

Según Ipsos Apoyo en una encuesta realizada en agosto del 2012, la edad promedio

de los internautas que utilizan redes sociales es 24 años (Perfil del usuario de redes

sociales, 2012). Para tener conocimiento de esta información puede acceder al

siguiente enlace:

http://www.ipsos-apoyo.com.pe/sites/default/files/marketing_data/MKT%20Data%20Perfil_del_usuario_de_redes_2012.pdf

Nosotros consideramos que la edad promedio de los internautas que utilizan las redes

sociales en la ciudad de Chiclayo es menor a la media obtenida por Ipsos Apoyo. A

continuación, probaremos lo dicho en base a la información recopilada en nuestra

encuesta.

PASO 1:

U0: Edad promedio de los internautas que acceden a redes sociales.

H0: La edad promedio de internautas que utilizan las redes sociales en Chiclayo es

mayor igual a la edad promedio nacional.

H1: La edad promedio de internautas que utilizan las redes sociales en Chiclayo es

menor a la edad promedio nacional.

Esto se representa de la siguiente manera:

H0: U0 > 24

H1: U0 < 24

PASO 2:

El nivel de significancia que emplearemos es el siguiente: α = 0.05

PASO 3:

Page 3: Proyecto Final Estadistica

Tenemos una muestra de 114 ciudadanos. Asimismo, contamos con la información de

que la media muestral de las edades de éstos es 19.22 y su desviación estándar es

2.00.

Dado que no conocemos la desviación estándar poblacional procederemos a utilizar la

distribución T-Student para hallar el estadístico de prueba. De la siguiente manera:

t=x−u0s /√n

Donde:

x: Media muestral.

U0: Variable evaluada.

s: Desviación estándar muestral.

n: Tamaño de la muestra.

PASO 4:

Reemplazando los valores que tenemos, el resultado de t es el siguiente:

t=19.22−242 /√114

=−25.518217

PASO 5:

Ahora, debemos hallar el valor-p, a partir de la distribución T-Student.

valor-p = P (t(n-1) < -25.518217)

Donde n = 114

El valor obtenido en Excel es el siguiente: 5.1E-49. Este valor es prácticamente 0.

PASO 6:

Page 4: Proyecto Final Estadistica

Ahora, comparamos el valor obtenido del valor-p con el nivel de significancia para

identificar si rechazamos o no la hipótesis nula. Si el valor-p es mayor al nivel de

significancia no se rechaza la hipótesis nula, de lo contrario sí se rechaza.

5.1E-49 < 0.05

PASO 7:

Como se rechaza H0, eso quiere decir que H1 es válida; es decir la hipótesis de la

investigación es cierta. Por ende, la edad promedio de internautas que utilizan las

redes sociales en Chiclayo es menor a la edad promedio nacional.

SEGUNDO CASO

Se desea comparar el número de días a la semana que emplean los encuestados para

hacer uso de las redes sociales. La hipótesis que presentamos es que los encuestados

varones usan más días a la semana para visitar las redes sociales que la cantidad de

días que usan las mujeres. A continuación se presentan los días a la semana en dos

muestras independientes de internautas separados por sexo. La primera corresponde a

aquellos cuyo sexo es masculino y la segunda a aquellos cuyo sexo es femenino.

VARONES7 7 7 7 7 44 7 7 7 4 74 7 7 7 5 77 3 2 7 7 45 7 4 5 7 37 6 7 7 6 72 7 5 5 4 23 3 7 7 5

MUJERES3 3 3 3 7 77 7 7 7 7 77 7 7 7 7 77 7 7 7 7 7

Page 5: Proyecto Final Estadistica

7 7 7 7 7 77 7 7 7 7 76 6 7 7 7 76 6 6 6 6 64 4 4 2 6 64 4 4 4 5 55 5 5 5 5 55

PASO 1:

U1: Promedio de días que los varones acceden a redes sociales.

U2: Promedio de días que las mujeres acceden a redes sociales.

H0: El promedio de días que los varones acceden a redes sociales es menor igual al

promedio de días que las mujeres acceden a redes sociales.

H1: El promedio de días que los varones acceden a redes sociales es mayor al

promedio de días que las mujeres acceden a redes sociales.

Esto se representa de la siguiente manera:

H0: U1 < U2

H1: U1 > U2

PASO 2:

El nivel de significancia que emplearemos es el siguiente: α = 0.05

PASO 3:

Vamos a calcular el valor de la varianza de cada población a partir de los datos

muestrales de las tablas observadas líneas arriba. Luego, si la varianza mayor al

cuadrado sobre la menor al cuadrado es mayor a 4 se asumirá que las varianzas

poblacionales son distintas, de lo contrario serán iguales:

Page 6: Proyecto Final Estadistica

VARIANZA DE LA MUESTRA DE VARONES: 2.9417

VARIANZA DE LA MUESTRA DE MUJERES: 1.8919

S2mayorS2menor

=2.4177

Por ende, las varianzas poblacionales son iguales. Para calcular el estadístico de

prueba vamos a utilizar la fórmula siguiente:

t=( x1−x 2 )−(u1−u2)

Sp√ 1n1

+ 1n2

t(n1+n2−2)

De lo cual asumimos que (u1-u2) = 0.

PASO 4:

n1 = 47 hombres. x1=5.5967 S1 = 2.9417

n2 = 67 mujeres. x2=5.9552 S2 = 1.8919

Sp=√ (n1−1 )S12+(n2−1)S22

n1+n2−2=√ (47−1 ) (2.94172 )+(67−1)(1.89192)

47+67−2=2.3692

Reemplazando los valores que tenemos, el resultado de t es el siguiente:

t=(5.5967−5.9552 )−0

2.3692√ 147 + 167

=−0.7952

PASO 5:

Ahora, debemos hallar el valor-p, a partir de la distribución T-Student.

Page 7: Proyecto Final Estadistica

valor-p = P (t(n1+n2-2) > -0.7952)

Donde n1 = 47, n2 = 67.

El valor obtenido en Excel es el siguiente: 0.7859.

PASO 6:

Ahora, comparamos el valor obtenido del valor-p con el nivel de significancia para

identificar si rechazamos o no la hipótesis nula. Si el valor-p es mayor al nivel de

significancia no se rechaza la hipótesis nula, de lo contrario sí se rechaza.

0.7859 > 0.05

PASO 7:

Como no se rechaza H0, eso quiere decir que H1 no es válida; es decir la hipótesis de la

investigación no es cierta. Por ende, el promedio de días que los varones acceden a

redes sociales es menor igual al promedio de días que las mujeres acceden a redes

sociales.

TERCER CASO

Tenemos el siguiente esquema:

VARONES MUJERESNº de encuestados sobre uso de redes sociales según sexo. 47 67Nº de encuestados sobre uso de redes sociales según sexo

que usan las redes sociales para trabajar, estudiar y socializar.25 16

Page 8: Proyecto Final Estadistica

PASO 1:

H0: La proporción de varones que utilizan las redes sociales para trabajar, socializar y

estudiar es mayor igual que la proporción de mujeres que la utilizan para el mismo fin.

H1: La proporción de varones que utilizan las redes sociales para trabajar, socializar y

estudiar es menor que la proporción de mujeres que la utilizan para el mismo fin.

Esto se representa de la siguiente manera:

H0: P1 > P2

H1: P1 < P2

PASO 2:

El nivel de significancia que emplearemos es el siguiente: α = 0.05

PASO 3:

Ahora procedemos a encontrar el estadístico de prueba:

Z= p̂1− p̂2

√ p̂(1− p̂)( 1n1+ 1n2

)N (0,1)

PASO 4:

n1 = 67 hombres. x1 = 16

n2 = 47 mujeres. x2 = 25

p̂1 = 16/67 = 0.23

p̂2 = 25/47 = 0.53

Page 9: Proyecto Final Estadistica

p̂= x1+x 2n1+n2

=16+2567+47

=0.3596

1− p̂=0.640350

Reemplazando los valores que tenemos, el resultado de z es el siguiente:

Z= 0.23−0.53

√(0.3596)(0.640350)( 167

+ 147

)N (0,1 )=−3.2857

PASO 5:

Ahora, debemos hallar el valor-p, a partir de la distribución normal.

valor-p = P (z < -3.2857)

El valor obtenido es: 0.00050865

PASO 6:

Ahora, comparamos el valor obtenido del valor-p con el nivel de significancia para

identificar si rechazamos o no la hipótesis nula. Si el valor-p es mayor al nivel de

significancia no se rechaza la hipótesis nula, de lo contrario sí se rechaza.

0.00050865 < 0.05

PASO 7:

Como se rechaza H0, eso quiere decir que H1 es válida; es decir la hipótesis de la investigación es cierta. Por ende, la proporción de varones que utilizan las redes sociales para trabajar, socializar y estudiar es menor que la proporción de mujeres que la utilizan para el mismo fin.