Proyecto Final Estadistica
-
Upload
juan-arturo-bravo-aguinaga -
Category
Documents
-
view
44 -
download
1
description
Transcript of Proyecto Final Estadistica
Encuesta sobre el uso de software libre en las empresas de Chiclayo
Para proceder a la realización de la presente investigación es necesaria la determinación de la muestra hacia la cual nos vamos a dirigir y que se calculará a partir del total de ciudadanos de Chiclayo cuya edad oscila entre 14 y 26 años para conocer acerca de su acceso y empleo de redes sociales.La fórmula a emplear es la siguiente:
Donde:Z: Distribución de Gauss. En este caso emplearemos un intervalo de confianza del 95%. Por ende, el valor de esta variable es 1.96.p: Prevalecencia del parámetro a evaluar.q: Es equivalente a 1 menos la prevalecencia del parámetro a evaluar (1-p).i: Error que se prevee cometer. Tomaremos como margen de error 4%.
Entonces:
n=(1.96)2∗(0.05)∗(0.95)
(0.04)2=114
La muestra de ciudadanos que será encuestada es 114.
La metodología a emplear es la siguiente:
A. Se planteará una hipótesis de investigación, la cual deberá ser rechazada o no al final de la misma.
B. En un documento Excel se procederá a realizar la base de datos a partir de los resultados de las encuestas y con ayuda de Megastat los gráficos respectivos para cada variable involucrada. Asimismo, se hallarán la media, desviación estándar y otras medidas aplicadas a cualquier encuesta.
C. En el presente documento se mostrarán los resultados analizados y comentados del conjunto de encuestas realizadas.
D. La hipótesis será evaluada en base a esos resultados y se emitirá una respuesta.
PRIMER CASO
Según Ipsos Apoyo en una encuesta realizada en agosto del 2012, la edad promedio
de los internautas que utilizan redes sociales es 24 años (Perfil del usuario de redes
sociales, 2012). Para tener conocimiento de esta información puede acceder al
siguiente enlace:
http://www.ipsos-apoyo.com.pe/sites/default/files/marketing_data/MKT%20Data%20Perfil_del_usuario_de_redes_2012.pdf
Nosotros consideramos que la edad promedio de los internautas que utilizan las redes
sociales en la ciudad de Chiclayo es menor a la media obtenida por Ipsos Apoyo. A
continuación, probaremos lo dicho en base a la información recopilada en nuestra
encuesta.
PASO 1:
U0: Edad promedio de los internautas que acceden a redes sociales.
H0: La edad promedio de internautas que utilizan las redes sociales en Chiclayo es
mayor igual a la edad promedio nacional.
H1: La edad promedio de internautas que utilizan las redes sociales en Chiclayo es
menor a la edad promedio nacional.
Esto se representa de la siguiente manera:
H0: U0 > 24
H1: U0 < 24
PASO 2:
El nivel de significancia que emplearemos es el siguiente: α = 0.05
PASO 3:
Tenemos una muestra de 114 ciudadanos. Asimismo, contamos con la información de
que la media muestral de las edades de éstos es 19.22 y su desviación estándar es
2.00.
Dado que no conocemos la desviación estándar poblacional procederemos a utilizar la
distribución T-Student para hallar el estadístico de prueba. De la siguiente manera:
t=x−u0s /√n
Donde:
x: Media muestral.
U0: Variable evaluada.
s: Desviación estándar muestral.
n: Tamaño de la muestra.
PASO 4:
Reemplazando los valores que tenemos, el resultado de t es el siguiente:
t=19.22−242 /√114
=−25.518217
PASO 5:
Ahora, debemos hallar el valor-p, a partir de la distribución T-Student.
valor-p = P (t(n-1) < -25.518217)
Donde n = 114
El valor obtenido en Excel es el siguiente: 5.1E-49. Este valor es prácticamente 0.
PASO 6:
Ahora, comparamos el valor obtenido del valor-p con el nivel de significancia para
identificar si rechazamos o no la hipótesis nula. Si el valor-p es mayor al nivel de
significancia no se rechaza la hipótesis nula, de lo contrario sí se rechaza.
5.1E-49 < 0.05
PASO 7:
Como se rechaza H0, eso quiere decir que H1 es válida; es decir la hipótesis de la
investigación es cierta. Por ende, la edad promedio de internautas que utilizan las
redes sociales en Chiclayo es menor a la edad promedio nacional.
SEGUNDO CASO
Se desea comparar el número de días a la semana que emplean los encuestados para
hacer uso de las redes sociales. La hipótesis que presentamos es que los encuestados
varones usan más días a la semana para visitar las redes sociales que la cantidad de
días que usan las mujeres. A continuación se presentan los días a la semana en dos
muestras independientes de internautas separados por sexo. La primera corresponde a
aquellos cuyo sexo es masculino y la segunda a aquellos cuyo sexo es femenino.
VARONES7 7 7 7 7 44 7 7 7 4 74 7 7 7 5 77 3 2 7 7 45 7 4 5 7 37 6 7 7 6 72 7 5 5 4 23 3 7 7 5
MUJERES3 3 3 3 7 77 7 7 7 7 77 7 7 7 7 77 7 7 7 7 7
7 7 7 7 7 77 7 7 7 7 76 6 7 7 7 76 6 6 6 6 64 4 4 2 6 64 4 4 4 5 55 5 5 5 5 55
PASO 1:
U1: Promedio de días que los varones acceden a redes sociales.
U2: Promedio de días que las mujeres acceden a redes sociales.
H0: El promedio de días que los varones acceden a redes sociales es menor igual al
promedio de días que las mujeres acceden a redes sociales.
H1: El promedio de días que los varones acceden a redes sociales es mayor al
promedio de días que las mujeres acceden a redes sociales.
Esto se representa de la siguiente manera:
H0: U1 < U2
H1: U1 > U2
PASO 2:
El nivel de significancia que emplearemos es el siguiente: α = 0.05
PASO 3:
Vamos a calcular el valor de la varianza de cada población a partir de los datos
muestrales de las tablas observadas líneas arriba. Luego, si la varianza mayor al
cuadrado sobre la menor al cuadrado es mayor a 4 se asumirá que las varianzas
poblacionales son distintas, de lo contrario serán iguales:
VARIANZA DE LA MUESTRA DE VARONES: 2.9417
VARIANZA DE LA MUESTRA DE MUJERES: 1.8919
S2mayorS2menor
=2.4177
Por ende, las varianzas poblacionales son iguales. Para calcular el estadístico de
prueba vamos a utilizar la fórmula siguiente:
t=( x1−x 2 )−(u1−u2)
Sp√ 1n1
+ 1n2
t(n1+n2−2)
De lo cual asumimos que (u1-u2) = 0.
PASO 4:
n1 = 47 hombres. x1=5.5967 S1 = 2.9417
n2 = 67 mujeres. x2=5.9552 S2 = 1.8919
Sp=√ (n1−1 )S12+(n2−1)S22
n1+n2−2=√ (47−1 ) (2.94172 )+(67−1)(1.89192)
47+67−2=2.3692
Reemplazando los valores que tenemos, el resultado de t es el siguiente:
t=(5.5967−5.9552 )−0
2.3692√ 147 + 167
=−0.7952
PASO 5:
Ahora, debemos hallar el valor-p, a partir de la distribución T-Student.
valor-p = P (t(n1+n2-2) > -0.7952)
Donde n1 = 47, n2 = 67.
El valor obtenido en Excel es el siguiente: 0.7859.
PASO 6:
Ahora, comparamos el valor obtenido del valor-p con el nivel de significancia para
identificar si rechazamos o no la hipótesis nula. Si el valor-p es mayor al nivel de
significancia no se rechaza la hipótesis nula, de lo contrario sí se rechaza.
0.7859 > 0.05
PASO 7:
Como no se rechaza H0, eso quiere decir que H1 no es válida; es decir la hipótesis de la
investigación no es cierta. Por ende, el promedio de días que los varones acceden a
redes sociales es menor igual al promedio de días que las mujeres acceden a redes
sociales.
TERCER CASO
Tenemos el siguiente esquema:
VARONES MUJERESNº de encuestados sobre uso de redes sociales según sexo. 47 67Nº de encuestados sobre uso de redes sociales según sexo
que usan las redes sociales para trabajar, estudiar y socializar.25 16
PASO 1:
H0: La proporción de varones que utilizan las redes sociales para trabajar, socializar y
estudiar es mayor igual que la proporción de mujeres que la utilizan para el mismo fin.
H1: La proporción de varones que utilizan las redes sociales para trabajar, socializar y
estudiar es menor que la proporción de mujeres que la utilizan para el mismo fin.
Esto se representa de la siguiente manera:
H0: P1 > P2
H1: P1 < P2
PASO 2:
El nivel de significancia que emplearemos es el siguiente: α = 0.05
PASO 3:
Ahora procedemos a encontrar el estadístico de prueba:
Z= p̂1− p̂2
√ p̂(1− p̂)( 1n1+ 1n2
)N (0,1)
PASO 4:
n1 = 67 hombres. x1 = 16
n2 = 47 mujeres. x2 = 25
p̂1 = 16/67 = 0.23
p̂2 = 25/47 = 0.53
p̂= x1+x 2n1+n2
=16+2567+47
=0.3596
1− p̂=0.640350
Reemplazando los valores que tenemos, el resultado de z es el siguiente:
Z= 0.23−0.53
√(0.3596)(0.640350)( 167
+ 147
)N (0,1 )=−3.2857
PASO 5:
Ahora, debemos hallar el valor-p, a partir de la distribución normal.
valor-p = P (z < -3.2857)
El valor obtenido es: 0.00050865
PASO 6:
Ahora, comparamos el valor obtenido del valor-p con el nivel de significancia para
identificar si rechazamos o no la hipótesis nula. Si el valor-p es mayor al nivel de
significancia no se rechaza la hipótesis nula, de lo contrario sí se rechaza.
0.00050865 < 0.05
PASO 7:
Como se rechaza H0, eso quiere decir que H1 es válida; es decir la hipótesis de la investigación es cierta. Por ende, la proporción de varones que utilizan las redes sociales para trabajar, socializar y estudiar es menor que la proporción de mujeres que la utilizan para el mismo fin.