Download - Expos. de seis estadísticos. stalin goyes

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

INGENIERÍA EN COMERCIO EXTERIOR Y NEGOCIACIÓN

COMERCIAL INTERNACIONAL

MÓDULO:

ESTADÍSTICA INFERENCIAL

DOCENTE:

MSC. JORGE POZO

NOMBRE:

STALIN GOYES

NIVEL:

SEXTO “A”

FECHA DE ENTREGA:

28/JUL/2012

1. TEMA

Manejo del SPSS Statistics en la Estadística Inferencial

2. PROBLEMA

El mal manejo del SPSS Statistics no le ha permitido al estudiante

utilizarlo para resolver de forma rápida problemas estadísticosaplicados al

Comercio Exterior.

3. ABSTRACT

CORRELATION AND REGRESSION

The correlation and linear regression are closely related. Both involve the

relationship between two or more variables. The correlation is concerned

primarily to establish whether a relationship exists and determining its

magnitude and direction, whereas the regression is primarily responsible

to the ratio used to make a prediction. (Spiegel, 1992)

HYPOTHESIS TESTING

It is also called hypothesis testing or hypothesis dócima are procedures

used to determine whether it is reasonable or correct, accept that the

statistic obtained in the sample population may come with a parameter,

the formulation in Ho.

As a result of hypothesis testing to accept or reject Ho. If we accept Ho,

we agree that the sampling error (random), by itself, can lead to the value

of the statistic that causes the difference between this and the parameter.

If we reject Ho, we agree that the difference is so great that we are the

result of sampling error (random) and conclude that the statistical sample

from a population that has the parameter studied. (Levin, 2010)

• Null hypothesis: It is a hypothesis that says the opposite of what you

want to try. It assumes that the parameter of the population being studied,

has a certain value. (Levin, 2010)

• Alternative hypothesis: It is a hypothesis different from the null

hypothesis. Express what we really believe is feasible, ie, is the research

hypothesis. Is designated by the symbol H1. (Levin, 2010)

• Error type 1: It consists in rejecting the null hypothesis when in fact it

should be rejected. Because it is true. The probability of committing Type I

error is called alpha. (Levin, 2010)

• Error Type 2:consists nonrejection not reject Ho when it should be

rejected as false. The probability of making type two error is called beta.

(Levin, 2010)

STUDENT T TEST.

In probability and statistics, distribution (Student t) is a probability

distribution that arises from the problem of estimating the mean of a

normally distributed population when the sample size is small.

Occurs naturally when performing the Student t test to determine

differences between two sample means and to build the confidence

interval for the difference between the means of two populations is

unknown when the standard deviation of a population and it must be

estimated from data of a sample. (Spiegel, 1992)

CHI SQUARE

It is a statistic that provides a basis for a nonparametric test called chi-

square test that is used especially for qualitative variables, ie variables that

lack of unity and therefore their values can not be expressed numerically.

The values of these variables are categories that only serve to classify the

elements of the universe of study. Can also be used for quantitative

variables, transforming previously by qualitative ordinal variables. (Spiegel,

1992)

VARIANCE

In probability theory, the variance (which is usually represented as) of a

random variable is a measure of dispersion defined as the expectation of

the square of the deviation of that variable from its mean.

Is measured in units other than those of the variable. For example, if the

variable measuring a distance in meters, the variance is expressed in

meters squared. The standard deviation is the square root of the variance,

is an alternative measure of dispersion expressed in the same units of

data from the variable under study. The variance is the minimum value 0.

Keep in mind that the variance can be strongly influenced by outliers and

are not recommended for use when the distributions of the random

variables have heavy tails. In such cases we recommend the use of other

more robust measures of dispersion.

4. OBJETIVOS

4.1. OBJETIVO GENERAL

Utilizar el SPSS Statisticspararesolver problemas aplicando métodos

estadísticos como la correlación y regresión lineal, prueba de hipótesis, t

de student, chi cuadrado y varianza.

4.2. OBJETIVOS ESPECÍFICOS

Investigar la utilizacióndel SPSS Statistics para resolver problemas

estadísticos

Analizar las opciones que tiene SPSS Statistics que se puedan

utilizar en la Estadística Inferencial.

Resolver problemas de Comercio Exterior a través delSPSS

Statistics utilizandométodos estadísticos como la correlación y

regresión lineal, prueba de hipótesis, t de student, chi cuadrado y

varianza.

5. JUSTIFICACIÓN

La presente tarea es realizada con la finalidad de conocer la importancia

del manejo adecuado delSPSS Statistics para resolución de problema del

contexto en la Estadística Inferencial en la cual se pueden utilizar

diferentesmétodos como la correlación y regresión lineal, prueba de

hipótesis, t de student, chi cuadrado y varianza; de esta manera se

podrán realizar conclusiones o inferencias de una forma más rápida para

la toma de decisiones, como también un análisis de datos reales donde

se pondrá en evidencia las relaciones que existen entre las variables

Es decir con el estudio de diferentes estadísticos en programas

informáticos el estudiante podrá realizar análisis simultáneos de una

manera ágil, en donde las dos variables bidimensionales pueden ser:

producción y consumo; ventas y utilidades; gastos en publicidad y valor en

ventas; salarios altos y horas de trabajo; salarios y productividad; ingresos

y gastos; etc.

Además el optimismo sobre el afortunado futuro basado en la Introducción

de la Tecnologías de la Información y la Comunicación (TIC) en el entorno

educativo está plenamente justificado, porque esta introducción es un

objetivo educacional en sí mismo, para lograr la inmersión de varias

ciencias que hoy están presentes en todas las dimensiones de la vida

humana: científica, económica, social y como lo es en este caso las TICS

han sido de gran ayuda para resolver problemas de la Estadística

Inferencial, siendo esta una rama de la matemática.

6. MARCO TEÓRICO:

LA CORRELACIÓN Y REGRESIÓN LINEAL

La correlación y regresión lineal están muy relacionadas entre sí. Ambas

implican la relación entre dos o más variables. La correlación se ocupa,

principalmente de establecer si existe una relación, así como de

determinar su magnitud y dirección, mientras que la regresión se encarga

principalmente de utilizar a la relación para efectuar una

predicción.(Spiegel, 1992)

PRUEBA DE HIPÓTESIS

Se llama también ensayo de hipótesis o dócima de hipótesis son

procedimientos que se usan, para determinar si es razonable o correcto,

aceptar que el estadístico obtenido en la muestra, puede provenir de la

población que tiene como parámetro, el formulado en Ho.

Como resultado de la prueba de hipótesis aceptamos o rechazamos Ho.

Si aceptamos Ho, convenimos en que el error de muestreo (al azar), por si

solo, puede dar lugar al valor del estadístico que origina la diferencia entre

este y el parámetro. Si rechazamos Ho, convenimos que la diferencia es

tan grande, que nos es fruto del error de muestreo (al azar) y concluimos

que el estadístico de la muestra no proviene de una población que tenga

el parámetro estudiado.(Levin, 2010)

Hipótesis nula: Es una hipótesis que afirma lo contrario de lo que se

quiere probar. En ella se supone que el parámetro de la población que

se esta estudiando, tiene determinado valor.(Levin, 2010)

Hipótesis alternativa: Es una hipótesis diferente de la hipótesis nula.

Expresa lo que realmente creemos es factible, es decir, constituye la

hipótesis de investigación. Se le designa por el símbolo H1.(Levin,

2010)

Error tipo 1: Consiste en rechazar la hipótesis nula cuando en

realidad no debe ser rechazado. Por ser verdadera. La probabilidad de

cometer el error tipo, se llama alfa.(Levin, 2010)

Error tipo 2: Consiste en no rechazar en no rechazar la Ho, cuando

debería ser rechazada por ser falsa. La probabilidad de cometer el

error tipo dos se llama beta. (Levin, 2010)

T DE STUDENT.

En probabilidad y estadística, la distribución (T de Student) es una

distribución de probabilidad que surge del problema de estimar la media

de una población normalmente distribuida cuando el tamaño de la

muestra es pequeño.

Aparece de manera natural al realizar la prueba t de Student para la

determinación de las diferencias entre dos medias muestrales y para la

construcción del intervalo de confianza para la diferencia entre las medias

de dos poblaciones cuando se desconoce la desviación típica de una

población y ésta debe ser estimada a partir de los datos de una

muestra.(Spiegel, 1992)

CHI CUADRADO

Es un estadístico que sirve de base para una prueba no paramétrica

denominada prueba de chi cuadrado que se utiliza especialmente para

variables cualitativas, esto es, variables que carecen de unidad y por lo

tanto sus valores no pueden expresarse numéricamente. Los valores de

estas variables son categorías que solo sirven para clasificar los

elementos del universo de estudio. También puede utilizarse para

variables cuantitativas, transformándolas, previamente, en variables

cualitativas ordinales.(Spiegel, 1992)

VARIANZA

En teoría de probabilidad, la varianza (que suele representarse como ) de

una variable aleatoria es una medida de dispersión definida como la

esperanza del cuadrado de la desviación de dicha variable respecto a su

media.

Está medida en unidades distintas de las de la variable. Por ejemplo, si la

variable mide una distancia en metros, la varianza se expresa en metros

al cuadrado. La desviación estándar, es la raíz cuadrada de la varianza,

es una medida de dispersión alternativa expresada en las mismas

unidades de los datos de la variable objeto de estudio. La varianza tiene

como valor mínimo 0.

Hay que tener en cuenta que la varianza puede verse muy influida por los

valores atípicos y no se aconseja su uso cuando las distribuciones de las

variables aleatorias tienen colas pesadas. En tales casos se recomienda

el uso de otras medidas de dispersión más robustas.(Spiegel, 1992)

DESCARGA E INSTALACIÓN DEL SPSS STATISTICS

1) Ir al link http://ibm-spss-statistics.softonic.com/descargar y hacer clic

en descargar

2) La descarga comenzará tras la lectura y aceptación del acuerdo, se

debe hacer clic en aceptar.

http://ibm-spss-statistics.softonic.com/descargar

3) Se debe esperar diez minutos aproximadamente mientras se descarga

el SPSS Statitics

4) Aparece el cuadro de dialogo donde se debe hacer clic en “Ejecutar”

para proseguir con la ejecución de este archivo.

5) En escritorio se ha descargado el archivo comprimido, hay que

descomprimirlo y aparecerá una carpeta con el nombre “SPSS PASW”

6) Dar doble clic en la carpeta “PASW Statistics”

7) Doble clic en la carpeta “Setup”

8) Dentro de la carpeta “Setup” dar doble clic en “Setup.exe”

9) Aparece el cuadro “InstallShieldWizard” y para continuar hacer clic en

siguiente.

10) Seleccionar la opción modificar y dar clic en “siguiente”.

11) Hacer clic en “ instalar” para comenzar la instalación y en

aproximadamente cinco minutos ya se podrá acceder a las bondades

del SPSS Statitics.

BREVE EXPLICACIÓN DE LA UTLILIZACIÓN DEL SPSS STATISTICS

Creación de variable

Para una mejor comprensión este link te ayudará:

http://www.youtube.com/watch?v=k8tmAvyCLq0&feature=BFa&list=LL

uAhA915jTWjdZEcZEh-3jA

Miramos la ventana que muestra las columnas y las filas denominada

data new donde se ingresan los datos, en la parte inferior izquierda se

encuentran vista de datos y vista de variables, en la de variables como

su nombre lo indica permite las variables que el usuario desee y en la

de datos se pondrán las características de dichas variables.

Ingreso de datos

http://www.youtube.com/watch?v=k8tmAvyCLq0&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

http://www.youtube.com/watch?v=k8tmAvyCLq0&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

Entonces construimos una base de datos y nos dirigimos a variables e

ingresamos las datos en el primer casillero de la primera columna

ingresamos el nombre de la variable sin espacios no tilde, en tipo

pondremos el tipo de datos ingresados como son fecha, cadena,

numérico entre otras, y llenamos los caracteres, vamos a utilizar

depende cuantas letras tenga la palabra a utilizar o números que

ingresemos.

Link de ayuda:

http://www.youtube.com/watch?v=otg0RqQ68sk&feature=BFa&list=LL

uAhA915jTWjdZEcZEh-3jA

Valorar variables

En valor de la variable se la realiza de la siguiente manera, damos un

clic en valor y se despliega una ventana que se puede mirar en la

imagen, en el primer casillero se coloca el código y en el segundo la

descripción y añadir y esta listo para ser usada.

Link de ayuda:

http://www.youtube.com/watch?v=WQ7RMtYkJC4&feature=BFa&list=L

LuAhA915jTWjdZEcZEh-3jA

http://www.youtube.com/watch?v=otg0RqQ68sk&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

http://www.youtube.com/watch?v=otg0RqQ68sk&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

http://www.youtube.com/watch?v=WQ7RMtYkJC4&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

http://www.youtube.com/watch?v=WQ7RMtYkJC4&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

Analizar datos

Podemos comenzar a ingresar los datos que se hayan obtenido en la

encuesta o entrevista depende del medio de recolección de datos que

utiliza el encuestador, la herramienta más utilizada es analizar ya que

esta cuenta con todas las herramientas del programa que permite

determinar el análisis correspondiente

Link de ayuda:

http://www.youtube.com/watch?v=vVPr_Oylc3s&feature=BFa&list=LLu

AhA915jTWjdZEcZEh-3jA.

EJERCICIOS EN EL SPSS E INTERPRETACIÓN DE RESULTADOS:

CORRELACIÓN Y REGRESIÓN LINEAL

Al ingresar al SPSS Statistics en la parte izquierda inferior aparece la

opción “Vista de variables” en donde se debe hacer clic para crear la

plantilla con datos año, mes, importaciones petroleras e importaciones no

petroleras que se investigaron del Banco Central del Ecuador:

http://www.youtube.com/watch?v=vVPr_Oylc3s&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

http://www.youtube.com/watch?v=vVPr_Oylc3s&feature=BFa&list=LLuAhA915jTWjdZEcZEh-3jA

La plantilla consta de:

- Nombresegún las variables que se vaya a ingresar

- Tipo: se escogió numérico pero tiene las siguientes opciones:

- Etiqueta: se escribe el nombre de las variables

- Valores: se insertan etiquetas de valor por cada pregunta

- Medida: Se escogió de “escala” porque se va a trabajar con

valores numéricos, y también ordinal para establecer orden

Luego de haber insertado todos los datos en la parte inferior izquierda del

SPSS Statistics se escoge la opción “Vista de datos” donde se pueden

observar todas las variables insertadas y se procede a ingresar los datos

Regresión lineal

Se debe seleccionar la opción “Analizar”, luego “Regresión” y “Lineales”

Aparecerá un cuadro donde se debe seleccionar una variable

“Dependiente” y otra independiente, también en la opción gráficos se

puede escoger entre varias opciones

Luego automáticamente el programa procesará los datos y aparecerán los

resultados y gráficos

Estadísticos descriptivos

Media Desviación típica N

Importaciones Petroleras 950065.7073 1.90619E5 41

Importaciones no petroleras 699123.5854 82124.50421 41

Correlaciones

Importaciones

Petroleras

Importaciones no

petroleras

Correlación de Pearson Importaciones Petroleras 1.000 .787

Importaciones no petroleras .787 1.000

Sig. (unilateral) Importaciones Petroleras . .000

Importaciones no petroleras .000 .

N Importaciones Petroleras 41 41

Importaciones no petroleras 41 41

Correlación

Se selecciona la opción “Analizar”, “Correlación” y “Bivariadas”

Aparecerá el cuadro de Correlaciones bivariadas, en donde se deberán

insertar las dos variables de importaciones petrolera y no petroleras

Los datos se procesarán automáticamente y aparecerán los resultados

Correlaciones

Importaciones

Petroleras

Importaciones no

petroleras

Importaciones Petroleras Correlación de Pearson 1 .787**

Sig. (bilateral) .000

N 41 41

Importaciones no petroleras Correlación de Pearson .787** 1

Sig. (bilateral) .000

N 41 41

**. La correlación es significativa al nivel 0,01 (bilateral).

Interpretación de datos:

Según los datos obtenidos en la tabla anterior se observa que el

coeficiente de Pearson es de 0,787 lo que indica que hay una relación

casi perfecta entre las variables y además los puntos están poco

dispersos.

PRUEBA DE HIPÓTESIS

Seleccionar “Analizar”, luego “Comparar medias” y “Prueba T”; las

variables deben tener más de 30 datos

En el cuadro de la Prueba T se insertarán las variables a contrastar

Luego el programa procesa los datos:

Prueba para una muestra

Valor de prueba = 0

95% Intervalo de confianza para

la diferencia

t gl Sig. (bilateral)

Diferencia de

medias Inferior Superior

Importaciones

Petroleras

31.914 40 .000 9.50066E5 889898.9933 1.0102E6

Importaciones no

petroleras

54.510 40 .000 6.99124E5 673201.8934 725045.2774


De acuerdo a los resultados el nivel de significación de la prueba es del

5% y teniendo en cuenta los grados de libertad (40) se tiene que el

resultado de la prueba es de 31,914 para las importaciones petroleras y

de 54,510 para las importaciones no petroleras, la prueba es unilateral.

T DE STUDENT

Se debe realizar el mismo procedimiento que la Prueba de Hipótesis pero

con menos de 30 datos, seleccionar “Analizar”, luego “Comparar medias”

y “Prueba T”.

En el cuadro de la Prueba T se insertarán las variables a contrastar

Luego el programa procesa los datos:

Prueba para una muestra

Valor de prueba = 0

99% Intervalo de confianza para la

diferencia

t gl Sig. (bilateral)

Diferencia de

medias Inferior Superior

Importaciones

Petroleras

48.557 22 .000 8.09530E5 762536.8821 856523.9874

Importaciones no

petroleras

101.888 22 .000 6.36014E5 618418.2343 653609.1570


De acuerdo a los resultados el nivel de significación de la prueba es del

1% y teniendo en cuenta los grados de libertad (22) se tiene que el

resultado de la prueba es de 48,557 para las importaciones petroleras y

de 101,888 para las importaciones no petroleras, la prueba es unilateral.

CHI - CUADRADO

Seleccionar la opción “Analizar”, “Pruebas no paramétricas” y elegir “Chi-

cuadrado”

En el cuadro de la “Prueba Chi-cuadrado” insertar las variables de las

importaciones petroleras y no petroleras.

Los datos serán procesados automáticamente:

Estadísticos de contraste

Petrolera No petrolera

Chi-cuadrado 27.488a 29.829

a

gl 23 23

Sig. asintót. .236 .154

Sig. exacta .251 .165

Probabilidad en el punto .046 .033

a. 24 casillas (100,0%) tienen frecuencias esperadas

menores que 5. La frecuencia de casilla esperada mínima

es 1,7.


De acuerdo a la tabla anterior se acepta la hipótesis alternativa es decir

que los datos son independientes porque el resultado de la prueba es

petrolera 27,488 y no petrolera 29,829; estos datos se encuentran en la

zona de rechazo porque el valor de z es de 0,251 y 0,165.

VARIANZA

Seleccionar la opción “Analizar”, “Estadísticos descriptivos” y elegir

“Descriptivos”

Aparecerá un cuadro denominado “Descriptivos” en donde se debe

insertar las dos variables de importaciones petroleras y no petroleras y se

hace clic en “Opciones”

En el cuadro de “Descriptivos: Opciones” se debe seleccionar “Varianza” y

hacer clic en “Continuar”

El SPSS procesa automáticamente los datos:

Estadísticos descriptivos

N Varianza

Petrolera 41 3.634E10

No petrolera 41 6.744E9

N válido (según lista) 41

Análisis de datos:

La varianza nos indica la distancia que hay entre la media y los puntos de

dispersión en este ejemplo los datos de las exportaciones petroleras

varían 3.63 y las exportaciones no petroleras en 6,74

7. CONCLUSIONES

Mediante el presente trabajo hemos podido conocer y aplicar sobre el

manejo y la forma correcta del SPSS permitiendo aprender

conocimientos básicos para su utilización

En estadística inferencial existen muchos riesgos de que se produzca

errores humanos de cálculo o de decisión, mas el SPSS facilita este

trabajo el cual ofrece información completa e enriquecedora para que

se efectué una razonable conclusión

Con el desarrollo de varios problemas con respecto al tema hemos

podido practicar y aprender las relaciones entre la utilización del SPSS

y la practicar a mano, es decir, realizar la resolución de problemas en

una hoja de papel, podemos decir que es importante conocer todo

referente al tema para aplicarlo por cualquier método de resolución

que se desee aplicar.

Al momento de interpretar la información entregada por el SPSS se

debe considerar muy cuidadosamente los valores como la media,

frecuencias, r de Pearson, entre otros y compararlos con los que

tenemos a mano para determinar una correcta decisión. Al aplicar

todos los métodos que se utiliza en la estadística Inferencial en el

SPSS se pudo observar que se ahorro tiempo, riesgos de error, y se

obtuvo el máximo de datos para ser analizados.

8. RECOMENDACIONES

Tener en cuenta que cuando se realice el análisis en el SPSS ir

determinando en el orden que se quiera obtener porque se acumulan

las tabla y no se comprenden los datos.

Basado en la H0 y H1 decidir de acuerdo a los datos que se

obtengan tomando en cuenta de las reglas que nos menciona cada

método

Una lógica bien desarrollada va acompañada de un conocimiento

amplio por esta razón se recomienda aprender muy bien los métodos

estadísticos con sus respectivos procesos.

Lo más importante del programa SPSS no es aprender aunque si es

indispensable pero si se recomienda que se enfoquen en la

interpretación de datos, saber de donde provienen y para qué sirven.

9. BIBLIOGRAFÍA

Levin, R. (2010). Estadística para Administración y Economía. En R.

Levin, Estadística para Administración y Economía.

Spiegel, M. R. (1992). Estadística II. En M. R. Spiegel, Estadística II.

México DF: Mcgraw Hill.

10. CRONOGRAMA DE ACTIVIDADES

Actividades Fecha de realización Duración

Planteamiento del tema y problema Martes (10/jul/2012) 10 min

Realización de objetivos Martes (10/jul/2012) 10 min

Justificación de la investigación Martes (10/jul/2012) 10 min

Realización del marco teórico Martes (10/jul/2012) 2:30 h

Conclusiones y recomendaciones Martes (10/jul/2012) 10 min