ESTADISTICA 1

Click here to load reader

Transcript of ESTADISTICA 1

LA ESTADISTICA

1. DEFINICIN:

La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para recopilar, organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudio de una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fenmenos en estudio. La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad, para hacer investigacin cientfica se necesita conocer de estadstica.

2. CLASIFICACION DE LA ESTADSTICALa Estadstica se clasifica de la siguiente manera: 2.1. Estadstica DescriptivaEs aquella rea de la Estadstica que describe y analiza una poblacin, sin pretender sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas con validas solo para dicha poblacin.2.2. Estadstica Inferencial Es aquella rea de la Estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de una poblacin, a partir del estudio de una muestra. Es decir las conclusiones obtenidas a partir de una muestra, son validas para toda la poblacin.

3. DEFINICIONES PRELIMINARES:3.1. UNIVERSO: Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en forma general en un espacio y tiempo.Ejemplo: Conjuntos de alumnos, concjunto de docentes universitarios, conjunto de de pacientes, conjunto de clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de documentos, etc.; de una determinada regin o zona en un tiempo determinado.3.2. POBLACIN: Es un conjunto grande y completo de individuos, elementos o unidades que presentan como mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe contener los siguientes elementos: contenido, espacio y tiempo. Al nmero de elementos de una poblacin de denota por N. Una poblacin puede clasificarse de la siguiente manera:A. Segn su extensin:Poblacin Finita: es aquella que tiene un determinado nmero de elementos.Poblacin Infinita: Es aquella cuyos elementos no se pueden contar.B. Segn su mbito o naturaleza: Poblacin Objeto: esta dada por los elementos que forman la poblacin.Poblacin Objetivo: esta dada por la informacin que da la poblacin objetoNota: De un universo se pueden desprender muchas poblaciones, pero operativamente se pueden hablar indistintamente como poblacin o universo.

3.3. MUESTRAEs una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es una coleccin de unidades de muestreo seleccionados de un marco muestral o de varios marcos mustrales. Al nmero de elementos de la muestra se denota por n.Una muestra tiene las siguientes caractersticas:a. Es representativa.b. Es adecuada.

MUESTREO Es una tcnica estadstica por la cual se realizan inferencias o generalizaciones para una poblacin examinando solo una muestra de ella. Es una tcnica empleada para seleccionar elementos de una poblacin. Su propsito es proporcionar diferente tipo de informacin estadstica de naturaleza cuantitativa o cualitativa. Por su gran importancia los investigadores lo utilizan en los diferentes campos de saber y tambin lo usamos en la vida diaria.

3.4. UNIDAD DE ESTUDIO: Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.Ejemplos:Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella de cerveza, una universidad, una vaca, una gota de sangre, etc.

3.5. OBSERVACIONES: Estadsticamente son los datos que se recolectan para un estudio. Una observacin o dato es cuando una variable en si toma un valor especifico.

3.6 VARIABLE:Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se quiere evaluar en una investigacin. Las caractersticas toma diferentes valores que varan de individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen inalterables en las unidades de estudio reciben el nombre de constantes.Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X, Y, Z; y los valores de las variables se designan con letras minsculas: xi , yi , etc.Las variables se clasifican de la siguiente manera: Por su relacin causal: Variable dependiente variable interviniente-variable independiente. a) IndependientesGeneralmente se simbolizan estas variables con la letra maysculas X ; y son aquellas que no dependen de ninguna variable dentro de un contexto determinado.Indica: causa, antecedente, determinante.b) Dependientes.Generalmente se simbolizan estas variables con la letra maysculas Y; y son aquellas que dependen de otra u otras variables dentro de un contexto determinado.Indica: Efecto, resultado, consecuente.c) Interviniente.Generalmente se simbolizan estas variables con la letra mayscula Z; y son aquellas que van a especificar las condiciones o requisitos para que las variables X e Y tomen sus correspondientes valores.

Ejm: El escaso fomento de la educacin alimentaria en la poblacin genera mayor desnutricin infantil en las familias con bajo nivel de instruccin . En este ejemplo las variables son:Educacin alimentaria = X Variable independienteDesnutricin Infantil = Y Variable dependiente.Nivel de Instruccin = Z Variable interviniente

Por su generalidad o nivel de abstraccin: Tericas-Intermedias-Empricas.a) TericasSin aquellas que necesitan definirse operacionalmente porque sus cualidades o caractersticas no son fcilmente observables ni medibles.Ejemplo: Desarrollo econmico, estrato socio-econmico, rendimiento acadmico, hbitos de consumo, asertividad, autoestima, etc.b) IntermediasSon variables que permiten especificar a las variables tericas, con el fin de hacerlas observables y medibles.c) EmpricasSin aquellas que no necesitan definirse operacionalmente porque sus valores se identifican en forma inmediata y sin fcilmente medibles. Ejem: Edad, nsexo, peso, talla, etc.

Por su naturaleza: Cuantitativas - Cualitativas.

VariableCualitativaCuantitativaNominalOrdinalDiscretaContinuaCualidadOAtributoCantidad o nmeroConteoMedicinNo ordenOrden

Medicin De las Variables

Las variables no slo se clasifican, sino que tambin es necesario medirlas. La medicin se hace necesaria con el fin de diferenciar por comparacin, un elemento de otro, en las caractersticas de la variable. Esta se hace a travs de niveles o escalas, entre las cuales tenemos:

A) Escala Nominal. Es el nivel ms simple de medicin donde la variable establece categoras sin orden .En este nivel de medicin, las categoras solo se nombran o se enumeran, pero no se comparan. En este nivel pueden ser:-Dicotmicas: Si tienen dos categoras o clases. Sexo (masculino, femenino)-Politmicas: Si tienen ms de dos categoras o clases. Estado civil (soltero, casado, viudo, divorciado)B) Escala Ordinal. Es el segundo nivel de medicin donde la variable establece categoras jerarquizadas. Este nivel de medicin no mide las magnitudes de las diferencias, pero si permite apreciar que los valores asignados a los individuos caen ms alto o ms bajo que otros.C) Escala de IntervaloEs el tercer nivel de medicin, entre cuyos diversos valores que toma la variable existen a la vez, clasificacin, orden y grados de distancia iguales entre las diferentes categoras, es decir, los intervalos son considerados como equivalentes y con origen convencional ( la unidad de medida no necesariamente tiene que partir del valor cero; solo sirve como punto o valor de comparacin)Ejm:-Temperatura: Un paciente puede llegar a tener 39 C de fiebre, pero ello no significa que su grado de temperatura haya tenido que partir de 0 C.-Rendimiento escolar: Un nio puede obtener calificacin de 15 en Matemticas, pero ello no nos lleva a pensar que necesariamente para llegar a esa calificacin haya tenido que obtener primero de nota 0.-Coeficiente de inteligencia.-Puntuacin obtenida en una escala.-Presin arterial.

D) Escala de razn o proporcin

Es el nivel ms alto de medicin y donde la variable supone o comprende a la vez todos los casos anteriores: clasificacin, orden, distancia, y origen nico natural (la unidad de medida necesariamente tiene que partir del valor cero).Ejm:-Edad: Un paciente puede tener 30 aos, pero para llegar a esa edad, necesariamente ha tenido que partir de cero aos.-Estatura -Tiempo de reaccin mental-Peso3.7. PARAMETRO:Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin. Dentro de estos tenemos: a. El promedio poblacionalb. La varianza poblacional.c. La proporcin poblacional, etc.

3.8. ESTIMADOR:Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro de estos tenemos:a. El promedio muestral.b. La varianza muestral.c. La proporcin muestral, etc.

3.9. INVESTIGACIN CUANTITATIVA Y CUALITATIVAEl objetivo de cualquier ciencia es adquirir conocimientos y la eleccin del mtodo adecuado que nos permita conocer la realidad es por tanto fundamental. Los mtodos inductivos y deductivos tienen objetivos diferentes y podran ser resumidos como desarrollo de la teora y anlisis de la teora respectivamente.

Los mtodos inductivos estn generalmente asociados con la investigacin cualitativa mientras que el mtodo deductivo est asociado frecuentemente con la investigacin cuantitativa.

La investigacin cuantitativa es aquella en la que se recogen y analizan datos cuantitativos sobre variables. La investigacin cualitativa evita la cuantificacin. Los investigadores cualitativos hacen registros narrativos de los fenmenos que son estudiados mediante tcnicas como la observacin participante y las entrevistas no estructuradas. La diferencia fundamental entre ambas metodologas es que la cuantitativaestudia la asociacin o relacin entre variables cuantificadas y la cualitativa lo hace en contextos estructurales y situacionales.

La investigacin cualitativa trata de identificar la naturaleza profunda de las realidades, su sistema de relaciones, su estructura dinmica. La investigacin cuantitativa trata de determinar la fuerza de asociacin o correlacin entre variables, la generalizacin y objetivacin de los resultados a travs de una muestra para hacer inferencia a una poblacin de la cual toda muestra procede. Tras el estudio de la asociacin o correlacin pretende, a su vez, hacer inferencia causal que explique por qu las cosas suceden o no de una forma determinada.

VENTAJAS E INCONVENIENTES DE LOS MTODOS

Tabla 1. Diferencias entre investigacin cualitativa y cuantitativa.Investigacin cualitativaInvestigacin cuantitativa

Centrada en la fenomenologa y comprensinBasada en la induccin probabilstica del positivismo lgico

Observacin naturista sin controlMedicin penetrante y controlada

SubjetivaObjetiva

Inferencias de sus datosInferencias ms all de los datos

Exploratoria, inductiva y descriptivaConfirmatoria, inferencial, deductiva

Orientada al procesoOrientada al resultado

Datos "ricos y profundos"Datos "slidos y repetibles"

No generalizableGeneralizable

HolistaParticularista

Realidad dinmicaRealidad esttica

Tabla 2.Ventajas e inconvenientes de los mtodos cualitativos vs cuantitativos.Mtodos cualitativosMtodos cuantitativos

Propensin a "comunicarse con" los sujetos del estudioPropensin a "servirse de" los sujetos del estudio.

Se limita a preguntar. Se limita a responder.

Comunicacin ms horizontal... entre el investigador y los investigados... mayor naturalidad y habilidad de estudiar los factores sociales en un escenario natural.

Son fuertes en trminos de validez interna, pero son dbiles en validez externa, lo que encuentran no es generalizable a la poblacinSon dbiles en trminos de validez interna -casi nunca sabemos si miden lo que quieren medir-, pero son fuertes en validez externa, lo que encuentran es generalizable a la poblacin.

Preguntan a los cuantitativos: Cuan particularizables son los hallazgos?Preguntan a los cualitativos: Son generalizables tus hallazgos?

3.11. METODOS ESTADISTICOS Concepto: Los mtodos estadsticos son un conjunto de procedimientos que se aplican en una secuencia lgica con el fin de recopilar, organizar, presentar, analizar e interpretar datos cuantitativos de fenmenos sujetos o variaciones. EtapasEl estudio de los mtodos estadsticos se har a travs de la siguiente etapa:a) Etapa de planeamientob) Etapa de recoleccin de datosc) Etapa de elaboracin de datosd) Etapa de presentacin de datose) Etapa de anlisis de elaboracin de datosf) Etapa de publicacin de datos3.12. TCNICAS DE RECOLECCIN DE DATOS:

Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de informacin acerca de los objetos de estudio (personas, objetos y fenmenos) y de su entorno.

Como ya se mencion, la recoleccin de datos tiene que ser sistemtica, ya que, si los datos se recolectan al azar ser difcil responder las preguntas de investigacin de una manera concluyente.Las tcnicas de recoleccin de datos son1. Utilizacin de la informacin disponible2. Observacin3. Entrevista( cara a cara)4. Cuestionarios auto administrados5. Discusin con grupos focales6. OtrasOBSERVACIN:La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente, la conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la conducta humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse a cabo de diferentes formas:a. Observacin participativa: El observador participa en la situacin que observab. Observacin no participativa: El observador no participa en la situacin que observaLas observaciones pueden servir para diferentes propsitos. Pueden dar informacin adicional y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios. Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin se puede, entonces, verificar la informacin recolectada (especialmente sobre temas como alcoholismo, drogadiccin, sida,) pero tambin puede ser una fuente primaria de informacin (observacin sistemtica de los juegos de los nios).La observacin de la conducta humana puede formar parte de algn estudio, pero como consume tiempo se usa con mayor frecuencia en estudios de pequea escala.

ENTREVISTA:La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La entrevista puede conducirse con diferentes grados de flexibilidad.Las entrevistas utilizando una cedulan para asegurar que se discuten todos los puntos, pero dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer preguntas adicionales para obtener tanta informacin adicional como sea posible, Las preguntas son abiertas y no hay restricciones para las respuestas.Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas individuales o grupales con informantes claves.Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la situacin que est investigando. Se aplica en estudios exploratorios y en los estudios de caso.

ENCUESTAS:

Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de obtener informacin de una muestra de individuos. Esta "muestra" es usualmente slo una fraccin de la poblacin bajo estudio. Una "encuesta" recoge informacin de una "muestra." Una "muestra" es usualmente slo una porcin de la poblacin bajo estudio.Las encuestas pueden ser clasificadas en muchas maneras. Una dimensin es por tamao y tipo de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas). Mientras que muchos de los principios son los mismos para todas las encuestas, el foco aqu ser en mtodos para hacer encuestas a individuos. Las encuestas pueden ser clasificadas por su mtodo de recoleccin de datos. Las encuestas por correo, telefnicas y entrevistas en persona son las ms comunes. En los mtodos ms nuevos de recoger datos, la informacin se entra directamente a la computadora ya sea por un entrevistador adiestrado o an por la misma persona entrevistada. Un ejemplo bien conocido es la medicin de audiencias de televisin usando aparatos conectados a una muestra de televisores que graban automticamente los canales que se observan

OTRAS TCNICAS DE RECOLECCION DE DATOSa. Tcnica de grupo nominalb. Tcnica delphic. Historias de vidad. Escalase. Ensayosf. Estudios de casosg. Mapeoh. Tcnicas rpidas de evaluacin de sondeoi. Encuestas participativas.

3.10. INSTRUMENTOS DE RECOLECCIN DE DATOS: Si tenemos presente el tema de investigacin por el que nos estarnos guiando se percibir que, una vez obtenidos los indicadores de los elementos tericos y definido el diseo de la investigacin, se har necesario estructurar las tcnicas d recoleccin de datos correspondientes, para as poder construir los instrumentos que nos permitan obtener tales datos de la realidad. Un instrumento de recoleccin de datos es, en principio, cualquier recurso de que pueda valerse el investigador para acercarse a los fenmenos y extraer de ellos informacin. Ya adelantbamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: una forma y un contenido. La forma del instrumento se refiere al tipo de aproximacin que establecemos con lo emprico, a las tcnicas que utilizamos para esta tarea; una exposicin ms detallada de las principales es la que se ofrece al lector en este mismo captulo. En cuanto al contenido ste queda expresado en la especificacin de los datos concretos que necesitamos conseguir; se realiza, por lo tanto, en una serie de tems que no son otra cosa que los indicadores bajo la forma de preguntas, de elementos a observar, etc. De este modo, el instrumento sintetiza en s toda la labor previa de investigacin: resume los aportes del marco terico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero tambin expresa. Todo lo que tiene de especficamente emprico nuestro objeto de estudio, pues sintetiza a travs de las tcnicas de recoleccin que emplea, el diseo concreto escogido para el trabajo.

II. PRESENTACIN DE LA INFORMACIN:

En la Estadstica se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de anlisis y clculos se organizan en Cuadros de Distribucin de Frecuencias (CDF) y Grficos Estadsticos (GE).

1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF):

1.1. DEFINICIN: Un cuadro de distribucin de frecuencias, es una tabla resumen de un conjunto de datos que muestra el comportamiento o distribucin de la variable en estudio en forma rpida y resumida.An cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta, generalmente es comn seguir algunos pasos que de alguna forma homogenizan criterios y ayudan a los fines didcticos. Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se esta evaluando.

1.2. PARTES DE UN CUADRO DE DISTRIBUCION DE FRECUENCIAS:Las partes de un CDF son las siguientes: a. Nmero del cuadro de frecuencias en forma correlativa.b. Ttulo: Especificar la variable y la poblacin en estudioc. Encabezado o conceptos.d. Cuerpo o contenido del cuadro de frecuenciase. Nota de pie (no siempre es necesaria)f. Fuenteg. Elaboracin

1.3. ELEMENTOS PARA CONSTRUIR UN CDF:Para construir un cuadro de frecuencias se utilizan los siguientes elementos:A. Valores de la variable Xi: Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus valores correspondientes no agrupados se representan como X1, X2, X3,..., X50 .B. Intervalos de clase: Los intervalos son subconjuntos de la recta real Ron que estn definidos por un lmite menor o inferior Li y un lmite mayor o superior Ls.C. Frecuencia:1. Frecuencia absoluta simple: Se denotan por fi. Est constituida por el nmero de veces que se repite un valor. En el caso de intervalos es el nmero de observaciones comprendidas en dicho intervalo. Estas frecuencias siempre son enteros positivos y adems la suma de todos ellos es el tamao de la muestra n. 2. Frecuencia relativa: Se denotan por hi. Indica la relacin o proporcin existente entre la frecuencia absoluta simple y el nmero total de datos. Estas frecuencias son nmeros fraccionarios positivos entre o y 1. Para fines interpretativos estas frecuencias se expresan en % (hi%) . As:

3. Frecuencia absoluta acumulada: Se denotan por Fi. Resulta de la suma de las frecuencias cuyas marcas de clase son iguales o menores a la marca de clase del intervalo dado o considerado, es decir:F1 = f1F2 = f1 + f2F3 = f1 + f2 + f3.............................................Fj = f1 + f2 + f3 + ....... + fi4. Frecuencia relativa acumulada: SE denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta la frecuencia del intervalo considerado. As:H4 = h1 + h2 + h3 + h4H6 = h1 + h2 + ....+ h6 Para fines interpretativos estas frecuencias se expresan en % (Hi%) D. Marca de clase: Se denota por Yi. Es el promedio de los valores correspondientes a los lmites inferior y superior de cada uno de los intervalos determinados.

1.4. PROPIEDADES DE UN CDF:A. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi , Fi 0B. Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y 1, es decir 0 hi , Hi 1C. F1 siempre es igual f1 y H1 siempre es igual a h1.D. La suma de toda la fi es igual a n y la suma del hi es igual a 1.E. Fm siempre es igual a n y Hm siempre es igual a 1.

1.5. CONSTRUCCIN DE CUADROS DE FRECUENCIAS: Para la construccin de los CDF hay que tener en cuenta el tipo de variable que se esta analizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable cualitativa.

A. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA: Para la construccin de este cuadro hay que realizar los siguientes pasos:PASO 1. Determinar el Rango del conjunto de datos.

R = Valor mximo - Valor mnimo

PASO 2. Determinar el nmero de intervalos m.

m = 1 + 3.322 log ( n ) Este valor siempre es un nmero entero (Redondeo)PASO 3. Determinar la amplitud Ci intervlica (de cada intervalo).

Ci = R / m

PASO 5. Determinar los intervalos y finalmente construir el cuadro.NOTA: Los intervalos no siempre van a tener la misma amplitud. De acuerdo a la investigacin y a la necesidad de presentar la informacin para su anlisis correspondiente, es posible tener tres tipos de intervalos

B. CDF PARA UNA VARIABLE CUANTITATIVA DISCRETA: Para la construccin de un CDF para una variable cuantitativa discreta (valores discretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a los diferentes valores discretos.

C. CDF PARA UNA VARIABLE CUALITATIVA: Para la construccin de un CDF para una variable cualitativa se sigue los mismos pasos que para una variable cuantitativa discreta, es decir, solamente colocar en los en los intervalos a las diferentes categoras de la variable cualitativa.

1.6. EXCEL EN LA COSNTRUCCION DE CDF: Si bien es cierto que el EXCEL no es un programa exclusivamente diseado para anlisis estadstico (como lo es el SPSS), puede realizar parte del trabajo estadstico. Una de las ventajas y razones de su uso, esta en su fcil acceso, pues en todas las computadoras esta instalado y as se podr explorar el funcionamiento de las herramientas que se presentan en este programa.

A. CONSTRUCCION DE CUADROS DE FRECUENCIA UTILIZANDO TABLAS DINAMICAS:Para construir cuadros de distribucin de frecuencias a travs de Excel se utiliza la herramienta TABLAS DINAMICAS ver el uso de este programa analizaremos la siguiente base de datos respecto a 50 casos y 10 variables de estudio. (Archivo BASE 01.exe).

Teniendo en cuenta esta base de datos realizar los siguientes pasos:Hacemos clic en Datos /informe de tablas y grficos dinmicos/. aparece la siguiente pantalla:

Luego aparecen las siguientes ventanas de trabajo.activamos (a) lista de base de datos de Excel y (b) Tabla Dinmica. Luego siguiente seleccionamos el rango respectivo, luego siguiente..luego seleccionamos la opcin diseo.

En la opcin diseo seleccionamos la variable que vamos a analizar y con el cursor activamos dicha variable y lo arrastramos hasta la opcin FILA y luego la misma variable la arrastramos hasta la opcin DATOS. Finalmente aceptamos y obtenemos los resultados

En funcin a lo que se quiera obtener como resultados de la variable analizada, se selecciona OPCIONES DE TABLA DINMICA para obtener ya sea totales, promedio o frecuencia de dicha variable. Esta ventana de trabajo es la siguiente:

BBASE DE DATOSLa base de datos que se evaluar con fines prcticos (BASE01.exe), es la siguiente:X1: Tamao familiar (Numero de integrantes de su familia) X2: EdadX3: SexoX4: ProfesinX5: Estado civilX6: Lugar de procedenciaX7: Tenencia de seguroX8: Tipo de enfermedadX9: Ingreso mensualX10: Actividad

Con la siguiente base de datos realizar lo siguiente:a. Indicar el comportamiento del tamao familiar de la muestra en estudio.b. Determinar el comportamiento de la muestra son segn estado civil. Sealar sus respectivos porcentajes.c. Determinar el comportamiento de la muestra segn tenencia de seguro.d. Determinar la edad promedio.e. Determinar el ingreso mensual.f. Realizar un cuadro de doble entrada segn sexo y estado civil. Interprete algunos resultados. g. Realizar un cuadro de doble entrada segn profesin y tenencia de seguros. Interprete algunos resultados.

B. CONSTRUCCION DE CUADROS DE FRECUENCIA UTILIZANDO LA OPCION ANALISIS DE DATOS:

Para construir cuadros de distribucin de frecuencias solamente para variables cuantitativas se utiliza la opcin Herramientas/Anlisis de datos. Para informacin de variables cualitativas solamente se utiliza tablas dinmicas vistas anteriormente.

Esta ventana de trabajo tiene la siguiente presentacin:

Para construir cuadros de frecuencias con esta opcin se debe de tener informacin de variables cuantitativas, como son peso, edad, talla, ganancias, ventas, PBI, tasa de inflacin, etc.Los pasos a seguir son: Herramientas/Anlisis de datos/.y aparece la ventana presentada anteriormente.Luego seleccionar HISTOGRAMA, luego aparece la siguiente ventana donde hay que ingresar rango de entrada / rango de clases / rtulos /rango de salida. Se activa rtulos siempre y cuando en la seleccin de los datos se seleccion el nombre de la variable respectiva.

TAREA:a. Teniendo como referencia la base de datos anterior, realizar el cuadro de frecuencias para la variable edad considerando los siguientes rangos. Menores de 20, de 20 a 40, de 40 a 60 y mayores de 60.b. Realice un CDF para el variable ingreso mensual.III. GRFICOS ESTADSTICOS:

1. DEFINICION: Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el comportamiento de una variable en estudio. Los grficos estadsticos son representaciones de informacin real que existe en nuestro mundo, es una expresin artstica de datos reales y observados. Un grfico sirve tambin para comparar visualmente el comportamiento de dos o ms variables similares o relacionadas.

2. PARTES DE UN GRAFICO ESTADISTICO: Numeracin. Titulo: Aqu se seala la poblacin en estudio y la variable de inters. Diagrama: esta dado por el propio dibujo el cual representa el comportamiento de los datos. Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre los elementos del grfico y la naturaleza de las medidas representadas. Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico.

3. CRITERIOS PARA CONSTRUIR GRAFICOS: No existe una regla especfica para la construccin de grficos, pero si es posible considerar algunas recomendaciones o criterios. Se emplea una diversidad de grficos, cuya estructura o forma depender del tipo de variable que se est estudiando. Este grfico debe tener rasgos simples y de fcil comprensin. 4. TIPOS DE GRAFICOS ESTADISTICOSHay varias tipos de grficos, los cuales dependen del tipo de variable que esta evaluando. Presentaremos aqu los ms importantes:a. Grfico de bastones: Se utiliza cuando se tienen datos de una variable cuantitativa discreta.b. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa continua. c. Grfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa. d. Grfico Sectorial o Pastel: Se utiliza cuando se tienen informacin de una variable cualitativa o cuantitativa discreta.e. Polgono de frecuencias: Se utiliza para indicar el comportamiento de un conjunto de datos. f. Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas continuas pero expresadas en el tiempo.g. Pirmide poblacional: Se utiliza para analizar el comportamiento de una poblacin segn sexo y edad. 5. CONSTRUCCIN DE GRAFICOS ESTADISTICOS DE EXCEL:Excel puede crear grficos a partir de datos previamente seleccionados en una hoja de clculo. El usuario puede incrustar un grfico en una hoja de clculo, o crear el grfico en una hoja especial para grficos. En cada caso el grfico queda vinculado a los datos a partir de los cuales fue creado, por lo que si en algn momento los datos cambian, el grfico se actualizar de forma automtica. Los grficos de Excel contienen muchos objetos, ttulos, etiquetas en los ejes que pueden ser seleccionados y modificados individualmente segn las necesidades del usuario.

Para crear un grfico con el Asistente para Grficos, se deben seguir los siguientes pasos:1. Seleccionar los datos a representar.2. Ejecutar el comando Insertar / Grfico o hacer clic en el botn

A continuacin aparece el siguiente cuadro de dilogo del Asistente para Grfico...que permite elegir el tipo y subtipo de grfico que se va a utilizar entre dos listas que son estndares y personalizados.

Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series que estn evaluando.

Luego debemos configurar los aspectos que conciernen a la presentacin del grfico, aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones de los ejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los rtulos. Las opciones de y Finalizar son las mismas que en los otros cuadros.

Finalmente hacer clic en el botn Finalizar, el grfico aparece ya en el lugar seleccionado. Si se quiere desplazar a algn otro lugar sobre la propia hoja en que se encuentra basta seleccionar todo el grfico y arrastrarlo con el mouse.

IV. ANALISIS ESTADISTICO DESCRIPTIVO:

La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:A. Las medidas de Posicin: Dentro de estas tenemos:a. Medidas de tendencia central: Media, Moda, Mediana.b. Medidas de localizacin: cuartiles, deciles y percentiles.B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.C. Las medidas de deformacin: asimetra y kurtosis.

1. MEDIDAS DE TENDENCIA CENTRAL

1.1. MEDIA ARITMTICA: Se denota por Es la medida estadstica ms fcil de calcular. La media o promedio es el punto central de un conjunto de datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

1.2. MEDIANA: Se denota por Me. Es un valor que divide al conjunto de datos en dos partes iguales, es decir, cada segmento tiene el 50% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

1.3. MODA: Se denota por Mo. La moda es el valor que ms se repite en un conjunto de datos. En un conjunto de datos se presentan los siguientes casos:a. No existir datos Amodalb. 1 modaUnimodal.c. 2 modasBimodald. 3 a ms modasMultimodal Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

2. MEDIDAS DE LOCALIZACIN:

2.1. CUARTILES: Se denotan por Qk, donde k=1,2,3 Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada sector tiene el 25% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

2.2. DECILES: Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9 Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada sector tiene el 10% de los datos.

2.3. PERCENTILES: Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99 Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir, cada sector tiene el 1% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

3. MEDIDAS DE VARIABILIDAD:

3.1. RANGO: Se denota por R y la medida de variabilidad ms fcil de calcular. Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto de datos.

3.2. VARIANZA: Mide la variabilidad de un conjunto de datos respecto a un valor central(promedio) Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilgica su interpretacin. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

3.3. DESVIACIN ESTANDAR: Mide la variabilidad de un conjunto de datos respecto a su valor central pero en unidades originales. Esta es la medida de variabilidad que tiene una interpretacin lgica. Se obtiene a la sacra la raz cuadrada de la varianza.

3.4. COEFICIETE DE VARIACIN: Se denota por C.V. El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento homogneo o heterogneo. Para llegar a determinar la homogeneidad se compara con un valor convencional del 33%. Si el CV 33% el conjunto de datos tiene un comportamiento homogneo. Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.

4. MEDIDAS DE FORMA:

ASIMETRIA: La asimetra se entiende como la deformacin horizontal de un conjunto de datos. Para conocer esta asimetra se calcula el coeficiente de asimetra As. En un conjunto de datos pueden presentar los siguientes casos:a. As= 0, el conjunto de datos es simtrica.b. As0, el conjunto de datos es asimtrica positiva.

KURTOSIS: Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es decir, mide el apuntamiento o achatamiento de un conjunto de datos. Para conocer que tipo de asimetra tiene un conjunto de datos, se utilizan las siguientes formulas:A. Kurtosis en funcin de los momentos: Si K1>3, el conjunto de datos es leptocrtica. Si K1=3, el conjunto de datos es mesoctica. Si K10, el conjunto de datos es leptocrtica. Si K2=0, el conjunto de datos es mesoctica. Si K20.263, el conjunto de datos es leptocrtica. Si K3=0.263, el conjunto de datos es mesoctica. Si K3