Informe de Estadistica. (1)

PROPUESTA DE MEJORAMIENTO DE LA EMPRESA

TECNOLOGA EN GESTIN DE LA PRODUCCIN INDUSTRIAL BOGOT D.C2014

CONTENIDO

Pg.

INTRODUCCIN91.OBJETIVOS101.1 OBJETIVO GENERAL102.2 OBJETIVOS ESPECFICOS101.2 ESTADSTICA INDUCTIVA Y DESCRIPTIVA121.2.1 Estadstica inductiva1212.2 Estadstica descriptiva131.3 ESTADSTICA DESCRIPTIVA E INFERENCIAL151.3.1 Anlisis estadstico171.3.2 Datos y variables172. CLASIFICACIN DE VARIABLES192.1 Variables independientes192.2 Variables dependientes192.3 Variable contina202.4 Variable discreta212.5 Variable dicotmica o binaria212.6 Variable ficticia (dummy)212.7 REPRESENTACIN DE DATOS232.8 MTODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS232.8.1 Diagrama de barras232.8.2 Histograma242.8.3 Polgono de frecuencias242.8.4 Diagrama de sectores243. distribucin de frecuencias253.1 organizacin de datos agrupados28Su fin es el resumir la informacin, generalmente los elementos son de mayor tamao por lo cual requieren de ser agrupados, esto implica:283.2 GRFICOS DE UNA DISTRIBUCIN DE FRECUENCIA294. histograma304.1 Polgono de frecuencias:314.1.1 Polgonos de frecuencia para datos agrupados324.1.2 Polgono de frecuencias acumuladas344.2 curvas de frecuencia344.3 MEDIDAS DESCRIPTIVAS354.4.MEDIDAS DE TENDENCIA CENTRAL375. MEDIA ARITMTICA396. mediana416.1 Datos sin agrupar416.2 Datos agrupados427. moda437.1 moda de datos agrupados447.1.1 Propiedades447.1.2 Inconvenientes457.2 ejemplo458. CUARTILES, DECIL Y PERCENTIL469. CALCULO DE CUARTILES DE DATOS AGRUPADOS EN INTERVALOS479.1 Datos agrupados479.1.1 Para datos no agrupados499.2 cuartiles509.3 percentiles5010. MEDIDAS DE DISPERSIN5210.1 rango5310.2 Obtencin del rango5310.2.1 requisitos del rango5410.2.2 ejemplos5510.3 varianza5510.3.1 Propiedades5610.4 DESVIACIN TPICA5710.4.1 Desviacin Tpica maestral5810.4.2 Desviacin tpica poblacional5910.4.3 Ejemplo5910.4.4 Covarianza6010.4.5 Propiedades6311. CONCEPTOS GENERALES DE PROBABILIDAD6511.1 POBLACIN (N)6811.2. MUESTRA (n)6911.3. MUESTREO7111.3.1. Tipos de Muestreo7211.4. ESPACIO MUESTRAL7311.6 DISCRETOS8011.6.1 Espacio probabilstico discreto8111.6.2 Espacio probabilstico discreto equiprobable8111.6.3 Espacio probabilstico finito8111.6.4 Procesos estocsticos finitos y diagramas de rbol8111.6.5 Espacio probabilstico infinito contable8211.7 continuos8211.8 EVENTOS ALEATORIOS8411.9. EXPERIMENTO ESTADSTICO8511.9.1 Experimento aleatorio8712. TCNICAS DE CONTEO8912.1 PRINCIPIO DE LA MULTIPLICACIN9112.1.1 Principio aditivo9212.2 PRINCIPIO DE LA SUMA O ADICIN o ley de la suma9312.3 NOTACIN FACTORIAL9512.3.1 Factorial de un entero Positivo9612.3.2 Variaciones9612.3.3 Propiedades de las Variaciones9712.3.4 Variaciones sin Repeticin9712.4 permutaciones9712.4.1 Principio de permutacin9712.5 combinaciones9812.5.1 Principio de combinacin9913. axiomas de las probabilidades100Segundo axioma100Tercer axioma10113.1 PROPIEDADES QUE DEDUCEN LOS AXIOMAS10214 TEOREMAS FUNDAMENTALES DE LA PROBABILIDAD10414.4 proposicin10714.2TEOREMA PROBABILIDAD COMPUESTA10715. PROBABILIDAD CONDICIONAL10916. TEOREMA DE BAYES11417. DISTRIBUCIN DE VARIABLE DISCRETA11717.1 BINOMIAL12117.1.1 Experimento binomial12217.2 CARACTERSTICAS ANALTICAS123Ejemplo12317.3HIPERGEOMETRIA12317.4 propiedades12518. poisson12718.1 PROPIEDADES12818.2SUMA DE VARIABLES ALEATORIAS DE POISSON13018.3 DISTRIBUCIN BINOMIAL13118.5DISTRIBUCIN EXPONENCIAL13319. distribucin de la variable continua13520. distribucin normal14020.1 Distribucin normal o de Gauss14020.1 Ejemplos145CONCLUSIONES147CIBERGRAFIA149

LISTA DE ILUSTRACIONES

Pg.

Ilustracin 1: Distribucin de frecuencias.26Ilustracin 2: Distribucin de frecuencias agrpales.27Ilustracin 3: histograma.31Ilustracin 4:Poligono de frecuencia absoluta.32Ilustracin 5: Polgono de frecuencias agrupados33Ilustracin 6: Polgono de frecuencias acumuladas.34Ilustracin 7: Moda de datos agrupados.45Ilustracin 8: Cuadro de covarianza62Ilustracin 9: grafic de poblacin.69Ilustracin 10: Probabilidad condicional.112Ilustracin 11:Diagrama de poisson.128Ilustracin 12: Tringulo de Tartaglia132Ilustracin 13: Grafico de distribucin binomial.133Ilustracin 14: distribucin probabilidad continua.139Ilustracin 15: Curva de poisson.141Ilustracin 16: Colas de eje.142Ilustracin 17: histograma normal.143Ilustracin 18: Histograma de una variable normal.143

INTRODUCCIN

Una variable aleatoria es un valor numrico que corresponde al resultado de un experimento aleatorio, como el nmero de caras que se obtienen al lanzar 4 veces una moneda, el nmero de lanzamientos de un dado hasta que aparece el seis, el nmero de llamadas que se reciben en un telfono en una hora, el tiempo de espera a que llegue un autobs. Las variables aleatorias, como las estadsticas, pueden ser discretas o continuas. Las variables aleatorias permiten definir la probabilidad como una funcin numrica (de variable real) en lugar de como una funcin de un conjunto dado. Se dice que una variable aleatoria sigue una distribucin uniforme si la funcin de densidad es constante en el intervalo en el que se encuentran todos los valores de la variable.

Las distribuciones de probabilidad estn relacionadas con las distribuciones de frecuencias. Una distribucin de frecuencias terica es una distribucin de probabilidades que describe la forma en que se espera que varen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos tiles para hacer inferencias y para tomar decisiones en condiciones de incertidumbre. Una distribucin de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que se presentaron realmente cuando se efectu el experimento, mientras que una distribucin de probabilidad es un listado de las probabilidades de todos los posibles resultados que podran obtenerse si el experimento se lleva a cabo.

Las distribuciones de probabilidad pueden basarse en consideraciones tericas o en una estimacin subjetiva de la posibilidad. Se pueden basar tambin en la experiencia.1. OBJETIVOS

1.1 OBJETIVO GENERAL

Estar en la capacidad de obtener a partir de los datos de la empresa muestras sobre diferentes productos para as representar, analizar e interpretar datos en cuadros estadsticos al igual graficar e interpretar un determinado producto que requiera una medicin de calidad y aplicar y calcular diferentes medidas en el proceso de una investigacin de los datos estadsticos de los productos que realiza la empresa Sara lee S.A.S.

2.2 OBJETIVOS ESPECFICOS

Conocer la historia y reconocer la importancia de la estadstica en todos los campos que se pueda aplicar.

Utilizar adecuadamente smbolos y palabras del lenguaje estadstico para aplicar procesos matemticos bsicos en clculos estadsticos.

Usar el mtodo estadstico en la recoleccin de la informacin de la empresa proyecto para poder diagnosticar los riesgos o no conformidades que se puedan encontrar. Elaborar y representar una investigacin en cuadros y en forma grfica.

1. ESTADSTICA

La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Es una ciencia formal y una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en forma aleatoria o condicional.

La estadstica es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han sido recopilados a partir de otros datos numricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra."La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini, 1953. Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954).

En ciertas ciencias (Biologa, Ciencias Humanas, algunos campos de la Fsica, ...) aparece el concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no produce el mismo resultado) y asociado al mismo el de variable aleatoria. Una variable no aleatoria (asociada al resultado de una experiencia que s produce el mismo resultado) est caracterizada por un valor para cada condicin.

Una variable aleatoria est caracterizada por la llamada funcin densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condicin. Los objetivos de la investigacin cientfica se pueden entender, de un modo muy general, en trminos de encontrar y describir las variables de inters y las relaciones entre ellas, para el problema en estudio. La estadstica es la ciencia que estudia los mtodos que permiten realizar este proceso para variables aleatorias. Estos mtodos permiten resumir datos y acotar el papel de la casualidad (azar).

1.2 ESTADSTICA INDUCTIVA Y DESCRIPTIVA

1.2.1 Estadstica inductiva

Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. Segn Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeas compuestas por los mismos elementos. En relacin a la estadstica descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos.Supngase que un profesor calcula la calificacin promedio de un grupo de historia. Como la estadstica describe el desempeo del grupo pero no hace ninguna generalizacin acerca de los diferentes grupos, podemos decir que el profesor est utilizando estadstica descriptiva. Grficas, tablas y diagramas que muestran los datos de manera que sea ms fcil su entendimiento son ejemplos de estadstica descriptiva. Supngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidas por uno de sus grupos para estimar la calificacin promedio de las diez unidades del mismo curso de historia. El proceso de estimacin de tal promedio sera un problema concerniente a la estadstica inferencial. Los estadsticos se refieren a esta rama como inferencia estadstica, esta implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez.

12.2 Estadstica descriptiva

La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales).Las variables tambin se pueden clasificar en:

Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas de dicha ciudad.

Muestra: subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caractersticas de la poblacin, de donde procede por lo que recibe tambin el nombre de inferencia estadstica.

1.3 ESTADSTICA DESCRIPTIVA E INFERENCIAL

Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal que describa fcil y rpidamente las caractersticas esenciales de dichos datos mediante el empleo de mtodos grficos, tabulares o numricos. Llamada tambin inferencia estadstica, la cual consiste en llegar a obtener conclusiones o generalizaciones que sobrepasan los lmites de los conocimientos aportados por un conjunto de datos. Busca obtener informacin sobre la poblacin basndose en el estudio de los datos de una muestra tomada a partir de ella.La estadstica descriptiva o deductiva trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones. Por lo general, cuando hay un gran nmero de datos antes de que la mente humana pueda interpretarlos, deben resumirse o reducirse. La mente humana no tiene la capacidad de extraer conclusiones de una serie de datos en bruto; la estadstica descriptiva sirve de herramienta o instrumento para describir, resumir o reducir las propiedades de un conjunto de datos para que se puedan manejar. En definitiva, comprende aquellas tcnicas que se usan para resumir la informacin (largas listas de valores) para proporcionar ndices simples y comprensibles y, por lo tanto, para facilitar descripciones y comparaciones, hacindolo de la forma ms exacta posible. Para reducir la informacin se construyen tablas, se representan grficos y se calculan parmetros estadsticos que caracterizan la distribucin, de esta forma se simplifica la complejidad de todos los datos que intervienen en la distribucin. Por lo tanto, la estadstica descriptiva hace referencia, o se utiliza en las etapas 3, 4 y 5 del mtodo cientfico (observacin, clasificacin y descripcin), y nicamente se limita a realizar deducciones directamente a partir de los datos y parmetros obtenidos.

Por su parte, la estadstica inferencial o inductiva trata de llegar a conclusiones que sobrepasan el alcance de los datos analizados, es decir, se trata de tcnicas que se emplean para inferir o deducir caractersticas desconocidas a partir de un conjunto de datos conocidos, apoyndose fundamentalmente en el clculo de probabilidades. Esto es as porque es imposible en la mayora de los casos utilizar como datos para comprobar las hiptesis la totalidad de los fenmenos que componen la poblacin objeto de estudio. (Por ejemplo, es imposible medir el dimetro de todos los cantos en una terraza fluvial, o encuestar a todos los agricultores de una determinada zonas...). Como resulta imposible examinar la poblacin entera de los fenmenos que estudiamos, la construccin de leyes y teoras se tiene que apoyar en DATOS MUSTRALES. A partir de unos pocos datos conocidos (los de la muestra), se trata de obtener informacin de la poblacin total, y esto lo hace apoyndose en el clculo de probabilidades, como hemos mencionado anteriormente. Uno de los principales objetivos de la estadstica inferencial es estimar las propiedades de una poblacin a partir del conocimiento de slo una muestra de ella. La estadstica inferencial se basa por lo tanto en la estadstica descriptiva, ya que la inferencia o deduccin de las propiedades de la poblacin entera se deriva de las caractersticas de la muestra que es analizada con las tcnicas de la estadstica descriptiva.

1.3.1 Anlisis estadstico

Por anlisis se entiende la separacin de las partes de un todo hasta llegar a conocer sus principios o elementos. Si extendemos esta definicin al mbito estadstico, podremos afirmar que el anlisis estadstico es el anlisis que emplea tcnicas estadsticas para interpretar datos, ya sea para ayudar en la toma de decisiones o para explicar los condicionantes que determinan la ocurrencia de algn fenmeno.

1.3.2 Datos y variables

La materia prima de la estadstica la constituyen los datos, stos provienen de las variables la cuales expresan la medicin de alguna caracterstica, a manera de ejemplo, una variable puede ser el color de los ojos en cada persona, el dato es la expresin de la medicin hecha y podra dar como resultado: negros, caf, azules, etc. De esta manera, como se seal antes, las variables son la herramienta fundamental con que se trabaja en estadstica, es necesario pues considerar con mayor atencin el tipo de valores que pueden tomar las variables puesto que de ello depende el tipo de anlisis estadstico que se realizar con posterioridad. La forma de clasificar a las variables en este caso tiene que ver con considerar los valores que pueden tomar, as pues, en el ejemplo anterior resulta claro que al interrogar a alguna persona, la respuesta que obtenemos tiene que ver con una expresin tal como: negros, caf, azules, etc.

Consideremos ahora otro ejemplo supongamos que se pregunta ahora acerca del grado de satisfaccin que tienen los clientes de un determinado banco, se obtiene como resultado expresiones como: muy satisfecho, satisfecho y poco satisfecho. Tambin se podran usar otros smbolos que estuvieran asociados a los resultados anteriores como: MS, S y PS; o 3, 2 y 1. Es pertinente sealar que estos ltimos valores no seran considerados como nmeros sino como sustitutos de las categoras utilizadas para denotar el grado de satisfaccin.

Note que en ambos ejemplos las respuestas son expresiones, sin embargo en este ltimo es posible percibir que las respuestas tienen un orden, puesto que si alguien responde satisfecho es posible saber que tiene un mayor grado de satisfaccin que quien responde poco satisfecho y menor que quien responde muy satisfecho. En el primero ejemplo no es as, ya que no resulta posible decidir que el color de ojos caf es mejor o peor que negros o cualquiera de los otros colores que hayan sido la respuesta de las personas. Ahora bien, revisemos otro tipo de variables. Si a una persona se le pregunta acerca del nmero de hermanos que tiene, se puede apreciar que los valores que se obtendrn como respuesta sern nmeros, iniciando desde el cero y los primeros nmeros naturales (1, 2, 3, 4, 5, 6, 7, 8, 9,...), as se puede clasificar a las personas de acuerdo al nmero de hermanos que tengan. 2. CLASIFICACIN DE VARIABLES

2.1 Variables independientes

Son las caractersticas en las que difieren los objetos de estudio (sexo, edad, etc.) (En estudios de encuesta y en estudios observacionales) mientras que en estudios experimentales son las diferentes condiciones a las que exponemos a los objetos de estudio. Tambin se les llama variables explicativas o productoras.

2.2 Variables dependientes

Son aquellas cuyo comportamiento es explicado o pronosticado por una o ms variables independientes. Tambin se las llama variables criterio o respuesta. En las investigaciones no experimentales no siempre est claro si una variable es dependiente o independiente, siendo el contexto de la investigacin la que hace decidir aunque a veces una variable puede desempear diferentes roles en distintas situaciones. En algunas aplicaciones del anlisis multivariable, todas las variables tienen el mismo estatus y se habla de relaciones de interdependencia entre variables. En estos casos no hay variables dependientes e independientes.

b) Clasificacin de las variables por los valores que pueden tomar. La clasificacin de las escalas de medida no siempre deja las cosas claras, por eso frecuentemente en el anlisis de datos se divide a las variables en dos grandes grupos:Variables no mtricas o cualitativas (escalas nominal y ordinal)Variables mtricas o cuantitativas (escalas de intervalo o de razn)

Variables cualitativas: representan una cualidad o atributo no medible numricamente. Son ejemplos habituales de variables cuantitativas: el sexo, el estado civil, la nacionalidad, etc. o Nominales: la variable puede tomar valores que no mantienen una relacin de orden entre s. Por ejemplo la nacionalidad de una persona: espaola o extranjera. O Ordinales: las variables cualitativas ordinales a pesar de no poder cuantificarse numricamente s pueden ordenarse. Es decir, existe cierta jerarqua entre los distintos valores que puede tomar la variable. Por ejemplo, el grado de dificultad que tiene un hogar para llegar a fin de mes: con mucha facilidad, con facilidad, con dificultad o con mucha dificultad.

2.3 Variable contina

Es una variable cuantitativa que por su naturaleza puede adoptar cualquier valor numrico (dentro de un intervalo). Para todo par de valores siempre se puede encontrar un valor intermedio, la precisin la da el instrumento de medida. (peso, estatura..). Son aquellas que pueden tomar cualquier valor dentro de un rango determinado. Por ejemplo, los ingresos procedentes del trabajo que recibe una persona.

2.4 Variable discreta

A diferencia de las continuas no pueden tomar cualquier valor del rango. Normalmente toman valores enteros. Son variables cuantitativas discretas el nmero de hijos de una persona, el nmero miembros de un hogar mayores de 65 aos. Variable cualitativa o cuantitativa que slo puede adoptar un nmero finito de valores distintos. En las cuantitativas entre dos valores continuos no hay uno intermedio. (Nmero de hijos)

2.5 Variable dicotmica o binaria

Es aquella que slo puede tomar dos valores. Por ejemplo Sexo, tener o no una enfermedad. Si a sus valores se les pone 0 y 1 se le llama binaria.

2.6 Variable ficticia (dummy)

Las variables cualitativas (nominales y ordinales) a veces se convierten en numricas usando variables ficticias. En ellas el 1 indica presencia de una categora y el 0 ausencia de la misma. Para convertir una variable cualitativa en dummy hacen falta tantas variables como niveles de la variable cualitativa menos uno. Para sexo sera suficiente con una (varn=0, mujer=1) Para Estudios (Eso, Bachillerato y FP) haran falta dos: V1: eso=1, Bach y FP=0, V2: Bach=1, eso y Fp =0, FP queda definida por ser 0 en las otras dos.

En relacin al anlisis de datos se clasifican las variables en funcin de ciertas clasificaciones de escala y de origen: Puntuaciones directas o brutas, son las obtenidas directamente y se suelen representar con letras maysculas (X,Y, ...) y tienen Medias (x , , ...) y desviaciones tpicas (s x , s y ...)

Puntuaciones centradas en la media o diferenciales, se suelen representar con letras minsculas y son un cambio de origen al restar la media de las puntuaciones originales (x = X - x; T = T-T ..) estas variables tienen media cero y su desviacin tpica coincide con la de las puntuaciones originales. Es un cambio de origen pero no de escala. Puntuaciones tpicas o estandarizadas, normalmente representadas por la letra z con el subndice correspondiente a la variable ( z x , z y ...). Se obtiene restando a los valores originales la media y dividiendo por la desviacin tpica ( z x = ( X - x ) / s x. Las puntuaciones tpicas estn libres de escala y siempre tiene media 0 y desviacin tpica 1.

La combinacin lineal de variables. La mayor parte de las tcnicas multivariables combinan las variables de alguna forma "til". Normalmente esta combinacin es una combinacin lineal, a veces llamada variante, aunque tambin hay combinaciones no lineales, no las estudiaremos este curso. Una combinacin lineal es una suma ponderada de las variables, para un conjunto p de variables observadas tendremos V = w1 X1 + w2 X2 +... w p X k

V es la nueva variante o combinacin lineal, y X j y w j representan las variables originales y sus pesos, respectivamente (j = 1,2, p). Esa misma ecuacin se puede representar como el producto de dos vectores v = w' x. En cuanto al nmero de variables que interesa incluir en un anlisis multivariante como regla general se debe observar la parsimonia cientfica, es decir obtener la mejor solucin con el menor nmero posible de variables.2.7 REPRESENTACIN DE DATOS

En los anlisis estadsticos, es frecuente utilizar representaciones visuales complementarias de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los anlisis de forma rpida, directa y comprensible para un conjunto amplio de personas. Las tablas estadsticas representan toda la informacin de modo esquemtico y estn preparadas para los clculos posteriores. Los grficos estadsticos nos transmiten esa informacin de modo ms expresivo, nos van a permitir, con un slo golpe de vista, entender de que se nos habla, observar sus caractersticas ms importantes, incluso sacar alguna conclusin sobre el comportamiento de la muestra donde se est realizando el estudio.

2.8 MTODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS

Los grficos estadsticos son muy tiles para comparar distintas tablas de frecuencia. Los grficos estadsticos ms usuales son:

2.8.1 Diagrama de barras: Se utiliza para la representacin de variables cuantitativas discretas, cada valor de la variable se representa por un punto sobre el eje OX y sobre l se dibuja una barra de longitud igual o proporcional a su frecuencia absoluta. Si la frecuencia absoluta que se utiliza es la acumulativa, el diagrama de barras que se obtiene es: diagrama de barras acumulativo.

2.8.2 Histograma: Se utiliza para la representacin de variables cuantitativas continuas, cada intervalo se representa sobre el eje OX , este ser la base del rectngulo que se dibuja sobre l con altura igual o proporcional a su frecuencia absoluta. Como los intervalos son consecutivos, los rectngulos quedan adosados. Si se utilizarn rectngulos de amplitud diferente, el rea del rectngulo es la que tendra que ser proporcional a la frecuencia absoluta correspondiente a ese intervalo. Histograma acumulativo, si se utiliza la frecuencia absoluta acumulativa.

2.8.3 Polgono de frecuencias: Se utilizan para variables estadsticas cuantitativas, discretas o continuas. Para una variable discreta, el polgono de frecuencias se obtiene uniendo por una poligonal, los extremos superiores de las barras. Para una variable continua, el polgono de frecuencias se obtiene uniendo por una poligonal los puntos medios de la base superior de los polgonos del histograma. Las escalas utilizadas para representar los polgonos de frecuencias influyen mucho por el impacto visual de los mismos.

2.8.4 Diagrama de sectores: Se utiliza para todo tipo de variable estadstica, cuantitativa o cualitativa. Consiste en dibujar sectores sobre un crculo, siendo la amplitud de los sectores proporcional a su frecuencia absoluta, cada sector se rellena con un color diferente. El clculo de la amplitud en grados sexagesimales del sector correspondiente se realiza as: ngulo = frecuencia relativa*360

3. distribucin de frecuencias

Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el nmero de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtencin de la informacin que contienen los datos.

La inspeccin de los datos originales no permite responder fcilmente a cuestiones como cul es la actitud mayoritaria del grupo, y resulta bastante ms difcil determinar la magnitud de la diferencia de actitud entre hombres y mujeres. Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable acompaados del nmero de veces (la frecuencia) que aparece cada valor.

X: Smbolo genrico de la variable.f: Frecuencia (tambin se simboliza como ni).La distribucin de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria de los individuos del grupo estudiado es indiferente. La interpretacin de los datos ha sido facilitada porque se ha reducido el nmero de nmeros a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la variable y 5 frecuencias).

Generalmente las tablas incluyen varas columnas con las frecuencias relativas (son el nmero de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No obstante la frecuencia acumulada tambin es definida incluyendo al valor de referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es el total de frecuencias relativas de los valores iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")

Ejemplo: Consideremos el siguiente grupo de datos:

La distribucin de frecuencias es:Ilustracin 1: Distribucin de frecuencias.

La reduccin de datos mediante el agrupamiento en frecuencias no facilita su interpretacin: La tabla es demasiado grande. Para reducir el tamao de la tabla agrupamos los valores en intervalos, y las frecuencias son las de los conjuntos de valores incluidos en los intervalos:

Ilustracin 2: Distribucin de frecuencias agrpales.

Ahora es ms sencillo interpretar los datos. Por ejemplo, podemos apreciar inmediatamente que el intervalo con mayor nmero de datos es el 34-39, o que el 75% de los datos tiene valor inferior a 46.Este tipo de tabla es denominado "tabla de datos agrupados en intervalos". Elementos bsicos de las tablas de intervalos:

Intervalo: cada uno de los grupos de valores de la variable que ocupan una fila en una distribucin de frecuencias Lmites aparentes: valores mayor y menor del intervalo que son observados en la tabla. Dependen de la precisin del instrumento de medida. En el ejemplo, los lmites aparentes del intervalo con mayor nmero de frecuencias son 34 y 39. Lmites exactos: valores mximo y mnimo del intervalo que podran medirse si se contara con un instrumento de precisin perfecta. En el intervalo 34-39, estos lmites son 33.5 y 39.5 Punto medio del intervalo (mco marca de clase): suma de los lmites divididos por dos. Mc del intervalo del ejemplo= 36.5 Amplitud del intervalo: diferencia entre el lmite exacto superior y el lmite exacto inferior. En el ejemplo es igual a 6.

3.1 organizacin de datos agrupados

Su fin es el resumir la informacin, generalmente los elementos son de mayor tamao por lo cual requieren de ser agrupados, esto implica:

Ordenar, clasificar, y expresar en una tabla de frecuencias. Se agrupan los datos si se cuenta con ms de 20 elementos, aunque se cuenta que ms de 20 elementos debe de verificarse que los datos no sean significativos, esto es que la informacin sea repetitiva tambin debemos de verificar que los datos puedan clasificarse y que dicha clasificacin tiene que tener coherencia entre s.La toma de datos es una de las partes de mayor importancia en el desarrollo de una investigacin. As los datos obtenidos mediante un primer proceso reciben el nombre de Datos sin tratar o en bruto. Los datos en bruto son largas listas de nmeros que no son de gran utilidad y no brindan al investigador la informacin que requiere si antes no se tratan. Los datos sin tratar se les debe sintetizar o resumir de manera que sea posible interpretarlos, entenderlos y utilizarlos. La manera de organizar los datos es mediante tablas de distribucin de frecuencias.

3.2 GRFICOS DE UNA DISTRIBUCIN DE FRECUENCIA

Histogramas Polgonos de frecuencia Ojivas Grficas de pie Diagramas de Pareto Grficas de series Scatter plot (diagrama de puntajes) Diagramas de relaciones entre variables

4. histograma

En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribucin de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua.

Los datos de una variable numrica, resumidos en tablas, tienen una expresin grfica que ayuda a su interpretacin visual. Esta representacin se denomina histograma. Un histograma est formado por una sucesin de rectngulos contiguos construidos sobre una recta. La base de cada rectngulo representa la amplitud del intervalo y la altura est determinada por la frecuencia, de acuerdo a la siguiente: Regla Bsica. Cada observacin representada en un histograma ocupa un rectngulo de igual rea y de base dada por el ancho del intervalo correspondiente. Para cada intervalo, el rectngulo que representa su frecuencia, puede imaginarse formado por un 'apilamiento' de los rectngulos correspondientes a sus observaciones.

Al aplicar la regla bsica en este caso, manteniendo rectngulos de igual rea para cada dato, resulta necesario determinar la altura del rectngulo asociado a un intervalo de acuerdo al tamao de su base correspondiente.

A modo de ejemplo, si un intervalo tiene el doble ancho que otro, cada una de sus observaciones estar representada por un 'rectangulito' de la mitad de la altura que los datos del otro intervalo. Como consecuencia del distinto tamao de los intervalos, a pesar de tener ambos la misma frecuencia, las alturas de los rectngulos correspondientes son distintas. Sin embargo el rea graficada es la misma para cada caso.

Ilustracin 3: histograma.

4.1 Polgono de frecuencias:

Los polgonos de frecuencias se realizan trazando los puntos que representan las frecuencias y unindolos mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos.

EjemploLas temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones:

Ilustracin 4:Poligono de frecuencia absoluta.

4.1.1 Polgonos de frecuencia para datos agrupados

Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo de un histograma

EjemploEl peso de 65 personas adultas viene dado por la siguiente tabla:

cifiFi

[50, 60)5588

[60, 70)651018

[70, 80)751634

[80, 90)851448

[90, 100)951058

[100, 110)110563

[110, 120)115265

65

Ilustracin 5: Polgono de frecuencias agrupados

4.1.2 Polgono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polgono.

Ilustracin 6: Polgono de frecuencias acumuladas.

4.2 curvas de frecuencia

El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extrada de una poblacin grande. A causa de las muchas observaciones que podemos realizar en la poblacin es posible tericamente (para datos continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero adecuado de observaciones dentro de cada clase.Las curvas de frecuencia acumuladas o acumuladas, con los histogramas, son los mtodos ms prcticos, tiles e importantes de interpretaron de datos geoqumicos. En este problema, se ir paso a paso para realizar la construccin de una curva de frecuencia acumulada.

Aunque estas curvas puedan ser generadas fcilmente por ordenadores y algunas calculadoras de escritorio, el conocimiento que est implicado en su construccin, en realidad, es ventajoso, usando datos geoqumicos. En general, en nuestra experiencia, hemos encontrado que muchos estudiantes nunca han construido una de estas curvas. Este ejercicio usar los datos obtenidos durante un muestreo de sedimento de corriente, de un estudio de reconocimiento, en el rea de la Hoja del Mapa de Keiyasi, Fiji.

Son grficos representados por una sola lnea curva (el polgono de frecuencia est conformado por varias lneas rectas consecutivas).

4.3 MEDIDAS DESCRIPTIVAS

El estudio de una variable estadstica comienza con la obtencin de datos, bien sondeando la poblacin o tomando una muestra. El siguiente paso en el proceso es la ordenacin de datos elaborando la tabla correspondiente. Trabajar con una tabla es complejo y tedioso por lo que es ms conveniente la introduccin de nuevos parmetros que nos permitan resumir la informacin que contienen esas tablas.

El objetivo que se persigue es la sintetizacin de la informacin que nos aportan los datos con la menor prdida posible. Vamos a agrupar los parmetros en tres grupos dependiendo de su funcin.

Medidas de centralizacin. Con ellas pretendemos condensar los distintos valores de la variable en uno slo que los resuma.

Medidas de posicin. Una vez ordenados los datos de menor a mayor ser necesario identificar la posicin de los valores.

Medidas de dispersin. Las medidas de centralizacin nos condensan los datos en uno slo pero no nos aportan informacin ninguna sobre la concentracin o dispersin de los datos, habr pues que introducir medidas que palien esta carencia.

Los fenmenos que se observan sometidos al azar no suelen ser constantes, por lo que ser necesario que junto a una medida que indique el valor alrededor del cual se agrupan los datos, se disponga de una medida que haga referencia a la variabilidad que refleje dicha fluctuacin. En este sentido pueden examinarse varias caractersticas, siendo las ms comunes: la tendencia central de los datos, la dispersin o variacin con respecto a este centro, los datos que ocupan ciertas posiciones, la simetra de los datos y la forma en la que los datos se agrupan.

4.4.MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas como medidas de posicin.Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica. Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cul es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones.

En otras palabras, para que una calificacin tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadsticos. Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del promedio de la clase.

En resumen, el propsito de las medidas de tendencia central es:Mostrar en qu lugar se ubica la persona promedio o tpica del grupo. Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el puntaje central o tpico. Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms grupos. Las medidas de tendencia central ms comunes son:

La media aritmtica: comnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una lnea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representa Mo.

5. MEDIA ARITMTICA

Es la principal medida de tendencia central. La media se calcula sumando todos los datos y luego dividiendo este resultado por el nmero total de datos que tiene la muestra.

Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al nmero del caso que representa la mediana de la distribucin. Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de valores antes y despus de l en un conjunto de datos agrupados. Segn el nmero de valores que se tengan se pueden presentar dos casos: Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho conjunto de datos. Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

media aritmtica (tambin llamada promedio o simplemente media) de un conjunto finito de nmeros es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestra{ siendo uno de los principales estadsticos muestrales.

Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin.Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada observacin (persona) tuviera la misma cantidad de la variable.

Tambin la media aritmtica puede ser denominada como centro de gravedad[cita requerida] de una distribucin, el cual no est necesariamente en la mitad.

Una de las limitaciones de la media aritmtica es que se trata de una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.

La media aritmtica se calcula sumando todos los componentes y dividiendo el resultado entre el nmero de componentes. El resultado entero o decimal es la media aritmtica.

6. mediana

Es el valor central de una serie de datos, para poder encontrar la mediana es indispensable que los datos estn ordenados. Existen dos mtodos para el clculo de la mediana:

Considerando los datos en forma individual, sin agruparlos.Utilizando los datos agrupados en intervalos de clase. A continuacin veamos cada una de ellas.

6.1 Datos sin agrupar

Sean x_1,x_2,x_3. . . . x n los datos de una muestra ordenada en orden creciente y designando la mediana como distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin (n+1)/2 una vez que los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: M_e=x_{(n+1)/2}.

Por ejemplo, si tenemos 5 datos, que ordenados son: x_1 = 3, x_2 = 6, x_3 = 7, x_4 = 8, x_5 = 9 => El valor central es el tercero: x_{(5+1)/2} = x_3 = 7. Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (x_1, x_2) y otros dos por encima de l (x_4, x_5)b) Si n es par, la mediana es la media aritmtica de los dos valores centrales. Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las posiciones n/2 y n/2+1. Es decir: M_e = (x_{\frac{n}{2}} + x_{{\frac{n}{2}}+1})/2.

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9, x6 = 10 => Hay dos valores que estn por debajo del y otros dos que quedan por encima del siguiente dato 1} = x_4 = 8. Por tanto, la mediana de este grupo de datos es la media aritmtica de estos dos datos:

6.2 Datos agrupados

Al tratar con datos agrupados, si {{\frac {n} {2}}} coincide con el valor de una frecuencia acumulada, el valor de la mediana coincidir con la abscisa correspondiente. Si no coincide con el valor de ninguna abscisa, se calcula a travs de semejanza de tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la siguiente equivalencia:

7. moda

La moda es el valor que aparece con mayor frecuencia dentro de una muestra.

En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de datos. Se habla de una distribucin bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

7.1 moda de datos agrupados

Para obtener la moda en datos agrupados se usa la siguiente frmula:

Dnde: = inferior de la clase modal. = es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal. = es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.

= Amplitud del intervalo modal

7.1.1 Propiedades

Sus principales propiedades son:

Clculo sencillo. Interpretacin muy clara. Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".7.1.2 Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del nmero de intervalos y de su amplitud. Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor. No siempre se sita hacia el centro de la distribucin. Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

7.2 ejemplo

Ilustracin 7: Moda de datos agrupados.

8. CUARTILES, DECIL Y PERCENTIL

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos

Decil se refiere a cada uno de los 9 valores que dividen un grupo de datos (clasificados con una relacin de orden) en diez partes iguales, y de manera que cada parte representa un dcimo de la poblacin.

El percentil es una medida no central usada en estadstica que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20 es el valor debajo del cual se encuentran el 20 por ciento de las observaciones

9. CALCULO DE CUARTILES DE DATOS AGRUPADOS EN INTERVALOS

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

Calcula Q1, Q2 y Q3 de los salarios de 15 personas: 300,275, 180, 325, 200, 250, 350, 260, 280, 310, 400, 380,260, 290, 370.

Cuartiles para datos agrupados en intervalos de clase Como son medidas de posicin similares a la mediana, entonces para su clculo en una distribucin enintervalos de clase se utiliza una frmula similar, slo que el total de datos en lugar de dividirlo entre dos Para encontrar la clase que contiene al cuartil se busca la primera clase cuya frecuencia acumulada es mayor o igual que esa posicin. En el caso del ejemplo actual como la posicin es 15 utilizas 16 que corresponde a la segunda clase.

9.1 Datos agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos agrupados es la siguiente:k= 1,2,3

Dnde:Lk = Lmite real inferior de la clase del cuartil kn = Nmero de datosFk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.fk = Frecuencia de la clase del cuartil kc = Longitud del intervalo de la clase del cuartil kSi se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente:El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones.Frmula de Q1, para series de Datos agrupados:

Dnde:L1 = lmite inferior de la clase que lo contieneP = valor que representa la posicin de la medidaf1 = la frecuencia de la clase que contiene la medida solicitada.Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.Ic = intervalo de claseEl tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.Frmula de Q3, para series de Datos agrupados:

Dnde:L1 = lmite inferior de la clase que lo contieneP = valor que representa la posicin de la medidaf1 = la frecuencia de la clase que contiene la medida solicitada.Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.Ic = intervalo de clase.Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.

9.1.1 Para datos no agrupados

Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las siguientes frmulas:- El primer cuartil:Cuando n es par:

Cuando n es impar: Para el tercer cuartilCuando n es par:

Cuando n es impar:

9.2 cuartiles

Cuando la distribucin de datos contiene un nmero determinado de datos y se requiere obtener un porcentaje o una parte de la distribucin de datos, se puede dividir la distribucin en cuatro partes iguales, cada parte tiene la misma cantidad de datos y cada una de las partes representa un 25% de la totalidad de datos.

9.3 percentiles

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99. Datos Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la frmula:

= 1, 2,3,... 99

Dnde:

Lk = Lmite real inferior de la clase del decil kn = Nmero de datosFk = Frecuencia acumulada de la clase que antecede a la clase del decil k.fk = Frecuencia de la clase del decil kc = Longitud del intervalo de la clase del decil k

Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.

10. MEDIDAS DE DISPERSIN

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.

Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).

Las medias de tendencia central o posicin nos indican donde se sita un dato dentro de una distribucin de datos. Las medidas de dispersin, variabilidad o variacin nos indican si esos datos estn prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se encuentran los datos. Estas medidas de dispersin nos permiten apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentracin de los mismos en un cierto sector de la distribucin, es decir, permiten estimar cun dispersas estn dos o ms distribuciones de datos.Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media aritmtica el dato central ms utilizado. Cuando existe una dispersin pequea se dice que los datos estn dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En el caso que la dispersin sea grande el valor central no es muy confiable. Cuando una distribucin de datos tiene poca dispersin toma el nombre de distribucin homognea y si su dispersin es alta se llama heterognea.

10.1 rango

El rango o recorrido interarticular es la diferencia entre el valor mximo y el valor mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con R'.En estadstica descriptiva se denomina rango estadstico (R) o recorrido estadstico al intervalo entre el valor mximo y el valor mnimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms dispersos estn los datos de un conjunto.

10.2 Obtencin del rango Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo

EjemploPara la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se encuentran en un rango de:

Rango = (9-4) = 5Medio rango o Rango medioEl medio rango o rango medio de un conjunto de valores numricos es la media del mayor y menor valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

EjemploPara una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:

Representacin del medio rango: Medio rango.jpg

10.2.1 requisitos del rango

* Ordenamos los nmeros segn su tamao.* Restamos el valor mnimo del valor mximo.* Es calculable mediante la resta del valor mnimo al valor mximo.* Comparte unidades con los datos.* Permite obtener una idea de la dispersin de los datos.

10.2.2 ejemplos

Para una serie de datos de carcter cuantitativo como es la estatura tal y como:x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155 Es posible ordenar los datos como sigue:x(1) =155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185 Donde la notacin x(i) indica que se trata del elemento i-simo de la serie de datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que es lo mismo:R = x(k) x(1)

Con cinco valores, nos da que R = 185-155 = 30.

10.3 varianza

En teora de probabilidad, la varianza (que suele representarse como \sigma^2) de una variable aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media.

Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin estndar es la raz cuadrada de la varianza, es una medida de dispersin alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mnimo 0.

10.3.1 Propiedades

Debido a que la variancia se define en trminos del valor esperado, tambin ella posee propiedades, algunas de las cuales se presentan a continuacin.Sean a y b dos constantes cualesquiera y sea X una variable aleatoria. Entonces:

1. Var (X) no puede ser negativa2. Var (a) = 03. Var (X + a) = Var (X) + Var(a) = Var(X)4. Var (bX) = b2 Var (X)5. Var (a + bX) = b2 Var (X)

Las propiedades de la desviacin estndar son las mismas que las de la variancia y lo nico que se debe hacer es tomar la raz cuadrada de los valores de la variancia.

10.4 DESVIACIN TPICA

La desviacin tpica o desviacin estndar es una medida de dispersin para variables de razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la variable.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.La desviacin tpica es una medida del grado de dispersin de los datos con respecto al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto a la media aritmtica.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar muestrales son 7, 5 y 1 respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7.

La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen la teora. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los datos alrededor de un valor central (la media o promedio).

10.4.1 Desviacin Tpica maestral

Es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir caractersticas de una poblacin o modelo estadstico.

La desviacin tpica o desviacin estndar (denotada con el smbolo o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersin para variables de razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la variable.Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.10.4.2 Desviacin tpica poblacional

La Desviacin Estndar es la raz cuadrada de lavarianzade la distribucin de probabilidad discreta:

Cuando los casos tomados son iguales al total de la poblacin se aplica la frmula de desviacin estndar poblacional. As la varianza es la media de los cuadrados de las diferencias entre cada valor de lavariabley lamedia aritmticade la distribucin.

10.4.3 Ejemplo

El gerente de una empresa de alimentos desea saber que tanto varan los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.Por lo que su media es:

10.4.4 Covarianza

Una medida del grado en que dos variables aleatorias se mueven en la misma direccin o en direcciones opuestas la una respecto a la otra. En otras palabras, si dos variables aleatorias generalmente se mueven en la misma direccin se dir que tienen una covarianza positiva. Si tienden a moverse en direcciones opuestas, se dir que tienen una covarianza negativa. La covarianza se mide como el valor que se espera de los productos de las desviaciones de dos variables aleatorias respecto a sus correspondientes medias. Una varianza es un caso especial de covarianza. En probabilidad y estadstica,

La covarianza es un valor que indica el grado de variacin conjunta de dos variables aleatorias. Es el dato bsico para determinar si existe una dependencia entre ambas variables y adems es el dato necesario para estimar otros parmetros bsicos, como el coeficiente de correlacin lineal o la recta de regresin.

Cuando a grandes valores de una de las variables suelen mayoritariamente corresponderles los grandes de la otra y lo mismo se verifica para los pequeos valores de una y la otra, se corrobora que tienden a mostrar similar comportamiento lo que se refleja en un valor positivo de la covarianza1

Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general los menores de la otra, expresando un opuesto comportamiento, la covarianza es negativa. El signo de la covarianza, por lo tanto, expresa la tendencia en la relacin lineal entre las variables. La magnitud requiere un esfuerzo adicional de interpretacin:

La versin normalizada de la covarianza, el coeficiente de correlacin indica la magnitud de la especificidad de la relacin lineal.

Se debe distinguir entre:

(1) la covarianza de dos variables aleatorias, parmetro estadstico de una poblacin considerado una propiedad de la distribucin conjunta y

(2) la covarianza maestral que se emplea como un valor estadsticamente estimado del parmetro.

Ilustracin 8: Cuadro de covarianza

En este sentido el indicador bivariante ms importante es lacovarianza:Dadas dos variables estadsticas x e y definiremos la covarianza Sxycomo:

En el caso de disponer de la distribucin agregada por frecuencias en una tabla de correlacin.En el caso de disponer de la distribucin sin agregar por frecuencias (en un listado matricial de datos donde cada registro es una observacin y n de registros= N)

10.4.5 Propiedades

1. La covarianza es elmomento centralde orden 1,1 de la distribucin bidimensional.2. Es invariante ante los cambios de origen en cualquiera de las dos variables.3. Sin embargo depende de los cambios de unidad .Si se cambia de unidad de medida en ambas variables la covarianza se modifica proporcionalmente a ambos cambios:

u= a+bx v = c + dy Suv= b.d.Sxy4. La expresin de clculo de la covarianza esDonde a11es el llamadomomento (ordinario)mixtoy su expresin es:

Si las observaciones estn agregadas por frecuencias , o bien: Si las observaciones no estn agregadas por frecuencias5. Si dos variables son independientes su covarianza es cero (el resultado recproco no es necesariamente cierto).6. La covarianza nos mide lacovariacin conjuntade dos variables: Si es positiva nos dar la informacin de que a valores altos de una de la variable hay una mayortendenciaa encontrar valores altos de la otra variable y a valores bajos de una de las variables, correspondientemente valores bajos. En cambio si la covarianza es negativa, la covariacin de ambas variables ser en sentido inverso: a valores altos le correspondern bajos, y a valores bajos, altos. Si la covarianza es cero no hay una covariacin clara en ninguno de los dos sentidos. Sin embargo el hecho de que la covarianza dependa de las medidas de las variables no permite establecer comparaciones entre unos casos y otros.

11. CONCEPTOS GENERALES DE PROBABILIDAD

Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa asociada al suceso a medida que el nmero de veces que se realiza el experimento crece.La probabilidad es un mtodo por el cual se obtiene la frecuencia de un acontecimiento determinado mediante la realizacin de un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, las ciencias y la filosofa para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecnica subyacente discreta de sistemas complejos, por lo tanto es la rama de las matemticas que estudia, mide o determina a los experimentos o fenmenos aleatorios.

Un experimento aleatorio se caracteriza porque repetido muchas veces y en idnticas condiciones el cociente entre el nmero de veces que aparece un resultado (suceso) y el nmero total de veces que se realiza el experimento tiende a un nmero fijo. Esta propiedad es conocida como ley de los grandes nmeros, establecida por Jakob Bernouilli. Tiene el inconveniente de variar la sucesin de las frecuencias relativas de unas series de realizaciones a otras, si bien el valor al que se aproximan a medida que el nmero de realizaciones aumenta se mantiene estable.La frecuencia relativa del suceso A:Propiedades de la frecuencia relativa:0 fr (A) 1 cualquiera que sea el suceso A.fr( ) = fr(A) + fr(B) si = .fr(E) = 1 fr() = 0.

Esta definicin presenta el inconveniente de tener que realizar el experimento un gran nmero de veces y adems siempre obtendremos un valor aproximado de la probabilidad.

rbol de probabilidades: representacin grfica que muestra los resultados posibles de una serie de experimentos y sus respectivas probabilidades.Complemento de un evento: elementos del espacio muestral no incluidos en el evento considerado.Dependencia estadstica: condicin en la que la probabilidad de presentacin de un evento depende de la presentacin de algn otro evento, o se ve afectada por sta.Diagrama de Venn: representacin grfica de los conceptos de probabilidad en la que el espacio muestral est representado por un rectngulo y los eventos que suceden en el espacio muestral se representan como partes de dicho rectngulo.Espacio muestral: conjunto de todos los resultados posibles de un experimento aleatorio.Evento: uno o ms de los resultados posibles de hacer algo, o uno de los resultados posibles de realizar un experimento.Eventos exhaustivamente colectivos: lista de eventos que representa todos los resultados posibles de un experimento.Eventos mutuamente excluyentes: eventos que no se pueden presentar juntos.Experimento aleatorio: actividad que tiene como resultado o que produce un evento. Prueba donde existen dos o ms resultados posibles, y no se pude anticipar cul de ellos va a ocurrir.Frecuencia relativa de presentacin: fraccin de veces que a la larga se presenta un evento cuando las condiciones son estables, o frecuencia relativa observada de un evento en un nmero muy grande de intentos o experimentos.Independencia estadstica: condicin en la que la presentacin de algn evento no tiene efecto sobre la probabilidad de presentacin de otro evento.Probabilidad: la posibilidad de que algo suceda.Probabilidad clsica: nmero de resultados favorables a la presentacin de un evento dividido entre el nmero total de resultados posibles. Asignacin de probabilidad "a priori", si necesidad de realizar el experimento.Probabilidad condicional: probabilidad de que se presente un evento, dado que otro evento ya se ha presentado.Probabilidad conjunta: probabilidad de que se presenten dos o ms eventos simultneamente o en sucesin.Probabilidad marginal: probabilidad incondicional de que se presente un evento; probabilidad de que se presente un solo evento. Probabilidad simple, o probabilidad de un evento cualquiera.Probabilidad subjetiva: probabilidad basada en las creencias personales de quien hace la estimacin de probabilidad. Asignacin de probabilidad en forma intuitiva, en base a la experiencia o el conocimiento.Producto de probabilidades: probabilidad de la interseccin de dos o ms eventos.Suma de probabilidades: probabilidad de la unin de dos o ms eventos.11.1 POBLACIN (N)

Conjunto finito o infinito de elementos, sobre los que vamos a realizar observaciones. Por ejemplo: los habitantes de un lugar, las piezas obtenidas de una mquina en un determinado tiempo, etc. El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes.

Destacamos algunas definiciones:"Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996)."Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974).

El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica y en nuestro caso social, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos.Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de habitantes de una comarca. Cuando la poblacin es muy grande, es obvio que la observacin y/o medicin de todos los elementos se multiplica la complejidad, en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica.

Evolucion de la poblacion espaolaIlustracin 9: grafic de poblacin.

Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo denominada muestra.

11.2. MUESTRA (n)

En estadstica, una muestra es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste. La muestra es una representacin significativa de las caractersticas de una poblacin, que bajo, la asuncin de un error (generalmente no superior al 5%) estudiamos las caractersticas de un conjunto poblacional mucho menor que la poblacin global.

"Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991)."Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin (1996).

"Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974). Por ejemplo estudiamos los valores sociales de una poblacin de 5000 habitantes aprox., entendemos que sera de gran dificultad poder analizar los valores sociales de todos ellos, por ello, la estadstica nos dota de una herramienta que es la muestra para extraer un conjunto de poblacin que represente a la globalidad y sobre la muestra realizar el estudio. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin.

Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.

11.3. MUESTREO

A la tcnica para la seleccin de una muestra a partir de una poblacin.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de toda la poblacin.

Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de poblacin. Este se realiza una vez que se ha establecido un marco muestral representativo de la poblacin, se procede a la seleccin de los elementos de la muestra aunque hay muchos diseos de la muestra.

Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada muestra no necesariamente seran iguales, y lo ms probable es que variaran de una muestra a otra.

11.3.1. Tipos de Muestreo

Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio evitan el anlisis estadstico necesario para hacer muestras de probabilidad.

No aleatorios: Se eligen los elementos, en funcin de que sean representativos, segn la opinin del investigador.

Aleatorios: Todos los miembros de la muestra han sido elegidos al azar, de forma que cada miembro de la poblacin tuvo igual oportunidad de salir en la muestra.

Simple: Elegido el tamao de la muestra, los elementos que la compongan se han de elegir aleatoriamente entre los N de la poblacin.

Sistemtico: Se ordenan previamente los individuos de la poblacin; despus se elige uno de ellos al azar, a continuacin, a intervalos constantes, se eligen todos los dems hasta completar la muestra.

Estratificado: Se divide la poblacin total en clases homogneas, llamadas estratos; por ejemplo, por grupos de edades, por sexo. Hecho esto la muestra se escoge aleatoriamente en nmero proporcional al de los componentes de cada clase o estrato.

11.4. ESPACIO MUESTRAL

La Estadstica, y por tanto el Clculo de Probabilidades, se ocupan de los denominados fenmenos o experimentos aleatorios. El conjunto de todos los resultados posibles diferentes de un determinado experimento aleatorio se denomina Espacio Muestral asociado a dicho experimento y se suele representar por . A los elementos de se les denomina sucesos elementales.

As por ejemplo, el espacio muestral asociado al experimento aleatorio consistente en el lanzamiento de una moneda es = {Cara, Cruz}; el espacio muestral asociado al lanzamiento de un dado es ={1, 2, 3, 4, 5, 6}, siendo Cara y Cruz los sucesos elementales asociados al primer experimento aleatorio y 1, 2, 3, 4, 5 y 6 los seis sucesos elementales del segundo experimento aleatorio. A pesar de la interpretacin que tiene el espacio muestral, no es ms que un conjunto abstracto de puntos (los sucesos elementales), por lo que el lenguaje, los conceptos y propiedades de la teora de conjuntos constituyen un contexto natural en el que desarrollar el Clculo de Probabilidades.

Sea A. el conjunto de las partes de, es decir, el conjunto de todos los subconjuntos de . En principio, cualquier elemento de A, es decir, cualquier subconjunto del espacio muestral contendr una cierta incertidumbre, por lo que trataremos de asignarle un nmero entre 0 y 1 como medida de su incertidumbre. En Clculo de Probabilidades dichos subconjuntos reciben en el nombre de sucesos, siendo la medida de la incertidumbre su probabilidad. La tripleta (,A,P) recibe el nombre de espacio probabilstico. Por tanto, asociado a todo experimento aleatorio existen tres conjuntos: El espacio muestral, la clase de los sucesos, es decir, el conjunto de elementos con incertidumbre asociados al experimento aleatorio A, y una funcin real, P:A [0, l], la cual asignar a cada suceso (elemento de A) un nmero entre cero y uno como medida de su incertidumbre.Se advierte no obstante, que la eleccin del espacio muestral asociado a un experimento aleatorio no tiene por qu ser nica, sino que depender de que sucesos elementales que se quieran considerar como distintos y del problema de la asignacin de la probabilidad sobre esos sucesos elementales. Respecto a la clase de los sucesos A, es natural que sta tenga una estructura tal que permita hablar no solo de sucesos sino tambin de su unin, interseccin, diferencia, complementario, etc., debiendo ser la clase A, en consecuencia, cerrada a dichas operaciones entre "conjuntos" (entre sucesos). Esta es la situacin del conjunto de las partes cuando es finito o inclusive numerable (caso, por ejemplo, del espacio muestral asociado al experimento aleatorio consistente en lanzar una moneda hasta que salga cara por primera vez). En otras ocasiones en las que sea un conjunto continuo (por ejemplo, cuando estudiamos el tiempo que tarda un istopo radioactiva en volverse inestable), deber ser A un conjunto estrictamente ms pequeo que el conjunto de las partes de . En todo caso se puede pensar en A como en el conjunto que contiene todos los elementos de inters, es decir, todos los sucesos a los que les corresponde una probabilidad.

Algunas peculiaridades del Clculo de Probabilidades respecto a la teora de conjuntos. Aqu, el conjunto vaco 0 recibe el nombre de suceso imposible, definido como aquel subconjunto de que no contiene ningn suceso elemental y que corresponde a la idea de aquel suceso que no puede ocurrir. De forma anloga, el espacio total recibe el nombre de suceso seguro al recoger dicha denominacin la idea que representa. Se Llamar sucesos incompatibles a aquellos cuya interseccin sea el suceso imposible.Por ltimo, puede decirse que la inclusin de sucesos, A B, se interpreta aqu como que siempre que se cumpla el suceso A se cumple el B; por ejemplo, siempre que salga el 2 (suceso A) sale par (suceso B).

Ejemplo: "Lanzamiento de un dado"El espacio probabilstico asociado al experimento aleatorio consistente en el lanzamiento de un dado, tendr como espacio muestras ={1,2,3,4,5,6} y como espacio de sucesos el conjunto de las partes por ser finito, el cual contiene 26 elementos,A = { , {1}, {2}, {3}, {4}, {5}, {6}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6}, {2,3}, {2,4}, {2,5}, {2,6}, {3,4}, {3,5}, {3,6}, {4,5}, {4,6}, {5,6}, {1,2,3}, {1,2,4}, {1,2,5}, {1,2,6}, {1,3,4}, {1,3,5}, {1,3,6}, {1,4,5}, {1,4,6}, {1,5,6}, {2,3,4}, {2,3,5}, {2,3,6}, {2,4,5}, {2,4,6}, {2,5,6}, {3,4,5}, {3,4,6}, {3,5,6}, {4,5,6}, {1,2,3,4}, {1,2,3,5}, {1,2,3,6}, {1,2,4,5}, {1,2,4,6}, {1.,2,5,6}, {1,3,4,5}, {1,3,4,6}, {1,3,5,6}, {1,4,5,6}, {2,3,4,5}, {2,3,4,6}, {2,3,5,6}, {2,4,5,6}, {3,4,5,6}, {1,2,3,4,5}, {1,2,3,4,6}, {1,2,3,5,6}, {1,2,4,5,6}, {1,3,4,5,6}, {2, 3, 4, 5, 6}, }.

Obsrvese que este conjunto contiene los sucesos sobre los que habitualmente se tiene incertidumbre, como por ejemplo que salga un nmero par, {2,4,6}, o un nmero mayor que cuatro, {5,6}, o simplemente que salga un seis, {6}, y que como se ve es cerrado respecto de las operaciones entre conjuntos.

El ltimo elemento del espacio probabilstico es la probabilidad, que como antes se anot est definida sobre A, asignando a cada suceso un nmero entre 0 y 1.

ASIGNACIN DE PROBABILIDADES:Concepto frecuentista Es un hecho, empricamente comprobado, que la frecuencia relativa de un suceso tiende a estabilizarse cuando la frecuencia total aumenta.Surge as el concepto frecuentista de la probabilidad de un suceso como un nmero ideal al que converge su frecuencia relativa cuando la frecuencia total tiende a infinito. As, solemos afirmar que la probabilidad de que salga un seis al tirar un dado es 1/6 porque al hacer un gran nmero de tiradas su frecuencia relativa es aproximadamente esa. El problema radica en que al no poder repetir la experiencia infinitas veces, la probabilidad de un suceso ha de ser aproximada por su frecuencia relativa para un n suficientemente grande, y cun grande es un n grande?. 0, qu hacer con aquellas experiencias que solo se pueden repetir una vez?

EVENTOSUn evento es un subconjunto de un espacio muestral.Experimento aleatorio: conjunto de pruebas cuyos resultados estn determinados nicamente por el azar. Es toda actividad cuyos resultados no se determinan con certeza. Ejemplo: lanzar una moneda al aire. No podemos determinar con toda certeza cul ser el resultado al lanzar una moneda al aire?, por lo tanto constituye un experimento aleatorio. Espacio muestral: conjunto de todos los resultados posibles de un experimento aleatorio Es un conjunto de todos los resultados posibles que se pueden obtener al realizar un experimento aleatorio. Ejemplo: sea el experimento E: lanzar un dado y el espacio muestral correspondiente a este experimento es: S = (1, 2, 3, 4, 5, 6(.

Punto muestral o suceso elemental: el resultado de una sola prueba de un experimento muestral Es un elemento del espacio muestral de cualquier experimento dado.

Suceso o evento: cualquier subconjunto de puntos muestralesEs todo subconjunto de un espacio muestral. Se denotan con letras maysculas: A, B, etc. Los resultados que forman parte de este evento generalmente se conocen como "resultados favorables". Cada vez que se observa un resultado favorable, se dice que "ocurri" un evento. Ejemplo: Sea el experimento E: lanzar un dado. Un posible evento podra ser que salga nmero par. Definimos el evento de la siguiente manera: A = sale nmero par = (2, 4, 6(, resultados favorables n(E) = 3Los eventos pueden ser:i) Evento cierto.- Un evento es cierto o seguro si se realiza siempre. Ejemplo: Al introducirnos en el mar, en condiciones normales, es seguro que nos mojaremos.ii) Evento imposible.- Un evento es imposible si nunca se realiza. Al lanzar un dado una sola vez, es imposible que salga un 10iii) Evento probable o aleatorio.- Un evento es aleatorio si no se puede precisar de antemano el resultado. Ejemplo: Al lanzar un dado, saldr el nmero 3?

Sucesos mutuamente excluyentes: sucesos o eventos que no pueden ocurrir simultaneamente .Sucesos complementarios: dos sucesos o eventos mutuamente excluyentes cuya unin es el espacio muestralSucesos independientes: sucesos o eventos que no tienen relacin entre s; la ocurrencia de uno no afecta la ocurrencia del otroSucesos dependientes: sucesos o eventos que s tienen relacin entre s; la ocurrencia de uno s afecta la ocurrencia del otro.

EJEMPLO: Se lanza un dado.a) Encontrar el espacio muestral. Solucin: S = {1, 2, 3, 4, 5, 6}b) Enumerar los puntos muestrales. Solucin: Hay seis puntos muestrales: {1},{2},{3},{4},{5} y {6}.c) Poner dos ejemplos de eventos. Solucin: evento A = {resultado es impar} = {1, 3, 5}; evento B = {resultado es mayor que 2} = {3, 4, 5, 6}d) Son mutuamente excluyentes los siguientes eventos? A = {resultado menor o igual a 4}, B = {resultado es primo}. Solucin: A = {1, 2, 3, 4} y B = {2, 3, 5} s tienen dos puntos en comn, 2 y 3. Por lo tanto, no son mutuamente excluyentes.e) Cul suceso es complementario a M = {2, 6}? Solucin: {1, 3, 4, 5}.f) Son dependientes o independientes los siguientes eventos? A = {obtener un 2 en el primer lanzamiento}, B = {obtener un 4 en el segundo lanzamiento}. Solucin: Son independientes, porque obtener o no un 2 en el primer lanzamiento no afecta el resultado del segundo lanzamiento.

PROBABILIDAD.- Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo determinado. Dichos eventos pueden ser medibles a travs de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una probabilidad de 0 (evento imposible) y un evento que ocurra con certeza es de 1 (evento cierto).La probabilidad de que ocurra un evento, siendo sta una medida de la posibilidad de que un suceso ocurra favorablemente, se determina principalmente de dos formas: empricamente (de manera experimental) o tericamente (de forma matemtica).i) Probabilidad emprica.- Si E es un evento que puede ocurrir cuando se realiza un experimento, entonces la probabilidad emprica del evento E, que a veces se le denomina definicin de frecuencia relativa de la probabilidad, est dada por la siguiente frmula:Nota: P(E), se lee probabilidad del evento Eii) Probabilidad terica.- Si todos los resultados en un espacio muestral S finito son igualmente probables, y E es un evento en ese espacio muestral, entonces la probabilidad terica del evento E est dada por la siguiente frmula, que a veces se le denomina la definicin clsica de la probabilidad, expuesta por Pierre Laplace en su famosa Teora analtica de la probabilidad publicada en 1812:G) POSIBILIDADES.- Las posibilidades comparan el nmero de resultados favorables con el nmero de resultados desfavorables. Si todos los resultados de un espacio muestral son igualmente probables, y un nmero n de ellos son favorables al evento E, y los restantes m son desfavorables a E, entonces las posibilidades a favor de E sonde de n(E) a m(E), y las posibilidades en contra de E son de m(E) a n(E)Ejemplos ilustrativos: Mathas se le prometi comprar 6 libros, tres de los cuales son de Matemtica. Si tiene las mismas oportunidades de obtener cualquiera de los 6 libros, determinar las posibilidades de que le compren uno de Matemtica.Solucin:Nmero de resultados favorables = n(E) = 3Nmero de resultados desfavorables = m(E) = 3Posibilidades a favor son n(E) a m(E), entonces,Posibilidades a favor = 3 a 3, y simplificando 1 a 1.Nota: A las posibilidades de 1 a 1 se les conoce como "igualdad de posibilidades" o "posibilidades de 50-50"Reglas de la probabilidadA) REGLA DE LA

Informe de Estadistica. (1)

Documents

Transcript of Informe de Estadistica. (1)