INFORME ESTADISTICA

30
UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN Facultad: FAIN – E.A.P. Ing. de Minas Curso: Análisis Estadístico de Datos Mineros Trabajo: Informe Estudiante: Fernando Alonso Ocaña Miranda Código:

description

Tesis Final de Estadística para Ingenieros Comerciales

Transcript of INFORME ESTADISTICA

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN

Facultad: FAIN E.A.P. Ing. de Minas Curso: Anlisis Estadstico de Datos MinerosTrabajo: 1 InformeEstudiante: Fernando Alonso Ocaa MirandaCdigo: 2012-36947

TACNA PER2015MEDIA

Construccin geomtrica para hallar las mediasaritmtica,geomtrica,armnicaycuadrticade dos nmerosayb.

Comparacin de lamedia aritmtica,la medianay lamodade dosdistribuciones log-normalcon diferenteasimetra.Enmatemticasyestadsticaunamediaopromedioes unamedida de tendencia centralque segn laReal Academia Espaola(2001) [] resulta al efectuar una serie determinada de operaciones con un conjunto de nmeros y que, en determinadas condiciones, puede representar por s solo a todo el conjunto. Existen distintos tipos de medias, tales como lamedia geomtrica, lamedia ponderaday lamedia armnicaaunque en el lenguaje comn, el trmino se refiere generalmente a lamedia aritmtica.Ejemplos de medias:Existen numerosos ejemplos de medias, una de las pocas propiedades compartidas por todas las medias es que cualquier media est comprendida entre el valor mximo y el valor mnimo del conjunto de variables:

Adems debe cumplirse que:

Media aritmticaLamedia aritmticaes un promedio estndar que a menudo se denomina "promedio".

La media se confunde a veces con lamedianaomoda. La media aritmtica es el promedio de un conjunto de valores, o su distribucin; sin embargo, para las distribuciones con sesgo, la media no es necesariamente el mismo valor que la mediana o que lamoda. La media, moda y mediana son parmetros caractersticos de una distribucin de probabilidad. Es a veces una forma de medir el sesgo de una distribucin tal y como se puede hacer en las distribucionesexponencialy dePoisson.Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores) esMedia aritmtica ponderadaA veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Sies un conjunto de datos o media muestral yson nmeros reales positivos, llamados "pesos" o factores de ponderacin, se define la media ponderada relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y escala, de las variables, es decir siXes una variable aleatoria eYes otra variable aleatoria que depende linealmente deX, es decir,Y=aX + b(dondearepresenta la magnitud del cambio de escala ybla del cambio de origen) se tiene que:

Media geomtricaLa media geomtrica es un promedio muy til en conjuntos de nmeros que son interpretados en orden de su producto, no de su suma (tal y como ocurre con la media aritmtica). Por ejemplo, las velocidades de crecimiento.

Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34 (seis valores) esMedia armnicaLa media armnica es un promedio muy til en conjuntos de nmeros que se definen en relacin con algunaunidad, por ejemplo lavelocidad(distancia por unidad de tiempo).

Por ejemplo, la media armnica de los nmeros: 34,27,45,55,22,y34 es:

Generalizaciones de la mediaExisten diversas generalizaciones de las medias anteriores.Media generalizadaLasmedias generalizadas, tambin conocidas como medias de Hlder, son una abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se definen y agrupan a travs de la siguiente expresin:

Eligiendo un valor apropiado del parmetrom, se tiene: -mximo, -media cuadrtica, -media aritmtica, -media geomtrica, -media armnica, -mnimo.Media-f generalizadaEsta media puede generalizarse para unafuncin montonacomo lamedia-f generalizada:

dondesea una funcin inyectiva eun intervalo. Escogiendo formas particulares parafse obtienen algunas de las medias ms conocidas: -media aritmtica, -media armnica, -media generalizada, -media geomtrica,.Media de una funcinPara una funcin continuasobre un intervalo [a,b], se puede calcular el valor medio de funcinsobre [a,b] como:

De hecho la definicin anterior vale an para una funcin acotada aunque no sea continua.

Media estadsticaLamedia estadsticase usa en estadstica para dos conceptos diferentes aunque numricamente similares:-Lamedia muestral, que es unestadsticoque se calcula a partir de lamedia aritmticade un conjunto de valores de unavariable aleatoria.-Lamedia poblacional, valor esperado oesperanza matemticade una variable aleatoria.En la prctica dada unamuestra estadsticasuficientemente grande el valor de la media muestral de la misma es numricamente muy cercano a la esperanza matemtica de la variable aleatoria medida en esa muestra. Dicho valor esperado, slo es calculable si se conoce con toda exactitud la distribucin de probabilidad, cosa que raramente sucede en la realidad, por esa razn, a efectos prcticos la llamada media se refiere normalmente a la media muestral.Media muestralLa media muestral es una variable aleatoria, ya que depende de la muestra, si bien es una variable aleatoria en general con una varianza menor que las variables originales usadas en su clculo. Si la muestra es grande y est bien escogida, puede tratarse la media muestra como un valor numrico que aproxima con precisin la media poblacional, que caracteriza una propiedad objetiva de la poblacin. Se define como sigue, si se tiene una muestra estadstica de valoresde valores para unavariable aleatoriaXcon distribucin de probabilidadF(x,) [donde es un conjunto de parmetros de la distribucin] se define la media muestraln-sima como:

Media poblacionalLa media poblacional tcnicamente no es una media sino un parmetro fijo que coincide con laesperanza matemticade una variable aleatoria. El nombre "media poblacional" se usa para significar que valor numrico de una media muestral es numricamente cercano al parmetro media poblacional, para una muestra adecuada y suficientemente grande.

MEDIANA

Visualizacin geomtrica de la moda, la mediana y la media de una funcin arbitraria de densidad de probabilidad.En el mbito de laestadstica, lamedianarepresenta el valor de la variable de posicin central en un conjunto de datos ordenados.

Clculo:Existen dos mtodos para el clculo de la mediana:1. Considerando los datos en forma individual, sin agruparlos.2. Utilizando los datos agrupados en intervalos de clase.

A continuacin veamos cada una de ellas:Datos sin agruparSeanlos datos de una muestraordenada en orden crecientey designando la mediana como, distinguimos dos casos:

a) Sin es impar, la mediana es el valor que ocupa la posicinuna vez que los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir:.Por ejemplo, si tenemos 5 datos, que ordenados son:,,,,=> El valor central es el tercero:. Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (,) y otros dos por encima de l (,).

b) Sin es par, la mediana es la media aritmtica de los dos valores centrales. Cuandoes par, los dos datos que estn en el centro de la muestra ocupan las posicionesy. Es decir:.Por ejemplo, si tenemos 6 datos, que ordenados son:,,,,,. Aqu dos valores que estn por debajo dely otros dos que quedan por encima del siguiente dato. Por tanto, la mediana de este grupo de datos es la media aritmtica de estos dos datos:.Datos agrupadosAl tratar con datos agrupados, sicoincide con el valor de una frecuencia acumulada, el valor de la mediana coincidir con laabscisacorrespondiente. Si no coincide con el valor de ninguna abcisa, se calcula a travs de semejanza de tringulos en elhistogramao polgono de frecuencias acumuladas, utilizando la siguiente equivalencia:

Dondeyson las frecuencias absolutas acumuladas tales que,yson los extremos, interior y exterior, del intervalo donde se alcanza la mediana yes la abscisa a calcular, la mediana. Se observa quees la amplitud de los intervalos seleccionados para el diagrama.Ejemplos para datos sin agruparEjemplo 1: Cantidad (N) impar de datosxifiNi

122

224

348

4513

5821 > 19.5

6930

7333

8437

9239

Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene dada por la siguiente tabla:Calificaciones123456789

Nmero de alumnos224589342

Primero se hallan las frecuencias absolutas acumuladas. As, aplicando la frmula asociada a la mediana para n impar, se obtiene. Ni-1< n/2 < Ni = N19 < 19.5 < N20Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar.En este ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.Ejemplo 2: Cantidad (N) par de datosLas calificaciones en la asignatura de Matemticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo):Calificaciones123456789

Nmero de alumnos224569442

xifiNi+w

122

224

348

4513

5619 = 19

6928

7432

8436

9238

Primero se hallan las frecuencias absolutas acumuladas. As, aplicando la frmula asociada a la mediana para n par, se obtiene la siguiente frmula:(Donde n= 38 alumnos divididos entre dos). Ni-1< n/2 < Ni = N18 < 19 < N19Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el decimonoveno y el vigsimo lugar. En el ejemplo el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6 con lo que Me = (5+6)/2 = 5,5 puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o ms.Ejemplo para datos agrupadosEntre 1.50 y 1.60 hay 2 estudiantes.Entre 1.60 y 1.70 hay 5 estudiantes.Entre 1.70 y 1.80 hay 3 estudiantes.

Mtodo de clculo general:xifiNi

[x11-x12]f1N1

...

...

..N(i-2)

[x(i-1)1-x(i-1)2]f(i-1)f(i-1)-N(i-2)=N(i-1)

[xi1-xi2]fifi-Ni-1=Ni

[x(i+1)1-x(i+1)2]f(i+1)f(i+1)-Ni=N(i+1)

...

...

...

[xM1-xM2]fMfM-N(M-1)=NM

Consideramos:- x11valor mnimo< Entonces:

MODAEnestadstica, lamodaes el valor con una mayor frecuencia en una distribucin de datos.Se hablar de una distribucin bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.Elintervalo modales el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

Moda de datos agrupadosPara obtener la moda en datos agrupados se usa la siguiente frmula:

Donde:=-inferior de la clase modal.= es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal.= es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.= Amplitud del intervalo modalPropiedadesSus principales propiedades son:-Clculo sencillo.-Interpretacin muy clara.-Al depender slo de las frecuencias, puede calcularse paravariables cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".Inconvenientes-Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del nmero de intervalos y de su amplitud.-Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.-No siempre se sita hacia el centro de la distribucin.-Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

VARIANZAEnteora de probabilidad, lavarianza(que suele representarse como) de unavariable aleatoriaes unamedida de dispersindefinida como laesperanzadel cuadrado de la desviacin de dicha variable respecto a su media.Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. Ladesviacin estndares la raz cuadrada de la varianza, es una medida de dispersin alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mnimo 0.Hay que tener en cuenta que la varianza puede verse muy influida por losvalores atpicosy no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersin msrobustas.El trminovarianzafue acuado porRonald Fisheren un artculo publicado en enero de 1919 con el ttuloThe Correlation Between Relatives on the Supposition ofMendelian Inheritance. DefinicinSi tenemos un conjunto de datos de una misma variable, la varianza se calcula de la siguiente forma:

Siendo: : cada dato : El nmero de datos : lamedia aritmticade los datosVariable aleatoriaAplicando este concepto a una variable aleatoria conmedia = E[X], se define suvarianza, Var(X) (tambin representada comoo, simplemente 2), como

Desarrollando la definicin anterior, se obtiene la siguiente definicin alternativa (y equivalente):

Si una distribucin no tiene esperanza, como ocurre con la deCauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la deParetocuando su ndiceksatisface1