Trabajo Recopilatorio de Estadística General

33
UNIVERSIDAD NACIONAL “SANTIAGO ANTÚNEZ DE MAYOLO” FACULTAD DE INGENIERÍA DE MINAS GEOLOGÍA Y METALURGIA ESCUELA ACADÉMICA: Ingeniería de minas CURSO: Estadística AÑO Y SEMESTRE ACADÉMICO: 2015 – II CICLO: V DOCENTE: SALDAÑA MIRANDA, Marcela Yvone RESPONSABLE : Trabajo De Investigación

description

Trabajo recopila torio del curso de estadística de lo hecho durante la primera parte del curso, aplicada a la carrera de ingeniería de s

Transcript of Trabajo Recopilatorio de Estadística General

UNIVERSIDAD NACIONALSANTIAGO ANTNEZ DE MAYOLOFACULTAD DE INGENIERA DE MINAS GEOLOGA Y METALURGIA

Trabajo De Investigacin

ESCUELA ACADMICA: Ingeniera de minasCURSO: EstadsticaAO Y SEMESTRE ACADMICO: 2015 IICICLO: VDOCENTE: SALDAA MIRANDA, Marcela Yvone RESPONSABLE :

HUERTA SOTELO, Ray Kolard

INTRODUCCIN

La palabra Estadstica se emplea en una gran variedad de formas, en plural se emplea como sinnimo de datso, se define como la ciencia aplicada que nos proporciona un conjunto de mtodos, tcnicas o procedimientos para: recopilar, organizar, presentar y analizar datos con el fin de describirlos o de realizar generalizaciones vlidas.El presente trabajo se divide en dos partes, una de teora y la otra es la aplicacin del curso.

PARTE TEORICA

Poblacin y Muestra:

POBLACIN

En forma general en Estadstica se denomina poblacin a un conjunto de elementos que consiste de personas, objetos, etc. En los que se pueden observar o medir una o ms caractersticas de Naturaleza cualitativa o cuantitativa.A cada elemento de una poblacin se le denomina unidad elemental o unidad Estadstica.Por ejemplo, los empleados de una empresa en un da laborable, constituyen una poblacin en la que cada empleado (Unidad Estadstica), tiene muchas caractersticas a ser observadas como: gnero, estado civil, lugar de procedencia, grado de instruccin, etc.(Caractersticas Cualitativas) ; o nmero de hijos, ingresos mensuales, etc.(Caractersticas Cuantitativas).El resultado de observar o medir una caracterstica en una unidad estadstica, se denomina dato estadstico, valor observado simplemente observacin.La poblacin es definida por una tarea o investigacin estadstica a realizarse. Y como la medicin de la caracterstica especificada por la investigacin se hace a cada unidad elemental, en este caso se define a la poblacin como la totalidad de valores posibles de una caracterstica particular especificada por la investigacin estadstica. En este sentido la poblacin consiste de un conjunto de datos estadsticos que se renen de acuerdo con la formulacin de una investigacin estadstica o con la definicin de la poblacin especfica.

Parmetros Se denomina parmetro a una medida descriptiva que resume una caracterstica definida en la poblacin tal como la media ( ) o la varianza ( ) etc. Calculada a partir de los datos observados de toda la poblacin.Tipos de PoblacinPor el nmero de elementos que la componen, la poblacin se clasifica en finita o infinita. La poblacin es finita si tiene un nmero finito N de elementos. Si tiene un nmero ilimitado de elementos la poblacin es infinita.

MUESTRADespues de definir la tarea o investigacin estadstica a realizar, se debe decidir entre investigar toda la poblacin o slo una parte de ella. El primer procedimiento es denominado censo y el segundo se llama muestreo.Definicin.- Se denomina muestra a una parte de la poblacin seleccionada de acuerdo con un plan o una regla con el fin de obtener informacin acerca de la poblacin de la cual proviene.La muestra debe ser seleccionada de manera que sea representativa de la poblacin. Un mtodo de muestras representativas es al azar, esto es , cada elemento de la poblacin tiene la misma posibilidad de ser incluida en la muestraVariable EstadsticaSe denomina variable estadstica a una caracterstica definida en una poblacin y que asume por lo menos dos valores. Estos valores pueden ser de cualidad o de cantidadSe ClasificanA. De acuerdo a su NaturalezaVariable1. Variables Cualitativas (Expresan Cualidad o Atributo)2. Variables Cuantitativas (Se Presentan en Forma Numrica)

2.1.Variable Cuantitativa Discreta: Cuando el valor de la variable est representado solo por Nmeros Enteros Positivos (+).

2.2. Variable Cuantitativa Continua: Cuando el valor de la variable puede tomar cualquier valor dentro de un rango dado, por tanto se expresa por cualquier nmero real ().

EJEMPLO:Estado Emocional (Alegre, Triste, Contento, Amargo, etc.)Gnero (Masculino, Femenino)Raza (Humano, Orco, Muerto Viviente, Elfo Nocturno)Colores (Amarillo, Rojo, Anaranjado, Verde, Morado, etc.)

Variable Cualitativa:

Variable CuantitativaVariable Cuantitativa Discreta:Nmero de IngenierosNmero de crditosNmero de AmigosNmero De Administrativos

Variable Cuantitativa Continua:La PresinLa VelocidadLa temperaturaEl Tiempo

B. Segn Su Medicin1. Variable Nominal: Se dice que los valores de una variable estadstica est en el nivel de escala nominal si estos solo clasifican a las unidades estadsticas en iguales y diferentes.Variable Cualitativa (1 y 2)

EJEMPLO: Genero (Masculino y Femenino)2. Variable Ordinal: Se dice que los valores de una variable estadstica estn en el nivel de escala ordinal si estn en escala nominal y si adems ordenan a las unidades estadsticas por la caracterstica definida que se observa.EJEMPLO: Nivel Socioeconmico (Bajo, Medio, Alto)Variable Cuantitativa (3 y 4)

3. Variable De Intervalo: Son aquellas variables que establecen categoras y la distancia entre cada uno de los valores puede ser determinada con exactitud. No tienen un origen comn; no tienen un cero absoluto. EJEMPLO: Puntaje Obtenido en un Examen De Conocimientos de 2 a 204. Variable De Razn: Son aquellas variables que establecen categoras de orden, distancia y tienen un origen comn, y sus valores se expresan como nmeros reales.EJEMPLO: Longitud En Metros

Distribucin De FrecuenciasFrecuenciaAbsolutaRelativasSimple (fi)Acumulada (Fi)Simple (hi)Acumulada (Hi)

PorcentajesSimple (hi%)Acumulado (Hi%)

Cuadros De Distribucin De Frecuencias Para Variables CualitativasVariable xifiFihiHihi%Hi%

C1f1F1h1H1h1%H1%

C2f2F2h2H2h2%H2%

C3f3F3h3H3h3%H3%

CKfkFkhkHkhi%Hi%

Totaln-1-100

Todo Cuadro Debe Tener:-Nmero-Ttulo-Cuadro En S-Fuente

Grficos Para Variables Cualitativas:Grfico De Barras:

Grfico De Sectores:

Cuadros De Distribucin De Frecuencias Para Variables Cuantitativas Discretas

Variable xifiFihiHihi%Hi%

m1f1F1h1H1h1%H1%

m2f2F2h2H2h2%H2%

m3f3F3h3H3h3%H3%

mKfkFkhkHkhi%Hi%

Totaln-1-100

Modalidades

Grficos Para Variables Cuantitativa Discretas: Grfico De Bastones:

Grfico De Frecuencias Acumuladas o de Escaleras

Cuadros De Distribucin De Frecuencias Para Variables Cuantitativas Continuas:Cuando se trabaja con variables continuas se debe tener en cuenta los siguientes pasos

1. Rango(R)

2. Nmero De Intervalos(m)

3. Amplitud Intervalica(C)

Construccin De Intervalos:

[YO , YO +C > YifiFihiHihi%Hi%*Fi*Hi*Hi%

C1Y1f1F1h1H1h1%H1%*F1*H1*H1%

C2Y2f2F2h2H2h2%H2%*F2*H2*H2%

C3Y3f3F3h3H3h3%H3%*F3*H3*H3%

CKYkfkFkhKHkHK%HK%*FK*HK*HK%

Total-n-1-100----

Grficos Para Variables Cuantitativa Continuas:

Medidas De Tendencia CentralSon aquellos datos o valores que tienden a ocupar posiciones centrales o intermedias entre el mayor y menor conjunto de datos, a partir de la cual se calculan los estadgrafos, brindando alguna forma de investigacin sobre el centro de la investigacin, Los datos organizados en una distribucin de frecuencias destacan sus caractersticas ms esenciales, como marcas de clases, centro, forma de distribucin (asimtrica, simtrica,) etc. Sin embargo, los indicadores que describen a los datos en forma ms precisa, deben calcularse. Estos indicadores resumen los datos en medidas descriptivas que se refieren a la centralizacin o posicin, a la dispersin o variacin, a la asimetra, y a la curtosis de los datos. Las medidas de posicin reflejan la tendencia central y la localizacin de los datos. Las medidas de tendencia central, denominados tambin promedios, ubican el centro de los datos como la media aritmtica, la media geomtrica, la media armnica y la mediana. Las medidas de localizacin indican el lugar de los datos ms frecuentes (Moda).1. MEDIA ARITMETICA(X): Es el valor numrico que se obtiene dividiendo la suma total de los valores observados de un variable entre el nmero de observaciones1.1. Media Aritmtica De Datos No Agrupados

1.2. Media Aritmtica de Datos Agrupados

2. MEDIANA (Me)La mediana o valor mediano de una serie de valores observados es el nmero Me que separa a la serie de datos ordenados en forma creciente (o decreciente) en dos partes de igual nmero de datos. La mediana es la medida promedio que depende del nmero de datos ordenados y no de los valores de estos datos.50%50%Me

2.1. Para datos No Agrupados: Se ordenan los datos en forma creciente o decreciente, se observa el nmero de datos y se define si es par o impar.

-Si es Par:

-Si es Impar:

2.2. Para Datos Agrupados

3. La Moda (Mo): Es el Dato que ms se repite o la frecuencia ms alta.3.1. Para Datos No Agrupados:Se trabaja con datos menores a 20 esta puede ser: Unimodal (Una moda), Bimodal (2 Modas), Multimodal (Mas de dos modas), Amodal (No existe Moda)

3.2. Para Datos Agrupados

Medidas De Dispersin Los estadgrafos de dispersin miden la dispersin de los datos de la muestra. Tenemos las siguientes Medidas:

1. Rango2. Varianza:2.1Varianza Poblacional:Para Datos No AgrupadosPara Datos Agrupados

2.2. Varianza MuestralPara Datos Agrupados

Para Datos No Agrupados

3. Desviacin Estndar: Es la raz de la varianza

4. Medidas de Tendencia Central4.1. Coeficiente De Variacin

4.2. Coeficiente De Asimetra

As = 0 , La Distribucin es SimtricaAs > 0 , La Distribucin es asimtrica a la derechaAs < 0 , La Distribucin es asimtrica a la izquierda5. Curtosis:5.1.Para Datos Tabulados

5.2. Para Datos No Tabulados

Si k < 0, La distribucin es PlaticurticaSi k=0, La distribucin es MesocurticaSi k > 0, LA Distribucin es Leptocurtica

Correlacin y regresin LinealCorrelacin Lineal(r): Es el grado de relacin entre 2 variables. El coeficiente de relacin se encuentra.

DIAGRAMAS DE DISPERSIN:

No Existe CorrelacinCorrelacin NegativaCorrelacin Positiva

Regresin Lineal: Se llama anlisis de regresin al anlisis que trata de establecer la relacin entre las variables (relacin funcional) de modo que podamos predecir el valor de una en base a otra.Convencionalmente la variable o variables que son la base de la prediccin se llama variable o variables independientes y la variable que no se va a predecir se llama variable dependiente. Para calcular tenemos la siguiente ecuacin. Elparmetro "a"es el valor que toma la variable dependiente "y", cuando la variable independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.Elparmetro "b"determina la pendiente de la recta, su grado de inclinacin.Laregresin linealnos permite calcular el valor de estos dos parmetros, definiendo la recta que mejor se ajusta a esta nube de puntos

Coeficiente de Correlacin(r)

El coeficiente de Determinacin: Esta denotado por el Cuadrado del coeficiente de correlacin (r2)

PARTE APLICATIVA

POBLACINProduccin de concentrados Metlicos de la empresa Minera Antamina en el ao 2015Caracterstica: Produccin de ConcentradosEspacio: Empresa Minera AntaminaTiempo: Ao 2015

MUESTRAProduccin de concentrados de cobre de la Minera Antamina en el Mes de Enero del Ao 2015Caracterstica: Produccin de concentrados de cobreEspacio: Empresa Minera AntaminaTiempo: Mes de Enero del ao 2015

Personalidad VocacinVariable Cualitativa:Variable CuantitativaVariable Cuantitativa Discreta:Nmero de IngenierosNmero de CamionesNmero de TolvasNmero De Taladros

Variable Cuantitativa Continua:

Exportacin en volumenProduccin en TMF

Para Variables CualitativasLa Empresa Minera Antamina Cuenta con Protocolo de Evaluacin Psicolgica el cual proporciona un punto de discusin en relacin al proceso de evaluacin de contrato de personal en ese instante se presentaron 20 personas las cuales demostraron tener distintas Virtudes: Tendencia a la introversin, Cooperadores, alta tolerancia a la rutina, alta responsabilidad.Virtudes de acorde al Protocolo de Evaluacin Psicolgicafihihi%

Introvertidos40.2020

Cooperadores50.2525

Alta tolerancia a la rutina60.3030

Alta responsabilidad50.2525

Total201100

Grfica De Barras:

FUENTE: Datos Hipotticos

Grfico de Sector Circular

FUENTE: Datos Hipotticos

Cuadro de Distribucin de Frecuencias Para Variables Cuantitativas Discreta:En la Compaa Minera Antamina se mueve material roto por medio de mquinas ,la compaa minera cuenta con una flota de 130 Camiones entre Komatsu y CAT de los cuales se mantienen 120 en operacin y 10 en stand By, adems cuenta con 7 Palas Elctricas entre Bucyrus y P&HTipo De Variable: Cuantitativa Discreta

Variable de Estudio: Nmero de Maquinas Variable Estadstica = Nmero de Maquinas Por TipoMaquinas Por Tipo

1Palas Bucyrus 80 Tn de Capacidad de Cuchara

2Pala P&H de 120 Tn de Carga

3Camiones Komatsu de 320 Tn

4Camiones CAT de 240 Tn

5Camiones en Stand By

Maquinas Por TipofiFihiHihi%Hi%

1440.0290.0292.922.92

2370.0220.0512.195.11

370770.5110.56251.0956.20

4501270.3650.92736.5092.70

5101370.0731.0007.30100

Total1371100

Grfico De Bastones

FUENTE: Datos de Consulta Previa

Grfico De Frecuencias Acumuladas o de Escaleras

FUENTE: Datos de Consulta Previa

Cuadro de Distribucin de Frecuencias Para Variables Cuantitativas Continua:El Valor Agregado bruto de la produccin minera de Cu durante los ltimos aos se encuentra entre 60-90 TMF.

IntervalosfiFihiHi%hi%Hi*Fi*Hi*Hi%Yi

[60-67>440.1050.10510.510.538110063.5

[67-74>10140.2630.36826.336.8340.89589.570.5

[74-81>4180.1050.43310.547.3240.63263.277.5

[81-88>13310.3420.81534.281.5200.52752.784.5

[88-95>5360.1320.94713.294.770.18518.591.5

[95-102>2380.05315.310020.0535.398.5

Total38-1-100-----

Grfico Para Variables Cuantitativas Continas

fiYiYi*fi

463.5254

1070.5705

477.5310

1384.51098.5

591.5457.5

298.5197

MEDIDAS DE TENDENCIA CENTRAL

La Media:

La Mediana:

IntervalosfiFihiHi%hi%Hi*Fi*Hi*Hi%Yi

[60-67>440.1050.10510.510.538110063.5

[67-74>10140.2630.36826.336.8340.89589.570.5

[74-81>4180.1050.43310.547.3240.63263.277.5

[81-88>13310.3420.81534.281.5200.52752.784.5

[88-95>5360.1320.94713.294.770.18518.591.5

[95-102>2380.05315.310020.0535.398.5

Total38-1-100-----

La Moda:

MEDIDAS DE DISPERSIN

1.Rango

2. Varianza

3. Desviacin Estndar

4. Coeficiente De Variacin:

5. Coeficiente de Asimetra:

As > 0 , La Distribucin es asimtrica a la derecha6.Kurtosis

Si k > 0, LA Distribucin es LeptocurticaREGRESIN LINEALEl Strip Ratio de la Compaa Minera Antamina es de 2.36/1 (Es decir Hay 2.36 toneladas de Material Estril por Cada tonelada de Mineral), en cierta parte del yacimiento de prfidos de cobre se registraron los siguientes datos donde esta relacin vara un poco:

Registro de datosTn de MineralTn de Estril

xy

124.64

2511.75

3818.88

41023.8

51229.04

61534.95

Total52123.06

Strip Ratio

12.32

22.35

32.36

42.38

52.42

62.33

Registro de datosTn de MineralTn de Estril

xyx2y2xy

124.64421.539.28

2511.7525138.0658.75

3818.8864356.45151.04

41023.8100566.44238

51229.04144843.32348.48

61534.952251221.50524.25

Total52123.065623147.311329.8

1. Graficar el diagrama de dispersin:

2. Calcular:El Coeficiente de Correlacin

El Coeficiente de Determinacin ( ) Se dice que existe un Correlacin directa positiva ambas variables aumentan o disminuyen simultneamente r>0

La ecuacin de Regresin

3. Cul ser la cantidad esperada de tonelada de estril por 11 Tn de Mineral? La prediccin es Confiable, la variable X explica muy bien a la variable Y

BIBLIOGRAFIA:MANUEL CRDOVA ZAMORA/Estadstica Descriptiva e Inferencial,(PUCP)http://www.aulafacil.com/CursoEstadistica/ CursoEstadistica.htmApuntes de la Lic. SALDAA MIRANDA, Marcela Yvone Apuntes de la clase del Lic. DE LA CRUZ MONZALVITE ,Jorge Eduardo

CONCLUSIONES:La estadstica es un elemento decisivo en el incremento de la calidad, ya que las tcnicas estadsticas pueden emplearse para Describir, Optimizar y Comprender la variabilidad de los procesos, como para tomar decisiones en presencia de sta.