Trabajo Colaborativo 1 Estadistica Descriptiva

12
Actividad 6, Trabajo colaborativo 1. Estadística descriptiva Universidad Abierta y a Distancia UNAD. ESTADISTICA DESCRIPTIVA Trabajo Colaborativo 1 TUTOR …………………Francisco Cabrera Días………… INTEGRANTES. Jaime Fernando Rodríguez Javier Antonio Moreno Silva Juan Carlos Moreno Ortiz ……………………………… UNIVERSIDAD NACIONAL ABIERTA Y ADISTANCIA UNAD 2014-04-11

Transcript of Trabajo Colaborativo 1 Estadistica Descriptiva

Page 1: Trabajo Colaborativo 1 Estadistica Descriptiva

Actividad 6, Trabajo colaborativo 1.

Estadí stica descriptiva

Universidad Abierta y a Distancia UNAD.

ESTADISTICA DESCRIPTIVA

Trabajo Colaborativo 1

TUTOR

…………………Francisco Cabrera Días…………

INTEGRANTES.

Jaime Fernando Rodríguez

Javier Antonio Moreno Silva

Juan Carlos Moreno Ortiz

………………………………

UNIVERSIDAD NACIONAL ABIERTA Y ADISTANCIA UNAD

2014-04-11

Page 2: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

2

2

Introducción.

La estadística descriptiva tiene como objetivo recolectar, organizar y sobretodo analizar un

conjunto de datos que pertenezcan a un estudio estadístico determinado. Esto se hace

teniendo en cuenta que los datos son generalmente imperfectos en el sentido que aún cuando

posean información útil no permiten realizar un análisis a simple vista.

En el siguiente trabajo tomará una base de datos del seguimiento a un proceso de

potabilización de agua en una planta de tratamiento compacta, se mostrarán gráficos y tablas

con el objetivo de realizar un análisis de las variables del proceso.

Para el estudio, se tomaron variables cuantitativas continuas como lo son la dosis o

concentración de cloro que se adiciona en el proceso de cloración, variables cuantitativas

discretas como lo es el flujo del coagulante utilizado en el proceso inicial de tratamiento y

para variables cualitativas se tomaron los resultados los valores de cloro residual presentes en

el agua potabilizada para dar apreciaciones de SI o NO cumple la norma 1575 para tratamiento

de aguas potables teniendo en cuenta que debe ser un valor entre 0,3 y 2 ppm ( Partes por

millón).

Page 3: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

3

3

Justificación

El agua potable es imprescindible para el mantenimiento de la vida. Mientras que las personas

pueden pasar incluso meses sin comer, tan sólo pueden pasar algunos días sin beber agua. Por

tanto, el hombre se sirve del agua existente en la naturaleza para consumirla y utilizarla, pero

es evidente que debido a determinadas características químicas, físicas y biológicas del agua,

ésta no puede ser utilizada de forma directa, y es por eso que dicha agua requerirá de una

serie de correcciones y tratamientos que eliminen aquellas partículas o sustancias perjudiciales

para el hombre. Lo anteriormente dicho hace necesario que se lleve controlado el proceso de

potabilización. Una de las formas de llevar a cabo el control es inspeccionar las diferentes

variables del proceso como lo son las adiciones de coagulante y floculante para la clarificación

y de cloro para el proceso de cloración. En este orden de ideas, se escoge una base de datos de

un proceso de potabilización del acueducto del Parque Industrial Malambo S.A (PIMSA)

ubicado en el municipio de Malambo en el departamento del Atlántico.

Objetivos

Verificar los avances conceptuales y procedimentales acerca de la fundamentación estadística.

Por medio de un trabajo investigativo y práctico.

Base de datos.

Población: datos mensuales de seguimiento de proceso de potabilización de agua. Tales datos

corresponden a Dosis de cloro gaseoso adicionado, Flujo de policloruro de aluminio (PAC),

Concentración de cloro residual en el agua tratada para determinar si se encuentra de los

parámetros permitidos según la resolución 1575 de 2007.

Muestra: datos tomados de los meses de febrero y marzo de 2013.

Variables: Dosis de cloro gaseoso, Flujo de policloruro de aluminio (PAC), Concentración de

cloro residual.

Unidad estadística: Variables de proceso de potabilización de agua.

Ubicación espacio temporal: Febrero y Marzo de 2014, Acueducto parque Industrial Malambo.

Día febrero (mañana)

Flujo bomba PAC (mL/s)

Dosis cloro (PPM)

Cloro residual (PPM)

Cumple Decreto 1575 para Cloro residual

1

2 22 2,258 1,26 si

3 22 2,392 1,49 si

4 20 2,024 2,1 no

5 19 2,631 1,11 si

6 9 2,506 1,95 si

7 18 1,827 2 si

8 14 2,364 1,85 si

9 15 2,740 2 si

Page 4: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

4

4

10 10 1,949 2,2 no

11 15 2,740 2,01 no

12 14 3,043 1,57 si

13 16 3,635 1,63 si

14 17 3,742 2 si

15 14 2,258 1,56 si

16 12 2,619 2,2 no

17 12 3,387 2 si

18 12 2,728 1,59 si

19 12 2,923 2,2 no

20 12 3,508 1,77 si

21 11 3,508 1,37 si

22 11 3,508 1,32 si

23 12 2,631 1,4 si

24 12 2,631 1,24 si

25 15 2,476 1,29 si

26 17 1,827 1,72 si

27 13 2,631 1,26 si

28 21 2,506 1,76 si

Día Febrero (tarde)

Flujo bomba PAC (mL/s)

Dosis cloro (PPM)

Cloro residual (PPM)

Cumple Decreto 1575 para Cloro residual

1

2 14 2,631 1,31 si

3 13 2,631 1 si

4 13 2,631 2,31 no

5 14 2,506 1,71 si

6 13 2,506 1,2 si

7 19 2,740 1,41 si

8 10 2,506 1,6 si

9 20 1,879 1,47 si

10 20 2,526 0,8 si

11 10 1,879 1,23 si

12 14 3,157 1,57 si

13 14 2,506 1,21 si

14 16 3,934 0,37 si

15 15 2,819 1,26 si

16 13 2,192 2,2 no

17 13 2,722 0,69 si

18 15 2,819 1,45 si

19 16 3,013 2,07 no

20 12 3,946 1,32 si

21 12 3,946 1,38 si

22 12 3,946 1,31 si

23 16 3,954 1,75 si

24 12 2,894 1,21 si

25 12 3,157 1,42 si

Page 5: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

5

5

26 12 2,850 1,63 si

27 16 2,526 1,25 si

28 16 4,024 1,74 si

Día marzo(mañana)

Flujo bomba PAC (mL/s)

Dosis cloro (PPM)

Cloro residual (PPM)

Cumple Decreto 1575 para Cloro residual

1 12 2,745 1,96 si

2 10 3,323 1,63 si

3 12 4,420 1,51 si

4 18 3,417 1,62 si

5 12 3,788 1,49 si

6 12 3,999 1,21 si

7 12 3,587 1,39 si

8 12 3,758 1,63 si

9 12 3,288 2,05 no

10 12 3,157 1,34 si

11 12 2,526 1,49 si

12 12 3,007 1,36 si

13 12 3,447 1,41 si

14 12 3,703 1,55 si

15 13 3,578 1,46 si

16 12 2,288 2 si

17 12 3,999 1,56 si

18 30 2,631 1,34 si

19 16 2,105 1,38 si

20 13 4,209 1,22 si

21 13 3,897 1,85 si

22 31 2,806 1,36 si

23 13 4,560 1,39 si

24 31 3,367 1,46 si

25 12 2,288 1,39 si

26 30 2,923 1,31 si

27 30 1,840 0,85 si

28 12 2,745 2,2 si

29 10 3,323 1,77 si

30 12 4,420 1,68 si

31 18 3,417 1,46 si

Día marzo(tarde)

Flujo bomba PAC (mL/s)

Dosis cloro (PPM)

Cloro residual (PPM)

Cumple Decreto 1575 para Cloro residual

1 10 3,431 1,39 si

2 12 2,631 1,31 si

3 12 3,157 0,85 si

4 12 3,431 2,2 no

Page 6: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

6

6

5 25 2,338 1,77 si

6 10 2,506 1,68 si

7 11 3,800 1,46 si

8 10 3,267 1,3 si

9 9 2,870 1,39 no

10 10 4,575 1,26 si

11 12 2,226 1,68 si

12 12 2,105 1,62 si

13 12 2,080 1,68 si

14 12 2,037 1,82 si

15 12 3,007 1,49 si

16 15 2,631 1,51 si

17 18 2,631 1,19 si

18 16 2,631 1,75 si

19 13 2,631 1,41 si

20 30 2,288 1,75 si

21 30 2,516 1,7 si

22 10 3,367 1,68 si

23 11 3,508 1,33 si

24 30 1,827 1,33 si

25 28 2,631 1,46 si

26 30 3,431 1,41 si

27 29 2,631 2,02 no

28 17 3,157 1,87 si

29 15 3,431 1,36 si

30 12 2,338 1,39 si

31 12 2,506 1,31 si

Graficando los datos de todos los meses, es decir en los 116 días, obtendremos los siguientes

gráficos para la variable cuantitativa discreta:

Ilustración 1 Flujo de PAC

0

10

20

30

40

1 8

15

22

29

36

43

50

57

64

71

78

85

92

99

10

6

11

3

mL/

min

Días

Flujo Bomba PAC

Page 7: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

7

7

Ilustración 2 Dosis Cloro gaseoso

Tabla 1 tabla de frecuencia variable cualitativa

Cumplimiento decreto 1575 para cloro residual

Variable Frecuencia

si 104

no 12

Ilustración 3 Variable cualitativa

Como se puede ver en el gráfico anterior, existe una moda claro de la variable cualitativa “SI”,

que indica que se cumple con la norma 1575 para cloro residual, para el cual el cloro debe

estar entre 0,3 ppm y 2 ppm en una corriente agua potabilizada.

A continuación se muestra la tabla de frecuencias para la variable discreta, que corresponde al

flujo de PAC utilizado a lo largo de los 116 días.

Tabla 2 Frecuencias variable discreta

Xi fi hi Fi Hi %

9 2 0,0172 2 0,0172 1,72413793

0

1

2

3

4

5

1 8

15

22

29

36

43

50

57

64

71

78

85

92

99

10

6

11

3

pp

m

Días

Dosis cloro gaseoso

0

20

40

60

80

100

120

Variable

Cumplimiento norma 1575 cloro residual

Si

NO

Page 8: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

8

8

10 10 0,0862 12 0,1034 8,62068966

11 4 0,0345 16 0,1379 3,44827586

12 39 0,3362 55 0,4741 33,6206897

13 12 0,1034 67 0,5776 10,3448276

14 7 0,0603 74 0,6379 6,03448276

15 6 0,0517 80 0,6897 5,17241379

16 7 0,0603 87 0,7500 6,03448276

17 3 0,0259 90 0,7759 2,5862069

18 4 0,0345 94 0,8103 3,44827586

19 2 0,0172 96 0,8276 1,72413793

20 4 0,0345 100 0,8621 3,44827586

21 1 0,0086 101 0,8707 0,86206897

22 2 0,0172 103 0,8879 1,72413793

25 1 0,0086 104 0,8966 0,86206897

29 2 0,0172 106 0,9138 1,72413793

30 7 0,0603 113 0,9741 6,03448276

31 3 0,0259 116 1,0000 2,5862069

Total 116 1,0000

Media (X).

X=15,15

Lo que quiere decir que en promedio, se utilizan 15,15 mL/seg de coagulante para el proceso

de clarificado del agua cruda (no tratada).

Mediana (Me).

Me=13

Este valor de la mediana, nos deja el 50% de los datos por encima de su valor y el otro 50% por

debajo de su valor.

Moda (Mo).

Mo= 12

Que quiere decir que es caudal de coagulante que más se ha utilizado en estos 2 meses para

clarificación de agua es de 12 mL/s

Cuartiles.

Q1 =12 que supera el 25% de los datos

Q2 =13 que supera el 50% de los datos y coincide con la mediana.

Page 9: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

9

9

Q3 =16 Que supera el 75% de los datos

En términos de la variable cuantitativa continua, la tabla de frecuencia para datos no

agrupados, será:

Tabla 3 Tabla frecuencia relativa datos no agrupados

Intervalo fi F1 hi %

1,5-2 7 7 0,06034483 6,03448276

2-2,5 14 21 0,12068966 12,0689655

2,5-3 42 63 0,36206897 36,2068966

3-3,5 23 86 0,19827586 19,8275862

3,5-4 21 107 0,18103448 18,1034483

4-4,5 9 116 0,07758621 7,75862069

116 1 100

Media (X).

X=2,948

Lo que quiere decir que en promedio, la dosis utilizada de cloro es 2,948 ppm para el proceso

de cloración de cloro.

Mediana (Me).

Me= 2,745

Este valor de la mediana, nos deja el 50% de los datos por encima de su valor y el otro 50% por

debajo de su valor.

Moda (Mo).

Mo= 2,631

Que quiere decir que la dosis de cloro que más se ha utilizado en estos 2 meses para la

cloración de agua es de 2,631 ppm.

Cuartiles.

Q1 =2,506 que supera el 25% de los datos

Q2 =2,745 que supera el 50% de los datos y coincide con la mediana.

Q3 =3,431 Que supera el 75% de los datos

Percentil p40

Page 10: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

10

10

Donde Li es el límite inferior de la clase donde se encuentra el percentil, N es la suma de

todas las frecuencias absolutas, Fi-1 es la frecuencia acumulada anterior a la clase del

percentil.ai es la amplitud de la clase.

Por lo tanto:

El 40 % de la muestra son valores menores que él y el 100-40 % restante son mayores.

A continuación de muestra el polígono de frecuencia y la ojiva para la variable continúa:

Ilustración 4 Polígono de frecuencia.

Ilustración 5 Ojiva variable continua

0

20

40

60

1,5-2 2-2,5 2,5-3 3-3,5 3,5-4 4-4,5

Fre

cuan

cia

Polígono de frecuencias

0

50

100

150

1,5-2 2-2,5 2,5-3 3-3,5 3,5-4 4-4,5

Fre

cue

nci

a ac

um

ula

da

Ojiva

Page 11: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

11

11

Glosario

VARIABLES CUALITATIVAS

Una variable es cualitativa si en la característica que se va a estudiar se busca conocer

gustos, preferencias u opiniones.

VARIABLES CUANTITATIVAS

Una variable es cuantitativa si la característica que se va a estudiar se pude medir en una

escala numérica.

MODA

La moda es el dato que tiene mayor frecuencia, es decir, el dato que mas se repite.

Pictogramas

Es una forma de representar los datos por medio de símbolos o dibujos donde cada uno

representa la misma información con un valor fijo.

MEDIA ARITMÉTICA

Se define como la suma de los valores de una cantidad dada de números dividido entre la

cantidad de números.

MEDIANA Se define como el valor que divide una distribución de datos ordenados en dos mitades, es

decir, se encuentra en el centro de la distribución.

RANGO O RECORRIDO

Se trata de la diferencia entre el límite superior y el límite inferior de un conjunto de datos.

VARIANZA Y DESVIACIÓN ESTÁNDAR

La desviación típica o estándar. Se define como la media aritmética de los cuadrados de las

desviaciones respecto a la media aritmética.

Desviación típica o estándar

Esta medida se obtiene extrayendo la raíz cuadrada de la varianza, tomando siempre el valor positivo.

Page 12: Trabajo Colaborativo 1 Estadistica Descriptiva

UNAD Trabajo colaborativo 1 Estadística descriptiva.

12

12

Conclusiones

Mediante el estudio estadístico de datos para las variables de procesos de un proceso de

potabilización, se pudo observar una tendencia al uso de no muy variable en las dosificaciones

de un coagulante para la parte de clarificación y de cloro gaseoso para la parte de cloración; lo

cual es muy importante desde el punto de vista del control de procesos puesto que ayuda a

mantener una calidad de agua constante a lo largo de tiempo.

Se pudo observar de igual manera que la planta de tratamiento de agua de PIMSA, cumple con

el decreto 1575 desde el punto de vista de la cantidad de cloro residual presente en el agua

potable, lo cual es un referente a la hora de hablar de la calidad de agua. Por último, se pudo

demostrar la importancia del tratamiento estadístico de datos, puesto que así como se dijo al

principio del trabajo los datos son imperfectos en el sentido que aún cuando posean

información útil no permiten realizar un análisis a simple vista.