TEMA 4 ESTADÍSTICA APLICADA AL LABORATORIO · PDF fileestadÍstica aplicada al...
date post
15-Feb-2018Category
Documents
view
222download
0
Embed Size (px)
Transcript of TEMA 4 ESTADÍSTICA APLICADA AL LABORATORIO · PDF fileestadÍstica aplicada al...
ESTADSTICA APLICADA AL LABORATORIO
GS ENSAYOS FSICO-QUMICOS Pg. 1 de 64
Ensayos fsico-qumicos
TEMA 4
ESTADSTICA APLICADA
AL LABORATORIO - TRATAMIENTO Y EVALUACIN DEL ERROR
EXPERIMENTAL
- ANLISIS DE LA DISTRIBUCIN DE LOS DATOS
Ciclo Formativo Laboratorio de Anlisis y Control de Calidad
ESTADSTICA APLICADA AL LABORATORIO
GS ENSAYOS FSICO-QUMICOS Pg. 2 de 64
TRATAMIENTO Y EVALUACIN DEL ERROR EXPERIMENTAL
1. TRATAMIENTO DE ERRORES.
Ante una serie de datos experimentales, nos interesara disponer de unos parmetros,
relativamente sencillos de calcular, que nos pudiesen informar de las relaciones existentes entres
los datos para poderlos comparar.
Hay que recordar que el tratamiento matemtico de los datos que realizaremos es aplicable
exclusivamente a los errores de tipo aleatorio, porque no podemos pretender obtener buenos
resultados a partir de datos no fiables o sujetos a errores de tipo sistemtico. En este caso, debemos
utilizar patrones y auditoras de calidad para detectar y resolver los errores.
Finalmente, nos interesa dar unos mrgenes dentro de los cuales se encuentra el valor real con
un cierto grado de probabilidad, previamente determinada. Recordemos la siguiente idea:
El tratamiento de errores no puede mejorar la calidad de los datos originales
1.1. PARMETROS DE CENTRALIZACIN.
Son valores alrededor de los cuales se suelen agrupar los datos de una serie estadstica. Las ms
importantes son las siguientes:
Media aritmtica ( x )
Tambin llamada valor medio o promedio, es el valor de tendencia central ms utilizado y
alrededor del cual se encuentran relacionadas la mayor parte de las variables estadsticas. Su
descripcin matemtica ya se ha visto anteriormente en la definicin de error.
Mediana (med)
Es el valor situado en la mitad de un conjunto de valores ordenados. En la serie ordenada hay
tantos valores por encima como por debajo de la mediana. Si la serie tiene un nmero de datos impar,
se toma como mediana el valor medio de los dos datos centrales.
Moda (mod)
Es aquel valor que tiene la mayor frecuencia de resultados.
ESTADSTICA APLICADA AL LABORATORIO
GS ENSAYOS FSICO-QUMICOS Pg. 3 de 64
EJEMPLO 1.
Tenemos una tabla de valores como sigue:
Valor 1 2 3 4 5
Frecuencia 1 4 5 1 10
Se pide:
a) Representacin grfica de los valores
b) La media aritmtica (con un decimal).
c) La mediana
d) La moda
Respuesta:
a) Para la representacin grfica de la serie de valores se ha utilizado un diagrama de columnas en tres dimensiones elaborado con una hoja de clculo.
1 2 3 4 5
Frecuencias
0
2
4
6
8
10
FR
EC
UE
NC
IAS
VALORES
b) La media aritmtica, s tomamos un solo decimal ser:
7,321
78
)101541(
)10514534211()( ==
++++++++=xaritmticaMedia
c) La mediana es el valor que tiene tantos valores por un lado como por el otro:
En este caso corresponde al 4, que es el valor que tienen el mismo nmero de valores por
debajo (1+ 4 + 5 = 10) que por encima (10)
Observemos la serie ordenada:
1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5
10 valores 10 valores
d) La moda es el valor 5, porque es aquel que tiene la mxima frecuencia, se repite 10 veces.
ESTADSTICA APLICADA AL LABORATORIO
GS ENSAYOS FSICO-QUMICOS Pg. 4 de 64
1.2. PARMETROS DE DISPERSIN:
Sirven para medir el grado de acercamiento de los valores de una serie estadstica respecto del
conjunto de datos de la serie (caso del rango), o respecto de un valor dado que acostumbra a ser, en los
otros casos, la media aritmtica.
Rango (R)
Tambin llamado intervalo o recorrido de una serie estadstica, es el valor resultante de la
diferencia de los valores extremos superior (Vext sup) e inferior (Vext inf) de la tabla de datos
experimentales.
El rango es una medida de amplitud de una serie estadstica y por tanto de la precisin de datos.
Su expresin matemtica es:
R = Vext sup Vext inf
EJEMPLO 2.
De la serie estadstica utilizada en el ejemplo 1, calcular el rango
Respuesta:
Como: Vext inf = 1 y Vext sup = 5, entonces el intervalo ser R = 5 1 = 4
Desviacin absoluta (da)
Es la diferencia, expresada en valor absoluto, entre cada uno de los valores muestrales y la
media aritmtica. Hay tantas desviaciones absolutas como valores incluidos en la serie.
xxd ia =
EJEMPLO 3.
De la serie estadstica del ejemplo anterior, queremos conocer la desviacin absoluta del valor 5.
Respuesta:
3,17,35 === xxd ia
ESTADSTICA APLICADA AL LABORATORIO
GS ENSAYOS FSICO-QUMICOS Pg. 5 de 64
Desviacin media (dm)
Es el valor medio de las desviaciones absolutas.
Cuando hablbamos de error absoluto mantenamos el signo para saber si un determinado valor
estaba por encima o por debajo del valor considerado ms probable (la media aritmtica). Ahora, en
cambio, cuando consideremos la desviacin absoluta tendremos en cuenta nicamente su magnitud sin
que nos importe el signo y, por este motivo, utilizamos valores absolutos. Eso nos permite operar
matemticamente con toda la serie de resultados y calcular la desviacin media como la media
aritmtica de las desviaciones absolutas:
N
d
N
xxd a
i
m
=
=
En el caso de tener datos agrupados por frecuencias absolutas podramos utilizar la ecuacin:
N
dfd aim
=
Observemos que si no utilizramos valores absolutos, el resultado sera cero y por tanto este parmetro
no nos proporcionar ninguna informacin (se propone comprobarlo en el ejemplo 1).
Desviacin relativa (dr)
Es el tanto por 1, tanto por ciento, o partes por mil de la desviacin media respecto al valor
medio. As, por ejemplo, si utilizamos el % la expresin es:
x
dd mr
= 100%
EJEMPLO 4.
Calcular las desviaciones total, media y relativa, en porcentaje, de los datos del ejemplo 1.
Respuesta:
xi fi fixi x da fida
1
2
3
4
5
1
4
5
1
10
1
8
15
4
50
3,7143
3,7143
3,7143
3,7143
3,7143
2,7143
1,7143
0,7143
0,2857
1,2857
2,7143
6,8571
3,5714
0,2857
12,8571
21 78 26,2857
ESTADSTICA APLICADA AL LABORATORIO
GS ENSAYOS FSICO-QUMICOS Pg. 6 de 64
Donde:
xi = valor.
fi = frecuencia absoluta. El total de valores es 21.
x = media aritmtica. En este caso hemos tomado cuatro decimales.
da = desviacin absoluta, obtenida al restas xi de xm
La desviacin total es: 26,2857.
La desviacin media es: 26,2857 / 21 = 1,2517.
La desviacin relativa, en porcentaje es: 100 x (1,2517 / 3,7143) = 33,7 %.
Cuanto ms dispersos estn los resultados, ms grandes son los valores de los parmetros de
dispersin.
Hay que tener en cuenta que la desviacin media nos representa la dispersin de los datos en
funcin de la media aritmtica y, como hemos dicho anteriormente, el rango lo hace en funcin de la
amplitud de los datos.
Desviacin estndar ().
Tambin llamada normal o tpica. Es un parmetro de dispersin de gran utilidad que aparece en
la formulacin matemtica de las distribuciones estadsticas ms habituales.
Cuando se estudia todo el conjunto de datos o poblacin que estamos observando, se define
matemticamente como la raz cuadrada de la media aritmtica de los cuadrados de las desviaciones
absolutas.
Se suele representar por la letra griega sigma, , cuando se trabaja con todo el conjunto de
datos o con la poblacin completa de un registro muestral. Su expresin matemtica es la siguiente:
N
d
N
xx ai ==22)(
Lo ms habitual es trabajar con una serie de datos experimentales (muestra), obtenidos como
un subconjunto de la totalidad de las posibles medidas a realizar. En este caso la desviacin estndar se
representa por la letra s y en la expresin anterior sustituimos el denominador N por N-1.
11
)( 22
=
= N
d
N
xxs ai
Es evidente que para series con muchos datos, la diferencia entre N y N-1 prcticamente no
existe y el valor de s tiende a .
Cuando se trabaja con calculadoras cientficas que incorporan funciones estadsticas hay que
tener en cuenta que no siempre se respeta este criterio: la desviacin estndar para la poblacin puede
ser descrita como N o sN mientras que para una muestra aparece como N-1o sN-