TEMA 4 ESTADÍSTICA APLICADA AL LABORATORIO · PDF fileestadÍstica aplicada al...

Click here to load reader

  • date post

    15-Feb-2018
  • Category

    Documents

  • view

    222
  • download

    0

Embed Size (px)

Transcript of TEMA 4 ESTADÍSTICA APLICADA AL LABORATORIO · PDF fileestadÍstica aplicada al...

  • ESTADSTICA APLICADA AL LABORATORIO

    GS ENSAYOS FSICO-QUMICOS Pg. 1 de 64

    Ensayos fsico-qumicos

    TEMA 4

    ESTADSTICA APLICADA

    AL LABORATORIO - TRATAMIENTO Y EVALUACIN DEL ERROR

    EXPERIMENTAL

    - ANLISIS DE LA DISTRIBUCIN DE LOS DATOS

    Ciclo Formativo Laboratorio de Anlisis y Control de Calidad

  • ESTADSTICA APLICADA AL LABORATORIO

    GS ENSAYOS FSICO-QUMICOS Pg. 2 de 64

    TRATAMIENTO Y EVALUACIN DEL ERROR EXPERIMENTAL

    1. TRATAMIENTO DE ERRORES.

    Ante una serie de datos experimentales, nos interesara disponer de unos parmetros,

    relativamente sencillos de calcular, que nos pudiesen informar de las relaciones existentes entres

    los datos para poderlos comparar.

    Hay que recordar que el tratamiento matemtico de los datos que realizaremos es aplicable

    exclusivamente a los errores de tipo aleatorio, porque no podemos pretender obtener buenos

    resultados a partir de datos no fiables o sujetos a errores de tipo sistemtico. En este caso, debemos

    utilizar patrones y auditoras de calidad para detectar y resolver los errores.

    Finalmente, nos interesa dar unos mrgenes dentro de los cuales se encuentra el valor real con

    un cierto grado de probabilidad, previamente determinada. Recordemos la siguiente idea:

    El tratamiento de errores no puede mejorar la calidad de los datos originales

    1.1. PARMETROS DE CENTRALIZACIN.

    Son valores alrededor de los cuales se suelen agrupar los datos de una serie estadstica. Las ms

    importantes son las siguientes:

    Media aritmtica ( x )

    Tambin llamada valor medio o promedio, es el valor de tendencia central ms utilizado y

    alrededor del cual se encuentran relacionadas la mayor parte de las variables estadsticas. Su

    descripcin matemtica ya se ha visto anteriormente en la definicin de error.

    Mediana (med)

    Es el valor situado en la mitad de un conjunto de valores ordenados. En la serie ordenada hay

    tantos valores por encima como por debajo de la mediana. Si la serie tiene un nmero de datos impar,

    se toma como mediana el valor medio de los dos datos centrales.

    Moda (mod)

    Es aquel valor que tiene la mayor frecuencia de resultados.

  • ESTADSTICA APLICADA AL LABORATORIO

    GS ENSAYOS FSICO-QUMICOS Pg. 3 de 64

    EJEMPLO 1.

    Tenemos una tabla de valores como sigue:

    Valor 1 2 3 4 5

    Frecuencia 1 4 5 1 10

    Se pide:

    a) Representacin grfica de los valores

    b) La media aritmtica (con un decimal).

    c) La mediana

    d) La moda

    Respuesta:

    a) Para la representacin grfica de la serie de valores se ha utilizado un diagrama de columnas en tres dimensiones elaborado con una hoja de clculo.

    1 2 3 4 5

    Frecuencias

    0

    2

    4

    6

    8

    10

    FR

    EC

    UE

    NC

    IAS

    VALORES

    b) La media aritmtica, s tomamos un solo decimal ser:

    7,321

    78

    )101541(

    )10514534211()( ==

    ++++++++=xaritmticaMedia

    c) La mediana es el valor que tiene tantos valores por un lado como por el otro:

    En este caso corresponde al 4, que es el valor que tienen el mismo nmero de valores por

    debajo (1+ 4 + 5 = 10) que por encima (10)

    Observemos la serie ordenada:

    1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5

    10 valores 10 valores

    d) La moda es el valor 5, porque es aquel que tiene la mxima frecuencia, se repite 10 veces.

  • ESTADSTICA APLICADA AL LABORATORIO

    GS ENSAYOS FSICO-QUMICOS Pg. 4 de 64

    1.2. PARMETROS DE DISPERSIN:

    Sirven para medir el grado de acercamiento de los valores de una serie estadstica respecto del

    conjunto de datos de la serie (caso del rango), o respecto de un valor dado que acostumbra a ser, en los

    otros casos, la media aritmtica.

    Rango (R)

    Tambin llamado intervalo o recorrido de una serie estadstica, es el valor resultante de la

    diferencia de los valores extremos superior (Vext sup) e inferior (Vext inf) de la tabla de datos

    experimentales.

    El rango es una medida de amplitud de una serie estadstica y por tanto de la precisin de datos.

    Su expresin matemtica es:

    R = Vext sup Vext inf

    EJEMPLO 2.

    De la serie estadstica utilizada en el ejemplo 1, calcular el rango

    Respuesta:

    Como: Vext inf = 1 y Vext sup = 5, entonces el intervalo ser R = 5 1 = 4

    Desviacin absoluta (da)

    Es la diferencia, expresada en valor absoluto, entre cada uno de los valores muestrales y la

    media aritmtica. Hay tantas desviaciones absolutas como valores incluidos en la serie.

    xxd ia =

    EJEMPLO 3.

    De la serie estadstica del ejemplo anterior, queremos conocer la desviacin absoluta del valor 5.

    Respuesta:

    3,17,35 === xxd ia

  • ESTADSTICA APLICADA AL LABORATORIO

    GS ENSAYOS FSICO-QUMICOS Pg. 5 de 64

    Desviacin media (dm)

    Es el valor medio de las desviaciones absolutas.

    Cuando hablbamos de error absoluto mantenamos el signo para saber si un determinado valor

    estaba por encima o por debajo del valor considerado ms probable (la media aritmtica). Ahora, en

    cambio, cuando consideremos la desviacin absoluta tendremos en cuenta nicamente su magnitud sin

    que nos importe el signo y, por este motivo, utilizamos valores absolutos. Eso nos permite operar

    matemticamente con toda la serie de resultados y calcular la desviacin media como la media

    aritmtica de las desviaciones absolutas:

    N

    d

    N

    xxd a

    i

    m

    =

    =

    En el caso de tener datos agrupados por frecuencias absolutas podramos utilizar la ecuacin:

    N

    dfd aim

    =

    Observemos que si no utilizramos valores absolutos, el resultado sera cero y por tanto este parmetro

    no nos proporcionar ninguna informacin (se propone comprobarlo en el ejemplo 1).

    Desviacin relativa (dr)

    Es el tanto por 1, tanto por ciento, o partes por mil de la desviacin media respecto al valor

    medio. As, por ejemplo, si utilizamos el % la expresin es:

    x

    dd mr

    = 100%

    EJEMPLO 4.

    Calcular las desviaciones total, media y relativa, en porcentaje, de los datos del ejemplo 1.

    Respuesta:

    xi fi fixi x da fida

    1

    2

    3

    4

    5

    1

    4

    5

    1

    10

    1

    8

    15

    4

    50

    3,7143

    3,7143

    3,7143

    3,7143

    3,7143

    2,7143

    1,7143

    0,7143

    0,2857

    1,2857

    2,7143

    6,8571

    3,5714

    0,2857

    12,8571

    21 78 26,2857

  • ESTADSTICA APLICADA AL LABORATORIO

    GS ENSAYOS FSICO-QUMICOS Pg. 6 de 64

    Donde:

    xi = valor.

    fi = frecuencia absoluta. El total de valores es 21.

    x = media aritmtica. En este caso hemos tomado cuatro decimales.

    da = desviacin absoluta, obtenida al restas xi de xm

    La desviacin total es: 26,2857.

    La desviacin media es: 26,2857 / 21 = 1,2517.

    La desviacin relativa, en porcentaje es: 100 x (1,2517 / 3,7143) = 33,7 %.

    Cuanto ms dispersos estn los resultados, ms grandes son los valores de los parmetros de

    dispersin.

    Hay que tener en cuenta que la desviacin media nos representa la dispersin de los datos en

    funcin de la media aritmtica y, como hemos dicho anteriormente, el rango lo hace en funcin de la

    amplitud de los datos.

    Desviacin estndar ().

    Tambin llamada normal o tpica. Es un parmetro de dispersin de gran utilidad que aparece en

    la formulacin matemtica de las distribuciones estadsticas ms habituales.

    Cuando se estudia todo el conjunto de datos o poblacin que estamos observando, se define

    matemticamente como la raz cuadrada de la media aritmtica de los cuadrados de las desviaciones

    absolutas.

    Se suele representar por la letra griega sigma, , cuando se trabaja con todo el conjunto de

    datos o con la poblacin completa de un registro muestral. Su expresin matemtica es la siguiente:

    N

    d

    N

    xx ai ==22)(

    Lo ms habitual es trabajar con una serie de datos experimentales (muestra), obtenidos como

    un subconjunto de la totalidad de las posibles medidas a realizar. En este caso la desviacin estndar se

    representa por la letra s y en la expresin anterior sustituimos el denominador N por N-1.

    11

    )( 22

    =

    = N

    d

    N

    xxs ai

    Es evidente que para series con muchos datos, la diferencia entre N y N-1 prcticamente no

    existe y el valor de s tiende a .

    Cuando se trabaja con calculadoras cientficas que incorporan funciones estadsticas hay que

    tener en cuenta que no siempre se respeta este criterio: la desviacin estndar para la poblacin puede

    ser descrita como N o sN mientras que para una muestra aparece como N-1o sN-