Seminario introductorio 1: Análisis de datos de...

18
Seminario introductorio 1: Análisis de datos de laboratorio MEDIDA DE UNA MAGNITUD Para la medida correcta de una magnitud con un aparato o material de laboratorio, hacen falta tres requisitos: un número, unas unidades y un índice de incertidumbre. Así, cuando se pesa una sustancia en una balanza tipo granatario, la medida podría ser del tipo: en el granatario, el dígito de las décimas habría estado “parpadeando”, unos instantes daría “8”, otros “7”, otros “6”.... por lo que anotaremos “7”, y como incertidumbre anotaremos 0.1 (que aquí vendría a significar la mínima lectura posible en la escala o límite de apreciación, una décima de gramo en este caso). Si la medida se hubiera realizado en una balanza analítica, hubiera sido del tipo: y como vemos la incertidumbre habría sido de dos diezmilésimas de gramo. A veces, la lectura de la medida no coincide estríctamente con una división y uno se ve obligado a “interpolar” entre dos divisiones de la escala, por ejemplo, al leer el volumen descargado por una bureta, el menisco podría quedar entre la marca de 23.7 y la de 23.8, en cuyo caso el volumen se anotaría: A veces, no se da explícitamente la incertidumbre de la medida (el ), cuando esto ocurre, se asume por convenio que la incertidumbre ha sido de una unidad en la última cifra del número. Esta regla es de vital importancia. Así, una temperatura expresada como 25.2 ºC, se debe entender que ha sido medida con un termómetro graduado en décimas de grado y que por tanto su incertidumbre ha sido de , de manera que, en el peor de los casos, podría haber sido de 25.3 ºC ó de 25.1 ºC: ( ) Seminario 1: Análisis de datos de laboratorio 1

Transcript of Seminario introductorio 1: Análisis de datos de...

Page 1: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Seminario introductorio 1: Análisis de datos de laboratorio

MEDIDA DE UNA MAGNITUD

Para la medida correcta de una magnitud con un aparato o material de laboratorio, hacenfalta tres requisitos: un número, unas unidades y un índice de incertidumbre. Así, cuando se pesauna sustancia en una balanza tipo granatario, la medida podría ser del tipo:

���� �

�������

���

������

� �

����� �������

��

en el granatario, el dígito de las décimas habría estado “parpadeando”, unos instantes daría “8”,

otros “7”, otros “6”.... por lo que anotaremos “7”, y como incertidumbre anotaremos 0.1 (que�aquí vendría a significar la mínima lectura posible en la escala o límite de apreciación, unadécima de gramo en este caso).

Si la medida se hubiera realizado en una balanza analítica, hubiera sido del tipo:

���� �

�������

������

������

� �

����� �������

��

y como vemos la incertidumbre habría sido de dos diezmilésimas de gramo.

A veces, la lectura de la medida no coincide estríctamente con una división y uno se veobligado a “interpolar” entre dos divisiones de la escala, por ejemplo, al leer el volumendescargado por una bureta, el menisco podría quedar entre la marca de 23.7 y la de 23.8, encuyo caso el volumen se anotaría:

������ �

�������

����������

�� �

����� �������

��

A veces, no se da explícitamente la incertidumbre de la medida (el ), cuando esto ocurre,�

se asume por convenio que la incertidumbre ha sido de una unidad en la última cifra del�

número. Esta regla es de vital importancia. Así, una temperatura expresada como 25.2 ºC, sedebe entender que ha sido medida con un termómetro graduado en décimas de grado y que portanto su incertidumbre ha sido de , de manera que, en el peor de los casos, podría haber� ��

sido de 25.3 ºC ó de 25.1 ºC:

����������� �

���� �

�� ������� �

������

�� (�� ����� �

����� �������

�� )

��������� Seminario 1: Análisis de datos de laboratorio 1

Page 2: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

INCERTIDUMBRE ABSOLUTA Y RELATIVA DE UNA MEDIDA

Incertidumbre absolutaExpresa la horquilla de duda asociada a una medida. Es el del que hemos hablado�

más arriba, por ejemplo el de nuestra pesada de 13.7 en el granatario. Esta� ��

incertidumbre se podría escribir como: .� = ��

Incertidumbre relativaEs el cociente entre la incertidumbre absoluta y el valor medido:

�� = ��������

por ejemplo, la incertidumbre relativa de nuestra pesada anterior sería:

�� = �����

= � � ��� �� � �������� ��(�) = �����

� � = � �

Como resulta evidente, lo importante en los laboratorios son las incertidumbresrelativas, que interesa mantenerlas lo más bajas posibles.

CIFRAS SIGNIFICATIVAS DE UN NÚMERO

Dado un número, se entiende por cifra significativa cualquier dígito no nulo (1 al 9),cualquier cero situado entre dígitos no nulos y cualquier cero situado a la derecha del número.

Ejemplos:0.0000689 = 6.89 · 10-5 3 cifras significativas�

0.00208 = 2.08 · 10-3 3 cifras significativas�

0.002080 = 2.080 · 10-3 4 cifras significativas�

El convenio en Ciencia es utilizar el punto (.) para indicar el comienzo de los decimales,por lo que no se debe utilizar para este fin la coma decimal española (,). Tampoco se puedeutilizar el punto español (.) para indicar los millares. Con esto se evitan, además, equivocacionesal usar calculadoras y ordenadores, ya que éstos utilizan dicho criterio.

Por otra parte, se aconseja utilizar principalmente la notación científica (potencias de 10):

ejemplo:

��

���� � �

����

���� � ��

VALOR EXACTO DE UNA MAGNITUD Y ERRORES ABSOLUTO Y RELATIVO

Valor exactoEs el verdadero valor de esa magnitud. Puede ser:

a) Tabulado: Cuando se ha medido varias veces por numerosos investigadores,por ejemplo el valor de la constante de los gases que es 8.31434 J K-1 mol-1.b) Estimado: Cuando un investigador realiza varias medidas de la magnitud, enaparatos previamente calibrados con patrones, y da como valor la mediaaritmética de las medidas.

2������Seminario 1: Análisis de datos

Page 3: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Error absolutoEs la diferencia entre el valor exacto y el valor medido en valor absoluto:

� = ���� � − �������Error relativo

Es el cociente entre el error absoluto y el valor exacto:

o en %, que sería: �� = ����� �

��(�) = ����� �

� �

Obsérvese que estas definiciones son análogas a las de incertidumbre absoluta y relativa, sólo

varía el que ahora se compara con el valor exacto y antes con el valor medido, de ahí el que

deban mantenerse nombres diferentes. En los laboratorios uno se enfrenta normalmente con

“incertidumbres”, ya que pocas veces se conocen lo valores exactos. Desafortunadamente se

utilizan a veces ambos términos como sinónimos, lo cual debe evitarse.

ERROR ALEATORIO Y ERROR SISTEMÁTICO

Error aleatorioEs el que se da cuando la medición se separa del valor exacto en cualquier dirección yal azar. Es un error indeterminable, su tratamiento se aborda en base a los métodosestadísticos. Un símil serían los siguientes disparos a una diana:

xx

x

x x

xx

x

xx

Error sistemáticoEs el que se da cuando la medición se separa del valor exacto siempre en unadirección y por tanto de manera sesgada. Es un error determinable o constante, sutratamiento se aborda en base a patrones y procedimientos de calibración.Un símil serían los siguientes disparos a una diana:

xxxxx xx

DIFERENCIA ENTRE PRECISIÓN Y EXACTITUD DE UN MÉTODO DE MEDIDA

PrecisiónHace referencia a la repetibilidad de una medida. Así, se dice que unas medidasrepetidas son precisas cuando presentan pequeñas diferencias entre si y sonreproducibles. La precisión de unas medidas repetidas se cuantifica con los

��������� Seminario 1: Análisis de datos de laboratorio 3

Page 4: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

procedimientos de la Estadística Descriptiva, principalmente con la llamada desviaciónestándar de la muestra.

ExactitudHace referencia a la concordancia de la medida con el valor verdadero o exacto. Sedice que una medida es tanto más exacta cuanto más se acerca a su valor verdadero.La exactitud de una medida se cuantifica en base a “patrones” y “curvas de calibrado”.

Símiles de ambos conceptosSiguiendo con nuestro símil de los disparos a una diana, tendriamos:

�������������������������������������������������������������������������������������������������������

������������� ���������������������������������!�� �������������������������������������������� �����

"#������$����������������������������������� �������������������������%�����&

xx

x

x x

xx

x

xx

xx

xxxxxx

xxx xxxxxxxxx

En los laboratorios lo primero es la precisión, si las medidas no son reproducibles nose puede hacer nada. La exactitud es una cuestión “a posteriori”, a la que se llegamediante la calibración del aparato con patrones y curvas de calibrado.

ANALIZANDO LA PRECISIÓN DE MEDIDAS REPETIDAS: MEDIA Y DESVIACIÓN ESTÁNDAR

Todas las medidas experimentales conllevan cierta variabilidad, pero la Estadística nosproporciona medios para tratar esta variabilidad.

Concepto de media y desviación estándarSi se repite una medida un gran número de veces, y los errores son puramentealeatorios, los resultados tienden a agruparse simétricamente en torno al valor medio.Imaginemos un investigador que dispone de mucho tiempo y decide hacer 100determinaciones del punto de equivalencia de una valoración de HCl con NaOH, acontinuación representa en abcisas el volumen de equivalencia en mL frente alnúmero de veces que se le ha repetido cada medida y obtiene una gráfica del tipo:

V / mL

número deveces

25 2624

24681012

4������Seminario 1: Análisis de datos

Page 5: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

los resultados tienen la forma de una curva suave tipo “campana” que recibe elnombre de “curva de Gauss”, la cual está caracterizada por dos parámetrosestadísticos: la media y la desviación estándar.

Media: es la suma de todos los valores medidos dividida por el número de medidas

� = �=�

� ���

Desviación estándar: es una medida del grado de dispersión de los datos en torno ala media (cuanto mayor es la desviación estándar mayor es el alejamiento de los datosrespecto a la media); viene dada por la expresión

= �=�

� (�� − �)�

� − �

(Se ha demostrado que dividir por “n-1” en lugar de por “n” proporciona una mejor estima de “s”)

La desviación estándar expresada como porcentaje del valor medio recibe el nombrede coeficiente de variación:

��(�) = �� �

El cuadrado de la desviación estándar se denomina varianza .(�)

Para una serie “infinita” de medidas, la media se designa con la letra y la�desviación estándar con la letra . En realidad nunca se pueden medir y , pero� � �los valores de (media de una muestra pequeña) y (desviación estándar de la�

muestra pequeña) se aproximan a (media de la población) y (desviación� �estándar de la población) a medida que aumenta el número de medidas. La

nomenclatura correcta sería denotar con y cuando los valores se refieren a una� muestra pequeña de la población y con y cuando se refieran a la población� �completa o a una muestra muy grande. Las calculadoras en su modo “Estadística”

suelen tener tres teclas: para la media, para la desviación estándar (dividiendo� ��por “n”) y para la llamada “cuasi desviación estándar” (dividiendo por “n-1”).��−�Como se ve no es una nomenclatura muy acertada, según lo que se ha dicho antes, y

a las desviación estándar debieran haberla llamado mejor y .� �−�

��������� Seminario 1: Análisis de datos de laboratorio 5

Page 6: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Distribución normal o GaussianaCuando una población de medidas repetidas se puede describir completamente por sumedia aritmética y su desviación estándar se la llama “normal” o “Gaussiana”. Laecuación de la curva en forma de campana que sigue una distribución de este tipo es:

� = �

� ���− �

�'"�−�� &(�

donde:

es el valor para una medida dada��

es la frecuencia relativa de ese valor (�� � = ��� )

media de la población�� desviación estándar de la población��

y su representación es:

Se demuestra que el 68% de las medidas caen dentro del intervalo y que el� � �95% de ellas caen dentro del intervalo . � � ��

Intervalos de confianza para una mediaEstos intervalos proceden de la imposibilidad de realizar infinitas medidas y determinar

así el valor medio exacto ( ) de una magnitud. En su lugar, nos vemos obligados a�realizar sólo unas pocas medidas (por ej. 5) y obtener la media de ellas ( ), que es�

una estima de pero que no coincide necesariamente con ella. Debemos hacer algo�para indicar una horquilla de confianza alrededor de la media de la muestra medida

por nosotros ( ).�

Haciendo muchas observaciones el irlandés Gosset (que utilizaba el seudónimo de

“Student”), comprobó que la mejor estima de la media de una magnitud ( ) venía�dada por la expresión:

6������Seminario 1: Análisis de datos

Page 7: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

� = � � �

donde:

es un parámetro llamado “t de Student”, que figura en tablas, y � que depende de “n” y del porcentaje de confianza establecido para la horquilla (normalmente el 95%).

es la desviación estándar�

es el número de medidas repetidas��

Los límites así establecidos se les denominan límites de confianza al 95%, y significa

el intervalo en el que se encuentra la verdadera media ( ) en el 95% de los casos.�

Menos riguroso, aunque bastante utilizado, es expresar los límites de confianzallamados de “una desviación estándar”:

� = � �

(Como ya se ha comentado, en este caso el intervalo de probabilidad considerado sería sólo del

68% de los casos e implicitamente se equipara con y con )� � �

Los límites de confianza se utilizan también en las representaciones gráficas paraindicar la “barra de incertidumbre” asociada a cada serie de medidas replicadas:

tiempo

Volumen

DESCARTANDO MEDIDAS “ATÍPICAS” EN UNA SERIE DE MEDIDAS REPETIDAS

En una serie de réplicas, es posible que alguna tenga un valor muy diferente al del restode las demás, en ese caso, surge la duda de si convendría descartar esa medida como afectadade alguna equivocación humana.

Existen varias reglas: criterio 3s, regla 4d, test Q. Para aplicar el criterio 3s se procede dela siguiente manera:

a) Se calcula la media y la desviación estándar de todos los puntos menos el “sospechoso”.

��������� Seminario 1: Análisis de datos de laboratorio 7

Page 8: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

b) Se calcula la desviación entre el “sospechoso” y la media: � = �������� − �c) Si se descarta el punto.� � �

PROPAGACIÓN RIGUROSA DE LAS INCERTIDUMBRES DE UNOS DATOS AL RESULTADO FINAL

DE UN CÁLCULO

La incertidumbre de una medida se suele expresar como la desviación estándar de unaserie de medidas repetidas. El problema surge cuando se combinan diferentes medidas en uncálculo para obtener un resultado final ¿Cúal es la incertidumbre asociada al resultado? ¿Cómose propaga la incertidumbre de cada medida al resultado final?

La teoría matemática de propagación de incertidumbres demuestra lo siguiente:

siendo:

� = �(�� �)y las desviaciones estándar de z, x e y�� �� �

se cumple que:

�� = ��

��

��� + ��

��

��

que para el caso concreto de diferentes cálculos matemáticos queda:

Operación Función Incertidumbre

adición � = � + � �� = �� + ��

sustracción � = � − � �� = �� + ��

multiplicación � = �� ��

= ��

+��

� = �� � = �� (m = constante)

división � = ��

��

= ��

+��

� = �� � = �

� (m = constante)

exponenciación � = �� ��

= � � ��

(m = constante)

logaritmo � = �� � � = ��

antilogaritmo � =������ � � = ��

8������Seminario 1: Análisis de datos

Page 9: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

PROPAGACIÓN APROXIMADA DE LAS INCERTIDUMBRES Ó REGLAS PRÁCTICAS PARA LOS

CÁLCULOS

En la práctica, a veces, no se considera la propagación de las incertidumbres de unaforma totalmente rigurosa (apartado anterior), sino que se siguen unos criterios mas flexibles queen muchos casos son suficientes:

1) Al registrar el valor numérico de una magnitud, se escriben sólo las cifras significativasadecuadas (se supone que la incertidumbre en la medida es de en la última cifra��

significativa dada).Ejemplo:

La lectura de una bureta, graduada en décimas, que hubiera descargadoquince mililitros justos, se anotaría 15.0, no 15 ni 15.00.

2) Si se quiere redondear un número que tiene cifras significativas superfluas,auméntese en una unidad la última cifra retenida si la primera cifra desechada es 5 omayor.Ejemplos:

0.212743 6 cifras significativas�

0.2127 redondeado a 4 cifras significativas�

0.213 redondeado a 3 cifras significativas�

3) Cuando se suman o se restan números, el resultado se da con tantas cifras decimalescomo tenga el número con menor número de decimales.

Ejemplo: 0.12 + 12.2324 + 1.568 = 13.9204 (mal)= 13.92 (bien)

4) Al multiplicar y dividir números, el resultado se da con las cifras significativasnecesarias para que su incertidumbre sea semejante a la incertidumbre relativa del factorque menos cifras significativas tenga. En la práctica viene a ser equivalente a expresar elresultado con el mismo numero de cifras significativas que las que tenga el factor conmenos cifras significativas. (Obsérvese que este criterio se refiere a las cifras significativas, no a los

decimales de los números).

Ejemplo: imaginemos el siguiente cálculo

(¿Por dónde cortar las cifras significativas)?)���) � ��)�)�

� �����*�+*� � �−�

recordando que la incertidumbre relativa viene dado por: �� = ��������

y que en la última cifra significativa, tendríamos que las incertidumbres� = � �relativas de todos los números participantes en el cálculo serían:

��������� Seminario 1: Análisis de datos de laboratorio 9

Page 10: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Ir(1.578) = 0.001/1.578 = 1/1578 = 6.34 ·10-4 0.0634 %�

Ir(0.0182) = 0.0001/0.0182 = 1/182 = 5.5 ·10-3 0.55 %�

Ir(81) = 1/81 = 0.012 1.2 %�

El resultado no se puede dar con menos incertidumbre relativa que la que tenga elnúmero con mayor incertidumbre relativa, por eso, en este caso, se dará como resultado 3.5·10-4 , ya que su incertidumbre relativa es Ir = 0.1/3.5 = 1/35 = 0.029 (2.9 %) , que esdel orden del 1.2 % requerido. Si diéramos más cifras significativas nos saldría unaincertidumbre relativa más baja que la del número con mayor incertidumbre relativa (el81 (1.2 %)); así, si diéramos como resultado 3.54.10-4, la incertidumbre relativa sería Ir =0.01/3.54 = 1/354 = 2.82.10-3 (0.28 %) y por tanto daríamos un resultado con sólo 0.28 %de incertidumbre relativa mientras que el número 81 la tiene ya del 1.2 %, luegosacaríamos un resultado más preciso que uno de los datos que nos han dado, lo cual esun absurdo.

(Según todo lo anterior, el expresar un resultado con "todos" los dígitos que salen en la calculadora no

significa mayor precisión (ó mejor calculadora), sino mayor ignorancia)

5) Al hacer el logaritmo neperiano o decimal de un número, el resultado se expresa con una cifrasignificativa más que el número del cual se hace el logaritmo.

Ejemplos: ln 8.25 = 2.110 log 121 = 2.083

al calcular antilogaritmos el resultado se expresa con una cifra significativa menos que el numerodel cual se hace el antilogaritmo.

FACTORES DE CONVERSIÓN Y ANÁLISIS DIMENSIONAL

Una herramienta útil, que elimina la posibilidad de equivocarse al realizar cualquier cálculo,es el uso de fracciones equivalentes, denominadas factores de conversión. Estas fracciones sonadimensionales e iguales a la unidad. Por ejemplo, como 1 kg equivale a 1000 g, podríamosescribir que el factor de conversión para transformar kg en g sería:

� �

� ��=� ��

� ��= �

De manera que 7.325 kg se transformarían en gramos así:

������ �� �

� ��= ����

Veamos un ejemplo del uso de factores de conversión: transfórmese una concentración deenzima de 2.00 µg/mL en unidades de mol/L (sabiendo que su masa molecular es de )����

g/mol). El procedimiento sería:

'�( =��

��

�� ��−*�

��� ����

�−��

)� � ���

���

=�� � �−� �

)� � ���

���

= ��� � �−) ����

10������Seminario 1: Análisis de datos

Page 11: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Este método, permite resolver cambios de unidades complejos de manera sencilla, basta contener en cuenta que las diversas unidades se pueden multiplicar o dividir en la forma habitual yque las unidades iguales se anulan entre sí cuando aparecen en el numerador y en eldenominador de una fracción.

Por tanto, al realizar un cálculo con una expresión, debe tenerse siempre la precauciónde acompañar cada número con sus unidades y "arrastrarlas" a lo largo del cálculo, deforma que se pueda apreciar en seguida si las unidades son homogéneas o no y si se hade introducir algún factor de conversión:

Ejemplo:

� = ����

� =���� ��� , ��+)

��

��� , �+)

*��� ��= ��� (��)

� ����� ��� � �)��

���

���� � �+)

*��� �� ��−�����

= )�+ � �� � (����)

Esta recomendación tan sencilla es la clave del éxito en la mayoría de los cálculos en

Química, su olvido, por el contrario, es la causa del mayor porcentaje de errores en la práctica(también en los exámenes).

CONVENIOS PARA LA ELABORACIÓN DE TABLAS

Las tablas son la herramienta más adecuada para anotar los datos de laboratorio y paratransmitir la información científica, por eso el habituarse al uso correcto de las mismas es de granimportancia. A continuación, se ponen diferentes ejemplos para confeccionar y encabezar tablas.

La forma mas rudimentaria para hacer una tabla sería:

0.00127 K-15.844787 K345 atm0.00214 K-13.058467 K21.3 atm0.00336 K-10.2927298 K1.34 atm0.0431 K-1-2.07923.2 K0.125 atm

1/TlnP T P

en esta tabla hay muchos términos que se repiten en cada columna y podrían sacarse comoinformación común a la cabecera de la tabla:

0.001275.844787345 0.002143.05846721.30.003360.29272981.340.0431-2.07923.20.125

1/T(K-1)

lnP(sin unid.)

T(K)

P(atm)

��������� Seminario 1: Análisis de datos de laboratorio 11

Page 12: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Esto ya es un avance, pero todavía se observa otra característica que convendría mejorar, y esque los números de alguna columna convendría ponerlos en notación científica y sacar a lacabecera de la tabla la potencia de diez mas idónea. El formato aconsejable en cienciasbiomédicas sería el siguiente (el que utilizaremos nosotros):

1.27 5.844 7.87 34.5 2.14 3.058 4.67 2.13 3.36 0.2927 2.98 0.134

43.1 - 2.079 0.232 0.0125 (1/T) / 10-3 K-1 lnP T / 102 K P / 101 atm

(la columna 3 no se ha modificado, ya que los números ya estaban (prácticamente) en notación científica )

Como vemos, en los encabezados de cada columna, el criterio ha sido el de usar el símbolo de lamagnitud física medida y dividirlo por la necesaria potencia de 10 (si hace falta) y las unidades dela magnitud, de manera que los valores tabulados en las celdas de dicha columna representennúmeros puros. Pero ojo, si uno necesitase utilizar alguno de los datos de la tabla para haceralgún cálculo con él, no basta con coger sólo el número de la celda, sino que ahora hay que“deshacer” lo que se llevó al encabezamiento, de manera que hay que volver a poner la potenciade 10 correspondiente y sus unidades (por ej.: ).���� � �� �

Otro convenio alternativo, muy utilizado en otras ciencias es el siguiente:

1.27 5.844 7.87 34.5 2.14 3.058 4.67 2.13 3.36 0.2927 2.98 0.134 43.1 - 2.079 0.232 0.0125

103 (1/T) / K-1 lnP 10-2T / K 10-1 P / atm

aquí, el criterio en los encabezados de cada columna es equivalente al anterior, pero se prefiereponer la potencia de 10 (si hace falta) delante del símbolo de la magnitud en el numerador, encuyo caso obviamente va cambiada de signo respecto al convenio anterior.

Nota: Convenios semejantes son los que se utilizan para rotular los ejes de coordenadas en las

representaciones gráficas.

CONVENIOS PARA LA ELABORACIÓN DE GRÁFICAS MANUALMENTE

a) En abcisas se pone la variable independiente "X" y en ordenadas la variabledependiente "Y".

b) La función a representar se suele linealizar, si hace falta, para hacer el ajuste de una recta a los datos que resulta más fácil:

12������Seminario 1: Análisis de datos

Page 13: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Ejemplo: y = a.ebx ln y = ln a + bx (representándose “ln y” frente a “x”)�

(con el advenimiento de los ordenadores estas linealizaciones no serían ya necesarias, pues ya es factible

numéricamente ajustar las funciones originales no lineales por regresión no lineal, y esa sería la mejor

opción, no obstante las tranformaciones lineales están muy arraigadas y todavía las usaremos en este curso).

c) Se elige la escala adecuada:

1.- Se utiliza papel milimetrado2.- Se pasan los datos, si es necesario, a notación científica:

Ejemplo: x (mL): 625 640 660 801 y (atm): 0.0331 0.0340 0.0350 0.0370

Cuyos valores se pueden reordenar en nuestro formato de tabla: x / 102 mL : 6.25 6.40 6.60 8.01

y / 10-2 atm : 3.31 3.40 3.50 3.70

3.- Se analizan el intervalo en que se “mueven” las “x” y las “y”, sin considerar laspotencias de 10. Conviene tener en cuenta que no necesariamente se tiene queempezar en el punto (0,0), aunque algunas veces puede resultar conveniente:

3.2

6.1

(BIEN)(MAL)

6.0 7.0 8.0

4.0

3.0

00

3.8

8.1

4.- Se "mete" el intervalo de datos en una medida de ejes adecuados (10-20cmdel papel milimitrado para cada eje). Para ello se suele pensar así:

- Se resta el límite superior del inferior (a la hora de elegir los límites delintervalo a representar se coge un límite superior ligeramente superior almayor número a representar y un límite inferior ligeramente inferior almenor número a representar):

x : (8.10 - 6.10) = 2.00y : (3.80 - 3.20) = 0.60

- Se reparte el intervalo entre los ejes, para ello se realiza una simple reglade tres:

��������� Seminario 1: Análisis de datos de laboratorio 13

Page 14: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

para las “x” :

si 2.00 va ocupar 20 cm�

0.1 unidades ocupará N cm�

de donde : N = 1 cm

análogo para las “y”:

si 0.60 van a ocupar 12 cm�

0.1 unidades ocupará M cm�

de donde : M = 2 cm

Este proceso se suele hacer mentalmente luego con la práctica, y seprocura siempre que las asignaciones cuadren con números enterosfácilmente medibles en el papel milimetrado.

- Se titula el gráfico y las escalas convenientemente:

3.20

3.80

y / 10 atm-2

X /10 kg2

6.10

3.40

3.60

6.60 7.10 7.60 8.10

(Al principio puede ser de utilidad señalar todas las divisiones de los ejes,en la práctica basta luego con indicar 4-6 divisiones para no sobrecargar lagráfica con tantas divisiones)

- Se comienzan a representar los puntos. La mejor simbología es poner unpunto muy fino en el lugar exacto y dibujar a su alrededor un círculo, uncuadrado, un triángulo, etc.:

(Todas estas operaciones se recomienda hacerlas con lápiz, con el fin depoder borrar las equivocaciones)

AJUSTE DE UNA RECTA A LOS DATOS

Esta operación se realiza para obtener los parámetros de la recta. Sabiendo que laecuación de una recta es y = ax + b, tenemos que obtener a partir de los datos los valores de lapendiente "a" y de la ordenada en el origen "b".

14������Seminario 1: Análisis de datos

Page 15: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

En la práctica se emplean dos métodos:

a) Método gráfico:

Cálculo de la pendiente:� Se traza "a ojo" la mejor recta que pase por los puntos experimentales� Se marcan dos puntos suficientemente separados sobre la recta (para

ganar en precisión) de dicha recta (ojo, nunca 2 puntos experimentales dela tabla, porque para terminar haciendo eso no hubiera hecho falta representar

todos los datos en una gráfica).� Se leen en las escalas correspondientes los valores de las abcisas y

ordenadas de los puntos marcados ((x2, y2), (x1, y1)):

x

xpend. =

y - y

x x-2

12

1

y

y

x x

2

1

1 2

� Se calcula la pendiente:

� �� =(! � − ! � ) � −� �

(" � − " � ) � � �� = ������� � �� −�

(No olvidarse de incluir las potencias de 10 si las hubiese, ni las unidades, ya que

una pendiente debe expresarse siempre con un número y con unas unidades (las

unidades de las ordenadas divididas por las unidades de las abcisas)

Cálculo de la ordenada en el origen:- Extrapolando la recta hasta el cero de las “x” se obtiene la elvalor de la ordenada en el origen, su valor y sus unidades (las deleje de las y). - Si no existe el cero de las “x” en nuestra representación, comoes el caso de nuestro ejemplo, el cálculo se haría analíticamente,despejando en la ecuación de una recta: b = y - ax y sustituyendo el valor de la pendiente "a" previamente obtenido yalgún par de valores “x,y” (leídos sobre la recta trazadagráficamente, de nuevo no es correcto coger valores de la tabla),

��������� Seminario 1: Análisis de datos de laboratorio 15

Page 16: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

procediendo luego a sacar la media de los valores de "b" asíobtenidos.

b) Método de regresión lineal por mínimos cuadrados (LR en las calculadoras):

Consiste en obtener matemáticamente una recta para la que la suma delas desviaciones al cuadrado de los puntos experimentales a la recta seamínima (es decir para la que las distancias verticales al cuadrado se mínima):

y

didi

di

didi

X

Que matemáticamente se expresa como:

�=�� ��� =

�=�

� (� � − (� � + �)�

La condición matemática para que una función sea mínima es que sea cerosu primera derivada, luego tendremos:

; �� ���

�= �� ���

��=

de donde (haciendo operaciones):

=�� �� �� −� �� � ���� ��

� − "� � � &� � =

� � � � ��� − � �� � ����

�� � �� − "� � � &�

(donde n es el número de datos experimentales y significa sumatorio)�Se define también matemáticamente otro índice llamado coeficiente decorrelación (r):

� = ���"� � � � − � �&�� ��

que nos mide si las desviaciones a la recta son más o menos importantes. Si"r" nos da un número próximo a +1 (rectas con pendiente positiva) ó -1 (rectas con

pendiente negativa), se admite el ajuste como bueno. Si "r" nos da un númeroalejado de +1 ó -1 entonces los puntos se desvían mucho de la recta.

16������Seminario 1: Análisis de datos

Page 17: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

Las calculadoras tienen automatizados todos estos cálculos, basta conseleccionar el modo “LR” en la máquina y proceder según las instruccionesdel manual de la calculadora.

Este método de la regresión lineal es el más utilizado, por ser su bondadestadística superior a la del método gráfico (siempre subjetivo), pero hay quetener en cuenta que hay una fase previa a cualquier método de ajuste y es larepresentación gráfica de los puntos experimentales (ver figura inferior), locual nos hará decidir sobre la conveniencia o no de aplicar el ajuste a unarecta. A veces se podría caer en la "trampa" de que el ajuste a una recta nosdiera un buen coeficiente de correlación y sin embargo la tendencia de lospuntos fuera claramente de tipo curvilíneo:

10.0

20.0

30.0

40.0

0.0 0.0 4.0 8.0 12.0 16.0

USO DE UNA HOJA DE CÁLCULO PARA ANALISIS DE DATOS

Una hoja de cálculo de un ordenador es una herramienta potente para el tratamiento dedatos en un laboratorio. Consiste en una serie de celdas tabuladas en filas y columnas, en ellasse pueden introducir los datos y luego, a partir de instrucciones sencillas, se pueden ir generandootras columnas con los cálculos deseados o generar distintas gráficas con los datos.

La hoja de cálculo “Excel” de Microsoft está disponible en muchos ordenadores y es unade las más populares:

��������� Seminario 1: Análisis de datos de laboratorio 17

Page 18: Seminario introductorio 1: Análisis de datos de laboratoriosimfit.usal.es/burguillo/docencia/fisicoquimica/modulo1/... · 2014-09-20 · Seminario introductorio 1: Análisis de datos

USO DE UN PAQUETE ESTADÍSTICO PARA ANÁLISIS DE DATOS

Otra herramienta para el análisis de datos de laboratorio son los paquetes estadísticosdisponibles en los ordenadores. Están más automatizados que las hojas de cálculo y permiten unmayor número de tratamientos estadísticos y tipos de gráficas. Entre ellos los mas populares sonSPSS (comercial) y SIMFIT (gratuito en http://simfit.usal.es). En estas prácticas podríamos utilizarSIMFIT, dada su disponibilidad y la posibilidad de consultar su manejo a los profesores. Unejemplo del ajuste a una recta con SIMFIT aparece en la siguiente figura:

18������Seminario 1: Análisis de datos