Sei sulla pagina 1di 14

Química Analítica Cuantitativa Ing. Iván M.

Romero
5

UNIDAD No 2
TRATAMIENTO ESTADISTICO DE DATOS ANALÍTICOS

Toda medición es una comparación, puesto que en toda medición siempre se cometen errores, nunca se conoce el valor
verdadero o exacto de una medición, los análisis químicos están sujetos a muchos errores provenientes de diversas
fuentes.

Los análisis químicos son procedimientos de laboratorio estandarizados para conocer:

 la cantidad o proporción de un analito en una muestra y expresarlo en alguna unidad de


concentración. la magnitud de una variable o parámetro fisicoquímico relacionada con control de calidad

Los resultados experimentales de un laboratorio deben ser confiables principalmente si son parte de una
investigación científica, La confiabilidad de los resultados depende de varios factores entre ellos:

 El método empleado,
 La pureza de los reactivos
 La calidad de los instrumentos
 El apoyo estadístico en los resultados
 La atención del analista
 El número de cifras significativas empleadas en los cálculos, etc.

Cifras significativas. Las cifras significativas de un número o dato es el número mínimo de dígitos para expresarlo
científicamente sin que se pierda exactitud. Ej.

6235000 = 62,35x103 = 6,235 x106 4 cifras significativas


4
1427 = 1,427x10 4 cifras significativas
0,00256 = 2,56x10-3 5 cifras significativas

Las cifras significativas es lo cierto, lo exacto que se pueda afirmar de una cifra o número. Por ejemplo no es lo mismo
preparar una solución con las siguientes concentraciones:

0 ,5 M 2 cifras significativas, no interesan los centésimos


0 ,50 M 3 cifras significativas interesan los centésimos
0,500 M las 4 cifras son significativas, interesan aún los milésimos

Errores en los experimentos Todo experimento o medición llevan un error experimental, nunca es posible estar
completamente seguro de un resultado, este depende del numero de cifras significativa empleada en los cálculos y
determinaciones. El tratamiento de datos, especialmente de datos dudosos o fuera de valores normales se realizan
estadísticamente.

Los errores experimentales pueden ser sistemáticos (determinados) y aleatorios (indeterminados)

El error sistemático es un error que depende del trabajo experimental o del observador, se puede detectar y
corregir, estos errores generalmente en análisis químico es debido a:

1. Error de Calibración

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero
6

2. Error de método
3. Error de observación (lectura)
Formas de detectar y corregir el error sistemático

1. Se analizan muestras de composición conocida, el método empleado debe estar de acuerdo con el tipo de análisis,
de la composición y de la exigencia en los resultados.

2. Se analizan muestras testigos o blancos que no contengan la sustancia buscada, si se observa un resultado distinto
del cero, existe un potencial error sistemático.

3. Se emplean distintos métodos analíticos para medir el mismo análisis, si los resultado de los dos métodos no
concuerdan existe un error asociado a uno de ellos o a los dos.

4. Distintas personas en distintos laboratorios pueden analizar las muestras del mismo material, del mismo lote,
empleando los mismos métodos o diferentes, deben producir resultados análogos que no excedan al error
aleatorio.

La característica clave del error sistemático es que tomando precauciones y trabajando con esmero puede detectarse
y corregirse.

Error aleatorio o indeterminado, se debe a las limitaciones materiales para realizar mediciones físicas como su
nombre lo indica el error aleatorio es a veces positivo (+) y a veces negativo (-), siempre existe, no puede ser
corregido, a veces se puede disminuir pero no eliminar. Es una limitante definitiva de las determinaciones
experimentales y está asociado con las lecturas subjetivas del investigador.

Precisión y exactitud

Precisión, Es una medida de la reproducibilidad de un resultado, no siempre cercano al valor real, el resultado de un
experimento puede ser perfectamente reproducible pero equivocado.

Exactitud, Se define como la proximidad al valor real ( si es que se conoce), es el error absoluto de una
determinación. por ejemplo, los siguientes conjunto de datos obtenidos por repeticiones del mismo
experimento, valor real 6,00 g

Observador 1 Observador 2 Observador 3


5,93 4,75 4 , 85
5,98 4,79 4 , 95
5.97 4,75 6 , 85
5,96 4,76 7 , 28
5,98 4,74 5 , 59
Preciso y Preciso e inexacto Impreciso e inexacto
Exacto

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero
7

El estudio estadístico plantea la forma de cómo tratar los datos matemáticos para la variación en los resultados
experimentales.
Curva de error normal o Gaussiana

Cuando la variación en un conjunto de datos experimentales es estrictamente aleatoria, la línea que une los puntos en
la gráfica se asemeja al perfil de una campana, llamada curva de Gauss o curva normal de error.

La curva que ajusta mejor los datos experimentales es la curva de Gauss. La gráfica de cualquier número finito de
datos presenta una variación con respecto a la curva de Gauss. A medida que aumenta el número de datos ( n  ∞) las
líneas que unen los puntos se hacen mas lisa y se aproximan a la curva de Gauss.

Media y desviación estándar

Media: Indica el centro de la distribución de datos, se


expresa como media aritmética

Desviación estándar: La desviación estándar se simboliza con s, representa que tanto se agrupan los datos
alrededor de la media o sea la extensión de la distribución de los datos.

El significado de Ses de cuanto mas pequeña es la desviación estándar mas agrupados están los datos
alrededor de la media, una técnica experimental que produce una desviación estándar pequeña, es mas
confiable (precisa) que otra que produce mayor desviación.

Para un conjunto infinito de datos (n  ∞), la media se representa por  y se llama media poblacional y la
desviación estándar se representa por  y se llama desviación estándar poblacional.

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero
8

Nunca puede medirse o determinarse  y  sin embargo los valores de la media aritmética tiende a la media
poblacional (xμ) y la desviación estándar tiende a la desviación estándar poblacional (s ), conforme el
número de mediciones aumenta o sea (n).

Mediana: Es el valor central por encima y por debajo del cuan se encuentra un número igual de
datos ordenados en forma creciente.

Dispersión, también llamada amplitud o rango de variación, es la diferencia entre los valores
máximos y mínimos de un conjunto de datos ordenados en forma creciente.
Ejemplo 1.Los siguientes datos representan 17 experimentos repetidos {1,55; 1,54; 1,35; 1,23; 1,43; 1,66; 1,95 ; 1,45;
1,70; 1,37; 1,76; 1,84, 1,52; 1,63; 1,58; 1,62; 1,47} del tiempo de caída de una esfera en un medio viscoso, hallar: La
media, mediana, desviación estándar, varianza y amplitud.

1. Se ordena de menor a mayor:

1,23-1,35-1,37-1,43-1,45-1,47-1,52-1,54-1,55-1,58-1,62-1,63-1,66-1,70-1,76-1,84-1 , 95

a) Rango o amplitud : 1,95 – 1 ,23 = 0, 72


b) La mediana es 1,55 (el valor del medio)
c) Media : 1 , 56
d) desviación estándar: s = 0,183
e) varianza: s2 = 0,033

Para construcción de la curva de Gauss

Clase Frecuencia Media de


Clase
1,23 - 1,32 1 1,275
1,33 - 1,41 2 1 , 36
1,42 – 1,50 3 1 , 45
1,51 – 1,59 4 1 , 55
1,60 – 1,68 3 1 , 64
1,69 – 1,77 2 1 , 73
1,78 – 1,86 1 1 , 84
1,87 – 1,95 1 1 , 95

Cálculo del error y la incertidumbre

Al emplear una curva de Gauss es especialmente útil expresar las desviaciones respecto del valor medio en múltiplos
de la desviación estándar, para ello se utiliza la relación del factor Z, para un conjunto finito de datos (μ  x) y (
s) ,

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero
9

la curva de error es simétrica con respecto a x=μ, la probabilidad relativa de obtener una media en particular es
proporcional a la ordenada (valor de y) correspondiente al valor de x, la probabilidad de medir x en cierto intervalo es
proporcional a medir el área bajo la curva correspondiente a ese intervalo, por ejemplo la probabilidad de hallar x
entre -1 y -2 es de 0,136 y esto corresponde al área bajo la curva entre estos valores.

La tabla siguiente muestra el área correspondiente bajo la curva para distintos intervalos, puesto que la suma de las
probabilidades de todas las mediciones debe ser igual a 1, el área bajo la curva completa desde z=- hasta z= + es
igual a 1. El factor 1/ √(2.) de la ecuación se llama factor de normalización y garantiza que el área bajo la curva
completa sea igual a 1.

Ejemplo 1 Se realizaron 1500 análisis del contenido de yodo en bolsas de un kilogramo de sal de cocina
(sal yodada) el promedio fue de 0,55 mg de I /kg de sal y la desviación estándar de 0,08.
a) Cuantas bolsas espera que tengan un contenido mayor a 0,65 mg/kg
b) Que proporción (%) de bolsas de sal espera que tengan menos de 0,42 mg/kg de yodo?

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero
1
0

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

Ejemplo 2. Un fabricante de lámparas prueba el tiempo de duración (vida útil) de sus lámparas, con
4500 ensayos encontró que el tiempo de duración media era de 845,2 horas con una
desviación estándar de 94,2 hrs
a) Si el fabricante ofrece reponer cualquier lámpara cuya vida útil es menor a 600 horas de
uso, que proporción de lámparas deberá reservar para esta reposición?
b) por cada lote de 10000 lámparas entregadas a los distribuidores cuantas lámparas
adicionales deberá entregar?
c) Que proporción de lámparas espera que tengan una vida útil comprendida entre 900 y 1000
hrs?.

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

Intervalos de confianza

A partir de un conjunto de datos experimentales no se puede determinar la media poblacional  ( media real de la
población de datos) o la desviación estándar poblacional , lo que se puede determinar es la media y desviación
estándar de la muestra.
El intervalo de confianza indica la magnitud del error o diferencia entre la media real y la media aritmética del
conjunto de datos para un cierto nivel de confianza, el intervalo de confianza se lo calcula mediante la fórmula:

El valor del factor t de Student se lo obtiene de una tabla de doble entrada con datos de:

Grados de libertad = n – 1
Nivel de confianza (%)

Los grados de libertad representa el número de datos independientes que se emplean para calcular la desviación
estándar y el nivel de confianza es una medida de la probabilidad expresada como porcentaje

Ejemplo: Los análisis repetidos de muestras de agua de río para determinar el contenido del ión Ca ++ en ppm
en la ciudad de Santa Cruz se muestran a continuación

S = { 225, 240, 254, 265, 238, 257, 245, 240, 232 }

Hallar: a) la media, b) mediana, c) moda, d) desviación estándar, e) varianza f) amplitud

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

g) el intervalo de confianza para un nivel de confianza de 95%

Comparación de medias

Algunas veces se requiere comparar los resultados de dos pruebas analíticas con repeticiones del mismo material a fin
de saber:
 Si los resultados son iguales o diferentes (están dentro del margen del error aleatorio)
 Si los métodos son iguales, es decir dan los mismos resultados dentro del margen del error aleatorio
Si las muestras pertenecen a la misma población

Para ello se aplica la prueba t empleando la t de Student, para los dos conjuntos de datos

a) Cuando las pruebas tienen distinto números de mediciones , la t se puede calcular mediante la
fórmula

El valor de t calculado mediante la ecuación anterior (t calc ) debe compararse con el valor de t tabulado
de la tabla 2 para el nivel de confianza considerado y para (n 1 + n2 – 2) grados de libertad.

Si tcalculado  ttabulado  los métodos son significativamente diferentes para el nivel


de confianza considerado o las muestras pertenecen a
distintas poblaciones
Ejemplo. El contenido en proteínas de una muestras de carne seca se determinó mediante dos
métodos distintos dando los siguientes resultados

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

Como se puede observar los métodos dan resultados diferentes con medias ligeramente
Diferentes, se puede asegurar con 90 % de confianza que los métodos dan resultados
análogos?
b) Cuando las pruebas tienenel mismonúmeros de mediciones , la t también se puede calcular mediante
la comparación de las diferencias individuales, con las fórmulas:

De igual modo, el valor de t calculado mediante la ecuación anterior (t calc ) debe compararse con el valor de t tabulado
de la tabla 2 para el nivel de confianza considerado y para ( n – 1) grados de libertad.

Si tcalculado  ttabulado los métodos son significativamente diferentes para el nivel de


confianza considerado o las muestras pertenecen a distintas
poblaciones

Ejemplo: El contenido de colesterol de seis muestras de plasma sanguíneo humano se determina por dos
métodos diferentes, uno turbidimétrico y el otro espectrofotomético, los resultados se
muestran en la tabla siguiente, cada una de las muestras es distinta.

Como se puede apreciar, las medias de ambos métodos son distintas, ¿ los métodos son
significativamente distintos para un nivel de confianza de 95% ? y para un N.C. de 80% ?

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

Manejo de datos dudosos

Es frecuente que en análisis repetidos de muestras aparecen datos que parecen estar fuera de serie (demasiado altos
o demasiado bajos), exceden los valores mínimo- máximo de los parámetros normales, pero en estos casos hay dos
posibilidades:

 El dato está fuera de rango, debido a errores durante la prueba


 El dato es correcto, la muestra presenta niveles altos o bajos

Lo mejor en estos casos es repetir el análisis con mas cuidado para salir de dudas, pero muchas veces cuando es difícil
repetir debido al tiempo, costo, rareza de material, etc. Es necesario tomar una decisión si se acepta o rechaza el
dato dudoso. Una prueba estadística que ayuda a tomar esta decisión es la prueba Q ( prueba de rechazo )

Este valor de Q calculado se compara con un valor de Q tabulado, el cual se obtiene de una tabla para un nivel de
confianza determinado y un número de observaciones dado.

Si Q calculado es mayor que el Q tabulado, entonces es recomendable desechar el punto sospechoso por ser
incongruente, estar fuera de rango del error aleatorio. Si sucede lo contrario, Qcalc  Qtabla entonces el dato puede
aceptarse.

Ejemplo: Los siguientes datos son resultados de análisis repetidos sobre el nivel de azufre en gasolina
en p.p.m. { 225, 229, 231, 239, 224 y 226}, aplicando la prueba Q indique si el dato de 239
(dato sospechoso) debe rechazarse o aceptarse para un 95% de Nivel de Confianza.

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

Ajuste de Rectas – Análisis de Regresión Lineal ( Método de los Mínimos Cuadrados )

A menudo un conjunto de datos experimentales tiene comportamiento lineal, es decir los puntos experimentales se
distribuyen gráficamente a lo largo de una recta no perfecta, por ejemplo en la calibración instrumentos como el
espectrofotómetro, se obtiene un conjunto de absorbancias para valores conocidos de concentración del analito, para
una cierta longitud de onda en la región de comportamiento lineal.

Entonces es necesario hallar la ecuación (modelo matemático) que representa el comportamiento de la concentración
versus absorbancia para utilizarlo posteriormente en la lectura de muestras de concentración desconocida.

Por tratamiento matemático (ajuste lineal) de datos se llega a una ecuación de la forma ymxb que representa el

modelo matemático donde m = pendiente; b=ordenada al origen.

El procedimiento mas empleado es el de regresión de los mínimos cuadrados, este procedimiento supone que las
desviaciones verticales di de los puntos experimentales respecto del modelo deben minimizarse. di = yi – y = yi – (mxi +
b).

Para hallar los valores de m y b que minimizan las desviaciones verticales se realizan algunos cálculos, aquí se muestra
el procedimiento en función de determinantes, sin embargo todas las calculadoras científicastienen programas
residentes de regresión lineal que se puede emplear fácilmente y en forma rápida para hallar los modelos
matemático ajustados.

Para el conjunto de puntos experimentales S = {(x1,y1), (x2,y2), (x3,y3), . . . . . . . . (xn,yn)}

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

Ejemplo: Un procedimiento común para determinar proteínas es el método colorimétrico de Bradford,


donde a la muestra de proteína en solución se le añada un colorante (gris) que cuando se une a
la proteína cambia de color a azul, la intensidad del color azul es proporcional a la cantidad de
proteína presente, el cual se determina mediante un espectrofotómetro a 595 nm.
La siguiente tabla muestra algunos datos reales

a) determine la ecuación ajustada de la recta que representa los puntos experimentales


b) Una muestra problema tuvo una absorbancia de 0,973, calcule la concentración de proteína
c) Para una muestra que tiene 20,5 ug/ml de proteína, cual será la lectura de absorbancia del
espectrofotómetro? .

UAGRM Ingeniería Química QMC - 203


Química Analítica Cuantitativa Ing. Iván M. Romero 18

UAGRM Ingeniería Química QMC - 203

Potrebbero piacerti anche