Sei sulla pagina 1di 39

Curso Básico de Estadística

y Quimiometría para
Química Analítica

Universidad de La Serena
Chile
Septiembre 2007
III Curso Básico de Estadística
y Quimiometría para
Química Analítica

Introducción a la Quimiometría.
Estadística descriptiva
Dr. Alberto Escarpa
Profesor Titular de Química Analítica
Junio, 2007
Universidad de Alcalá
Introducción a la Quimiometría
Estadística descriptiva

1-Tipos de errores y concepto de incertidumbre


2-Población y muestra
3-La distribución normal
4-Descriptores poblacionales y estimadores muestrales
5-El intervalo de confianza
Introducción a la Quimiometría

Concepto de Quimiometría

“Durante años, los científicos experimentalistas


han llenado [de datos] los cuadernos de laboratorio
y a menudo los han descartado por falta de técnicas
de interpretación adecuadas”

(C.F. Bender, 1973)


Introducción a la Quimiometría

Concepto de Quimiometría

Disciplina química que utiliza métodos matemáticos y estadísticos


para diseñar o seleccionar procedimientos de medida y experimentos
óptimos y para proporcionar la máxima información química mediante
el análisis de datos químicos

(1975, The Chemometrics Society)

Disciplina química que utiliza la Matemática, la Estadística y la lógica


formal para diseñar o seleccionar procedimientos experimentales óptimos,
proporcionar la máxima información química relevante a partir del análisis
de datos químicos y obtener conocimientos a partir de sistemas químicos

(1997, Prof. Massart)


Introducción a la Quimiometría

Concepto de Quimiometría

Quimiometría Valor añadido

Permite diseñar y realizar experimentos más eficaces


y extraer más información a partir de los datos

Potencia la incorporación del químico y del profesional


del laboratorio a la cadena de control del proceso
productivo
Introducción a la Quimiometría

Concepto de Quimiometría

Aplicación + Especialización

Química Analítica Estadística Aplicada

Limitado número de factores (Concentración, pH, I...)


Posibilidad de control de los factores (Experimentación)
Incertidumbre relativamente pequeña (0.3-3%)
Introducción a la Quimiometría

Proceso Analítico y Quimiometría

Teoría del muestreo Problema analítico


Diseño de experimentos
NO
Optimización Muestra

Tratamiento de las muestras y medidas


Filtrado de señales
Resultados Análisis discriminante Conocimiento
Regresión y predicción
¿Problema resuelto?

Toma de decisiones
Estadística descriptiva

1-Tipos de errores y concepto de incertidumbre


2-Población y muestra
3-La distribución normal
4-Descriptores poblacionales y estimadores muestrales
5-El intervalo de confianza
Estadística descriptiva

¿Contiene pesticida en este alimento?

Demanda cualitativa

¿Cuánto pesticida contiene este alimento?

Demanda cuantitativa
Estadística descriptiva

Tipos de errores

No existen resultados cuantitativos de interés sino


van acompañados de un alguna estimación de los
errores inherentes a los mismos

1-Errores groseros o accidentales


2-Errores aleatorios
3-Errores sistemáticos
Estadística descriptiva

Tipos de errores

1-Errores groseros o accidentales

2-Errores aleatorios Precisión


Azar (sin dirección privilegiada)
Sesgo
3-Errores sistemáticos
Exactitud
(con dirección privilegiada)
(Personales, Instrumento, Método)
Estadística descriptiva

Concepto de precisión y la exactitud

A B

Baja precisión Alta precisión y


y baja exactitud baja exactitud

C D

Baja precisión y Alta precisión y


alta exactitud alta exactitud
Estadística descriptiva

Concepto de precisión y la exactitud

Precisión es el grado de concordancia entre


resultados obtenidos en idénticas condiciones

Repetibilidad (dentro de rachas)


Reproducibilidad (entre rachas)

Exactitud es el grado de concordancia entre


el resultado medio obtenido con el correspondiente al
valor verdadero o valor de referencia
Estadística descriptiva

Concepto de precisión y la exactitud

La precisión describe los errores aleatorios, el


sesgo los errores sistemáticos y la exactitud
como grado de proximidad entre al valor de una
medida y el valor verdadero incorpora ambos tipos
de error (aleatorios y sistemáticos)
Estadística descriptiva

Concepto de incertidumbre

Errores aleatorios + Errores sistemáticos

Precisión + Exactitud

Incertidumbre
El intervalo de valores donde es razonablemente
verosímil encontrar el valor verdadero
Estadística descriptiva

Estadística descriptiva

1-Tipos de errores y concepto de incertidumbre


2-Población y muestra
3-La distribución normal
4-Descriptores poblacionales y estimadores muestrales
5-El intervalo de confianza
Estadística descriptiva

Concepto de Población y Muestra


Población Conjunto de todos los casos experimentales
bajo estudio

Inferencia Estadística
Muestra Subconjunto aleatorio de una población

Estadística descriptiva
Estadística descriptiva

Estadística descriptiva

1-Tipos de errores y concepto de incertidumbre


2-Población y muestra
3-La distribución normal
4-Descriptores poblacionales y estimadores muestrales
5-El intervalo de confianza
Estadística descriptiva

Distribución normal
Distribución de medidas repetidas
Resultados de 50 determinaciones de ión nitrato (g/mL)

0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
Valor medio=0.500 g/mL
Desviación estándar=0.0165 g/mL
Estadística descriptiva

Distribución normal

ConcentraciónFrecuencia

14
0.46 1

12
0.47 3

Frecuencia
10
0.48 5 Serie1

8
0.49 10
6
0.50 10
4

0.51 13
2
0

0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53


0.52 5
Concentración de nitrato (ug/mL)
0.53 3

Tabla de frecuencias Histograma de distribución


Estadística descriptiva

Distribución normal
Un modelo de distribución es una
función matemática que describe la
distribución de la población en
términos de frecuencia de los
resultados frente a su valor
numérico.

Nos informa de cómo están distribuidos los datos

=1/2 exp [-(x-)2/22]


Valor central (más probable)
Dispersión (anchura)
Estadística descriptiva

Distribución normal
A B C
A

A:    se encuentran el 68.3% de los datos


B:   2 se encuentran el 95% de los datos
C:   3 se encuentran el 99.7% de los datos
La probabilidad de encontrar una medida cualquiera dentro
de unos límites cualesquiera, x1 y x2, es igual al área
subtendida bajo la curva
Estadística descriptiva

1-Tipos de errores y concepto de incertidumbre


2-Población y muestra
3-La distribución normal
4-Descriptores poblacionales y estimadores muestrales
5-El intervalo de confianza
Estadística descriptiva

Descriptores poblacionales

Estadística paramétrica Modelos

Estadística no paramétrica No Modelos

Permite resumir toda la información


Modelo
obtenida en los descriptores poblacionales
Estadística descriptiva

Descriptores poblacionales

Modelo Permite resumir toda la información


obtenida en los descriptores poblacionales

Modelo de Distribución normal

Media de la población:  Tendencia central


Desviación estándar típica:  Dispersión
Estadística descriptiva

Descriptores poblacionales


n
 ( Xi -  )
n 2
= Xi
=
i=1 i=1

N N

Media de la población:  Desviación estándar típica: 

Tendencia central Dispersión

Ausencia de
 Valor verdadero
Errores Sistemáticos
Estadística descriptiva

Estimadores muestrales


n
 ( Xi - X )
n 2
X= i=1 Xi i=1
s=
n n-1

Media de la población: x Desviación estándar típica: s

Tendencia central Dispersión


Estadística descriptiva

Estimadores muestrales
Otros parámetros para estimar el valor central

Media geométrica
(Distribución log-normal)
g = n X 1 X 2 ....... X n
Otros parámetros para estimar la dispersión
Varianza = el cuadrado de la desviación estándar, s2
Desviación estándar relativa DER/RDS
RSD= 100 s /x
Estadística descriptiva

1-Tipos de errores y concepto de incertidumbre


2-Población y muestra
3-La distribución normal
4-Descriptores poblacionales y estimadores muestrales
5-El intervalo de confianza
Estadística descriptiva

Distribución muestral de la media


Número de medidas de la muestra
Descomponer en un conjunto de muestras

Conjunto de muestras más agrupadas


Distribución muestral de la media

Media es la misma
Error estándar de la media (e.e.m)=/n
Estadística descriptiva

Distribución muestral de la media

0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51

0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486
Estadística descriptiva

Distribución muestral de la media


2
1,8
1,6
ConcentraciónFrecuencia
1,4

Frecuencias
0.486 1
1,2
0.492 1
1 Serie1
0.496 1
0,8
0.5 1
0,6
0.502 2
0.504 1 0,4
0.506 1 0,2
0
0.486 0.492 0.496 0.5 0.502 0.504 0.506
Concentraciones de nitrato (ug/mL)

Valor medio=0.500 g/mL


Desviación estándar=e.e.m=0.005 g/mL
Estadística descriptiva

Distribución muestral de la media

Una propiedad muy importante de la distribución


muestral de la media es que, aun cuando la población
original no esté distribuida normalmente, la distribución
muestral de la media tiende a la distribución normal
cuando n

Teorema del límite central


Estadística descriptiva

Introducción al Intervalo de confianza

Errores sistemáticos NO

Errores aleatorios SÍ

La media de una muestra de medidas Estimación de 

Medidas varían por los errores aleatorios


Definir el intervalo donde sea Intervalo de
probable incluir al valor verdadero confianza
Estadística descriptiva

Introducción al Intervalo de confianza

AMPLITUD del intervalo donde sea


probable incluir al valor verdadero

Precisión de las medidas Número de medidas


individuales
A mayor número
de medidas

Más confianza
Estadística descriptiva

Intervalo de confianza: las claves

Intervalo de valores dentro del cual se puede suponer


de manera razonable que se encuentra el valor verdadero

Los extremos del intervalo Límites de confianza

Término confianza  Cierta probabilidad

Amplitud mayor a mayor confianza


Estadística descriptiva

Intervalo de confianza: las expresiones


Muestras grandes

x  zs / n
Muestras pequeñas

x  tn1s / n
  ts / n   ts / n
El estadístico t de Student
Distribución t Grados de libertad
Niveles de confianza
Alberto Escarpa

Potrebbero piacerti anche