Sei sulla pagina 1di 15

VARIANZA Y COVARIANZA

1. Varianza
1.1. Definición:
Constante que representa una medida de dispersión media de una variable aleatoria
X, respecto a su valor medio o esperado. Puede interpretarse como medida de
variabilidad de la variable. (KERLINGER, F Y LEE.H 2002)

La varianza de una variable aleatoria X se define como:

Siempre que dicho valor exista, siendo f la función de densidad de la variable. La raíz
cuadrada positiva de la varianza recibe el nombre de desviación típica o estándar.

2. Covarianza
2.1. Definición

En probabilidad y estadística, la covarianza es un valor que indica el grado de


variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato
básico para determinar si existe una dependencia entre ambas variables y además
es el dato necesario para estimar otros parámetros básicos, como el coeficiente de
correlación lineal o la recta de regresión. ( Donald E. Knuth (1998))

2.2. Interpretación

Cuando los valores altos de una de las variables suelen mayoritariamente corresponderse
con los valores altos de la otra, y lo mismo se verifica para los pequeños valores de una con
los de la otra, se corrobora que tienden a mostrar similar comportamiento lo que se refleja
en un valor positivo de la covarianza. ( http://mathworld.wolfram.com/Covariance.html)

Por el contrario, cuando a los mayores valores de una variable suelen corresponder en
general los menores de la otra, expresando un comportamiento opuesto, la covarianza es
negativa.

El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las
variables.
La magnitud requiere un esfuerzo adicional de interpretación:
La versión normalizada de la covarianza, el coeficiente de correlación indica la magnitud de
la especificidad de la relación lineal.
Se debe distinguir entre:
(1) La covarianza de dos variables aleatorias, parámetro estadístico de una población
considerado una propiedad de la distribución conjunta
(2) La covarianza maestral que se emplea como un valor estadísticamente estimado del
parámetro.

La covarianza entre dos variables aleatorias reales de distribución conjunta x e y,

de segundos momentos finitos se define como2

Donde E[x] es el valor esperado de x, conocido también como la esperanza de x. Apelando a la


propiedad de la esperanza matemática lineal, se puede simplificar como:

Aunque esta última ecuación es proclive a dar un resultado poco significativo cuando se la calcula
con punto flotante aritmético y se da la circunstancia de que. Por tanto no debería usarse en
programas de ordenador si los datos no han sido previamente centrados. (Donald E. Knuth (1998). The
Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn., p. 232. Boston: Addison-Wesley)

El estimador insesgado de la covarianza denotado de dos variables aleatorias x e y es:

Cuando las variables aleatorias x e y son n-dimensionales, es decir:

2.3. Propiedades
Estas propiedades se deducen de manera casi directa de la definición de la covarianza. En otras
palabras la covarianza trata de explicar qué tan relacionadas se encuentran dos variables entre sí,
qué tanto se mueve una cuando la otra se mueve otro tanto. Ejemplo, si la variable X se mueve 1,
supongamos que la variable Y se mueve 2, entonces podemos decir que la variable Y se mueve
positivamente el doble de lo que se movería la variable X.

2.4. Interpretación de la covarianza

: hay dependencia directa (positiva), es decir, a grandes valores de x corresponden


grandes valores de y.

: Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las
dos variables estudiadas.

: hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden


pequeños valores de y.
EJEMPLOS APLICATIVOS DE VARIANZA Y COVARIANZA

DEFINIR LA VARIABILIDAD DE UN YACIMIENTO.

a) Concepto de soporte

b) Varianza de dispersión (c/distintos soportes)

c) Varianza de estimación

 Estimación de leyes por Kriging

 Soporte: es el término que se usa en la geoestadística para describir el volumen en función


del cual se define una ley.

 A medida que aumenta el tamaño de la muestra (o del soporte de la muestra), la varianza


de las leyes resultantes disminuye.

 El cambio en la varianza debido al cambio en el volumen se denomina la relación volumen-


varianza.

 Existe un tamaño mínimo de bloque que se puede seleccionar ya sea como mineral o estéril.
El tamaño del bloque se denomina la unidad minera selectiva o UMS.

 A medida que <<UMS la varianza aumenta.

Ejemplo: un área con sondajes en una cuadrícula regular de aproximadamente 8metros. En esta
área, se definen las leyes de bloque en soportes diferentes calculando el promedio de las leyes de
los sondajes dentro de cada bloque. Los tamaños de soporte seleccionados son bloques de 30 x
30 y 50 x 50 en el plano. En todos los casos se usa una dimensión vertical de 12 m,
correspondiente a la altura del banco.
VARIANZA DE DISPERSIÓN

 Expresa la variabilidad de las Leyes

D2(0/A)=D2(v/A)+D2(0/v)

 D 2 : Varianza
 0 : Muestras puntuales
 V: Bloques
 A : Area

Varianza de las muestras puntuales en un área

 Varianza de los Bloques del área +


 Varianza de las muestras puntuales en los bloques

Se demostró que la Varianza disminuye al aumentar el tamaño del soporte

 El modelo de variograma se puede usar para predecir la varianza de leyes en un


soporte de cualquier tamaño dentro de cualquier volumen.
 vi es reemplazado por las leyes de los datos individuales y el término m es reemplazado por
la ley media del bloque y la varianza de dispersión se interpreta como la varianza de las
leyes de muestra dentro del bloque.

Se puede ver de la similitud de ambas expresiones que la varianza de dispersión de las leyes
de muestra dentro de un volumen es igual al medio de la función de variograma en función del
volumen. Se puede escribir matemáticamente:

 Basado en esta relación se puede expresar cualquier varianza de dispersión en


términos de la función de variograma

VARIANZA DE ESTIMACIÓN

 Mientras que la varianza de dispersión expresa la variabilidad de las leyes, la varianza de


estimación expresa la variabilidad asociada con una

 estimación o, en otras palabras, expresa la varianza de los errores de estimación.

 La varianza de estimación es una medida de la dispersión de los errores aleatorios,ya


que se requiere que el estimador no tenga ningún sesgo y, por lo tanto, el error sistemático
será cero.( J.Sullivan,1998)

 Se puede definir la varianza de estimación para cualquier tipo lineal de estimador, no


solamente para el estimador de kriging.

 La característica relevante del estimador de kriging es que el kriging proporciona el


estimador (ponderador) que minimiza la varianza de estimación. Así que, la varianza de
estimación será más pequeña cuando se aplica el kriging.

La precisión describe el error aleatorio o las fluctuaciones en torno al valor verdadero mientras
que la exactitud describe el error sistemático o el sesgo.
 El error de estimación para un punto (E), será la diferencia entre Z*, (la verdadera ley del
punto), y la Ley (Zx) que es resultado de su cálculo a través de leyes x i afectados por un
coeficiente Ki .

 Ε = Z* - Zx = Z* - (xi . Ki )
 Si el estimador no tiene sesgo (error sistemático nulo), la distribución de los errores debería
seguir una distribución normal.
 El estimador usado tiene la forma :
donde los  representan las ponderaciones asignadas a cada dato. La única restricción para las
ponderaciones es que sumen uno,

 La varianza de estimación va a depender de las distancias estadísticas (Y), promedio entre


los datos y el bloque. Puesto que el modelo de variograma es una función creciente, el
error de estimación aumenta o diminuye con las distancias desde las muestras al centro
del bloque.(es lo que expresa el 1er término de la fórmula) .

 El segundo término de la expresión involucra el promedio de la función del variograma


entre las ubicaciones de las muestras. Este término es negativo, así que la varianza de
estimación disminuye a medida que este término aumenta (datos distanciados). Si los
datos se encuentran agrupados, las muestras básicamente investigarán el mismo punto
en el espacio y, como consecuencia, mucha de la información se hará redundante
(aumenta la varianza de estimación).

 El tercer término examina el promedio de la función del variograma dentro del bloque
mismo. A medida que aumenta el tamaño del bloque, también aumenta ese término,
reduce la varianza de estimación.

EJEMPLO 2

Se desea contrastar 4 tipos de abonos en la mejora de crecimiento en plantones de café. Si se


distingue diferencia significativa mencionar el mejor tratamiento, realizar una gráfica de promedio
de los tratamientos.

T1 T2 T3 T4
22.3 17 26 19
18.5 22 27 19
19 23 25 20
24 24 27 18

21 22 26 19
19.6 23 25 20
22.5 21 27 18
20.4 20 26 19

ANÁLISIS DE VARIANZA DE UN FACTOR

Resumen

Grupos Cuenta Suma Promedio Varianza


T1 8 167.3 20.9125 3.63553571
T2 8 172 21.5 4.85714286
T3 8 209 26.125 0.69642857
T4 8 152 19 0.57142857

ANÁLISIS DE VARIANZA

Origen de las Suma de Grados Promedio F Probabilidad Valor crítico


variaciones cuadrados de de los para
libertad cuadrados F
Entre grupos 219.158438 3 73.0528125 29.938034 7.0122 2.94668527
Dentro de los 68.32375 28 2.44013393
grupos
Total 287.482188 31

219,158438
R² =
= 0.76233745
287,82188

Ho: Los tipos de abono para la mayoría del crecimiento del café son iguales.
H1: Los tipos de abono para la mayoría del crecimiento del café son diferentes.

Grafica

RA

RR

2.94 29,94
1. El departamento de control de calidad de una planta de acabados textiles estudia
los efectos de varios factores sobre el teñido de una tela combinada de algodón y
fibra sintética que se usa para hacer camisas. Se seleccionan dos operadores (A),
tres duraciones del ciclo (B) y dos temperaturas (C), y dos ejemplares de prueba
pequeños de tela se tiñeron bajo cada conjunto de condiciones. La tela terminada
se comparó con un patrón y se asignó una puntuación numérica. Los resultados se
presentan en la tabla siguiente:
hipotesis apropiadas usando el análisis de varianza con α=0.05Para calcular la
sumatoria de Yij²
Para calcular la sumatoria de Yi.j²
Para calcular la sumatoria de Yijk.²
Dado que utilizamos un α=0.05 y puesto que el valor de f, con su nivel de significancia
como con sus grados de libertad en las tablas respectivamente tenemos F0.05,1,12 =
4.75 y
F0.05,2,12 = 3.89
Región crítica; α=0.05

RA

RR

3.89 4.75

Decisión: Se acepta H0 sobre la duración del ciclo, temperatura y los ejemplares de


tela por lo tanto existe inferencia entre las transmisiones, la prueba es significativa.
BIBLIOGRAFIA

 Bustillo Revuelta, M. y López Jimeno, C., 1997: Manual de evaluación y


diseño de explotaciones mineras. Madrid. ISBN 84-921708-2-4 .

 ANNELS, A. E. (1991). Mineral deposit evaluation. A practical


approach. Ed. Chapman & Hall, London.

 TULCANAZA,E. (1992). Técnicas geoestadísticas y criterios técnico-


económicos para la estimación y evaluación de yacimientos mineros..
E.Tulcanaza, Santiago, Chile.

 Jeff Sullivan 1998. Curso Geoestadística para Minería. Codelco Santiago


d e Chile.

http://e-stadistica.bio.ucm.es/glosario/varianza.html

https://es.wikipedia.org/wiki/Covarianza
cg.ensmp.fr/bibliotheque/public/MATHERON_Ouvrage_00537.pdf

www.scielo.org.ar/pdf/enfoques/v25n1/v25n1a05.pdf

http://blogs.unlp.edu.ar/geominas/files/2016/08/geoestadistica-2.pdf

ftp://ftp.ciat.cgiar.org/DAPA/projects/Cursos_Talleres/Curso_R/DOCUMEN
TOS/LIBRO%20DE%20GEOESTADISTICA.pdf
https://www.researchgate.net/publication/311828465_Categorizacion_de_r
ecursos_y_reservas_mineras

Potrebbero piacerti anche