Clase #7 - Estadísticas

ESTADISTICA
INTRODUCCIÓN
¿Qué es la Estadística?
Estadística es la ciencia de:
– Recolectar
– Describir
– Organizar Datos
– Interpretar
con el fin de transformar dichos datos en
información y conseguir una toma de decisiones
más eficiente.
La Estadística en la formación de un Ingeniero
– La responsabilidad básica de un ingeniero es la de

liderar la mejora continua de la calidad y de la
productividad en todos los procesos que dependan de
él. Para ello es necesario cambiarlos y estos cambios
son el fruto del análisis de datos. Cuestiones que se
plantean: ¿cómo generar datos que contengan
información relevante? y ¿cómo extraer dicha
información de los datos?.
– Entre las áreas sobre las cuales puede tener más
impacto la Estadística en los próximos años destacamos
las siguientes:
• Mejora de la calidad y de la productividad.
• Recogida y uso de información para la agricultura, la
industria y la Administración.
• Integración de la Estadística en la planificación
• Desarrollo de nuevos productos y todos el proceso de la
innovación.
Partes de la Estadística
• Estadística Descriptiva: Métodos de organizar,
resumir y presentar los datos de manera informativa.
• Probabilidad: Estudio de los fenómenos aleatorios.
• Inferencia Estadística: Métodos usados para emitir
conclusiones acerca de una población, basándose en
los datos de una muestra.
- Población es el conjunto de individuos objeto de
estudio.
- Muestra es un subconjunto de la población de
interés.
Algunos Ejemplos
• ¿Cuál es el número de llamadas telefónicas recibidas en una centralita durante un
día? No existe un número fijo que pueda ser conocido a priori, sino un conjunto de
posibles valores, cada uno de ellos con un cierto grado de certeza.
• ¿Cuál es el tamaño de un paquete de información que se transmite a través de
HTTP? No existe un número fijo, sino que éste es desconocido a priori.
• ¿Cuál es la posición de un objeto detectado mediante GPS? Dicho sistema
transmite una estimación de dicha posición, pero existen márgenes de error que
determinan una región del plano donde el objeto se encuentra con alta
probabilidad.
• ¿Qué ruido se adhiere a una señal que se envía desde un emisor a un receptor?
Dependiendo de las características del canal, dicho ruido será más o menos
relevante. Su presencia deberá ser diferenciada de la señal primitiva, sin que se
conozca ésta, teniendo en cuenta que se trata de un ruido aleatorio.
• ¿Cuál fue el programa de televisión más visto la pasada noche? Los índices de
audiencia se obtienen mediante estimaciones a partir de muestras representativas.
Pasos en un estudio estadístico
• Recoger los datos (muestreo)
• Describir (resumir) los datos obtenidos
• Realizar una inferencia sobre la

población
6
OBJETIVO:
- Resumir la información contenida en un conjunto de
datos, usando para ello métodos gráficos y
medidas numéricas que informan de lo más
relevante.
- Un dato puede consistir en un solo número {58}, en

un par de números {(1.66, 58)}, una terna {(1.66,
58, M)}, etc.
Primeros pasos
Cuando disponemos de un conjunto de datos, debemos identificar:
1. La característica que representan dichos datos (variable).
2. La población de la que proceden los datos (conjunto total de individuos
de interés).
3. La naturaleza de los datos:
3.1. Variables cualitativas o atributos: Expresan una cualidad y no un
valor numérico. Ejemplos: Sexo, Nacionalidad, Marcas de autos,
Grado de Satisfacción con la Universidad, etc..
3.2. Variables cuantitativas: Toma valores numéricos
a) Cuantitativas Discretas: sólo pueden asumir ciertos valores y
normalmente hay huecos entre ellos. Son conteos normalmente.
Ejemplos: nº de asignaturas aprobadas, cantidad de hijos.
b) Cuantitativas Continuas: puede asumir cualquier valor
dentro de un intervalo. Normalmente representan magnitudes como
longitud, superficie, volumen, peso, tiempo, dinero ,LEYES DE
MINERALES.
Formas de presentar y resumir la información de un conjunto de
datos:
A) Tabla de frecuencias
A.1) Datos no agrupados
A.2) Datos agrupados
B) Descripción gráfica
B.1) Gráficos para v. cualitativas o cuantitativas discretas
B.2) Gráficos para v. cuantitativas continuas
B.3) Diagramas acumulados
B.4) Gráfico temporal
C) Descripción numérica
C.1) Medidas de localización o centralización
C.2) Medidas de dispersión o variabilidad
C.3) Medidas de forma
A) Tabla de Frecuencias
Intentan resumir la información recogida en la muestra, de forma que no

se pierda nada de información (o poca).
– Frecuencias absolutas: Contabilizan el número de individuos de
cada modalidad o clase.
– Frecuencias relativas (porcentajes): Es el cociente entre la
frecuencia absoluta y el número total de datos. Contabilizan el
porcentaje de individuos de cada modalidad.
– Frecuencias acumuladas: Contabilizan el número de individuos que
toman un valor menor o igual que el dado en una modalidad. Sólo
tienen sentido para variables cuantitativas (numéricas)
– Ejemplos de tablas de frecuencias para datos cualitativos y para
datos cuantitativos discretos
EJEMPLO
• ¿Cuántos individuos tienen menos de 2 hijos?
– frec. indiv. sin hijos +frec. indiv. con 1 hijo = 419 + 255
= 674
• ¿Qué porcentaje de individuos tiene 6 hijos o menos?
97,3%
• ¿Qué cantidad de hijos es tal que al menos el 50% de la
muestra tiene una cantidad inferior o igual?
2 hijos
Número de hijos
Porcent. Porcent.
Frec. (válido) acum.
0 419 27,8 27,8
1 255 16,9 44,7
2 375 24,9 69,5 >50%
3 215 14,2 83,8
4 127 8,4 92,2
5 54 3,6 95,8
6 24 1,6 97,3
7 23 1,5 98,9
Ocho+ 17 1,1 100,0
Total 1509 100,0
Datos agrupados:
– Para datos cuantitativos continuos, los datos se suelen

agrupar en clases, que son intervalos que no se traslapan y
cuya unión cubre todo el rango de los datos.
– Suelen elegirse de la misma longitud, de modo que basta
con seleccionar el número de clases a tomar.
– La elección del número de clases puede influir en la
posterior interpretación de los datos.
– Una regla empírica, sugiere que el número de clases sea
aproximadamente n donde n = nº total de datos.
– Ejemplos de tablas de frecuencias para datos cuantitativos
agrupados en clases
B) Descripción Gráfica
B.1) Gráficos para v. cualitativas o cuantitativas discretas
• Diagramas de barras
– Alturas proporcionales a las
frecuencias (abs. o rel.)
• Diagramas de sectores (tartas,

polares)
– El área de cada sector es
proporcional a su frecuencia (abs.
o rel.)
• Pictogramas
– El área de cada modalidad debe
ser proporcional a la frecuencia.
B.2) Gráficos para v. cuantitativas continuas
• Diagrama de puntos
- Para conjuntos con menos de 25 datos
• Diagrama de tallo-hojas
- Para conjuntos de datos de tamaño moderado
• Histograma
- Para conjuntos con gran número de datos. Es la representación
gráfica de la tabla de frecuencias para datos agrupados en clases. El
área que hay bajo el histograma entre dos puntos cualesquiera indica
la cantidad (porcentaje o frecuencia) de individuos en dicho intervalo.
B.3) Diagramas acumulados
Algunos de los diagramas anteriores tiene su correspondiente

diagrama acumulado. Se realizan a partir de las frecuencias
acumuladas. Indican, para cada valor de la variable, la cantidad
(frecuencia) de individuos que poseen un valor inferior o igual al
mismo.
Frec. Frec. Abs Polígono de Frec. Abs

Absolutas Acumuladas Acumuladas
C) Descripción Numérica
Objetivo: Resumir la información más relevante de la muestra o
población en unos pocos números (parámetros).
C.1) Medidas de Centralización o Localización

– Indican valores con respecto a los que los datos parecen
agruparse.
• Media, mediana y moda
C.2) Medidas de Posición
– Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
• Cuantiles, percentiles, cuartiles, deciles,...
C.3) Medidas de Dispersión o Variabilidad
– Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
• Rango, varianza, desviación típica, rango intercuartílico,
coeficiente de variación
C.4) Medidad de Forma
– Indican la forma en que se distribuyen los datos
• Coeficientes de asimetría y de apuntamiento o curtosis
Medidas de tendencia central o posición
• Corresponden a valores que

generalmente se ubican en la parte central
de un conjunto de datos.
• Forma como los datos pueden
condensarse en un solo valor central
alrededor del cual todos los datos
muestrales se distribuyen.
Medidas de tendencia central o posición
• Las medidas de tendencia central más

importantes son:
– Media: Aritmética y Aritmética ponderada.

– Mediana.
– Moda.
Media Aritmética
• Es la suma de todas las observaciones dividida entre el
número total de observaciones.
• Expresada de forma más intuitiva, podemos decir que la

media aritmética es la cantidad total de la variable
distribuida a partes iguales entre cada observación.
• Por ejemplo, si en una habitación hay tres personas, la

media de dinero que tienen en sus bolsillos sería el
resultado de tomar todo el dinero de los tres y dividirlo a
partes iguales entre cada uno de ellos. Es decir, la media es
una forma de resumir la información de una distribución
(dinero en el bolsillo) suponiendo que cada observación
(persona) tendría la misma cantidad de la variable.
Cálculo de la media aritmética
Para datos no agrupados:

n
x i
X i 1
n
 Para datos agrupados:
k
m f i i
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
Mediana
• Es el valor que ocupa la posición central
de un conjunto de observaciones, una vez
que han sido ordenados en forma
ascendente o descendente.
• Divide al conjunto de datos en dos partes
iguales.
Cálculo de la mediana
• Para datos no agrupados:
– Si n es impar: posición donde se ubica la
mediana es igual a (n+1)/2.
– Si n es par: (n+1)/2 no es entero, por lo tanto
la mediana será igual al promedio de las dos
posiciones centrales.
Cálculo de la mediana
• Datos agrupados: clase mediana es la que

contiene a la observación que ocupa la
posición n/2.
n 1
 F ( xm1 )
Md  Lm  2 Cm
f ( xm )
Donde: Lm: límite inferior de la clase mediana.

F(xm-1): frecuencia acumulada de la clase
anterior a la clase mediana.
f(xm): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Moda
• Observación o clase que tiene la mayor
frecuencia en un conjunto de
observaciones.
• Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
• Es la única medida de tendencia central
que se puede determinar para datos de
tipo cualitativo.
Cálculo de la moda
• Para datos no agrupados: es simplemente la
observación que más se repite.
• Para datos agrupados:
1
Mo  Lim  Cm
1   2
Donde: Lim: límite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Medidas de dispersión, variación
o variabilidad.
• Son valores numéricos que indican o

describen la forma en que las
observaciones están dispersas o
diseminadas, con respecto al valor central.
Medidas de dispersión,
variación o variabilidad.
• Rango.
• Varianza.
• Desviación Típica.
• Coeficiente de variación.
Medidas de dispersión: Rango
Rango (amplitud o recorrido):

• Está determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la
mayor y menor observación.
• Es una medida de dispersión
absoluta, ya que depende solamente
de los datos y permite conocer la
máxima dispersión.
Medidas de dispersión:
Varianza
• Es un valor numérico que mide el grado
de dispersión relativa porque depende de
la posición de los datos x1,x2,…,xn con
respecto a la media.
• Es el promedio al cuadrado de las
desviaciones de cada observación con
respecto a la media.
• Notación: s2, 2, var(X)
Varianza
Para datos agrupados en una
distribución de frecuencias:
k

 i
m  x  2
 fi
s2  i 1
n
k
 i  fi
m 2
s  i 1
 x 
2 2
n
Desviación Típica
• Es la raíz cuadrada de la varianza.
• Notación: s, .
s s 2
Medidas de dispersión: Coeficiente de
Variación
• Es una medida de dispersión relativa que

permite comparar el nivel de dispersión de dos
muestras de variables estadísticas diferentes.
• No tiene dimensiones.
• Notación: CV
s
CV  100%
x
Medidas de Forma
• Son medidas numéricas que permiten
determinar la forma que tiene la curva de
los datos, por lo tanto, sirven para
corroborar lo que los gráficos muestran.
Coeficiente de Pearson
-Asimetría
Medidas
Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
Medidas de Forma: Asimetría
• Permiten estudiar la forma de la curva,
dependiendo de cómo se agrupan los
datos.
Medidas de Forma: Asimetría
Coeficiente de Asimetría de Pearson:

• Fácil de calcular e interpretar.
• Cálculo:
ASP 

3 X  Md 
s
o Interpretación:
= 0, X=Md Simétrica
ASP
> 0, X>Md Asimétrica Positiva
< 0, X<Md Asimétrica Negativa

Medidas de Forma: Kurtosis
• Miden si los valores de la distribución
están más o menos concentrados
alrededor de los valores medios de la
muestra (zona central de la distribución).
• Se definen tres tipos de distribución según
su grado de Kurtosis:
• Mesocúrtica: grado de concentración

medio alrededor de los valores
centrales de la variable.
• Leptocúrtica: grado de concentración
elevado.
• Platicúrtica: grado de concentración
reducido.
 x  X 
n
4
i
CK  i 1
4
3 Datos No Agrupados
ns
 M 
k
4
i  X  fi
CK  i 1
4
3 Datos Agrupados
ns
Interpretación:
=0 Mesocúrtica
CK >0 Leptocúrtica
<0 Platicúrtica
ESTADISTICA BIVARIABLE
• En este punto vamos a tratar diferentes formas de
describir la relación entre dos variables cuando estas son
numéricas.
• Haremos mención de pasada a otros casos:

– Alguna de las variables es ordinal.
• Hay más de dos variables relacionadas.
40
Estudio conjunto de dos variables
• A la derecha tenemos una posible manera de recoger
los datos obtenido observando dos variables en
varios individuos de una muestra.
Altura Peso
en cm. en Kg.
– En cada fila tenemos los datos de un individuo
162 61
– Cada columna representa los valores que toma una 154 60
variable sobre los mismos. 180 78
158 62
– Las individuos no se muestran en ningún orden
particular. 171 66
169 60
• Dichas observaciones pueden ser representadas en 166 54
un diagrama de dispersión (‘scatterplot’). En ellos, 176 84
cada individuos es un punto cuyas coordenadas son
los valores de las variables. 163 68
... ...
• Nuestro objetivo será intentar reconocer a partir del

mismo si hay relación entre las variables, de qué tipo,
y si es posible predecir el valor de una de ellas en
función de la otra.
Diagramas de dispersión o nube de puntos
Tenemos las alturas y los pesos de 30 individuos representados en

un diagrama de dispersión.
100
90
80 Pesa 76 kg.
70
Mide 187 cm.

60
Pesa 50 kg.
50
40 Mide 161 cm.
30
140 150 160 170 180 190 200
Relación entre variables.
Tenemos las alturas y los pesos de 30 individuos representados en

un diagrama de dispersión.
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
Predicción de una variable en función de la otra
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea,
el peso aumenta en una unidad por cada unidad de altura.
100
90
80
70
10 kg.
60
50
40 10 cm.
30
140 150 160 170 180 190 200
Relación directa e inversa
330 100
Incorrelación 90 Fuerte relación

280
80 directa.
230
70
180
60
130
50
80 40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Para valores de X por encima de la

•Para los valores de X mayores que la
media tenemos valores de Y por
media le corresponden valores de Y
encima y por debajo en
mayores también.
proporciones similares.
Incorrelación.
80 •Para los valores de X menores que la
70 Cierta relación media le corresponden valores de Y
60 inversa
50
menores también.
40
30
20
10
0
140 150 160 170 180 190 200
Covarianza de dos variables X e Y
• La covarianza entre dos variables, Sxy, nos indica

si la posible relación entre dos variables es
directa o inversa.
1
– Directa: Sxy >0
S xy   ( xi  x )( yi  y )
– Inversa: Sxy <0 n i
– Incorreladas: Sxy =0
• El signo de la covarianza nos dice si el aspecto

de la nube de puntos es creciente o no, pero no
nos dice nada sobre el grado de relación entre las
variables.
Coef. de correlación lineal de Pearson
• La coeficiente de correlación lineal de Pearson
de dos variables, r, nos indica si los puntos
tienen una tendencia a disponerse
alineadamente (excluyendo rectas horizontales
y verticales).
• tiene el mismo signo que Sxy por tanto de su

signo obtenemos el que la posible relación sea
directa o inversa.
• r es útil para determinar si hay relación lineall

entre dos variables, pero no servirá para otro
tipo de relaciones (cuadrática, logarítmica,...) S xy
r
SxS y
Propiedades de r
• Es adimensional
• Sólo toma valores en [-1,1]
• Las variables son incorreladas  r=0
• Relación lineal perfecta entre dos variables  r=+1 o r=-1
– Excluimos los casos de puntos alineados horiz. o verticalmente.
• Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación
lineal.
– Siempre que no existan observaciones anómalas.
Relació
n Relació
inversa n
perfecta Variables
directa
incorrelad
casi
as
perfecta
-1 0 +1
Entrenando el ojo: correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Entrenando el ojo: correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Preguntas frecuentes
• ¿Si r=0 eso quiere decir que no las variables son
independientes?
– En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
– Lo contrario si es cierto: Independencia
implica incorrelación.
• Me ha salido r=1’2 ¿la relación es “superlineal”[sic]?

– ¿Superqué? Eso es un error de cálculo. Siempre debe
tomar un valor entre -1 y +1.
• ¿A partir de qué valores se considera que hay “buena

relación lineal”?
– Imposible dar un valor concreto (mirad los gráficos
anteriores). Para este curso digamos que si |r|>0,7 hay
buena relación lineal y que si |r|>0,4 hay cierta relación
(por decir algo... la cosa es un poco más complicada…
observaciones atípicas, homogeneidad de varianzas...)
Regresión
• El análisis de regresión sirve para predecir
una medida en función de otra medida (o
varias).
– Y = Variable dependiente
• predicha
• explicada
– X = Variable independiente
• predictora
• explicativa
– ¿Es posible descubrir una relación?
• Y = f(X) + error
– f es una función de un tipo determinado
– el error es aleatorio, pequeño, y no depende de X
Regresión
• El ejemplo del estudio de la altura en grupos
familiares de Pearson es del tipo que
desarrollaremos en el resto del tema.
– Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X)
• Si el padre mide 200cm ¿cuánto mide el hijo?

– Se espera (predice) 85 + 0,5x200=185 cm.
» Alto, pero no tanto como el padre. Regresa a la media.
• Si el padre mide 120cm ¿cuánto mide el hijo?

– Se espera (predice) 85 + 0,5x120=145 cm.
» Bajo, pero no tanto como el padre. Regresa a la media.
• Es decir, nos interesaremos por modelos de

regresión lineal simple.
Modelo de regresión lineal simple
• En el modelo de regresión lineal simple, dado dos
variables
– Y (dependiente)
– X (independiente, explicativa, predictora)
• buscamos encontrar una función de X muy simple

(lineal) que nos permita aproximar Y mediante
– Ŷ = b0 + b1X
• b0 (ordenada en el origen, constante)
• b1 (pendiente de la recta)
• Y e Ŷ rara vez coincidirán por muy bueno que sea el

modelo de regresión. A la cantidad
– e=Y-Ŷ se le denomina residuo o error residual.
¿Cómo medir la bondad de
una regresión?
Interpretación de la variabilidad en Y
En primer lugar olvidemos que Y

existe la variable X. Veamos cuál
es la variabilidad en el eje Y.
La franja sombreada indica la

zona donde varían los valores de
Y.
Proyección sobre el eje Y = olvidar

X
Interpretación del residuo
Fijémonos ahora en los errores de
predicción (líneas verticales). Los Y
proyectamos sobre el eje Y.
Se observa que los errores de
predicción, residuos, están menos
dispersos que la variable Y original.
Cuanto menos dispersos sean los

residuos,
mejor será la bondad del ajuste.
Bondad de un ajuste
Resumiendo: Y
• La dispersión del error residual será

una fracción de la dispersión original de
Y
•Cuanto menor sea la dispersión del

error residual
mejor será el ajuste de regresión.
Eso hace que definamos como medida de

bondad de un ajuste de regresión, 2
S
o coeficiente de determinación a: R  1
2 e
2 S 2
e  S 2
Y
S Y
Resumen sobre bondad de un ajuste
• La bondad de un ajuste de un modelo de regresión se mide usando
el coeficiente de determinación R2
• R2 es una cantidad adimensional que sólo puede tomar valores en

[0, 1]
– Para el alumno astuto: ¿por qué?
• Cuando un ajuste es bueno, R2 será cercano a uno.

– ¿por qué?
• Cuando un ajuste es malo R2 será cercano a cero.

– ¿por qué?
• A R2 también se le denomina porcentaje de variabilidad explicado

por el modelo de regresión.
– ¿por qué? Difícil.
• R2 puede ser pesado de calcular en modelos de regresión general,

pero en el modelo lineal simple, la expresión es de lo más sencilla:
R2=r2
– ¿Es coherente lo dicho entonces sobre los valores de R2?
Otros modelos de regresión
• Se pueden considerar otros ¿recta o parábola?
tipos de modelos, en función
del aspecto que presente el
diagrama de dispersión
(regresión no lineal)
• Incluso se puede considerar

el que una variable dependa 140 150 160 170 180 190 200
de varias (regresión múltiple).
¿recta o cúbica?
140 150 160 170 180 190 200

60
¿Qué hemos visto?
• Relación entre variables
• Diagrama de dispersión
• Covarianza
– Relación directa, inversa e incorrelación
• Correlación lineal
– Relación directa, inversa e incorrelación
– grado de relación lineal entre variables
• Regresión, predicción
– Variable dependiente
– Variable(s) independientes
– Modelo lineal de regresión
• Ordenada en el origen
• Pendiente
– Residuo, error
– Bondad del ajuste, coef. determinación
• En el modelo lineal simple: r2
EJEMPLOS GRAFICOS
Análisis de la Variable Aleatoria Ley de Cobre Total
La curva de la Función de Distribución que se expone a continuación,

muestra varios sub pulsos de mineralización para el caso del Cobre total,
los cuales corresponden a zona de veta de alta ley, contacto de la veta de
alta ley con las cajas correspondientes, zona de impregnación a las rocas
de caja y finalmente, mineralización de cobre correspondiente al
backgrown regional.
1.Análisis de la Variable Aleatoria Ley de Fierro Total
La variable Ley de Fierro Total, presenta al igual que la función de Distribución de

Cu, un comportamiento log normal, unimodal y con una ley media para el Distrito C°
Negro levemente superior a 20 % Fe T.
Se han definido para el Fe T. los pulsos de mineralización que a continuación se
indican:
Un pulso con ley variable entre 0 % Fe T. y 5 % Fe T. correspondiente al backgrown
regional. Un segundo pulso con leyes variables entre 5 % Fe T. a 28 % Fe T.
correspondiente a un episodio metasomático producto del metamorfismo de
contacto de las series volcánico andesíticas con el Plutón Sierra Pastenes y con
contenido de Fe T. variable entre 5 % Fe T. y 20 % Fe T. y la adición de un episodio
hidrotermal y/o neumatolítico con contenido de Fierro variable entre 20 % Fe T. a 28
% Fe T. El tercer pulso corresponde a un episodio hidrotermal y/o neumatolítico en
avance, con leyes de Fe T variables entre 28 % Fe T. y 38 % Fe T. El cuarto pulso
corresponde a un episodio hidrotermal y/o neumatolítico desarrollado el cual
presenta leyes variables entre 38 % Fe T. y 51 % Fe T. Finalmente se observa
mineralización de fierro en vetas de alta ley ( Fe > 51 % Fe T.).
Media y varianza log normal
Media y varianza normal

n
x
k
i m f i i
X i 1
X i 1
n n

Clase #7 - Estadísticas

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Clase #7 - Estadísticas

Caricato da

Copyright:

Formati disponibili

ESTADISTICA

– La responsabilidad básica de un ingeniero es la de

• Recoger los datos (muestreo)

• Describir (resumir) los datos obtenidos

• Realizar una inferencia sobre la

- Un dato puede consistir en un solo número {58}, en

Intentan resumir la información recogida en la muestra, de forma que no

– Para datos cuantitativos continuos, los datos se suelen

B.1) Gráficos para v. cualitativas o cuantitativas discretas

• Diagramas de sectores (tartas,

Algunos de los diagramas anteriores tiene su correspondiente

Frec. Frec. Abs Polígono de Frec. Abs

C.1) Medidas de Centralización o Localización

• Corresponden a valores que

• Las medidas de tendencia central más

– Media: Aritmética y Aritmética ponderada.

• Expresada de forma más intuitiva, podemos decir que la

• Por ejemplo, si en una habitación hay tres personas, la

Para datos no agrupados:

• Datos agrupados: clase mediana es la que

Donde: Lm: límite inferior de la clase mediana.

• Son valores numéricos que indican o

Rango (amplitud o recorrido):

• Es una medida de dispersión relativa que

Coeficiente de Asimetría de Pearson:

< 0, X<Md Asimétrica Negativa

• Mesocúrtica: grado de concentración

• Haremos mención de pasada a otros casos:

• Nuestro objetivo será intentar reconocer a partir del

Tenemos las alturas y los pesos de 30 individuos representados en

Mide 187 cm.

Tenemos las alturas y los pesos de 30 individuos representados en

Incorrelación 90 Fuerte relación

Para valores de X por encima de la

• La covarianza entre dos variables, Sxy, nos indica

• El signo de la covarianza nos dice si el aspecto

• tiene el mismo signo que Sxy por tanto de su

• r es útil para determinar si hay relación lineall

• Me ha salido r=1’2 ¿la relación es “superlineal”[sic]?

• ¿A partir de qué valores se considera que hay “buena

– Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X)

• Si el padre mide 200cm ¿cuánto mide el hijo?

• Si el padre mide 120cm ¿cuánto mide el hijo?

• Es decir, nos interesaremos por modelos de

• buscamos encontrar una función de X muy simple

• Y e Ŷ rara vez coincidirán por muy bueno que sea el

En primer lugar olvidemos que Y

La franja sombreada indica la

Proyección sobre el eje Y = olvidar

Cuanto menos dispersos sean los

• La dispersión del error residual será

•Cuanto menor sea la dispersión del

Eso hace que definamos como medida de

• R2 es una cantidad adimensional que sólo puede tomar valores en

• Cuando un ajuste es bueno, R2 será cercano a uno.

• Cuando un ajuste es malo R2 será cercano a cero.

• A R2 también se le denomina porcentaje de variabilidad explicado

• R2 puede ser pesado de calcular en modelos de regresión general,

• Incluso se puede considerar

140 150 160 170 180 190 200

La curva de la Función de Distribución que se expone a continuación,

La variable Ley de Fierro Total, presenta al igual que la función de Distribución de

Media y varianza normal