Sei sulla pagina 1di 28

Javier Suárez Espinosa, PhD

sjavier@colpos.mx
Contenido
 Objetivos
 Introducción
 La línea recta (Modelo matemático)
 Modelo de Regresión Lineal
 El problema de estimar (Estimación)
 Pruebas de Hipótesis (Decisión)
Objetivos
 Que el alumno entienda la importancia de la metodología
estadística (REGRESIÓN LINEAL y DISEÑOS EXPERIMENTALES) en la toma
de decisiones para optimizar el uso de los recursos.

 Que el alumno entienda el concepto de modelo lineal.

 Que el alumno entienda el concepto de estimación.

 Que el alumno entienda el concepto de prueba de hipótesis y su


utilidad en la toma de decisiones.
Introducción
Introducción
Ejemplo 1:
 Objetivo:
 Aumentar el rendimiento.
 Experimento:
 A un agricultor le ofrecen cuatro tipos de fertilizante para su cultivo
de papa. Para comparar el efecto de los fertilizantes en la producción
utiliza para cada fertilizante diez parcelas de su terreno y anota los
kilos recolectados al final de la temporada. Los datos son
Producción
Fertilizante 1 Fertilizante 2 Fertilizante 3 Fertilizante 4
47 51 37 42
42 56 39 43
43 54 41 42
46 49 38 45
44 53 39 47
42 51 37 50
45 50 42 48
43 49 36 45
44 50 40 44
44 53 40 45
Ejemplo 2
 Objetivo:
 Determinar cual de los cinco tratamientos a la gasolina
produce en mayor octanaje.
 Experimento:
 Se seleccionaron cuatro barriles de gasolina de distintas
fabricas (uno de cada fabrica) y cada barril se dividió en
cinco partes, a cada una de las partes, en forma aleatoria se
le aplico cada uno de los distintos tratamientos (5).
Introducción

Ejemplo 3: Se piensa que el número de latas dañadas en los


carros de rieles esta en función de la velocidad de los mismos
al impacto. Trece carros de rieles fueron seleccionados al azar
investigar si esto es cierto.
Ejemplo 3 180

160

140

120

No. Latas dañadas 100

80

60

40

20

0
0 2 4 6 8 10

Velocidad (mi/hr)
Introducción
Ejemplo 4: En un proceso de biofiltración de aguas residuales,
el aire de descarga usado en el tratamiento es pasado a través
de una membrana porosa que hace que los contaminantes se
disuelvan en agua y los transforma en productos no dañinos. Se
piensa que la eficiencia de remoción de partículas dañinas de
este tratamiento depende de la temperatura a la cual se realiza
el proceso, para investigarlo se colectó la siguiente
información.
Ejemplo 4 Temp
7.68
6.51
Remoción (%)
98.09
98.25
6.43 97.82
5.48 97.82
6.57 97.82
10.22 97.93
15.69 98.38
16.77 98.89
17.13 98.96
17.63 98.90
16.72 98.68
15.45 98.69
12.06 98.51
11.44 98.09
10.17 98.25
9.64 98.36
8.55 98.27
7.57 98.00
6.94 98.09
8.32 98.25
10.50 98.41
16.02 98.51
17.83 98.71
17.03 98.79
16.18 98.87
16.26 98.76
14.44 98.58
12.78 98.73
12.25 98.45
11.69 98.37
11.34 98.36
10.97 98.45
Ejemplo 4
99.20

99.00

98.80

98.60

98.40
%
98.20

98.00

97.80

97.60
0.00 5.00 10.00 15.00 20.00

°C
Línea Recta (Modelo matemático)
y =1+0.5 x
Ecuación de la línea recta.

y = a + m x8
7

0
0 2 4 6 8 10 12 14
Modelo de Regresión Lineal
yi = 0 + 1 xi + ei 99.20

99.00

98.80
Estas constantes
ei
son conocidas como 98.60

Parámetros.
98.40
%
98.20

98.00
ej
97.80

97.60
0.00 5.00 10.00 15.00 20.00

°C
El problema de Estimar (Estimación)
yi = 0 + 1 xi + ei 99.20

99.00

98.80

98.60

98.40
%
98.20

98.00

97.80

97.60
0.00 5.00 10.00 15.00 20.00

°C
Estimación 99.20

 y i = 0 + 1 xi + ei
99.00

98.80

98.60 ei
 y i - 0 - 1 xi = ei 98.40
%
98.20

98.00

 (yi - 0 - 1 xi )2= ei2 97.80


ej

97.60
0.00 5.00 10.00 15.00 20.00

°C
 (yi - 0 - 1 xi )2= ei2
Estimadores de Mínimos Cuadrados
(yi - 0 - 1 xi )2= ei2 99.20

   yi   0  1 xi 
2 99.00

0
98.80
i
 0 98.60 ei

   yi   0  1 xi 
2 98.40
%
i
0 98.20

1 98.00

ˆ0  y  1 x  b0 97.80
ej

  y  y x  x 
i i
97.60
0.00 5.00 10.00 15.00 20.00

ˆ1  i
b °C
 x  x  2 1
i
i
Pruebas de Hipótesis b1 0
105

100

b1=0 95
% de eficicncia

90

85

80

75

70
5 7 9 11 13 15 17 19
Temperatura

Datos ejemplo 4.

Si 1=0 significa que x NO es importante para predecir y


Pruebas de Hipótesis

Por lo anterior es importante probar el siguiente juego de


hipótesis.

Ho: 1= 0 vs Ha: 1 0

Si 1 0 significa que x ES importante para predecir y


Pruebas de Hipótesis
(Tipos de Errores)
En realidad la hipótesis H0 es:
Cierta Falsa
El resultado de la No hay error Error tipo II, 
prueba es:
x realmente
No Rechazar H0 auxilia a
predecir y. (10%)
Error tipo I,  No hay error
Rechazar H0 x realmente no
auxilia a
predecir y. (5%)
Pruebas de Hipótesis
(Tipos de Errores)

P(Error tipo I) = 
P(Error tipo II)= 

Cuando se prueba el siguiente juego de hipótesis.

Ho: 1= 0 vs Ha: 1 0

Se rechaza con una P(Error tipo I) controlado.


Pruebas de Hipótesis
(Tipos de Errores)
Ho: Viene un vehículo vs Ha: No viene ningún vehículo

¿Rebasar o No rebasar?

Opción 1. No rebaso y no viene ningún vehículo (E.T.


II, )
Opción 2. Rebaso y no viene ningún vehículo (No
hay error)
Opción 3. No rebaso y viene un vehículo (No hay
error)
Opción 4. Rebaso y viene un vehículo (E.T. I , )
Ejemplo 4
99.20

99.00

98.80

98.60

98.40
%
98.20

98.00

97.80

97.60
0.00 5.00 10.00 15.00 20.00

°C
Ejemplo 4
Se piensa que la eficiencia de remoción de partículas dañinas de este
tratamiento depende de la temperatura a la cual se realiza el proceso, para
investigarlo se colectó la siguiente información.
99.20

Estimadores de 99.00

Mínimos cuadrados 98.80

98.60
b0= 97.5
98.40
Y

b1= 0.076 Y
Predicted Y
98.20

98.00

97.80

97.60
0.00 5.00 10.00 15.00 20.00
X = °C
Ejemplo 4
Se piensa que la eficiencia de remoción de partículas dañinas de este tratamiento depende de la
temperatura a la cual se realiza el proceso, para investigarlo se colectó la siguiente información.

¿La temperatura es un factor


importante para predecir 99.20
la eficiencia?
99.00

¿ Es decir 1 0?
98.80

Ho: 1= 0 vs Ha: 1 0 98.60

Dada la información obtenida se 98.40


Y

Y
Rechaza Ho con
Predicted Y
un valor de p (p-value) < 0.001 98.20

Por lo tanto la temperatura SI 98.00

es un factor importante para


97.80
inferir en la eficiencia.
97.60
0.00 5.00 10.00 15.00 20.00
X = °C
Modelo para un Diseño Completamente Aleatorio (DCA)
Pruebas de Hipótesis (caso: DCA)
Ho: Todos los tratamientos producen el mismo efecto.
vs
Ha: Al menos un tratamiento produce un efecto diferente

Reglas de decisión:
rechazar Ho Fc >Ft donde: Fc=CM(T)/CM(E) , Ft=F gl(t),gl(e)
o
rechazar Ho si el valor de p (p-value) < alfa
Tabla de ANAVA
The GLM Procedure

Dependent Variable: y

Sum of
Source DF Squares Mean Square F Value Pr > F

Model 15 7608.45833 507.23056 0.31 0.9768

Error 8 13233.50000 1654.18750

Corrected Total 23 20841.95833

R-Square Coeff Var Root MSE y Mean

0.365055 89.96506 40.67170 45.20833

Source DF Type III SS Mean Square F Value Pr > F

trat 3 1924.583333 641.527778 0.39 0.7650


bloq 3 453.729167 151.243056 0.09 0.9627
trat*bloq 9 5414.416667 601.601852 0.36 0.9234
Supuestos del modelo para realizar
Pruebas de Hipótesis
1. Normalidad
2. Homogeneidad de varianzas
3. Independencia

Potrebbero piacerti anche