Sei sulla pagina 1di 13

Universidad Tecnológica del Norte de Coahuila

Trabajo Final

Probabilidad y Estadística

Ing. Cristina Raudry

Integrantes:

Aldo Daniel García Domínguez

Omar Imanol Ortega Terrazas

MT AIEE 3°B

Nava, Coah. 14 de Agosto del 2017

1
Tabla de contenidos: No. De páginas

Portada………………………………………………………………………………1

Índice…………………………………………………………………………………2

Introducción………………………………………………………………………..3

Tema #1: Regresión lineal y correlacion………………………………………4

Concepto de regresión lineal y correlación………………………………..4 (A)

Proceso de diagrama de dispersión…………………………………………..4(B)

Proceso de regresión lineal y correlación. …………………………………..5

Tema#2: Diseño de experimentos…………………………………………...……7

Concepto de diseño de experimentos………………………………..………….7(A)

Elementos de análisis de varianza.(ANOVA)……………………………………7(B)

Fuentes de variación……………………………………………………………...…8(C)

Suma de cuadrados……………………………………………………………..…..8(D)

Cuadrados medios………………………………………………………………..….8(E)

Estadística de prueba…………………………………………………………..……9(F)

Proceso de construcción e interpretación de la tabla ANOVA………………9(G)

Conclusión……………………………………………………………………………..12

Bibliografía………………………………………………………………………..……13

2
Introducción.

En este trabajo vamos a estar analizando y verificando algunos conceptos y


procesos que se nos han sido asignados por la profesora. Desde la regresión
lineal hasta tabla ANOVA.

3
Tema #1: Regresión lineal y correlación.

a) Regresión lineal:

La regresión lineal estima los coeficientes de la ecuación lineal, con una o más
variables independientes, que mejor prediga el valor de la variable dependiente.

Por ejemplo:

Puede intentar predecir el total de ventas anuales de un vendedor (la variable


dependiente) a partir de variables independientes tales como la edad, la formación
y los años de experiencia.

Correlación:

Es la relación que existe entre dos o más variantes

b) Identificar el proceso de diagrama de dispersión:

1. Como primer paso hay que tener bien identificado que es lo que está
pasando.
2. Tienes que encontrar con que variables trabajar, tienen que tener alguna
relación.
3. Ya que tengas claro con que variables trabajar, ahora falta tener los
valores de estas variables, solo que tienen que ser dados en el mismo
tiempo para que estas presenten relación.
4. Ya hay que pasar tus variables al plano cartesiano, en el eje X va la
variable independiente (aquella que no es influenciada por la otra), y en el
eje Y se coloca aquella variable dependiente la cual es influenciada por la
otra, y así ya podríamos tener distribuidas nuestras variables, cada quien
en su eje.
5. Determina el coeficiente de correlación: El coeficiente de correlación debe
verse reflejado en la forma que toma el gráfico de dispersión. Es el cociente

4
de la covarianza y la multiplicación de la desviación típica de las dos
variables. Con Excel logramos calcularlo de manera muy simple.
6. Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la
relación de las dos variables y tomamos las decisiones pertinentes.

c) Identificar el concepto de coeficiente de correlación.


El coeficiente de correlación, creado por Karl Pearson alrededor de 1900,
describe la fuerza de la relación entre dos conjuntos de variables en escala de
intervalo o de razón. Se designa con la letra r.

R=∑(x-ẋ) (y-ẏ)/(n-1) (sx- sy)

CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN


1. El coeficiente de correlación de la muestra se identifica con la letra
minúscula r.
2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables
en escala de intervalo o en escala de razón.
3. Varía de -1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las
variables.
6. Un valor cercano a -1 indica una asociación inversa o negativa entre las
variables

d) Explicar el proceso de regresión lineal y su interpretación.


Con este se desea estimar el valor de la variable dependiente Y con base en un
valor seleccionado de la variable independiente X. La técnica para desarrollar la
ecuación y proporcionar las estimaciones se denomina análisis de regresión.
Ecuación de regresión, es la ecuación que expresa la relación lineal entre dos
variables.

5
El objetivo es utilizar los datos para trazar una línea que represente mejor la
relación entre las dos variables. Ῡ=a + bX
El propósito de un análisis de regresión es calcular los valores de a y b para
desarrollar una ecuación lineal que se ajuste mejor a los datos.

6
Tema #2: Diseño de experimentos.
a) Explicar el concepto de diseño de experimentos.
Una hipótesis es una declaración relativa a una población. La prueba de hipótesis
comienza con una afirmación, o suposición, sobre un parámetro de la población,
como la media poblacional.
-Pasos para probar una hipótesis.
1. Se establecen las hipótesis nula y alternativa
2. Se selecciona un nivel de significancia
3. Se idéntica el estadístico de la prueba
4. Se formula una regla para tomar decisiones
5. Se toma una muestra; se llega a una decisión
6. No se rechaza H0 o se rechaza H0 y se acepta H1

b) Identificar los elementos de análisis de varianza (ANOVA).


El análisis de varianza es una colección de modelos estadísticos y sus
procedimientos, en el cual la varianza está patrocinada en ciertos componentes,
debido a diferentes factores.
Para emplear ANOVA, se supone lo siguiente:
1. Las poblaciones siguen la distribución normal.
2. Las poblaciones tienen desviaciones estándares iguales
3. Las poblaciones son independientes.
Después, se calculan las varianzas muestrales (de cada muestra).
Lo siguiente es calcular la variación entre muestras, para ello se suman todas las
varianzas muestrales y se dividen entre el número de muestras (k), esto es una
media de varianzas.
Posteriormente, se estima la varianza de interna de los grupos, para lo cual,
previamente se estima la varianza de las medias aritméticas
La cual se multiplica por el número de elementos totales de cada muestra (n)

7
c) Fuentes de variación;

Estas pueden ser controladas o aleatorias, las controladas son aquellas en las que
se puede tener la manipulación en tus manos, ya sea bajo una orden o alguna
constante, y las aleatorias son aquellas en las que no se sabe cuál será su
próximo valor.

d) Suma de cuadrados.

La suma de cuadrados representa una medida de variación o desviación con


respecto a la media. En el análisis de varianza (ANOVA), la suma total de los
cuadrados ayuda a expresar la variación total que se puede atribuir a diferentes
factores. Por ejemplo, usted hace un experimento para probar la efectividad de
tres detergentes para ropa.

La suma total de los cuadrados = suma de los cuadrados del tratamiento (SST) +
suma de los cuadrados del error residual (SSE)

La suma de los cuadrados del tratamiento es la variación atribuida a, o en este


caso entre, los detergentes para ropa. La suma de los cuadrados del error residual
es la variación atribuida al error.

e) Cuadrados medios.

Los cuadrados medios representan una estimación de la varianza de la población.


Se calculan dividiendo la suma correspondiente de los cuadrados entre los grados
de libertad.

En ANOVA, los cuadrados medios se utilizan para determinar si los factores


(tratamientos) son significativos.

 El cuadrado medio del tratamiento se obtiene dividiendo la suma de los cuadrados


del tratamiento entre los grados de libertad. El cuadrado medio del tratamiento
representa la variación entre las medias de las muestras.

8
 El cuadrado medio del error (MSE) se obtiene dividiendo la suma de los cuadrados
del error residual entre los grados de libertad. El MSE representa la variación
dentro de las muestra

f) Estadística prueba:

Valor, determinado a partir de la información de la muestra, para determinar si se


rechaza la hipótesis nula.

g) Explicar el proceso de construcción e interpretación de la tabla


ANOVA:

El objetivo del ANOVA es comparar los diversos valores medios para determinar si
alguno de ellos difiere significativamente del resto.

Aquí veremos un ejemplo de cómo se puede realizar una tabla ANOVA.

El secreto está, pues, en descomponer la variabilidad total de los datos en dos


fuentes de variación: la debida a los laboratorios y la debida a la precisión dentro
de cada laboratorio. Matemáticamente, la suma de cuadrados total, SST, puede
descomponerse como una suma de dos sumas de cuadrados:

SST = SSR + SSlab

9
SST es la suma de las diferencias al cuadrado de cada resultado individual
respecto a la media de todos los resultados.

SSR mide las desviaciones entre los resultados individuales (xkj), de cada
laboratorio (donde j indica el nº de repetición) y la media del laboratorio (xk) y, por
lo tanto, es una medida de la dispersión dentro de los laboratorios. Cuando se
divide SSR por los correspondientes grados de libertad, (N - K), se obtiene el
cuadrado medio (o MS, del inglés Mean Square) "dentro de los laboratorios", MSR
SSlab mide las desviaciones entre los resultados medios de los laboratorios y el
resultado medio global y, dividido por sus grados de libertad, (k - 1)

Se calculan, por tanto, MSlab y MSR como una medida de las dispersiones
comentadas y se comparan mediante una prueba de hipótesis F.

Como Fcal > Ftab, en este caso se podría concluir que al menos uno de los
laboratorios ha producido resultados la media de los cuales difiere de forma
estadísticamente significativa del resto de laboratorios.

10
Hemos visto que el ANOVA puede utilizarse para comparar entre sí las medias de
los resultados obtenidos por diversas variables

11
Conclusión

Esperamos y este trabajo les haya sido servido para su información, logramos ver
todos los conceptos que aquí se requerían y confiamos en nosotros en que hayan
estado bien planteados.

12
Bibliografía.

Nombre del libro: Estadística Aplicada a los Negocios y la Economía.


Nombre del autor: Douglas A. Link, Samuel A. Wathen, William G. Marchal
Casa Editorial: Mc Graw Hill
Número de edición: Cuarta edición.
Lugar y fecha de impresión: México D.F 2012
Número de páginas contenidas: 856 pag.

Nombre del libro: Probabilidad y Estadística para Ingeniería y Ciencias


Nombre del autor: Jay L. Devore
Casa Editorial: Cengage Learning
Número de edición: Séptima edición
Lugar y fecha de impresión: México D.F 2008
Número de páginas contenidas: 720 pag.

Nombre del libro: Probabilidad y Estadística para Ingeniería

Nombre del autor: Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers


Casa Editorial: Pearson
Número de edición: Novena Edición
Lugar y fecha de impresión: México 2012
Número de páginas contenidas: 816 paginas

13

Potrebbero piacerti anche