Sei sulla pagina 1di 13

Instituto Tecnológico Superior de Cosamaloapan

Ext. Carlos. A Carrillo

Alumno: Ruben Caldelas Rodrigues


Docente: Fred Yasit Zamudio Almendra
Materia: Probabilidad y estadística
Carrera: Ing. Tics 210cc
14/05/2018

1
Índice

0.introduccion ....................................................................................................................3
1.diagrama de dispersión .............................................................................................4
2.ecuación de regresión múltiple ..............................................................................8
3.Conclusiones ...................................................................................................................12

2
INTRODUCCIÓN:

A continuación, vamos meternos a fondo sobre 2 temas importante el primero es el


diagrama de dispersión que vamos a analizar para que sirve, su formula y un
ejemplo para poder entenderse de una manera más fácil y concreta y el 2 tema es
ecuación de regresión múltiple que ya antes habíamos explicado el de regresión
simple este es casi lo mismo pero cuando hay más de 2 variable

3
Qué es un diagrama de dispersión

Dispersión se define como el grado de distanciamiento de un


conjunto de valores respecto a su valor medio.

A partir de esta definición, se derivan las medidas de dispersión que aprendimos en


la clase de estadística del colegio: Rango, varianza, desviación, covarianza,
coeficiente de correlación, etc.

Ahora bien, el diagrama de dispersión, también conocido como gráfico de


dispersión o gráfico de correlación consiste en la representación gráfica de dos
variables para un conjunto de datos. En otras palabras, analizamos la relación entre
dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes
son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano
cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de
correlación

El coeficiente de correlación en un diagrama de dispersión


El coeficiente de correlación nos describe cómo es la relación existente entre dos
variables, en otras palabras, al conocer este número sabemos si la correlación es
positiva o negativa y qué tan fuerte o débil es. Se usa la letra r para expresarla,
veamos cómo:

 r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en
una proporción constante. Es una relación directa, por eso si trazamos una linea de
ajuste esta va pasar por todos y cada uno de los puntos.
 0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El
grado de cercanía de 1 define qué tan directa y proporcional es la relación entre
ambas variables, por ende entre más cerca esté de 0, más débil será su correlación
negativa.

 r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas
variables. Qué tal si pruebas buscando otro tipo de relación.

 -1<r<0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El
grado de cercanía a -1 define que tan inversa y proporcional es la relación entre

4
ambas variables, por ende entre más cerca esté de 0, más debíl será su correlación
negativa.

 r=-1
La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en
proporción constante. Es una relación directa e inversa, por lo tanto una línea de
ajuste va a tocar todos los puntos graficados.

Cómo hacer un diagrama de dispersión paso a paso


 Paso 1: Determina cuál es la situación. Si no entendemos qué es lo que esta
ocurriendo, no podremos establecer las variables a estudiar.
 Paso 2: Determina las variables a estudiar. Si ya determinaste las variables a
estudiar, es porque crees que puede existir una relación entre ellas que te permita
caracterizar la situación.
 Paso 3: Recolecta los datos de las variables: Si ya los tienes, perfecto. Si no,
definimos un período de tiempo para conseguir los datos de las variables antes
definidas. Recuerda que los datos de las dos variables deben estar dados en el
mismo período de tiempo.
 Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable
independiente es aquella que no está influenciada por la otra y se ubica en el eje x.
La variable dependiente que es la que se ve afectada por la otra variable se ubica
en el eje y. Así pues, procedemos a ubicar los valores en el plano cartesiano de
acuerdo a su variable (x, y)
 Paso 5: Determina el coeficiente de correlación: El coeficiente de correlación debe
verse reflejado en la forma que toma el gráfico de dispersión. Es el cociente de la
covarianza y la multiplicación de la desviación típica de las dos variables. Con excel
logramos calcularlo de manera muy simple.
 Paso 6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la
relación de las dos variables y tomamos las decisiones pertinentes.

Ejemplo de diagrama de dispersión


Vamos a ver desde una problemática empresarial, un ejemplo resuelto de diagrama
de dispersión para el área de calidad.

Imagina que una litográfica está abriendo una nueva área de producción para
la impresión de posters, y en este momento se encuentra haciendo todos los
ensayos y pruebas para determinar la cantidad de tinta de cada color que deberían
tener las maquinas.

Como prueba inicial, han decidido establecer la relación de errores de impresión


según el grado de llenado de los recipientes de tinta de la máquina.

5
Bien, definida la situación, iniciamos desde el paso 2:
Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son:

 Cantidad de tinta en litros


 Número de errores de impresión
Para el paso 3, comenzamos a recolectar las variables. En nuestro caso, el
departamento de control de calidad hace 50 corridas o pruebas durante 5 días
continuos.

Los resultados, a continuación:

6
Para el paso 4 ubicamos los ejes según las variables que tenemos. Al estar el
número de errores influenciado por la cantidad de tinta, lo ubicamos como el eje y.
Por consiguiente, el eje x es la cantidad de tinta. Ahora sí, hacemos el gráfico de
dispersión.
Paso 5: Determinamos el coeficiente de correlación. En excel lo calculamos con la
formula COEF.DE.CORREL. Para nuestro ejemplo resuelto, obtenemos 0,94, ¿se
ve esto reflejado en el gráfico? Por supuesto que si, fíjate que los puntos están muy
cerca unos de los otros, lo que indica que los valores se correlacionan fuertemente,
es decir que la relación entre un aumento en los litros de tinta, impacta directamente
en el número de errores en la impresión de posters. De hecho se hace evidente si
miramos la tabla, no hay grandes saltos entre datos si miramos el número de
errores.
Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la
cantidad de tinta con la que se carga el tubo de la máquina y el número de errores
generados en la impresión de los posters. Un paso siguiente para un problema de
este tipo, sería buscar la forma de aprovechar la capacidad restante de la máquina,
por ejemplo usar más tubos y más pequeños.

7
ECUACION DE REGRESION MULTIPLE

Regresión Múltiple: Este tipo se presenta cuando dos o más variables


independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z).

Por ejemplo: Podría ser una regresión de tipo múltiple:


Una Empresa de desarrollo de software establece relacionar sus Ventas en función
del numero de pedidos de los tipos de software que desarrolla (Sistemas,
Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el
presente año.
En la Tabla representa Y (Ventas miles de S/.) e X (Nº pedidos de sistemas), W (Nº
de pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de Automatizaciones
empresariales).
Y 440 455 470 510 506 480 460 500 490 450
X 50 40 35 45 51 55 53 48 38 44
W 105 140 110 130 125 115 100 103 118 98
Z 75 68 70 64 67 72 70 73 69 74
Objetivo: Se presentara primero el análisis de regresión múltiple al desarrollar y
explicar el uso de la ecuación de regresión múltiple, así como el error estándar
múltiple de estimación. Después se medirá la fuerza de la relación entre las
variables independientes, utilizando los coeficientes múltiples de determinación.
Análisis de Regresión Múltiple
Dispone de una ecuación con dos variables independientes adicionales:

Se puede ampliar para cualquier número "m" de variables independientes:

Para poder resolver y obtener y en una ecuación de regresión múltiple el


cálculo se presenta muy tediosa porque se tiene atender 3 ecuaciones que se
generan por el método de mínimo de cuadrados:

8
Para poder resolver se puede utilizar programas informáticos como AD+, SPSS y
Minitab y Excel.

El error estándar de la regresión múltiple


Es una medida de dispersión la estimación se hace más precisa conforme el grado
de dispersión alrededor del plano de regresión se hace mas pequeño.
Para medirla se utiliza la formula:

Y : Valores observados en la muestra

: Valores estimados a partir a partir de la ecuación de regresión


n : Número de datos
m : Número de variables independientes

El coeficiente de determinación múltiple

Mide la tasa porcentual de los cambios de Y que pueden ser explicados por

, y simultáneamente.

APLICACION DE REGRESION MULTIPLE


Mediante el siguiente problema podremos ilustrar la aplicación de Regresión
Multiple:
En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca
Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos
que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15
alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base
de Datos y Programación como se muestran en el siguiente cuadro.
Alumno PHP Algoritmos Base de Datos Programación
1 13 15 15 13

9
2 13 14 13 12
3 13 16 13 14
4 15 20 14 16
5 16 18 18 17
6 15 16 17 15
7 12 13 15 11
8 13 16 14 15
9 13 15 14 13
10 13 14 13 10
11 11 12 12 10
12 14 16 11 14
13 15 17 16 15
14 15 19 14 16
15 15 13 15 10
Lo que buscamos es construir un modelo para determinar la dependencia que exista
de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas
de las asignaturas Algoritmos, Base de Datos y Programación.
Se presentara la siguiente ecuación a resolver:

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresión o utilizando Regresión de Análisis de datos, en la Hoja de
Calculo de Excel podemos calcular también los coeficientes de regresión:

Por lo tanto podemos construir la ecuación de regresión que buscamos:

10
El Error Estándar de Regresión Múltiple
Mediante esta medida de dispersión se hace más preciso el grado de dispersión
alrededor del plano de regresión, se hace más pequeño.
Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error típico y para explicar la relación del
aprendizaje de PHP que se viene desarrollando es de 0.861
El coeficiente de determinación múltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las
variables múltiples, utilizando la si siguiente formula:

- CONCLUSIONES
El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las
notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.

11
CONCLUSIONES
Pues como pudimos observa se explicó el diagrama de dispersión tanto su
definición, que es lo que hace, pasó a paso como se hace y para terminar un ejemplo
para saberlo hacer y así poder aprender más fácil para en un futuro hacer nuevos
problemas sobre el tema y también se explicó la ecuación de regresión múltiple que
igual vimos su definición la formula que se utiliza y 2 ejemplos por que es la manera
más fácil de entender

12
bibliografía
https://ingenioempresa.com/diagrama-de-dispersion/#Correlacion_positiva

http://m.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml

13

Potrebbero piacerti anche