Sei sulla pagina 1di 9

CURSO DE ESTADISTICA II

TRABAJO DE APLICACIÓN DE MUESTREO

Tenemos en Proyecto la compra de una Fuente de soda en los alrededores de la UIS. Este negocio
ya tiene una historia comercial de 11 años atendiendo personas que directamente tienen que ver
con la Universidad, es decir, estudiantes, profesores y trabajadores. Esta fuente de soda tiene una
sección especializada en Jugos y Frutas naturales gozando de muy buena aceptación dentro de su
clientela. Para la sección de frutas, observando sus datos de ventas durante los pasados 11 años
encontramos los siguientes datos:

Año No Clientes Atendidos Volumen Ventas Millones de $


1999 10000 9,2
2000 11000 10,3
2001 11000 11,2
2002 11500 12,3
2003 11400 12,5
2004 12000 13,5
2005 12300 14,3
2006 13000 16,2
2007 14500 17
2008 15500 17,5
2009 16500 19,5

Queremos analizar cifras que nos permitan determinar las bondades del proyecto en lo referente
a la sección ya mencionada y para tal efecto estamos pensando en reforzar estrategias de ventas
considerándose conveniente hacer un encuestamiento por muestreo con el ánimo de conocer
expectativas de venta y sus características de comercialización.

Nos interesa especialmente crear el servicio de venta a domicilio. Pensando en conocer la clientela
potencial de este nuevo servicio, se sugiere hacer el encuestamiento por muestreo.

Se pide entonces para esta problemática planteada, lo siguiente:

1. ¿Qué técnica de muestreo recomiendan ustedes y porqué?

Como la proporción de clientes que estarían interesados en dicho servicio, es diferente de un


sector poblacional a otro, entonces, se recomienda el Muestreo Estratificado Aleatorio. Este
muestreo simplifica los procesos y suele reducir el error muestral para un tamaño dado. Consiste
en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad
respecto a alguna característica. Lo que se pretende con este tipo de muestreo es asegurarse de
que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente.
2. Aplicando su técnica sugerida, qué tamaño de muestra se debe utilizar? Tenga en cuenta
que el mercado potencial total es de 6000 personas, de las cuales 1000 son profesores y
500 trabajadores de la Universidad, el resto son vecinos del negocio.

n?
Con L estratos, donde L=3
L

Ni 1
i
2
pi qi

wi N1  4500
Entonces  n= L
, donde N i  Tamaño Estrato N 2  1000
N D   N i pi qi
2
N  6000 N 3  500
i 1

pi  Proporción de clientes que estarían interesados en nuestro


servicio de venta a domicilio  pi  #interesados de n i
Ni
qi  1- pi wi  ; Si el muestreo se aplica con afijación proporcional.
N
ni n
wi  n i  Ni
n N
B2
D donde B  error,
4
B=0,05  5% ya que Asumimos  =5%  Z  =1,96  2
1
2

Solución:
     
 N12 p1q1   N 2 2 p2 q2   N32 p3q3 
 N12 p1q1   N 2 2 p2 q2   N32 p3q3   N  N  N 
 w  w  w   1
  2
  3


n 2 1   2   3   n   2N   N   N 
N D   N1 p1q1  N 2 p2 q2  N 3 p3q3  N D   N1 p1q1  N 2 p2 q2  N 3 p3q3 

Nosotros asumimos un intervalo para cada 𝑝𝑖 , y luego escogimos de los limites el que más se
acercara a 0,5. Entonces:

p1   0, 2  0,3
p2   0,3  0, 4
p3   0,1  0, 2
Luego entonces: p1  0,3
p2  0, 4
p1  0, 2
Entonces reemplazo p1 , p2, p3 y obtengo:

     
 45002 *0,3*0, 7  1000 2 *0, 4*0, 6   500 2 *0, 2*0,8 
 4500  1000  500 
     
n  6000   6000   6000 
(60002 *0, 000625)   (4500*0,3*0, 7)  (1000*0, 4*0, 6)  (500*0, 2*0,8) 

 4252500   240000   40000 


 0, 75    1  
     1  5670000  1440000   480000
n 6   12   n
22500  945  240  80 23765

7590000
n  319,3772354  320
23765

N1  4500 
n1  *n   *320  240
N  6000 
N2  1000  160
después n n2  *n    *320   53,3333  53
N  6000  3

N3  500  80
n3  *n    *320   26, 6667  27
N  6000  3

3. Con ese tamaño muestral y simulando el encuestamiento referido, sugiera una cantidad
de personas que serían clientes de este nuevo servicio y estime la proporción de clientes
para este servicio. Calcule un intervalo de confianza del 95% para esta proporción (Dele
datos al muestreo recomendado y calcule el intervalo de confianza).

# veces que dicen si


Hallamos pˆ i  , para i  1, 2,3
ni

En este caso, suponemos el número de veces que los encuestados dicen que “si”.

70
pˆ1   0, 291666667  0, 2617
240
18
pˆ 2   0,3396226415  0,3396
53
3
pˆ 3   0,1111111111  0,1111
27
1
- Entonces el Estimador Puntual es pˆ st 
N
 Ni * pˆ i , indicando cuantos clientes de la
población N podríamos tener.

1
pˆ st  ( N1 * pˆ1 )  ( N 2 * pˆ 2 )  ( N3 * pˆ 3 )
6000
1  70   18   3 
pˆ st    4500*   1000*    500*  
6000  240   53   27  

1  18000 500  1
pˆ st  1312,5     * 1707, 678197   0, 2846130328  0, 2846
6000  53 9  6000

- La varianza Estimada del Estimador es:

1 i  N  n   p *q 
Vˆpˆ st  2  Ni 2  i i  *  i i  para i  1, 2,3
N 1  Ni   ni  1 

  70 170     18 35   
 2  4500  240 
*
 240 240    2  1000  53 
 53 * 53   
  4500 *   *    1000 *   *   
  4500   240  1     1000   53  1   
1          
Vˆpˆ st  * 
6000  
2
 3 24   
 2  500  27 
 27 * 27   
 500 *  500  *  27  1   
     
     
1 1
2 
Vˆpˆ st  16570,99895  4084, 467508  898,3855651   21553,85202
6000 36000000
Vˆpˆ st  5,987181118*104

- El Intervalo de Confianza (Numero de clientes ± La fluctuación) es pˆ st  2 Vˆpˆ st

Vˆpˆ st  5,987181118*104

Vˆpˆ st  0, 024468717

2* Vˆpˆ st  0, 04893743401

Entonces el Intervalo de Confianza es:



   
I .C.   pˆ st  2 Vˆpˆ st  P  pˆ st  2 Vˆpˆ st   0,95


I .C.   0, 2846130328  0, 04893743401  P   0, 2846130328  0, 04893743401   0,95

I .C.   0, 2356755988  P  0,3335504668  0,95

4. De no crearse este servicio de venta a domicilio, cuál sería la proyección de ventas de la


fuente de soda para el 2010? Ajuste una línea de regresión, verifique si es apropiada
para pronosticar. Para esta proyección asuma que en este año 2010 esperamos atender
17000 clientes. Sugerencia: realice un análisis de regresión con los datos mostrados al
comienzo. ESTE ANÁLISIS DE REGRESIÓN HAGALO CON STATGRAPHICS.

Ruta a seguir:

i. Abrir programa STATGRAPHICS PLUS


ii. Analizar datos Existentes o Introducir nuevos datos  Aceptar
iii. Deseo introducir nuevos datos  Aceptar
iv. Modificar Columna  Nombre: Clientes Atendidos  Aceptar
v. Modificar Columna  Nombre: Volumen Ventas  Aceptar  Cancelar
vi. Se introducen los datos respectivamente
vii. Dependencia
viii. Regresión Simple
ix. Entrada de datos:
a. X: Clientes Atendidos
b. Y: Volumen Ventas
x. Aceptar
xi. Resultado: Análisis de Regresión – Modelo lineal Y= a+bx
xii. Opciones Tabulares
xiii. Comparación de Modelos Alternativos  Aceptar
xiv. Se observa los modelos en orden descendente según el R-cuadrado.
xv. Para cambiar los modelos, seleccione el cuadro de diálogo Opciones de Análisis.
xvi. Dependencia
xvii. Regresión Polinomial
xviii. Entrada de datos:
a. X: Clientes Atendidos
b. Y: Volumen Ventas
xix. Resultado: Análisis de Regresión Polinomial Orden 2
xx. Clic Derecho  Opciones de Análisis  Orden: 3  Aceptar
xxi. Resultado: Análisis de regresión Polinomial Orden 3
Comparación de Modelos Alternativos
Modelo Correlación R-cuadrado
Inverso-X -0,9833 96,68%
Logarítmico-X 0,976 95,57%
Curva-S -0,9735 94,76%
Raíz cuadrada-X 0,9730 94,68%
Lineal 0,9674 93,59%
Multiplicativo 0,9607 92,30%
Raíz cuadrada-Y 0,9570 91,58%
Doble inverso 0,9530 90,83%
Exponencial 0,9439 89,09%
Inverso-Y -0,9102 82,84%
Logístico <sin ajustes> <sin ajustes>
Log Probit <sin ajustes> <sin ajustes>

El STATADVISOR

Esta tabla muestra los resultados de ajuste a los datos de varios modelos curvilíneos. De los
modelos ajustados, el modelo recíproco-X procura el valor de R-cuadrado más alto con 96,6811%.
Este es 3,09138% más alto que el modelo lineal seleccionado inicialmente.

Entonces, si solo realizamos el análisis de Regresión simple obtenemos que el modelo que más
se ajusta sea el que presenta el mayor R-cuadrado por tanto escogemos el Modelo Inverso-X y
obtenemos:
Análisis de Regresión – Modelo Inverso-X: Y= a+ (b/x)

Indicadores:

 Coeficiente de correlación = -0,983266


 R-cuadrado = 96,6811%
 Error estándar de estimación = 0,626296

El STATADVISOR

La ecuación del modelo ajustado es:

262492, 0
Volumen ventas  35, 2436 
Clientes Atendidos

Dado que el P-valor es inferior a 0.01, existe relación estadísticamente significativa entre el
Volumen de Ventas y Clientes Atendidos para un nivel de significancia del 99%.

El estadístico R-cuadrado indica que el modelo explica un 96,6811% de la variabilidad en Volumen


ventas. El coeficiente de correlación es igual a (-0,983266), indicando una relación relativamente
fuerte entre las variables. El error estándar de la estimación muestra la desviación típica de los
residuos que es de 0,626296.

Entonces podemos calcular el volumen de ventas proyectadas teniendo en cuenta el No. De


clientes atendidos que en este caso es de 17.000:

262492, 0
Volumen ventas (17000)  35, 2436 
17000
Volumen ventas (17000)  19,80289412

Entonces el volumen de ventas proyectado para el año 2010 si se espera atender 17000 clientes
es de 19,803 millones de pesos aproximadamente.

Ahora si hacemos un nuevo análisis pero esta vez teniendo en cuenta tanto la regresión simple
como la polinomial los resultados serían los siguientes:

- Regresión Polinomial de orden 1 tenemos:


o R-cuadrado = 93,5897%
o Error estándar de estimación = 0,870404

- Regresión Polinomial de orden 2 tenemos:


o R-cuadrado = 96,8882%
o Error estándar de estimación = 0,643223

- Regresión Polinomial de orden 3 tenemos:


o R-cuadrado = 97,0037%
o Error estándar de estimación = 0,674762

En este caso el modelo de regresión que más se ajusta teniendo en cuenta el R-cuadrado más alto
y que más se acerca al 100% es el Modelo Polinomial de Orden 3 entonces su respectivo análisis es
el siguiente:

El STATADVISOR

La ecuación del modelo ajustado es:

Volumen ventas  69, 4695  0, 0142431* CA  8, 046937 * CA2   1, 6173811 * CA3 
donde CA  Clientes Atendidos

Dado que el P-valor es inferior a 0.01, hay relación estadísticamente significativa entre el volumen
de Ventas y los clientes atendidos para un nivel de confianza del 99%.

El estadístico R-cuadrado indica que el modelo explica un 97,0037% de la variabilidad en el


volumen de ventas. El error estándar de la estimación muestra la desviación típica de los residuos
que es 0,674762.

Entonces podemos calcular nuevamente el volumen de ventas proyectadas teniendo en cuenta el


No. De clientes atendidos que en este caso es de 17.000 y utilizando el nuevo modelo ajustado:
Volumen ventas  69, 4695   0, 0142431*17000  8, 046937 *170002   1, 6173811 *170003 
Volumen ventas  69, 4695   242,1327   132, 2775915   2.479784899*1010 
Volumen ventas  2, 479784899*1010

Nota: En la determinación de orden apropiado del polinomio, tenga en cuenta que el P-valor del
término de mayor orden del polinomio es igual a 0,619587. Puesto que el P-valor es superior o
igual a 0.10, este término no es estadísticamente significativo para un nivel de confianza del 90% o
superior. Por consiguiente debería considerarse reducir el orden del modelo a 1 utilizando las
opciones de análisis del cuadro de diálogo.

REALIZADO POR:

- LEIDY JOHANNA CÁRDENAS SOLANO 2071978


- KATHERINE JULIETH SIERRA SUÁREZ 2071981

PRESENTADO A: PROF. JOSÉ JOAQUÍN GARCÍA DÍAZ

FECHA: 31 DE AGOSTO DE 2010

Potrebbero piacerti anche