Sei sulla pagina 1di 16

Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Laboratorio Nº 1

Población y Muestreo

Conjunto de elementos, personas o individuos de los cuales queremos obtener un dato.


Muestras Aleatorias y No-Aleatorias.
En Microsoft Excel, podemos utilizar una función que nos permita seleccionar una muestra
dentro de una población.
Ejemplo:
Legajo del Ingreso Legajo del Ingreso
Alumno familiar Alumno familiar
1 A 3014/1 780 11 M 3269/1 780
2 A 3016/6 750 12 N 3698/7 730
3 A 3025/7 730 13 O 9865/1 500
4 B 2589/8 760 14 P 3265/5 680
5 D 2356/9 790 15 Q 3265/1 700
6 F 2541/8 800 16 R 1235/2 720
7 H 2659/4 900 17 S 1523/2 810
8 J 5859/1 850 18 T 2356/5 910
9 K 5623/2 820 19 U 1256/3 855
10 K 5623/3 760 20 V 1254/2 770
Tabla Nº1 Datos Ejemplo Nº1. Ingreso Familiar.

Alumnos de la Facultad con sus respectivos Legajos y el Ingreso por Familia.


Determinar población trabajando con muestras aleatorias de los mismos.
Contando con la tabla de la figura anterior, seleccionamos Herramientas y dentro de ella
seleccionar Análisis de Datos.

Seleccionamos la opción Muestra, donde aparecerá otra ventana que deberá completarse con los
datos y características del problema planteado.

Ing. Kerkhoff Alejandro 1


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

En el recuadro Entrada incorporar los datos, tenemos opción de seleccionar Rótulos.

Paso siguiente seleccionar Método de Muestreo y por ultimo, la Opción de Salida.

Posteriormente se puede obtener el Promedio ($ 779,375)

Otra forma do obtener el Promedio es con el total de los datos ($ 769.65), la diferencia es por
que el promedio realizado solo toma 8 muestras de la población.

Ing. Kerkhoff Alejandro 2


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Estadística Descriptiva

Análisis de Datos

¾ Variables Cuantitativa y Cualitativa.


¾ Medidas Descriptivas.
¾ Frecuencia Absoluta, Relativa y Acumulada.
¾ Histograma.

La Variable, es aquello que vamos a analizar en el estudio que estemos desarrollando.


Variables Cualitativas Nominales y Ordinales.
Variables Cuantitativas Discretas y Continuas.

Medidas Descriptivas a analizar en un conjunto de datos son las Medidas de Posición,


Medidas de Dispersión y las Medidas de Forma.

Ejemplo:

Alumnos de la Facultad con sus alturas correspondientes.


Se puede observar que la cantidad de alumnos es 20.
El paso siguiente, consiste en seleccionar la opción Análisis de Datos en el menú
Herramientas. Se abre una ventana donde se debe seleccionar la opción Estadística
Descriptiva.

Ing. Kerkhoff Alejandro 3


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Aceptando esta opción se abrirá una nueva ventana, en la que se deberán incorporar los datos de
los que se disponen dentro de Rango de Entrada.

Especificar la forma en que han sido cargados los datos, Agrupados por Filas o Columnas. En
nuestro caso seleccionar la opción “Columna”, ya que los datos fueron ingresados de esa forma.
Para las Opciones de Salida debemos seleccionar Resumen de Estadísticas, y para K-ésimo
mayor, K-ésimo menor (si se desea según los datos que tenemos) lo seleccionamos si es
necesario, para nuestro caso no; hechas las selecciones simplemente hacemos clic sobre la
palabra Aceptar, se abrirá una nueva hoja dentro del libro que estamos trabajando presentando
el siguiente cuadro.

Ing. Kerkhoff Alejandro 4


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Medidas Descriptivas

Medidas de Posición
Nos informan cuál es la tendencia central de la variable, sus valores medios.
Media (1.742), Mediana (1.745), Moda (1.79)

Medidas de Dispersión
Estos datos nos permiten juzgar la confiabilidad de las medidas de tendencia central.
Varianza de la Muestra (0.00400632), y la Desviación Estándar (0.06329546).

Medidas de Forma
Estos datos nos dan una idea de la manera en la que están distribuidos los datos.
Curtosis o Kurtosis (indica que tan puntiaguda es la distribución de probabilidades de los datos,
se compara con una distribución normal)
Si K > 0 (pico alto), si K < 0 (distribución plana) y, K = 0 (no presenta pico ni es plana).
Coeficiente de Asimetría (analiza si la curva que forman los datos, presenta la misma forma a
izquierda y a la derecha de la Media Aritmética).
Si As > 0 (curva asimetría positiva, distribución hacia la izquierda de la media), As < 0 (curva
asimétrica negativa, distribución hacia la derecha de la media), y As = 0 Simétrico.
Curtosis (-0.7367 distribución plana), Coeficiente de Asimetría (-0.168 asimétrica negativa).

Histograma

Se utiliza el histograma para graficar los datos cuantitativos resumidos en las tablas de
Frecuencia. Nos informa, cuál es el número de apariciones de un valor en un conjunto de datos.
Para obtener el histograma debemos entrar en el menú Herramientas, opción Análisis de Datos,
Histograma y hacemos clic en Aceptar.
Aparecerá una ventana en la que incorporaremos los datos de Entrada, Rango de entrada, y si
tenemos un Rango de Clase (si no lo tenemos definida el programa divide los datos). En
Opciones de Salida podemos seleccionar la opción de Pareto (histograma ordenado),
Porcentaje Acumulado y Crear Grafico.

Ing. Kerkhoff Alejandro 5


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Al aceptar estas opciones, se abrirá una nueva hoja dentro del mismo libro en el que estamos
trabajando con el siguiente cuadro y grafico.

Utilizando el programa de EXCEL

Nociones Básicas Estadística Microsoft Excel

Autores: Maria Elizabeth Cristófoli y Matías Belliard.


www.edicionesmaurina.com.ar/estadistica

Ing. Kerkhoff Alejandro 6


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Análisis de Datos

Está aplicación le permite realizar el Análisis de Datos, de las muestras que decidimos tomar,
obteniendo medidas descriptivas de dicho conjunto de datos. El programa permite obtener:
Medidas de posición, medidas de variabilidad y medidas de forma.

Ingreso de datos en los archivos del programa.

Hacemos clic sobre el icono “ingreso de Datos” e ingresamos los datos correspondientes a
nuestro problema.

Ing. Kerkhoff Alejandro 7


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Después del ingreso de los datos volvemos al “Menú” (imagen anterior), y seleccionamos esotro
icono “Análisis de Datos”

Como se ve ya en esta página obtenemos los datos que necesitamos sin que insertemos algún
paso adicional.

Análisis de Datos Agrupados


Ejercicio “Referencial” TP Nº 1:
Los datos corresponden a una muestra del tiempo de servicio (en minutos) de 60 componentes
electrónicos:
0,7 0,4 3.4 4,8 2,0 1,0 5,5 6,2 1,2 4,4
1,5 2,4 3,4 6,4 3,7 4,8 2,5 5,5 0,3 8,7
2,7 0,4 2,2 2,4 0,5 1,7 9,3 8,0 4,7 5,9
0,7 1,6 5,2 0,6 0,9 3,9 3,3 0,2 0,2 4,9
9,6 1,9 9,1 1,3 10,6 3,0 0,3 2,9 2,9 4,8
8,7 2,4 7,2 1,5 7,9 11,7 6,3 3,8 6,9 5,3

Para los datos consignados:


1. Encontrar el número óptimo de intervalos de clase.
2. Construir una distribución de frecuencias.
3. Construir el histograma y polígono de frecuencias (absolutas y relativas), y el gráfico y
polígono de frecuencias acumuladas (absolutas y relativas).

% %
Clase Frecuencia acumulado Clase Frecuencia acumulado
0,20 2 3,33% 1,84 16 26,67%
1,84 16 30,00% 3,49 14 50,00%
3,49 14 53,33% 5,13 9 65,00%
5,13 9 68,33% 6,77 8 78,33%
6,77 8 81,67% 10,06 5 86,67%
8,41 4 88,33% 8,41 4 93,33%
10,06 5 96,67% 0,20 2 96,67%
y mayor... 2 100,00%y mayor... 2 100,00%

Ing. Kerkhoff Alejandro 8


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Histograma

18 120,00%
16
100,00%
14

Frecuencia
12 80,00%
10 Frecuencia
60,00%
8 % acumulado
6 40,00%
4
20,00%
2
0 0,00%

...
84
49
13
77

6
41

ay 0
,0

y 0,2
or
1,
3,
5,
6,

8,
10

m
Clase

Componentes Electrónicos
Media 4,07948718
Error típico 0,4864726
Mediana 3,8
Moda 4,8
Desviación estándar 3,03802043
Varianza de la muestra 9,22956815
Curtosis -0,15608802
Coeficiente de asimetría 0,65953604
Rango 11,5
Mínimo 0,2
Máximo 11,7
Suma 159,1
Cuenta 39

Utilizando el programa de EXCEL

Nociones Básicas Estadística Microsoft Excel

Autores: Maria Elizabeth Cristófoli y Matías Belliard.


www.edicionesmaurina.com.ar/estadistica

Ing. Kerkhoff Alejandro 9


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Frecuencia Acumulada
1,2

1,0

0,8

0,6

Histograma
0,350

0,300

0,250

0,200

0,150

0,100

Ing. Kerkhoff Alejandro 10


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Análisis de Datos Agrupados


Total de Datos 60
Valor Medio 4,000
Varianza Muestral 8,333
Desviación Estandar 2,887
Asimetria 0,748
Curtosis -0,455
Mediana 6
Modo 1
Valor Máximo 12
Valor Mínimo 0
Recorrido 12
Asimetría de los Datos Asimetría Positiva

Distribución de probabilidad

Binomial, Poisson, Geométrica, Hipergeométrica


Para la resolución de los ejercicios con las diferentes distribuciones de probabilidad, con el
programa Microsoft Excel se seleccionaran del TP Nº 5 algunos ejercicios que hacen referencia a
los mismos.

Distribución Binomial:

Ejercicio Nº 1 (TP Nº5 Distribución de Variable Aleatoria Discreta)

La variable aleatoria X tiene una distribución binomial con n = 10 y p = 0.5.


a) ¿Cuál es el valor más probable?
b) Hallar las siguientes probabilidades:
P (X = 5); P (X ≤ 2).
Con el programa Microsoft Excel se puede desde la barra de herramientas Insertar Función,
seleccionando la categoría “Estadísticas”, luego seleccionamos la función que deseamos
trabajar, en nuestro primer caso seria la “Distribución Binomial”

Ing. Kerkhoff Alejandro 11


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Seguidamente se abrirá una ventana donde tendrán que cargar los datos del problema a resolver.

Para la resolución de nuestro ejercicio tenemos los siguientes datos:


n = 10 y p = 0.5.
P (X = 5) = 0.246

Para P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2)
Se obtiene la probabilidad para x = 0; 1 y 2. y se suman.

P(X=0) 0,00097656
P(X=1) 0,00976563
P(X=2) 0,04394531
P (X ≤ 2) 0,0546875

Ing. Kerkhoff Alejandro 12


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

O se cambia en la opción Acumulado el falso por el Verdadero para obtener P (X ≤ 2)

Distribución Poisson:

Sea X la variable aleatoria que cuenta el número de fallas superficiales de un alambre delgado de
cobre, y que dicha variable tiene una distribución de Poisson con media de 2,3 fallas por
milímetro.
a) Determinar la probabilidad de tener exactamente dos fallas en un milímetro de alambre.
b) Calcular la probabilidad de tener 10 fallas en cinco milímetros de alambre.
c) Si sabemos que en el alambre hay fallas, ¿cuál es la probabilidad de haya menos de tres en dos
milímetros de alambre?
Con el programa Microsoft Excel se puede desde la barra de herramientas Insertar Función,
seleccionando la categoría “Estadísticas”, luego seleccionamos la función que deseamos
trabajar, en caso seria la “Distribución Poisson”, como en el caso anterior pero cambia el tipo
de distribución.

Los datos que debemos ingresar son los siguientes:


X ; Media = 2.3 ( λ = np) y Acumulado, Verdadero (usa para la función acumulativa de Poisson),
o Falso ( usa la función de probabilidad bruta de Poisson), según se requiera.
a) Determinar la probabilidad de tener exactamente dos fallas en un milímetro de alambre.
P (X = 2) = 0.265

Ing. Kerkhoff Alejandro 13


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

b) Calcular la probabilidad de tener 10 fallas en cinco milímetros de alambre.

Para cinco milímetros de alambre la media será: 2.3*5 = 11.5


P(X=10)= 0.1129

c) Si sabemos que en el alambre hay fallas, ¿cuál es la probabilidad de haya menos de tres en dos
milímetros de alambre?
En este caso nuestra media cambia ya que son dos milímetros de alambre, 2,3*2 = 4,6

P (X < 3) = 0.3257

Distribución Geométrica:

Suponga que la variable aleatoria X tiene una distribución geométrica con p = 0,5.
a) Calcular las siguientes probabilidades:
P(X = 1); P(X = 4); P(X = 8); P(X ≤ 2);
Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que x ensayos sean
necesarios para obtener un éxito es:
P (X = x) = p (1 – p) x-1
Por lo tanto podemos escribir la formula en un casillero del programa Microsoft Excel para
poder obtener los resultados, no tiene la función en el programa ni las tablas correspondientes
como la tiene con relación a las distribuciones anteriores.
En la resolución de nuestro ejercicio tenemos:
p = 0.5; 1 – p = 0.5 Î P (X = x) = 0.5 (0.5) x-1
p 0,5
1-p 0,5
X 1 2 3 4 5 6 7 8
P(X = x) 0,50000 0,25000 0,12500 0,06250 0,03125 0,01563 0,00781 0,00391

Ing. Kerkhoff Alejandro 14


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

Para P(X = 1) = 0.5


Para P(X = 4) = 0.0625
Para P(X = 8) = 0.00391
Para P(X ≤ 2) = 0.75

Distribución Hipergeométrica:

Suponga que X tiene una distribución hipergeométrica con N = 60, n = 6 y K = 20.


a) Calcular P (X = 1); P (X = 7); P (X < 4).

Con el programa Microsoft Excel se puede desde la barra de herramientas Insertar Función,
seleccionando la categoría “Estadísticas”, luego seleccionamos la función que deseamos
trabajar, en caso seria la “Distribución Hipergeométrica” (distr. Hipergeométrica), como en el
caso anterior pero cambia el tipo de distribución.

Los datos que debemos ingresar son los siguientes: h(x;N;n;k);

Los argumentos de la función que deben ingresarse en el programa deben ser los siguientes:

Muestra éxito: es el número de éxitos en la muestra. (x)


Núm. de muestra: es el tamaño de la muestra. (n)
Población éxito: es el número de éxitos en la población. (k)
Núm. de población: es el tamaño de la población. (N)

a) P (X = 1) ; h(1;60;6;20)
-P (X = 1) = 0.2628
Cargando los datos en el programa como se describió anteriormente, y seguidamente hacemos
clic en “Aceptar”, tenemos el resultado en el cuadro que hemos seleccionado.

Ing. Kerkhoff Alejandro 15


Universidad Nacional de Misiones

PROBABILIDAD Y ESTADISTICA

-Para P (X = 7) el programa Microsoft Excel me da un error, esto se debe a que la probabilidad


que me piden X=7, supera el tamaña de la muestra.
-Para P (X < 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 0.07666 + 0.2628 + 0.3468
+0.2249 = 0.9113
Si armamos un cuadro en Excel como el siguiente; donde en cada uno obtenemos la probabilidad
según lo requerido por y luego sumamos los datos podremos obtener:

P(X = 0) 0,07666968
P(X = 1) 0,26286747
P(X = 2) 0,34683902
P(X = 3) 0,22497666
Total 0,91135282

Ing. Kerkhoff Alejandro 16

Potrebbero piacerti anche