Sei sulla pagina 1di 43

Estadística 1

I UNIDAD
ESTADÍSTICA DESCRIPTIVA
Definición de Estadística
Ciencia que proporciona un conjunto de métodos,
técnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos
o realizar generalizaciones válidas.
Tipos de Estadística
Estadística Descriptiva o deductiva: métodos y técnicas de
recolección, tabulación, resumen y presentación que
permite describir apropiadamente las características de un
conjunto de datos.
Estadística Inferencial o inductiva: métodos y técnicas que
hacen posible estimar una o más características de una
población o tomar decisiones referentes a la población
basados en el resultado de muestras.
Desarrollo de un proyecto
estadístico:
Conceptos básicos:
Unidad de observación o experimental: es el objeto sobre el
cual se hace la medición.
Población (N): conjunto total de individuos u objetos con
alguna característica que es de interés estudiar.
◦ Parámetro: es alguna característica de la población en estudio.
Muestra (n): es un subconjunto de la población y contiene
elementos en los cuales debe estudiarse la característica de
interés para la población.
◦ Estadístico: es alguna característica de la muestra en estudio.
La diferencia entre el parámetro y el estadístico es el error de
estimación.
Conceptos básicos:
Censo: es el estudio completo de todos los elementos de la
población.
Muestreo: es el proceso estadístico que permite seleccionar
algunos elementos de la población.
Variable: es una característica de la población definida por
la investigación estadística y que puede tomar dos o más
valores en distintas unidades experimentales.
Técnicas de muestreo
También se le conoce como diseño del experimento.
Toda muestra debe ser representativa.

TIPOS DE MUESTREO:
Muestra: probabilística y no probabilística.

◦ Muestreo Probabilístico: también conocido como muestreo


aleatorio simple.
◦ Muestreo con y sin reemplazo.

◦ Muestreo no probabilístico: también conocido como muestreo por


conveniencia, muestreo de respuesta voluntaria o sesgo personal.
Otros tipos de muestreo:
Muestreo sistemático: comienza con una unidad al azar y a
partir de allí continúa cada k unidades.

Muestreo aleatorio estratificado: se divide en grupos


homogéneos llamados estratos.
Variables
Variable (X): característica de interés sobre cada
elemento individual de una población o
muestra.

Tipos de variables:
◦ Dependiendo del número de características:
◦ Variables unidimensionales
◦ Variables bidimensionales
◦ Variables pluridimensionales o multidimensionales.
Tipo de variables
Dependiendo del tipo de datos:
Variables cuantitativas: miden una cantidad numérica
en cada unidad experimental, sólo pueden ser
expresadas en escala de intervalo o razón.
◦ Discretas: es la variable cuyos valores numéricos se pueden
contar o son finitos en un intervalo cualquiera. (generalmente
valores enteros).
◦ Continuas: se da cuando los valores numéricos que forman la
variable en un intervalo cualquiera son infinitos.
Variables cualitativas: son las que representan una
cualidad o etiqueta, sólo pueden ser expresadas en
escalas nominales u ordinales.
Escalas de medición.
◦ Nominal: son etiquetas o categorías que se usan para definir
un atributo. Pueden ser numéricos o no numéricos.
◦ Ordinal: se usa para indicar el orden que ocupa un elemento al
comparar el tamaño relativo de sus medidas, del más grande al
más pequeño.
◦ Intervalos: Nos permite precisar cuanto se es mayor o menor
las medidas de comparación. En esta escala el cero es
arbitrario, es decir, no indica la ausencia de la característica de
la medida.
◦ De razón: se diferencia de la escala por intervalos únicamente
porque tiene un punto cero natural, es decir, ausencia de
característica de la medida.
¿ESCALA DE MEDICIÓN?
Género de una persona.
Altura sobre el nivel del mar.
Número de carné universitario.
El tiempo para realizar la tarea de Estadística.
Las medidas pequeño, mediano, grande.
Número de identificación personal (DPI).
La temperatura del día de hoy.
Tiempo de vida de una bacteria.
Punto de fusión de un compuesto químico.
Ejemplo:
Una compañía produce arandelas que se supone
tengan un diámetro promedio de 2.5 centímetros,
según requerido por el computador. Un equipo de
ingenieros examina la producción rutinaria para
velar que se cumpla con las especificaciones. Si
encuentra que las arandelas no cumplen con las
especificaciones establecidas, las máquinas que las
producen son ajustadas. Ellos seleccionan un grupo
de 100 arandelas del lote producido en la fábrica
por máquina y calculan el diámetro promedio. De
acuerdo al texto, indique:
Continuación…
Población
◦ Todas las arandelas producidas por la compañía.
Muestra
◦ Las 100 arandelas seleccionadas del lote.
Unidad estadística.
◦ Una arandela producida por la compañía.
Variables que se deben medir, tipo y escala de medición.
◦ Diámetro de la arandela.
◦ Cuantitativa continua, escala razón.
◦ Máquina que produce la arandela.
◦ Cualitativa, escala nominal.

Parámetro
◦ Promedio de todas las arandelas producidas, 2.5 centímetros.
Estadístico.
◦ Promedio de las arandelas de la muestra.
Estadística descriptiva
Recopilación de datos
Fuentes para obtener datos:
◦ Investigación en registros administrativos.
◦ Mediante encuesta, entrevista, cuestionario u
observación. (Técnicas para recopilar datos)

Descripción de conjunto de datos:


◦ Tabular.
◦ Gráficamente.
◦ Análisis estadístico.
Tabulación:
Presentación de datos de una sola variable:
Distribución de frecuencias:
Es una representación de la relación entre un conjunto de
medidas o clases de medidas y la frecuencia de cada una de
ellas.

Al hacer una distribución de los datos, podemos clasificar la


información obtenida en forma:
◦ Cronológica o histórica
◦ Geográfica
◦ Cualitativa
◦ Cuantitativa
Distribución de frecuencias
simples:
Esta nos indica la frecuencia con que aparecen los
números, desde el menor del conjunto hasta el
mayor o viceversa.
Cuando la muestra es menor a 30 o el rango de los
valores observados de la variable de interés es
pequeño.
Simbología
n: el tamaño de la muestra, es el número de observaciones.
Xi: la variable; es cada uno de los diferentes valores que se han observado.
fi: la frecuencia absoluta o solo frecuencia, es el número de veces que se
repite la variable Xi.
Fa: la frecuencia acumulada; se obtiene acumulando la frecuencia
absoluta.
fr: frecuencia relativa; es el resultado de dividir c/u de las frecuencias
absolutas por el tamaño de la muestra.
Fra: frecuencia relativa acumulada; se obtiene dividiendo la frecuencia
acumulada entre el tamaño de la muestra.
f%: frecuencia porcentual: es el resultado de multiplicar la frecuencia
relativa por 100.
F% : Frecuencia porcentual acumulada
Ejemplo 1:
Media Research proporcionó una lista de los 25 programas
con mayor rating en la historia de la televisión. Los datos
siguientes muestran la cadena que produjo cada uno de estos
programas.

Resuma los datos mediante la elaboración de una tabla de


distribución de frecuencias.
Ejemplo 2:
Organice una tabla de distribución de frecuencia para: las
calificaciones obtenidos en el primer corto de Estadística 1.

0 0 0 0 0
0 0 0 0.5 0.5
0.5 0.5 0.5 0.5 0.5
0.5 0.5 0.5 0.5 0.5
1 1 1 1 1
1 1 1 1.5 1.5
1.5 1.5 1.5 1.5 1.5
2 2 2 2 2
2 2 2 2 2
Distribución de frecuencias por
intervalos o de valores agrupados.
Es un método estadístico que se utiliza para
estudiar el comportamiento de un conjunto de
datos y consiste en formar grupos de valores
consecutivos de la variable y poner cada uno de
estos grupos en cada fila.
Reglas para la construcción de
intervalos.
Ordenar los datos de menor a mayor o viceversa.
Calcular el rango o recorrido. R=Xmax-Xmin
Determinar el número de clases: k=1+3.3log(n) fórmula de Sturges
Determinar el intervalo de clase i=R/k
Formar los intervalos (límites aparentes).
Formar los límites reales.
Determinar las frecuencias de clase contando el número de
observaciones
Determinar marca de clase: media de los intervalos.
Ejemplo 3:
De acuerdo con una revista de Informes al consumidor en su
número de febrero, las cuotas anuales de 40 compañías para un
seguro de $ 25 000 para personas de 35 años de edad son:
82 85 86 87 87
89 89 90 91 91
92 93 94 95 95
95 95 95 97 98
99 99 100 100 101
101 103 103 103 104
105 105 106 107 107
107 109 110 110 111
Continuación…
Realice una distribución de frecuencias de valores
agrupados para los resultados obtenidos.
Ejemplo 4
Los siguientes datos son los lapsos, en minutos,
necesarios para que 50 clientes de un banco
comercial, lleven a cabo una transacción bancaria.
Realice una tabla de distribución de frecuencias.
0.2 0.5 1.2 1.4 2.3 2.8 3.3 4.4 5.6 7.2
0.4 0.7 1.2 1.5 2.4 2.8 3.4 4.6 5.8 7.6
0.4 0.8 1.3 1.6 2.4 2.9 3.7 4.7 6.2 7.8
0.4 0.9 1.3 1.8 2.5 3.1 3.8 5.2 6.3 9.5
0.5 1.1 1.4 1.9 2.7 3.3 4.2 5.5 6.8 9.7
Tabla de distribución de
frecuencias

Límites aparentes Límites reales Xi f F fr Fr f% F%


0.2-1.5 0.15-1.55 0.85 17 17 17/50 17/50 34 34
1.6-2.9 1.55-2.95 2.25 11 28 11/50 28/50 22 56
3.0-4.3 2.95-4.35 3.65 7 35 7/50 35/50 14 70
4.4-5.7 4.35-5.75 5.05 6 41 6/50 41/50 12 82
5.8-7.1 5.75-7.15 6.45 4 45 4/50 45/50 8 90
7.2-8.5 7.15-8.55 7.85 3 48 3/50 48/50 6 96
8.6-9.9 8.55-9.95 9.25 2 50 2/50 1 4 100
Representación gráfica
 Es la manera de expresar los datos estadísticos,
utilizando los medios de representación que
proporciona la Geometría.
 Componentes de una gráfica:
◦ Título general
◦ Elementos de referencia con expresión de la variable
representada sobre cada uno.
◦ Fuente de procedencia de los datos representados.
Tipos de gráficos: gráfica de
barras
Barras rectangulares de igual ancho, conservando la
misma distancia de separación entre sí.
Se utiliza básicamente para mostrar y comparar
frecuencias de variables cualitativas.
Pueden ser verticales o en forma horizontal.
Diagrama de barras
Quejas principales de los clientes.
Otros

Descortesía de personal
Quejas principales

Falta de retroalimentación

Repuestos caros

Horarios de atención inadecuados

No cumple plazos establecidos

Ubicación de local inadecuada

Servicio caro

0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00%


Porcentaje de quejas
Diagrama de columnas
Quejas principales de los clientes.
35.00%
Porcentaje de quejas

30.00%

25.00%

20.00%

15.00%

10.00%

5.00%

0.00%

Queja principal
Gráfica de pastel, circulares o
sectores
Se usan para mostrar como una cantidad total se reparte en un grupo de
categorías.
Variables cualitativas en porcentajes o cifras absolutas.
PORCENTAJE DE QUEJAS

Servicio caro Ubicación de local inadecuada


No cumple plazos establecidos Horarios de atención inadecuados
Repuestos caros Falta de retroalimentación
Descortesía de personal Otros
5% 3%
16% 19%

10%

31% 9%
7%
Histograma
Eje horizontal: intervalos de clase (límites reales)
Eje vertical: frecuencias
Rectángulos unidos cuyos anchos son los de los
intervalos de clase.
Variables cuantitativas.
◦ Datos agrupados
Ejemplo 4
Histograma y polígono de frecuencias
Tiempo de transacción bancaria
18 17
número de clientes

16

14

12 11
10

8 7
6
6
4
4 3
2
2
0 0
0

Tiempo de transacción (min)


Polígono de frecuencias
Es un gráfico de líneas trazado sobre las marcas de
clase.
El polígono empieza y termina en el eje horizontal.
Polígono de frecuencias (ejemplo
4)
Polígono de frecuencias
Tiempo por transacción bancaria
18
17
16
14
Número de clientes

12
11
10
8
7
6 6
4 4
3
2 2
0 0 0
0.85 2.25 3.65 5.05 6.45 7.85 9.25
Tiempo promedio por transacción (min) Marcas de clase
Frecuencias acumuladas u
Ojiva
Eje horizontal: límites reales superiores
Eje vertical: frecuencia acumulada
Para el límite inferior de la primera clase la frecuencia acumulada
es cero y para el límite superior de la última clase es igual al total
de datos.
Ojiva ascendente (ejemplo 4)
Ojiva ascendente (menor que)
Tiempo por transacción bancaria

48 50
45
No. de clientes

41
35
28
17

0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tíempo de transacción (min)
Ojiva Descendente (ejemplo 4)
Ojiva descendente (mayor que)
Tiempo por transacción bancaria
60

50 50
No. de clientes

40

30
33

20 22
15
10
9
5
0 2 0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tiempo de transacción (min)
Gráficas lineales
Sirven para representar las series de tiempo, porque reflejan la
dirección del cambio.
Eje horizontal: escala de tiempo

Proyecciones de crecimiento de población


25
Edad de 85 años o más (millones)

20

15

10

0
2010 2020 2030 2040 2050
Año
Gráfica de puntos
Muestra pequeños conjunto de datos cuantitativos.
Eje horizontal: valores de la variable estudiada.
Eje vertical: la frecuencia de aparición de un valor en el conjunto de datos
estudiados.
Pulsaciones por minuto de un grupo de 30 personas.

Potrebbero piacerti anche