Sei sulla pagina 1di 59

Anlisis de Datos I

Unidad 1: Introduccin y Estadstica


Descriptiva

Clase: Organizacin y representacin de datos


II Semestre de 2017

27 de enero de 2014
Unidad 1
Introduccin
Definicin y trminos bsicos de la estadstica
Papel de la estadstica en la ingeniera y en la ciencia
Estadstica descriptiva e inferencial
Estadstica descriptiva

Organizacin de datos
Tipos de datos y escalas de medicin usados en estadstica
Organizacin de datos mediante tablas
Representacin grfica de datos (e.g., histograma, barras, circulas)
Anlisis de datos univariados
Medidas de tendencia central o de centralizacin
Medidas de localizacin
Medidas de dispersin o variabilidad
Medidas de forma
Tendencia central y dispersin para datos contenidos en tablas de frecuencia
Estandarizacin de datos, datos extremos, diagramas de cajas
27 de enero de 2014
Unidad 1

Estadstica descriptiva

Organizacin de datos
Tipos de datos y escalas de medicin usados en estadstica
Organizacin de datos mediante tablas
Representacin grfica de datos (e.g., histograma, barras, circulas)

Estadstica.
Richard C. Weimer.
Editorial CECSA.
27 de enero de 2014
Organizacin de datos
Tipos de datos

Cualitativos Colores
(Cualidades, Gnero
categoras o Sexo
atributos)
Datos
Discretos Nmero de hijos
(Unidades Pginas de un libro
Cuantitativos Completas)
(Medibles Temperatura
numricamente) Continuos Peso
(Valor en Talla
un rango) Tiempo

27 de enero de 2014
Organizacin de datos
Escalas de medicin
Las escalas de medicin indican qu clculos y pruebas
estadsticas se pueden realizar para resumir y presentar los datos.
1. Nominal: son datos que se etiquetan o nombran. Se utilizan para
datos cualitativos (tipos de autos, gnero, colores, etc.).
- Las observaciones se pueden clasificar o contar.
- No existe un orden particular para las clases o categoras.
- Operaciones matemticas, ni relaciones tienen sentido.
- nica medida es la moda.
2. Ordinal: son datos medidos en una escala nominal, pero ordenada
de alguna manera (calificaciones por letra, grados de escuela).
- Se pueden establecer relaciones de orden (mayor, menor) y
contar elementos.
- Operaciones matemticas no tienen sentido.
- No es posible medir distancia entre valores. 27 de enero de 2014
Organizacin de datos
Escalas de medicin
3. De intervalo: son datos medidos en una escala ordinal, pero de
tipo cuantitativo (puntajes de inteligencia, temperaturas, fechas).
- La distancia entre valores tiene sentido (suma, resta), pero no
establecer razones.
- Una escala de intervalo no siempre tiene un punto cero que
indique ausencia de lo que se quiere medir (escala Celsius).

4. De razn: son datos medidos en una escala de intervalo (distancia,


peso, dinero), pero:
- El punto cero significa ninguno, es decir, ausencia de
medida (escala Kelvin).
- Distancia entre valores tiene sentido, y se pueden establecer
razones entre valores (velocidad, tiempo, peso, dinero, etc.).
27 de enero de 2014
Organizacin de datos
Ejemplos: Indicar tipo de dato y escala de medicin

a) Juan cultiv un pepino que midi 4 pulgadas de largo.


Cuantitativo De razn

b) Juan est en el cuarto grado.


Cualitativo Ordinal

c) Juan registr la temperatura como 4 Celsius.


Cuantitativo De intervalo

d) El nmero de la camiseta de ftbol de Juan es el 4.


Cualitativo Nominal

27 de enero de 2014
Organizacin y representacin de datos
Tipos de tablas o distribuciones de frecuencia

1. No agrupadas (Datos cualitativos, y cuantitativos discretos


cuando el rango de valores no es muy amplio).

2. Agrupadas (Cuantitativos continuos, y discretos cuando el rango


de valores es muy amplio).

3. Acumuladas (Cuantitativos).

4. Bivariadas (Cualitativos).

27 de enero de 2014
Organizacin y representacin de datos
Tipos de grficos
1. Diagrama de barras univariados y bivariados, circular (Datos
cualitativos y cuantitativos discretos de tablas no agrupadas).
2. Diagrama de puntos (Datos cuantitativos discretos de tablas no
agrupadas)
3. Histograma (Datos cuantitativos de tablas agrupadas o no
agrupadas).
4. Polgono (Datos cuantitativos de tablas agrupadas o no agrupadas).
5. Ojiva (Datos cuantitativos de tablas acumuladas).
6. Diagrama de tallo y hojas (Datos cuantitativos).
7. Diagrama de Pareto (Datos cualitativos).
8. Diagrama de cajas y bigotes (Datos cuantitativos).
27 de enero de 2014
Organizacin y representacin de datos
Caso 1: Tabla o distribucin de frecuencias no agrupadas
Ejemplo 1: (Datos cualitativos)
Se pidi a un grupo de clientes de un banco clasificar la atencin
prestada como excelente (E), buena (B), regular (R) ,o mala (M). Los
resultados se muestran a continuacin:

Construya una tabla de frecuencias no agrupadas.

27 de enero de 2014
Organizacin y representacin de datos
Caso 1: Tabla o distribucin de frecuencias no agrupadas
Ejemplo 1: (Datos cualitativos)

Donde f : frecuencia absoluta o frecuencia que representa el


nmero de veces que aparece un dato.
f
f r : frecuencia relativa, f r n
% : Porcentaje, % f r *100%
27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 1: (Diagrama de barras)

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 1: (Diagrama circular)


Se asume que el nmero total de datos se distribuye de manera
uniforme en un giro completo (360). Luego se determina qu ngulo
ocupa cada categora de acuerdo con su frecuencia absoluta.

Calificacin f Angulo 360* f n %


E 5 45 12,5
B 17 153 42,5
R 10 90 25
M 8 72 20
Total (n) 40 360 100

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 1: (Diagrama circular)

27 de enero de 2014
Organizacin y representacin de datos
Caso 2: Tabla o distribucin de frecuencias no agrupadas
Ejemplo 2: (Datos cuantitativos discretos)
Al final de un semestre se contabiliz el nmero de fallas de un grupo
de estudiantes en una asignatura, los resultados se muestran a
continuacin:

Construya una tabla de frecuencias no agrupadas.

27 de enero de 2014
Organizacin y representacin de datos
Caso 2: Tabla o distribucin de frecuencias no agrupadas
Ejemplo 2: (Datos cuantitativos discretos)

27 de enero de 2014
Organizacin y representacin de datos
Caso 2: Tabla o distribucin de frecuencias no agrupadas
Ejemplo 2: (Datos cuantitativos discretos)

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 2: (Diagrama de puntos)

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 2: (Diagrama de barras)

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 2: (Histograma)

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 2: (Polgono de frecuencias o grfico lineal)

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3:
Los clculos en millas por galn en 50 cargas del tanque de cierto
tipo de automvil nuevo se resumen en la siguiente tabla. A partir de
esa tabla construya una tabla agrupada (frecuencias absolutas,
relativas, y en porcentajes).

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3:
1. Se determina el nmero de clases C a utilizar.
Acuerdos: Utilizar la Ley de Sturges: C = (3,3 * log n) + 1 y aproximar
al entero ms cercano. n es el nmero de datos a agrupar.
Para n = 50, se obtiene C = 6,606 7.
2. Se calcula el rango R.
R = Dato mayor Dato menor = 38,6 20,5 = 18,1.
3. Se determina la precisin P, P = 0,1.
Nota: la precisin la determina el instrumento de medicin
dependiendo del nmero de cifras decimales que maneje, as:

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3:
4. Se calcula la amplitud A.
Acuerdo: Siempre vamos a aproximar por arriba, teniendo en cuenta
la precisin.
R 18,1
A 2,5857
C 7
Para entender mejor: si la precisin fuera: (i) enteros A = 3; (ii) con
una cifra decimal A = 2,6; (iii) con dos cifras A = 2,59; (iv) con tres
cifras A = 2,586, con cuatro cifras A = 2,5857
En este caso P = 0,1; entonces A = 2,6.

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3:
5. Se calculan lmites tericos (Lmites de clase) y lmites
prcticos (Fronteras de clase) para las clases.
Lmites para la primera clase sern:
Lmite inferior: LI1 Dato menor 20,5.
Lmite superior: LS1 LI1 A P 20,5 2, 6 0,1 23.
Frontera inferior: FI1 LI1 P 2 20,5 0, 05 20, 45.
Frontera superior: FS1 LS1 P 2 23 0, 05 23, 05.
Lmites para las siguientes clases sern:
LI i LI i 1 A LSi LSi 1 A
FI i FI i 1 A FSi FSi 1 A
27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Caractersticas de las tablas agrupadas
1. Uniformidad: todas las clases deben tener la misma amplitud.
2. Unicidad: las clases no deben traslaparse.
3. Completez: cada dato debe pertenecer a alguna clase.

Notas
1. Si la ltima clase queda sin datos se puede eliminar
2. Si usted no sigue el acuerdo para el clculo de la amplitud, es
posible que los datos mayores no pertenezcan a ninguna clase,
En este caso anexe otra clase que cumpla con las tres
propiedades anteriores.

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3:

mi : Es el punto medio de cada clase, se denomina marca de clase.


27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3: (Histograma)

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3: (Polgono)

27 de enero de 2014
Dudas?

Claridad en cmo construir e interpretar conceptos


claves en las Tablas agrupadas

27 de enero de 2014
Dudas?
Tabla o distribucin de frecuencias agrupadas
Ejemplo 3:

A
mi FI , FS
P
27 de enero de 2014
Organizacin y representacin de datos
QUIZ
Calcular lmites y fronteras de las dos primeras clases P 0,1

Lmites para la primera clase:


LI1 Dato menor
LS1 LI1 A P
FI1 LI1 P 2
FS1 LS1 P 2

Lmites para las siguientes clases :


LI i LI i 1 A LI i LSi
mi
LSi LSi 1 A 2
FI i FI i 1 A FI i FSi
mi
FSi FSi 1 A 2
27 de enero de 2014
Resumen Clase: Organizacin de datos
Tipos de datos Escalas de medicin

Datos
Nominal Cualitativo y
Cualitativos Cuantitativos Ordinal cuantitativos

Continuos De intervalo
Discretos
(Proceso de (Proceso de De razn Cuantitativos
conteo) medicin)

Tipos de tablas Tipos de grficos


(para reportar frecuencias absolutas y/o relativas) Barras
Circular
No agrupadas Agrupadas De puntos
(resumir gran Polgono
cantidad de datos) Histogramas
27 de enero de 2014
Resumen Clase: Organizacin de datos
Barras Circular
Histograma

De puntos Polgono

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias acumuladas
Ejemplo 2: (Nmero de fallas) Datos cuantitativos

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias acumuladas
Ojiva para Ejemplo 2: (Nmero de fallas)

Ojiva: Construida a travs de una tabla de frecuencia o tabla de


frecuencia relativa acumulada.
27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias acumuladas
Ejemplo 3: (Rendimiento)

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias acumuladas
Ojiva para Ejemplo 3: (Rendimiento)

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias Bivariadas
Ejemplo 4: (Datos cualitativos)
La siguiente tabla muestra los resultados de una prueba de
conocimientos a un grupo de empleados de tres compaas A, B, C. Los
resultados se clasificaron como excelente(E), bueno (B),regular (R),
malo(M). Construya una tabla de frecuencias Bivariadas.

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias Bivariadas
Ejemplo 4: (Datos cualitativos)

Calcular el porcentaje de los empleados:


1. Que tienen un desempeo excelente.
2. Que son de la compaa A.
3. De la compaa A, que tienen un desempeo excelente.
4. Con mal desempeo, que pertenece a la compaa B.
5. Que son de la compaa C y tienen un desempeo bueno.
27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias Bivariadas
Ejemplo 4: Diagrama de barras bivariadas

27 de enero de 2014
Organizacin y representacin de datos
Tabla o distribucin de frecuencias Bivariadas
Ejemplo 4: Diagrama de barras bivariadas

27 de enero de 2014
Ejercicio

Empleados/Opinin A favor En contra Total


Estudiantes 252 139 391
Profesores 107 81 188
Administrativos 43 40 83
Total 402 260 662

27 de enero de 2014
Quiz

titular

c) Qu tanto por ciento de los profesores titulares, estn a favor del contrato
colectivo?

Cuntos
profesores titulares?
f) Qu porcentaje del total de los acadmicos representan los profesores
(considere todas las categoras de profesores), que estn a favor del contrato?
27 de enero de 2014
Quiz

titular

27 de enero de 2014
Organizacin y representacin de datos

Diagrama de Tallo y Hojas


Una tabla de frecuencias agrupadas tiene una desventaja obvia:
los datos originales se pierden en el proceso de agrupamiento.

Los diagramas de tallo y hojas ofrecen una forma novedosa y


rpida de exhibir informacin numrica sin perder la informacin
de los datos. Cada dato se descomponen en un tallo y una hoja.
Por ejemplo, el nmero 278 se puede descomponer en dos
formas:

27 de enero de 2014
Organizacin y representacin de datos

Diagrama de Tallo y Hojas (sin ordenar)

27 de enero de 2014
Organizacin y representacin de datos
Diagrama de Tallo y Hojas (ordenado)

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 5: (Diagrama de Tallo y Hojas)


Una de las principales formas de medir la calidad del servicio que
proporciona una organizacin es evaluar la rapidez con la que responde
a las quejas de los clientes. Una empresa de telfonos obtuvo 50 quejas
en el ltimo mes. Los datos siguientes representan el nmero de das
entre el recibimiento de la queja y su solucin. Construya un diagrama
de tallo y hojas.

27 de enero de 2014
Organizacin y representacin de datos

Ejemplo 5: (Diagrama de Tallo y Hojas)

27 de enero de 2014
Organizacin y representacin de datos
El diagrama de Pareto

- En un proceso de decisin, permite asignar un orden prioridades


a las no conformidades identificadas.

- Grfico que permite mostrar el principio de Pareto:


Pocos vitales, muchos triviales!

- 20% de las causas representan el 80% de los problemas


27 de enero de 2014
Organizacin y representacin de datos
Cmo elaborar diagramas de Pareto

27 de enero de 2014
Organizacin y representacin de datos
Cmo elaborar diagramas de Pareto

27 de enero de 2014
Organizacin y representacin de datos
Cmo elaborar diagramas de Pareto

27 de enero de 2014
Organizacin y representacin de datos
Cmo elaborar diagramas de Pareto

27 de enero de 2014
Organizacin y representacin de datos
Cmo elaborar diagramas de Pareto

27 de enero de 2014
Organizacin y representacin de datos
Cmo elaborar diagramas de Pareto

Def. C Def. B Def. D Def. A Def. E


27 de enero de 2014
Organizacin y representacin de datos
Ejercicio: Elabore un diagrama de Pareto con los
siguientes datos:

27 de enero de 2014
Anlisis de Datos I
Unidad 1: Introduccin y Estadstica
Descriptiva

Clase: Organizacin y representacin de datos


I Semestre de 2017

27 de enero de 2014

Potrebbero piacerti anche