Sei sulla pagina 1di 54

Tema :

Estadstica Descriptiva

Descripcin de los datos, distribuciones de frecuencias y representaciones grficas


Objetivos: Al terminar podr: 1. 2. 3. 4. 5. Presentar datos en forma grfica mediante graficas de puntos y de dispersin. Organizar los datos en una distribucin de frecuencias. Presentar una distribucin de frecuencias en un histograma, un polgono de frecuencias y ojivas. Elaborar e interpretar una representacin de tallo y hoja. Presentar datos utilizando tcnicas de graficacin como grficas de lneas, grficas de barras y grficas circulares.

Panorama general de Estadstica Descriptiva

Datos en Estadstica

La informacin se rene y almacena en forma electrnica en la mayora de los casos. Los formatos defieren de acuerdo al observador. A menudo es conveniente usar formatos de tabla o de hojas de calculo ya que son compatibles con casi todo el software de anlisis estadstico.
4

Datos en Estadstica

Comnmente, las unidades observadas se colocan en las filas mientras que las columnas representan datos numricos o categricos de una o mas variables y se representan por la letra xi,. Adems se puede asignar a una columna una secuencia o ndice de orden, as como a otros dato de identificacin de unidades.

Ejemplo:
Datos organizados en columnas de la fuerza de tensin de alambres semiconductores. Tabla 1.
Nmero de observacin Fuerza de tensin ( y ) Longitud del alambre ( x1 ) Tensin del troquel ( x2 )

Presentacin grfica de la informacin

Datos numricos: grfica de puntos y graficas de dispersin. Grfica de puntos Cuando nos interesa una de las variables asociadas con las unidades observadas, los datos se llaman univariados, y las graficas de puntos son tiles en la representacin de dichos datos.
7

Presentacin grfica de la informacin

Grafica de puntos Estas grficas reflejan extensin, extremos, centros y espacios o separaciones. Para acomodar el rango de los valores de los datos se grada una lnea horizontal. Despus se grafica cada observacin como un punto directamente arriba de esa lnea y en donde mltiples observaciones que tienen el mismo valor simplemente se apilan verticalmente.
8

Presentacin grfica de la informacin

Ejemplos: Grfica de puntos Tarea 1. (Actividad a realizar tambin en LC ) Realice las grficas de puntos para cada una de las variables mostradas en la tabla 1.
Instrucciones: 1. Haga una grfica de puntos en su cuaderno. 2. Obtenga una grfica de puntos en Minitab 16. a) Obtenga de forma individual cada grfica. b) Obtenga la grfica de puntos para las tres 9 variables.

Presentacin grfica de la informacin

Ejemplos: Grfica de puntos

10

Presentacin grfica de la informacin

Grfica de dispersin Cuando queremos presentar conjuntamente los resultados de dos variables, el equivalente bivariado de la grfica de puntos se llama grfica de dispersin.

11

Presentacin grfica de la informacin

Construccin de la Grfica de dispersin Para construir esta grfica trazamos una simple grfica rectangular en un sistema de coordenadas acorde a los datos y asignamos al eje horizontal a una de las variables y al eje vertical a la otra variable. Despus trazamos cada observacin como un punto en ese plano.
12

Presentacin grfica de la informacin

Ejemplos: Grficas de dispersin

13

Presentacin grfica de la informacin

Grficas de dispersin Tarea 2. (Actividad a realizar tambin en LC) Realice las grficas de dispersin de las variables mostradas en la tabla 1.
Instrucciones: 1. Haga una grfica de dispersin en su cuaderno considerando a la variable fuerza de tensin en el eje vertical y a la longitud del alambre en el eje horizontal. 2. Obtenga las grfica de dispersin con Minitab 16 para ambos pares de variables. 3. Obtenga una grfica de dispersin de datos tridimensional en Minitab 16.

14

Presentacin grfica de la informacin

Ejemplos: Grficas de dispersin

15

Distribucin de frecuencias y el histograma

Distribucin de frecuencias: Agrupamiento de datos en categoras mutuamente excluyentes, que indican el nmero de observaciones en cada categora. La distribucin de frecuencias es un resumen de datos ms til que la simple enumeracin de los datos obtenidos en algn experimento.

16

Distribucin de frecuencias y el histograma

Por ejemplo suponga que se tienen los siguientes datos

Tabla 2. Resistencia al estallamiento, en libras por pulgada cuadrada (lb/inch2) de 100 botellas de vidrio con capacidad de un litro

17

Distribucin de frecuencias y el histograma

Los datos anteriores en el formato en el que se encuentran no proporcionan mucha informacin acerca de su resistencia al estallamiento. Preguntas como cul es la resistencia promedio?
o qu porcentaje de botellas estallan antes de las 230 lb/inch2? no son fciles de responder cuando los datos se presentan en esta manera.
18

Distribucin de frecuencias

Distribucin de frecuencias: La distribucin de frecuencia nos permite entonces agrupar los datos y obtener informacin que nos permitir responder preguntas como las anteriores y algunas otras que surgen en la investigacin de algn fenmeno.

19

Elementos Bsicos de una Tabla de Distribucin de frecuencias Clase Lmites Relacin

20

Terminologa de las Tablas de Distribucin de frecuencias Limites de clase: Cada clase de una Tabla de distribucin de frecuencia est delimitada por el lmite inferior de la clase ak y el lmite superior de la clase bk. En una distribucin de frecuencias agrupadas el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

21

Terminologa de las Tablas de Distribucin de frecuencias Punto medio de clase o marca de clase: Es un punto que divide el intervalo en dos partes iguales. Es el promedio entre el lmite inferior y el limite superior del intervalo de clase, se identifica con la letra X. Frecuencia de clase: El nmero de observaciones en cada clase se identifica con la letra f. Intervalo de clase: El intervalo de clase es obtenido restando el lmite inferior de una clase del lmite inferior de la siguiente clase, o restando el lmite inferior de una clase de el lmite superior de la misma clase. se identifica con la letra c
22

Distribucin de frecuencias

Clasificacin en clases A1, A2, . . . ,Ak : Clases

23

Nmero de clases k

Si se dispone de n datos muestrales, se suele usar la regla de Sturges: k = [3.3 log n] + 1 Ejemplo: Para n = 1000, usar: k = [3.3 log n] + 1 = [3. 3 3] + 1 = 9.9 + 1 = 11 clases
24

Rango de las clases R

Si los datos representados por:

muestrales

estn

x1, x2, . . . , xn
entonces el rango de las clases es de:

R = max xi min xi

25

Intervalo de clases c

Si los datos muestrales representados por:

estn

x1, x2, . . . , xn
entonces el intervalo de las clases es de:

( max xi min xi ) R c= = k (3.3 log n + 1)


26

27

Clase

Lmites

marcas de clase

28

Ejemplo
El Dr. Yez es director de una Escuela de Negocios en la Universidad de Mxico. l desea preparar un resumen mostrando el nmero de horas por semana que los estudiantes emplean en el estudio. Selecciona una muestra de 30 estudiantes y determina el nmero de horas que cada alumno estudi en la ltima semana. 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6 Organice los datos en una distribucin de frecuencias.

29

Ejemplo (Continuacin) Si se dispone de n datos muestrales, se suele usar la regla de Sturges: k = [3.3 log n] + 1 Ejemplo: Para n = 30, usar: k = [3.3 log n] + 1= [3.3 1.4771] + 1 = 4.8745 + 1 = 5.8745 k 6 clases

30

Ejemplo (Continuacin) El rango es de 23.5 horas, restando min xi =10.3 de max xi = 33.8 horas.R = max xi min xi = 10.3 33.8 Intervalo de clase

(max xi min xi ) 33.8 10.3 c= = = 3.9166 k 6


Tomamos c=4 El lmite inferior de la primera clase es 10.3 (min xi) La primera marca de clase es (10.3+14.3)/2=12.3
31

Ejemplo (Continuacin)
Las clases quedan entonces:
Clase A1 A2 A3 A4 A5 A6 Tiempo de estudio en horas De 10.3 a menos de 14.3 De 14.3 a menos de 18.3 De 18.3 a menos de 22.3 De 22.3 a menos de 26.3 De 26.3 a menos de 30.3 De 30.3 a menos de 34.3

32

Ejemplo (Continuacin)
Las clases quedan entonces:
Clase A1 A2
Observacin: La clase A1 indica que se incluyen los valores de la variable bajo estudio mayores o iguales que 10.3 pero menores de 14.3 esto es:

Tiempo de estudio en horas De 10.3 a menos de 14.3 De 14.3 a menos de 18.3

10.3 x < 14.3


33

Ejemplo(Continuacin)
Una vez determinadas las clases se contina con el conteo de los datos, este conteo recibe el nombre de frecuencia de clase. La frecuencia de clase la podemos definir como la cantidad de veces que un dato cae en una clase. Estas clases son mutuamente excluyentes.
Clase A1 A2 A3 A4 A5 A6 Tiempo de estudio en horas De 10.3 a menos de 14.3 De 14.3 a menos de 18.3 De 18.3 a menos de 22.3 De 22.3 a menos de 26.3 De 26.3 a menos de 30.3 De 30.3 a menos de 34.3 Frecuencia f 7 7 9 4 2 1
34

Distribucin de frecuencias

Sugerencias en la construccin de la distribucin de frecuencias


El intervalo o amplitud de las clases debe ser el mismo para todas ellas. Determine el intervalo o amplitud usando la siguiente frmula:

(valor ms alto valor ms bajo) c= nmero de clases

( max xi min xi ) c= k

35

Sugerencias en la construccin de la distribucin de frecuencias

Use el clculo obtenido como sugerencia del ancho del intervalo en la construccin de la distribucin de frecuencias. Nota: Esto es un ancho del intervalo de clase sugerido; si el clculo obtenido es 97, puede ser mejor usar 100. Cuente el nmero de valores en cada clase apoyndose del conteo tradicional de los reclusos.
36

Ejemplo (Continuacin)

Una distribucin de frecuencias relativas muestra el porcentaje de observaciones en cada clase.


Frecuencia de clase f fr = 100% = 100% Suma de todas las frecuencias n

37

Distribucin de frecuencias relativas


Clase A1 A2 A3 A4 A5 A6
Horas en estudio Frecuencia, f Frecuencia relativa 7/30 = 0.2333 = 23.33 % 7/30 = 0.2333 = 23.33 % 9/30 = 0.3 = 30 %

10.3 - 14.3 14.3 - 18.3 18.3 - 22.3 22.3 - 26.3 26.3 - 30.3 30.3 - 34.3
Total

7 7 9 4 2 1
30

4/30 = 0.1333 = 13.33 % 2/30 = 0.0666 = 6.66 % 1/30 = 0.0333 = 3.33 % 30/30 = 1.000 = 100 %

38

Presentacin de una distribucin de frecuencias en grficas


Las tres grficas ms comunes son: histograma, polgono de frecuencias y distribucin de frecuencias acumuladas. Un histograma es una grfica en la cual los intervalos de clase se sealan en el eje horizontal, y las frecuencias de clase en el eje vertical. Las frecuencias de clase son representadas por barras de diferente altura y stas se colocan una junto a otra.
39

Histograma para horas empleadas en estudiar


Tarea 3. a) Construya para los datos del Dr. Yez un Histograma en su cuaderno. b) Construya en Minitab un Histograma

40

Presentacin de una distribucin de frecuencias en grficas


Un polgono de frecuencias consiste en segmentos de lnea conectados a travs de los puntos medios (marcas de clase) de clase en cada intervalo de clase.

41

Polgono de frecuencias para horas empleadas en estudiar


Tarea 4. a) Construya para los datos del Dr. Yez un polgono de frecuencias en su cuaderno. b) Con el histograma que realizo en Minitab haga una copia en Word y realice el polgono de frecuencias usando la insercin de lneas

42

Presentacin de una distribucin de frecuencias en grficas


Una distribucin de frecuencias acumulada (ojiva) es utilizada para determinar cuntos o qu proporcin de los datos estn por arriba o por debajo de cierto valor.

43

Distribucin de frecuencias acumuladas (ojiva) para horas en estudio


Tarea 5. a) Construya para los datos del Dr. Yez una ojiva en su cuaderno. b) Con el histograma configurado para mostrar porcentajes acumulativos que realizo en Minitab haga una copia en Word y realice la ojiva usando la insercin de lneas

44

Tarea 6 Para los datos mostrados en la tabla 2 construya en su cuaderno una distribucin de frecuencias, incluyendo: a) Clases, limites, marcas de clase, frecuencia, frecuencia relativa, frecuencia acumulada. b) Construya un histograma, un polgono de frecuencias y una ojiva.

45

Representacin de tallo y hoja


Representacin de tallo y hoja: Es una tcnica estadstica que muestra un conjunto de datos. Cada valor numrico se divide en dos partes: los dgitos principales se toman como el tallo, y el dgito siguiente es la hoja. Los tallos se ubican a lo largo del eje vertical principal, y las hojas de cada observacin, a lo largo del eje horizontal. Nota: Una ventaja de esta representacin sobre la distribucin de frecuencias es que no se pierde la identidad de cada observacin.

46

Ejemplo

Coln obtuvo las siguientes calificaciones en doce pruebas de este semestre:

86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya un diagrama de tallo y hojas.
47

Ejemplo 2 (Continuacin)

rbol 6 7 8 9

Hojas 9 8 9 2 3 4 5 6 8 1 2 6

48

Grfica de barras

Una grfica de barras es especialmente til para mostrar cualquiera de los niveles de medicin: nominal, ordinal, de intervalo o de razn.

49

Tarea 7
Construya un diagrama de barras en Minitab para el nmero de empleados de una compaa de que tiene 6 plantas en diferentes ciudades del mundo en el 2012. Ciudad Nmero de empleados por ciudad
7300 5400 6700 8900 8200 8900
50

Atlanta Madrid Caracas Lima Mxico New York

Diagrama de barras para empleados por ciudad

51

Diagrama tipo pastel

Un diagrama tipo pastel es til para mostrar la distribucin de frecuencias relativas. Un crculo es dividido proporcionalmente a las frecuencias relativas y las porciones del crculo estn ubicadas para los diferentes grupos.

52

Tarea 8
A una muestra de 200 corredores se le pregunt su tipo de zapato tenis favorito. Elabore un diagrama tipo pastel en base a la siguiente informacin.

Tipo de zapato Nike Adidas Reebok Asics Otros

No. de corredores 92 49 37 13 9
53

Diagrama tipo pastel para zapato tenis

54

Potrebbero piacerti anche