Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadstica Descriptiva
Datos en Estadstica
La informacin se rene y almacena en forma electrnica en la mayora de los casos. Los formatos defieren de acuerdo al observador. A menudo es conveniente usar formatos de tabla o de hojas de calculo ya que son compatibles con casi todo el software de anlisis estadstico.
4
Datos en Estadstica
Comnmente, las unidades observadas se colocan en las filas mientras que las columnas representan datos numricos o categricos de una o mas variables y se representan por la letra xi,. Adems se puede asignar a una columna una secuencia o ndice de orden, as como a otros dato de identificacin de unidades.
Ejemplo:
Datos organizados en columnas de la fuerza de tensin de alambres semiconductores. Tabla 1.
Nmero de observacin Fuerza de tensin ( y ) Longitud del alambre ( x1 ) Tensin del troquel ( x2 )
Datos numricos: grfica de puntos y graficas de dispersin. Grfica de puntos Cuando nos interesa una de las variables asociadas con las unidades observadas, los datos se llaman univariados, y las graficas de puntos son tiles en la representacin de dichos datos.
7
Grafica de puntos Estas grficas reflejan extensin, extremos, centros y espacios o separaciones. Para acomodar el rango de los valores de los datos se grada una lnea horizontal. Despus se grafica cada observacin como un punto directamente arriba de esa lnea y en donde mltiples observaciones que tienen el mismo valor simplemente se apilan verticalmente.
8
Ejemplos: Grfica de puntos Tarea 1. (Actividad a realizar tambin en LC ) Realice las grficas de puntos para cada una de las variables mostradas en la tabla 1.
Instrucciones: 1. Haga una grfica de puntos en su cuaderno. 2. Obtenga una grfica de puntos en Minitab 16. a) Obtenga de forma individual cada grfica. b) Obtenga la grfica de puntos para las tres 9 variables.
10
Grfica de dispersin Cuando queremos presentar conjuntamente los resultados de dos variables, el equivalente bivariado de la grfica de puntos se llama grfica de dispersin.
11
Construccin de la Grfica de dispersin Para construir esta grfica trazamos una simple grfica rectangular en un sistema de coordenadas acorde a los datos y asignamos al eje horizontal a una de las variables y al eje vertical a la otra variable. Despus trazamos cada observacin como un punto en ese plano.
12
13
Grficas de dispersin Tarea 2. (Actividad a realizar tambin en LC) Realice las grficas de dispersin de las variables mostradas en la tabla 1.
Instrucciones: 1. Haga una grfica de dispersin en su cuaderno considerando a la variable fuerza de tensin en el eje vertical y a la longitud del alambre en el eje horizontal. 2. Obtenga las grfica de dispersin con Minitab 16 para ambos pares de variables. 3. Obtenga una grfica de dispersin de datos tridimensional en Minitab 16.
14
15
Distribucin de frecuencias: Agrupamiento de datos en categoras mutuamente excluyentes, que indican el nmero de observaciones en cada categora. La distribucin de frecuencias es un resumen de datos ms til que la simple enumeracin de los datos obtenidos en algn experimento.
16
Tabla 2. Resistencia al estallamiento, en libras por pulgada cuadrada (lb/inch2) de 100 botellas de vidrio con capacidad de un litro
17
Los datos anteriores en el formato en el que se encuentran no proporcionan mucha informacin acerca de su resistencia al estallamiento. Preguntas como cul es la resistencia promedio?
o qu porcentaje de botellas estallan antes de las 230 lb/inch2? no son fciles de responder cuando los datos se presentan en esta manera.
18
Distribucin de frecuencias
Distribucin de frecuencias: La distribucin de frecuencia nos permite entonces agrupar los datos y obtener informacin que nos permitir responder preguntas como las anteriores y algunas otras que surgen en la investigacin de algn fenmeno.
19
20
Terminologa de las Tablas de Distribucin de frecuencias Limites de clase: Cada clase de una Tabla de distribucin de frecuencia est delimitada por el lmite inferior de la clase ak y el lmite superior de la clase bk. En una distribucin de frecuencias agrupadas el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
21
Terminologa de las Tablas de Distribucin de frecuencias Punto medio de clase o marca de clase: Es un punto que divide el intervalo en dos partes iguales. Es el promedio entre el lmite inferior y el limite superior del intervalo de clase, se identifica con la letra X. Frecuencia de clase: El nmero de observaciones en cada clase se identifica con la letra f. Intervalo de clase: El intervalo de clase es obtenido restando el lmite inferior de una clase del lmite inferior de la siguiente clase, o restando el lmite inferior de una clase de el lmite superior de la misma clase. se identifica con la letra c
22
Distribucin de frecuencias
23
Nmero de clases k
Si se dispone de n datos muestrales, se suele usar la regla de Sturges: k = [3.3 log n] + 1 Ejemplo: Para n = 1000, usar: k = [3.3 log n] + 1 = [3. 3 3] + 1 = 9.9 + 1 = 11 clases
24
muestrales
estn
x1, x2, . . . , xn
entonces el rango de las clases es de:
R = max xi min xi
25
Intervalo de clases c
estn
x1, x2, . . . , xn
entonces el intervalo de las clases es de:
27
Clase
Lmites
marcas de clase
28
Ejemplo
El Dr. Yez es director de una Escuela de Negocios en la Universidad de Mxico. l desea preparar un resumen mostrando el nmero de horas por semana que los estudiantes emplean en el estudio. Selecciona una muestra de 30 estudiantes y determina el nmero de horas que cada alumno estudi en la ltima semana. 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6 Organice los datos en una distribucin de frecuencias.
29
Ejemplo (Continuacin) Si se dispone de n datos muestrales, se suele usar la regla de Sturges: k = [3.3 log n] + 1 Ejemplo: Para n = 30, usar: k = [3.3 log n] + 1= [3.3 1.4771] + 1 = 4.8745 + 1 = 5.8745 k 6 clases
30
Ejemplo (Continuacin) El rango es de 23.5 horas, restando min xi =10.3 de max xi = 33.8 horas.R = max xi min xi = 10.3 33.8 Intervalo de clase
Ejemplo (Continuacin)
Las clases quedan entonces:
Clase A1 A2 A3 A4 A5 A6 Tiempo de estudio en horas De 10.3 a menos de 14.3 De 14.3 a menos de 18.3 De 18.3 a menos de 22.3 De 22.3 a menos de 26.3 De 26.3 a menos de 30.3 De 30.3 a menos de 34.3
32
Ejemplo (Continuacin)
Las clases quedan entonces:
Clase A1 A2
Observacin: La clase A1 indica que se incluyen los valores de la variable bajo estudio mayores o iguales que 10.3 pero menores de 14.3 esto es:
Ejemplo(Continuacin)
Una vez determinadas las clases se contina con el conteo de los datos, este conteo recibe el nombre de frecuencia de clase. La frecuencia de clase la podemos definir como la cantidad de veces que un dato cae en una clase. Estas clases son mutuamente excluyentes.
Clase A1 A2 A3 A4 A5 A6 Tiempo de estudio en horas De 10.3 a menos de 14.3 De 14.3 a menos de 18.3 De 18.3 a menos de 22.3 De 22.3 a menos de 26.3 De 26.3 a menos de 30.3 De 30.3 a menos de 34.3 Frecuencia f 7 7 9 4 2 1
34
Distribucin de frecuencias
( max xi min xi ) c= k
35
Use el clculo obtenido como sugerencia del ancho del intervalo en la construccin de la distribucin de frecuencias. Nota: Esto es un ancho del intervalo de clase sugerido; si el clculo obtenido es 97, puede ser mejor usar 100. Cuente el nmero de valores en cada clase apoyndose del conteo tradicional de los reclusos.
36
Ejemplo (Continuacin)
37
10.3 - 14.3 14.3 - 18.3 18.3 - 22.3 22.3 - 26.3 26.3 - 30.3 30.3 - 34.3
Total
7 7 9 4 2 1
30
4/30 = 0.1333 = 13.33 % 2/30 = 0.0666 = 6.66 % 1/30 = 0.0333 = 3.33 % 30/30 = 1.000 = 100 %
38
40
41
42
43
44
Tarea 6 Para los datos mostrados en la tabla 2 construya en su cuaderno una distribucin de frecuencias, incluyendo: a) Clases, limites, marcas de clase, frecuencia, frecuencia relativa, frecuencia acumulada. b) Construya un histograma, un polgono de frecuencias y una ojiva.
45
46
Ejemplo
86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya un diagrama de tallo y hojas.
47
Ejemplo 2 (Continuacin)
rbol 6 7 8 9
Hojas 9 8 9 2 3 4 5 6 8 1 2 6
48
Grfica de barras
Una grfica de barras es especialmente til para mostrar cualquiera de los niveles de medicin: nominal, ordinal, de intervalo o de razn.
49
Tarea 7
Construya un diagrama de barras en Minitab para el nmero de empleados de una compaa de que tiene 6 plantas en diferentes ciudades del mundo en el 2012. Ciudad Nmero de empleados por ciudad
7300 5400 6700 8900 8200 8900
50
51
Un diagrama tipo pastel es til para mostrar la distribucin de frecuencias relativas. Un crculo es dividido proporcionalmente a las frecuencias relativas y las porciones del crculo estn ubicadas para los diferentes grupos.
52
Tarea 8
A una muestra de 200 corredores se le pregunt su tipo de zapato tenis favorito. Elabore un diagrama tipo pastel en base a la siguiente informacin.
No. de corredores 92 49 37 13 9
53
54