Sei sulla pagina 1di 39

NOMBRE: IVON ARCE MORALES

CARRERA: LICENCIATURA INFORMATICA ADMINISTRATIVA

NIVEL: SEXTO CUATRIMESTRE

MATERIA: ESTADISTICA

PROFESOR: ING. JOSE ZENA.

PROYECTO: EXPLICACION DEL FUNCIONAMIENTO DE LA ESTADISTICA CON EJEMPLOS APLICADOS.

Tabla de contenido Introduccin....3 Desarrollo La estadstica..4 Frecuencia Absoluta, Acumulada, Relativa....9 Diagramas de barras e histogramas...12 Tipos de grficos......14 Calculo de media, mediana y lo moda....19 La varianza......27 Desviacin Estndar........31 Coeficiente de Variacin........34 Los cuartiles......35 Conclusin.........39 Anexos Ejercicios y problemas de Estadstica I y II...40

Introduccin

Hablar de estadstica es hablar de datos sobre un fenmeno, acontecimiento, situacin; dichos datos recopilados, organizados y resumidos para ser analizados, nos ayudan de cierta forma a conocer o a entender y reconocer diversas situaciones, en la vida. La estadstica nos puede hablar de posibilidades, promedios, nos muestra de manera grfica comportamientos, hechos en apariencia separados. La estadstica los puede agrupar si muestran caractersticas semejantes, si somos fabricantes, maquiladores, cocineros, podemos observar la frecuencia de errores en nuestro trabajo, la eficiencia de nuestro negocio, el promedio de productos fabricados por da, tantos fenmenos-hechos ocurridos en nuestro trabajo, los podemos visualizar de manera representativa gracias a la estadstica. Observar, analizar y obtener respuestas eso buscamos como seres humanos.

La estadstica La estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado ya sea de ocurrencia de forma aleatoria o condicionar en otras palabras es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Clasificacin de la estadstica Dependiendo de cmo se realizan los datos, la estadstica se clasifica como: estadstica descriptiva. La cual es una rama que trata sobre la descripcin, anlisis estadstico de una poblacin, que resume y presume de los datos obtenidos de la poblacin o de una muestra esta tiene como objetivo caracterizar; la estadstica descriptiva es la que d se dedica analizar, representar los datos (anlisis muy bsicos). Estadstica Inferencial: Rama de la estadstica que estudia el comportamiento, propiedades de las muestras, la posibilidad y lmite de la generalizacin de los resultados obtenidos a partir de aquella poblacin a la que se representa a esta estadstica. Tambin se le llama estadstica matemtica teniendo como objetivo general el generalizar las propiedades de la poblacin bajo estudio basndose en los resultados de una muestra representativa de la poblacin. Variables Estadsticas Variable Cuantitativa: La variable cuantitativa se refiere a caractersticas o cualidades que no pueden ser medidos con nmeros, de los cuales podemos distinguir dos tipos: Variable Cuantitativa normal: Esta es una modalidad no numrica que no admite un criterio de orden. Variable cualitativa ordinal o variable cualitativa, esta es una variable no numrica en la cual si existe el orden. Variable Cuantitativa: Es una variable cuantitativa es la que se expresa mediante un numero por lo tanto se pueden realizar operaciones aritmticas con ellas y estos pueden ser distinguidos por 2 tipos.

Variable Discreta: Una variable discreta es aquella que toma valores a su lado, es decir, no admite valores intermedios entre dos valores especficos. Variable Continua: Es aquella que se puede tomar valores comprendidos entre dos nmeros. Los siguientes datos corresponden a la cantidad de asientos vacos que reportan su autobs : 12,11,4,6,6,11,3,10,12,4,10,1,1,2,4,5,2,4,4,8,8,7,8,4,10,4,2,6,2,9,5,6,6,4,12, 8,1,12,1,7,7,6,8,4,6,9,3,7,7,5.

1.-Primero se ordenan los datos de menor a mayor de preferencia: 1,1,1,1,2,2,2,2,3,3,4,4,4,4,4,4,4,4,4,5,5,5,6,6,6,6,6,6,6,7,7,7,7,8,8,8,8,8,9,9, 10,10,11,11,12,12.

LI = Lmite Inferior LS=Limite Superior LRI=Limite real inferior LRS=Limite real Superior (X) =Marca de Clave 2.-Sacar el rango: El rango es la diferencia entre el mayor y el menor de los datos ordenados, tambin se le llama recorrido de datos. Rango Dato mayor 12 1 datos menores 11 = Rango

3.-Dato calcular el nmero de clases o intervalos

La cantidad de intervalos o cantidad de clases, se obtiene aproximando o igualando al entero ms prximo de la raz cuadra del tamao de la muestra.

Dato -

50 = 7.3 intervalo

Sin embargo la forma ms utilizada para el clculo de tamao de la clave de la regla de surgir 1 + 3.332 (Log ) = 6 grupos

Amplitud de intervalo tamao de clase amplitud internalice la formula va a estar dada por lo siguiente:
Formula

= 1.83 Se redondea al proximo 2

Lmite de la Clase: representa el tamao de cada clase el lmite inferior (LI) toma el valor del dato menor de la coleccin de datos.

1+2=3 3+2=5 5+2=7 7+2=9 9 + 2 = 11 Lmite de clase inferior 1.83 1.90 + 2 = 3.90

Para obtener el lmite superior de la clase se suma al lmite inferior el tamao de la clase.

Limites reales de clase se obtienen sumando al lmite superior e inferior divide entre dos.

Se divide el intervalo entre 2 para sacar el lmite real

Nota: Para sacar los dems lmites reales superior e inferior se le suma 2.

1.- orden de datos 2.- Rango 3.- Calculo de No. De clase Formula 1 + 3.332 (Log N) 4.- Amplitud de intervalos = n 5.- Lmite e clase 6.- Marca de Clase

Lmite de clase superior 1 + 1.9 = 2.9 3 + 1.9 = 4.9 5 + 1.9 = 6.9 7 + 1.9 = 8.9 9 + 1.9 = 10.9 11 + 1.9 = 12.9

Limite Real Inferior y Limite Real Superior. LOS INTERVALOS: Resultan de limites superiores que deben ser igual al limite real inferior. EL LIMITE REAL INFERIOR DEL PRIMER INTERVALO: Se determina restndole 0.5 y al superior se le suma. Existen con intervalos de clase el cual se ordenan y agrupan del mismo tamao y se tabulan ordenando en las frecuencias correspondientes entonces 2 intervalos contienen limites reales de clase los cuales son: INFERIOR/SUPERIOR

clase 1 2 3 4 5 6

LI 1 3 5 7 9 11

LS 2.9 4.9 6.9 8.9 10.9 12.9

LRI 0.95 2.95 4.95 6.95 8.95 10.95

LRS 2.95 4.95 6.95 8.95 10.95 12.95

COMO SE CALCULA EL LIMITE REAL SUPERIOR LS + 0.5 =LRS 2.9 + 0.5 = 2.95 4.9 + 0.5 = 4.95 6.9 + 0.5 = 6.95 8.9 + 0.5 = 8.95 10.9 + 0.5=10.95 12.9 + 0.5=12.95

COMO SE CALCULA EL LIMITE REAL INFERIOR LS - 2 =LRI 2.9 - 2 = 0.95 4.9 - 2 = 2.95 6.9 - 2 = 4.95 8.9 - 2 = 6.95 10.9 - 2 =8.95 12.9 - 2=10.95

FRECUENCIAABSOLUTA La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni. FRECUENCIA ACUMULADA Es la sumatoria de las fracciones absolutas, FRECUENCIAS RELATIVA Va a estar dada va ser igual a : fr= Frecuencia Abosluta Numero de eventos totales =50 La frecuencia relativa se obtiene mediante la divisin de la frecuencia absoluta entre el total de elementos que estamos utilizando. Todos los datos utilizados en a estadstica se concentran en tablas de frecuencia de cualquiera de los siguientes tipos: a) Absolutas: son el total de veces que se repite un mismo valor (fa). b) Relativa: porcentaje que ocupa cada valor de la variable (fr). c) Acumulada: es la suma de la frecuencia absoluta correspondiente a un valor con las frecuencias absolutas de todos los valores anteriores a l (fac).

d) Relativa Acumulada: es la suma de la frecuencia relativa correspondiente a un valor, con las frecuencias relativas de todos los valores anteriores a l (frac). Los datos obtenidos es lo que llamamos la frecuencia absoluta. 1. Ya teniendo la distribucin de las frecuencias es ms fcil elaborar los grficos para su representacin. Ejemplos: 1.-Los siguientes datos numero de hermanos que hay. NMERO DE HERMANO S 0 1 2 3 4 5 TOTAL FRECUENCI A ABSOLUTA (fa) 7 17 10 6 5 4 49 FRECUENCI A RELATIVA (fr) 14.28% 34.69% 20.40% 12.24% 10.20% 8.16% 100% FRECUENCI A ACUMULAD A (fac) 7 24 34 40 45 49 49 FRECUENCI A RELATIVA ACUMULAD A (frac) 14.28% 48.97% 69.37% 81.61% 91.81% 100% 100%

En este caso podemos observar que los datos obtenidos es el nmero de hermanos y cantidad correspondiente es lo que llamamos la frecuencia absoluta porque engloba todos los datos que estamos utilizando. En la frecuencia relativa nicamente realizamos la operacin explicada anteriormente, por ejemplo para sacar la correspondiente a los hermanos 0 hermanos /7fa.= es igual al porcentaje 14.28% especificado en la tabla anterior. En la frecuencia acumulada solo es cuestin de sumar las frecuencias absolutas, por ejemplo, para sacar la frecuencia acumulada del nmero de hermanos 3 es la suma de 7+17+10=34. En la frecuencia relativa acumulada tambin se hace una suma, pero en este caso de las frecuencias relativas, por ejemplo, para obtener la frecuencia relativa acumulada del nmero de hermanos 1 es la suma del porcentaje de 14.28%+34.69%=48.97%

10

2.- Frecuencia con la que un grupo de 20 jvenes asiste aun concierto de Msica los fines de semana. VECES QUE ASISTEN 0 1 2 3 4 TOTAL NMERO DE JVENES (fa) 1 4 10 3 2 20 FRECUENCIA FRECUENCIA FRECUENCIA RELATIVA (fr) ACUMULADA RELATIVA (fac) ACUMULADA (frac) 5% 1 5% 20% 5 25% 50% 15 75% 15% 18 90% 10% 20 100% 100% 20 100%

Tipos de representaciones grficas Cuando se muestran los datos estadsticos a travs de representaciones grficas, se ha de adaptar el contenido a la informacin visual que se pretende transmitir. Para ello, se barajan mltiples formas de representacin: Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa. Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas continuas. Polgonos de frecuencias: formados por lneas poligonales abiertas sobre un sistema de ejes cartesianos. Grficos de sectores: circulares o de tarta, dividen un crculo en porciones proporcionales segn el valor de las frecuencias relativas. Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable. Cartogramas: expresiones grficas a modo de mapa. Pirmides de poblacin: para clasificaciones de grupos de poblacin por sexo y edad.

11

Diagramas de barras e histogramas Los diagramas de barras se usan para representar grficamente series estadsticas de valores en un sistema de ejes cartesianos, de manera que en las abscisas se indica el valor de la variable estadstica y en las ordenadas se seala su frecuencia absoluta. Estos grficos se usan en representacin de caracteres cualitativos y cuantitativos discretos. En variables cuantitativas continuas, se emplea una variante de los mismos llamada histograma. Histograma. Polgonos de frecuencias Para construir polgonos de frecuencias, se trazan las frecuencias absolutas o relativas de los valores de la variable en un sistema de ejes cartesianos y se unen los puntos resultantes mediante trazos rectos. Con ello se obtiene una forma de lnea poligonal abierta. Los polgonos de frecuencias se utilizan preferentemente en la presentacin de caracteres cuantitativos, y tienen especial inters cuando se indican frecuencias acumulativas. Se usan en la expresin de fenmenos que varan con el tiempo, como la densidad de poblacin, el precio o la temperatura.

Grficos de sectores En los diagramas de sectores, tambin llamados circulares o de tarta, se muestra el valor de la frecuencia de la variable sealada como un sector circular dentro de un crculo completo. Por ello, resultan tiles particularmente para mostrar comparaciones entre datos, sobre todo en forma de frecuencias relativas de las variables expresadas en forma de porcentaje.

12

Pictogramas y cartogramas A continuacin se te explicaran los pasos a seguir para crear una grafica o histograma en Excel: Proceso de creacin de un grfico. Los pasos para crear un grafico son los siguientes: 1. Seleccionamos los datos que queremos graficar 2. Seleccionamos la opcin Insertar 3. Elegimos grfico de la Cinta de Opciones 4. Seleccionamos el tipo de grfico que queremos usar. Para insertar un grfico tenemos varias opciones, pero nosotros siempre utilizamos la seccin Grficos que se encuentra en la pestaa Insertar. Recomendamos tener seleccionados los datos que queremos graficar antes de crear el grfico. De lo contrario el grfico se mostrar en blanco y tendremos que ingresar las series de datos a posteriori.

13

Como podemos ver existen muchos tipos de grficos para utilizar. Nosotros podemos seleccionar el que mas se adecue a nuestras necesidades. Para quienes trabajaron con otras versiones del programa encontraran mejoras a la hora de crear un nuevo grfico. Una de ellas nuestro entender es la posibilidad de ver mas claramente todos los tipos de grficos con los que cuenta el programa logrando de esta forma elegir mas claramente el que deseamos para trabajar. Tipos de grficos Vamos a describir alguno de l los tipos de grficos con los que cuenta el programa y de que forma representan los datos de nuestras planillas de clculo. Para nosotros los ms importantes y ms utilizados son: Los grficos circulares Los grficos circulares permiten representar una serie de datos de acuerdo al porcentaje que cada uno de ellos representa sobre la suma de todos los valores de la serie.

En la imagen anterior se presentan arriba cada uno de los valores y abajo la representacin circular de cada uno de esos valores. Nosotros usamos este tipo de grafico cuando queremos expresar grficamente la diferencia en porcentaje de un grupo de datos en relacin al total.

14

Grficos bidimensionales Los grficos bidimensionales permiten representar las series de datos en dos dimensiones o sea los valores se representan alineados en dos ejes perpendiculares: el eje horizontal X abscisas) y el eje vertical Y (ordenadas). Hay res tipos principales de grficos bidimensionales: columnas, xy, y lneas. Salvo en caso de los grficos xy, las series de valores numricos se representan en el eje vertical y las categoras se alinean a lo largo del eje horizontal.

Grficos de columnas

En la siguiente imagen mostramos un ejemplo de un grfico bidimensional, en este caso de columnas. Los datos representados en el grfico corresponden a los datos de la tabla que tambin se muestra en la misma imagen. En el eje x se representan los meses y en el eje y las ventanas. En el ejemplo en un eje tenemos las ventas y en el otro eje los meses.

15

Grficos xy

Los grficos XY permiten por ejemplo visualizar la variacin de un dato con el transcurso del tiempo tal como muestra la siguiente imagen en la cual se muestra la evolucin de la poblacin mundial desde los aos 1800 al 2025. Un grfico XY dispersin tiene dos ejes de valores y los datos pueden mostrarse en rangos desiguales o grupos es muy usado para datos cientficos en sus planillas de calculo.

16

Grficos de lneas

A diferencia del anterior estos grficos no consideran como valores los datos del eje x sino como rtulos por eso si tomamos como ejemplo la evolucin de poblacin mundial vemos que la curva del grafico vara. Vemos otro ejemplo de grafic de lneas:

17

En el siguiente grafico de lneas se muestran las ventanas de un producto determinado en distintas regiones de un pas. Grficos tridimensionales

Los grficos tridimensionales permiten representar datos en tres dimensiones o sea valores que se representan alineados en tres ejes: el eje horizontal X (abscisas), el eje vertical Z (ordenadas), y el eje Y (series). El siguiente ejemplo muestra la comparacin de los datos de ventas para tres regiones (Sur, Este y Oeste) en los cuatro trimestres del ao. Un grafico est compuesto de varios objetos: rea de trazado, rea de grfico, leyenda, ttulos, series, rtulos de datos, etc. La gran mayora de estos objetos los podemos personalizarlos Una vez que tengamos el grafico en la hoja, si lo seleccionamos vemos como aparecen distintas opciones sobre la cinta de opciones desde las cuales podemos trabajar. Bsicamente se organizan en tres categoras. Diseo Presentacin Formato. Desde estas opciones podremos personalizarlo agregndole informacin modificndole el diseo cambindole la forma de presentacin y muchas cosas ms.Esta nueva versin de Excel agrega muchas herramientas nuevas para mejorar los grficos creados.Existen muchos tipos de grficos, por eso en nuestra opinin Excel 2007 nos permite resolver todos los

18

problemas que se nos planten a la hora de crear un grfico brindndonos una gran variedad de opciones para poder armar y modificarlos a nuestros gusto. Particularmente esta nueva versin de Excel nos ayuda aun ms, claro que para aquellas personas que estn acostumbradas a versiones anteriores del programa les va a resultar extrao y van a tener algunas dificultades a la hora de encontrar las herramientas debido a que muchas de las ventanas y menues estn ubicados de otra forma y en otra disposicin en esta nueva versin del programa. Para calcular la media, la mediana y la moda. Se siguen los siguientes pasos: Siempre que te den una lista as pon los nmeros de menor a mayor. Por ejemplo en el (1): Paso 1: 8, 8, 9, 9, 9, 10, 10, 10, 11, 12, 13, 14, 16 Paso 2: Calcula la moda, la moda es la que est de moda, o sea, la que ms se repite. En este caso las ms que se repiten son el 9 y el 10. Por lo tanto la moda es 9 y 10. Paso 3: Calcula la mediana. La mediana es el nmero del medio, ve tachando el primer nmero con el ltimo numero. Te quedas con: 8, 9, 9, 9, 10, 10, 10, 11, 12, 13, 14 Repite: 9, 9, 9, 10, 10, 10, 11, 12, 13 Repite: 9, 9, 10, 10, 10, 11, 12 Repite: 9, 10, 10, 10, 11 Repite: 10, 10, 10 Repite: 10

19

Por lo tanto la mediana sera 10. En caso de que te quedes con dos nmeros en el medio, tomas esos dos nmeros, los sumas, y luego lo divides entre 2. O sea, si te hubiese quedado 2 y 8 en el medio, entonces la mediana sera, (2 + 8) / 2 = (10) /2=5 Paso 4: Calcula la media. Para conseguir la media tienes que sumar todos los nmeros en la lista, y luego dividirlos por la cantidad de nmeros que hay en la lista. Osea tienes que sumar 8 + 8 + 9 + 9 + 9 + 10 + 10 + 10 + 11 + 12 + 13 + 14 + 16 = 139, ahora tomas esta suma y la divides por 13 que es la cantidad de nmeros que tienes en la lista. Vas a terminar con 139/13 = 10.69 aproximadamente. Esta ser tu media.

Medidas de tendencia central: Una medida de tendencia central es un valor que est en el centro o punto medio de un conjunto de datos. Media: Es el valor que se obtiene sumando los puntajes y dividiendo el total entre el nmero de puntajes. Mediana: Es el valor que esta en medio, cuando los puntajes se acomodan en orden ascendente o descendente. Moda: Es el puntaje que ocurre con mas frecuencia. L a m e di a a r i tm tic a e s e l va l o r o b te n id o a l s u ma r tod o s lo s d a to s y d i vi d i r e l re s u lt a do en t re e l n m e r o t o ta l d e da to s . e s e l s m bo lo de la m e d ia a r i tm ti ca .

20

E je m p l o L o s pe s o s d e se is a m igo s s on : 84 , 91 , 72 , 68 , 8 7 y 7 8 k g. Ha lla r e l p e so me dio .

Mediana para datos no agrupados La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos partes iguales, de forma que el nmero de valores mayor o igual a la mediana es igual al nmero de valores menores o igual a estos. Su aplicacin se ve limitada ya que solo considera el orden jerrquico de los datos y no alguna propiedad propia de los datos, como en el caso de la media. A continuacin se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios:

Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado.

Sean ordenados lo datos en orden ascendente x1 , x 2 , x3 , K , x n

Si el nmero de valores es impar, la mediana es el valor medio, el cual xn corresponde al dato 2 . Cuando el nmero de valores en el conjunto es par, no existe un solo valor medio, si no que existe dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la mediana es numricamente igual a

21

Ca l c u l o d e l a m od a

L a mo d a e s e l va lo r q u e ti e n e ma yo r f re cu e n c ia a b so lu t a . S e re p re se n ta po r M o . S e pu e de ha lla r la m od a p a ra varia b le s c u a lit at iva s y c u a n t ita t iva s . Ha lla r la m od a d e la d is t rib u c in : 2 , 3 , 3 , 4 , 4 , 4, 5 , 5 M o = 4 S i e n u n gru po ha y d o s o va r i a s p u n tu a c i o n e s con la misma modas. 1 , 1 , 1 , 4 , 4 , 5, 5 , 5 , 7 , 8 , 9 , 9 , 9 M o = 1 , 5 , 9 Cu a n do t od a s la s p u n tu a c i o n e s de u n gru po t ie nen la m i s m a fr ec u e n ci a , n o h a y m o d a . 2 , 2 , 3 , 3 , 6 , 6, 9 , 9 S i d o s p u n tu a c i o n e s a d ya c e n te s t ie n e n la fr e c u en c ia m x i ma , la m o d a e s e l p r o m e d i o d e la s d o s p un tu a c io ne s a d ya c e n t e s. 0 , 1 , 3 , 3 , 5 , 5, 7 , 8 Mo = 4 fr e c u e nc ia y esa f re c uen c ia es la m xim a , la d i s tr i b u c i n e s b im o d a l o m u l ti m o d a l , e s d e c ir, t ie ne va r i as

22

C l c u l o d e l a m od a p a r a da to s a g ru p a d o s 1 T o d o s l o s i n te rva l o s ti e n e n l a m is m a am p l i tu d .

L i e s e l lm it e inf e rio r d e la c la s e m od a l. f i e s la f re c u en c ia a b s o lut a de la c la se mo d a l. f i - - 1 e s la f re c u e n cia a b s o lu ta in m ed ia t am e nt e inf e rio r a la c la s e mo da l. f i - + 1 e s la f re c u enc ia a b s o lut a inm ed ia t am en t e p o s t e rio r a la c la s e m od a l. a i e s la am p litu d de la c la se . T am b i n s e u t iliza o t ra f r m u la de la m o d a que da un va l o r a p r o x i m a d o d e s t a :

23

E je m p l o Ca l c u l a r la m o da d e un a d is t ribu c i n e s t ad s t ic a qu e vie n e d a da po r la s igu ie n t e t ab la :

fi

[6 0 , 63 )

[6 3 , 66 )

18

[6 6 , 69 )

42

[6 9 , 72 )

27

[7 2 , 75 )

100

2 L o s i n te r va l o s ti e n e n a m p li tu d e s d i s ti n ta s .

24

E n p rime r lu ga r t en e mo s qu e h a lla r la s a lt u ra s.

L a c la se mo da l e s la qu e t ie ne m a yo r a lt u ra .

La

f r m u l a

de

la

moda

a p r ox i ma d a

c ua n do

e xis t en

d is t in t a s a mp lit u des e s :

25

E je m p l o En la s igu ie n t e t a b la se m ue st ra la s c a lif ica c io n es

(s u s p e n so , a p ro ba d o , n o ta b le y s o b re s a lie n te ) o b te nid a s p or u n gru p o d e 5 0 a lum n o s. Ca lc u l a r l a m o d a .

fi

hi

[0 , 5 )

15

[5 , 7 )

20

10

[7 , 9 )

12

[9 , 1 0 )

50

26

La Varianza
L a va r i a n z a e s la m e d i a a r i tm ti ca d e l c u a d r a d o d e l a s d e s vi a c i o n e s e s t a d s t ic a . L a va ria n za s e re pre s e n t a p o r . res p e c to a la me d i a de una d is t rib u c i n

V a r i a n za p a ra d a to s a g r u p a d o s

P a ra s im p lif ic a r e l c lc u l o de la va r i a n z a va mo s o ut iliza r la s s igu ie n t e s exp re s io n e s qu e son e qu iva le n t e s a las a n t e rio re s .

V a r i a n za p a ra d a to s a g r u p a d o s

27

Ca l c u l a r l a va r i a nz a d e la d is t ribu c i n : 9 , 3 , 8 , 8 , 9 , 8, 9 , 1 8

Ca l c u l a r l a va r i a nz a d e la d is t ribu c i n de la t a b la:

xi

fi

xi fi

xi2 fi

[1 0 , 20 )

15

15

225

[2 0 , 30 )

25

200

5 0 00

[3 0 , 4 0 )

35

10

350

1 2 25 0

[4 0 , 50 )

45

405

1 8 22 5

[5 0 , 60

55

440

2 4 20 0

[6 0 , 7 0 )

65

260

1 6 90 0

[7 0 , 80 )

75

150

1 1 25 0

42

1 8 20

8 8 05 0

28

P r o p i e d a d es d e la va r i a n z a 1 L a va r i a n z a s e r s ie mp re u n va l o r p o s i ti vo o c e r o , en e l c a s o d e qu e la s p u nt u a c ion e s se an igu a le s . 2 S i a to do s lo s va l o r e s d e la va ria b le s e le s s u m a un n m e r o la va r i a n z a n o va r a . 3 S i t od o s lo s va l o r e s de la va ria b le s e m u l ti p li c a n p o r u n n m e r o la va r i a n z a qu ed a m u l ti p l i c a da po r e l cu a d r a d o d e d ich o n m e r o . 4 S i t e n em o s va ria s d is t rib u c io ne s c o n la m is ma m e di a y c o n o ce mo s s u s re s p e c t iva s va r i a n z a s se pu ed e ca lc u la r la va r i a n z a to ta l . S i t o da s la s m ue s tra s t ie n en e l m ismo t am a o :

S i la s mu e s t ra s t ien e n d is t in t o t am ao :

29

O b s e r va c i o n e s s ob r e l a va r i a n z a 1 L a va r i a n z a , a l igu a l qu e la m e dia , e s u n n d ic e m u y s e n s ib le a la s p u ntu a c io ne s e xt re ma s. 2 E n lo s ca s o s qu e no s e pu e da ha lla r la m e d ia t ampo c o s e r p o s ib le ha lla r la va r i a n z a . 3 L a va r i a n z a n o vie n e e xp re s a d a e n la s m ism a s u n idad e s qu e lo s d a t o s, y a qu e la s d e s via c io n e s e s t n e le va d a s al c u a d rad o .

30

La desviacin estndar Se calcula, obteniendo la raz cuadrada de la varianza, consiguiendo as, un valor similar a la desviacin media.

Desviacin estndar o tpica (S o ): Es igual a la raz cuadrada de la varianza. La S representa la desviacin estndar de una muestra, mientras que la desviacin para todos los datos de una poblacin. Ampliando las frmulas tenemos Aplicamos el mismo procedimiento a las frmulas para las tablas de frecuencias tipo A. Y para las tablas de frecuencias tipo B.
Ejemplo: Desviacin estndar para datos no agrupados

Calcular la desviacin estndar al siguiente conjunto de datos muestrales. 220 219 213 218 217 215 208 204 200 209 218 207 225 205 207 210 213 211 220 211 210 225 221 215 218

PASO 1: Calcular la media aritmtica. PASO 2: Calcular la varianza En este punto, la varianza es identificada por S2. PASO 3: Calcular la desviacin estndar a partir de la raz cuadrada de la varianza. Los datos se alejan en promedio de la media aritmtica en 6,5516 puntos.
Ejemplo: Desviacin estndar para datos agrupados

Calcular la desviacin estndar a partir de la siguiente tabla de frecuencia. Considere los datos como poblacionales.

31

No. 1 2 3 4 5 6 7

Lm 13,20 15,21 17,21 19,21 21,21 23,21 25,21 Total

Ls 15,21 17,21 19,21 21,21 23,21 25,21 27,20

F 15 10 1 4 5 12 1 48

Mc 14,21 16,21 18,21 20,21 22,21 24,21 26,21

PASO 1: Calcular la media aritmtica. PASO 2: Calcular la varianza En este punto, la varianza es identificada por 2. PASO 3: Calcular la desviacin estndar a partir de la raz cuadrada de la varianza. Los datos se alejan en promedio de la media aritmtica en 7,6239 puntos.
Clculo de la Desviacin estndar en Excel

Al igual que en la varianza, Excel posee dos funciones para el clculo de la media, diferenciando los datos muestrales de los datos poblacionales.

DESVEST: Calcula la desviacin estndar de una muestra. Formato: DESVEST(nmero1;nmero2;) Categora: Estadsticas DESVESTP: Calcula la desviacin estndar de todos los datos de una poblacin. Formato: DESVESTP(nmero1;nmero2;) Categora: Estadsticas

32

Tomemos los datos del ejemplo para aplicar la frmula de desviacin estndar para datos muestrales. Copie los datos a una hoja en blanco en Excel: En la celda B8 active la funcin DESVEST, marcando en la primera casilla, los datos del ejercicio y luego pulsando en el botn aceptar. El resultado es de aproximadamente 6,5516. Para datos agrupados, calcularemos la varianza tal cual como se mostr en la seccin anterior, para luego calcular su raz cuadrada con la funcin RAIZ:

RAIZ: Calcula la raz cuadrada de un nmero. Formato: RAIZ(nmero1) Categora: Matemticas y trigonomtricas Calculemos la raz cuadrada de una tabla de frecuencia sencilla. Ni 1 2 3 4 5 6 Clase 4 5 6 7 8 9 Total f 15 10 1 4 5 12 47

En la celda B11 hallamos la media aritmtica de la tabla. En una columna nueva colocamos las distancias de las clases respecto a la media, multiplicadas por sus frecuencias respectivas. Dividimos el total de las distancias al cuadrado por el nmero de datos (colocamos el resultado en la celda B12). La desviacin ser igual a la raz cuadrada del valor contenido en la celda B12.

33

E l c o e fi c ie n te d e va r i a c i n e s la re la c i n e n t re la d e svi a c i n t p i c a de un a m ues t ra y s u m e d i a .

E l c o e fi c ie n te d e va r i a c i n s e s u e le e xp re s a r e n p o rc en t a je s

E l c o e fi c ie n te d e va r i a c i n p e rm ite c o m pa ra r la s d i s pe r s i o n es d e do s d is t ribu c ion e s d is t in t a s , s ie mp re qu e s u s m e d ias s e an p o s i ti va s . S e c a lc u la pa ra c ad a un a d e la s d is t rib u c io n e s y lo s va l o re s qu e s e o bt ie n en s e c om p a ra n e n t re s . L a m a yo r d i s p e r s i n c o rre s p o nd e r a l va lo r d e l c o e fici e n te d e va r i a c i n m a yo r . E je mp lo Un a d is t rib u c i n t ie n e x = 1 40 y = 2 8 . 28 y o t ra x = 1 50 y = 2 5 . Cu l d e la s do s p re s en t a ma yo r d is p e rs i n?

L a p rim e ra d is t rib uc i n p re se n ta ma yo r d is p e rs i n.

34

L o s c u a r ti le s S o n lo s t re s va lo res d e la va ria b le qu e d ivid e n a u n co nju n t o d e d a t o s o rd en ad o s en c u at ro pa rt e s igua le s . Q 1 , Q 2 y Q 3 d e te rm in an lo s va lo re s c o rre s p o nd ie n te s a l 2 5 % , a l 5 0 % y a l 75 % d e lo s da t o s. Q 2 c o in c id e c o n la m e d ia n a. C lc u lo d e lo s c uart ile s 1 O rd en am o s lo s da t o s d e m en o r a ma yo r. 2 B u s ca mo s e l lu ga r qu e o c up a ca da c u a rt il me d ian t e la e xp re s i n .

N m e ro im pa r d e d a t o s 2 , 5 , 3 , 6 , 7 , 4, 9

N m e ro p a r d e d a to s 2 , 5 , 3 , 4 , 6 , 7, 1 , 9

35

C lc u lo d e lo s c uart ile s p a ra da t o s agru p a d o s E n p rime r lu ga r b us c a m o s la c la se do n de s e e n c ue n t ra , e n la t ab la d e la s f re c u en c ia s a cu mu la d a s.

L i e s e l lm it e inf e rio r d e la c la s e d o nd e s e e n cu e nt ra e l c u a rt il. N e s la s um a d e las f re c u en c ia s ab s olu t a s . F i - 1 e s la f re cu e n c ia a c um u la d a a nt e rio r a la c la se de l cu a rt il. a i e s la am p lit ud de la c la se .

36

E je rc ic io d e cu a rt ile s Ca lc u la r lo s c ua rt ile s d e la d is t ribu c i n de la t a b la:

fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[ 9 0 , 1 00 )

10

58

[ 1 0 0, 11 0 )

63

[ 1 1 0, 12 0 )

65

65

37

C lc u lo d e l p rim e r c u a rt il

C lc u lo d e l se gu nd o c ua rt il

C lc u lo d e l t e rc e r c u a rt il

38

Conclusiones El efecto de la computadora sobre la enseanza de la estadstica es metodolgico y de contenido. En cuanto a contenido se necesitarn ms tpicos de metodologa de la investigacin estadstica y anlisis exploratorio de datos para apoyar el rea de la computacin. Del punto de vista metodolgico hay que tomar en cuenta paquetes interactivos y grficos que permiten cambiar el enfoque didctico y poner menos nfasis en manipulaciones mecnicas, y ms en el desarrollo de conceptos que permiten descubrir y explorar con la ayuda de computadoras. Podemos pensar que un curso de Estadstica se divide en tres partes: terico, resolucin de ejercicios-prctico- y aplicacin de la computadora. Queremos dejar muy claro que en ningn momento se pretende adiestrar en el uso de un software estadstico. Menos an, en cuestiones informticas. Queremos enfatizar siempre que la computadora es un mero instrumento, comparable a una calculadora.. Existe mucho software estadstico que sirve como apoyo del profesor y de los alumnos para mostrar en forma precisa y rpida las grficas e indicadores estadsticos. Con estos software los profesores pueden trabajar bien las grficas y los indicadores, y mostrar rpidamente lo que pasa al cambiar los datos. Generalmente resulta una confusin si el profesor dispone de nada ms que pizarrn y transparencias. Si la computadora est presentando las grficas, el profesor y los alumnos pueden fijarse en el comportamiento de los mismos, en vez de calcular y graficar. Se ha planteado en varias ocasiones la siguiente controversia: utilizar software estadstico o planilla electrnica. Nuestra experiencia nos ha mostrado que ambos .

39

Potrebbero piacerti anche