Sei sulla pagina 1di 8

ESTADSTICA

La ESTADSTICA es la parte de las Matemticas que tiene por objeto estudiar fenmenos fsicos, biolgicos, econmicos, sociales, etc. , a partir de datos recogidos de numerosas experiencias u observaciones. 1. INFORMACIN ESTADSTICA. CONCEPTOS BSICOS. El conjunto de todos los elementos que cumplen una determinada caracterstica y sobre el que se desea obtener informacin se denomina poblacin. La poblacin viene representada usualmente por la letra N. Cada uno de los elementos que forman la poblacin es un individuo. Para recoger informacin acerca de la poblacin se realiza una encuesta. Esta recogida de informacin se hace bien por observacin o mediante preguntas. Por razones de economa, tiempo o necesidad, en Estadstica no se trabaja con el total de la poblacin, sino con una parte de la misma. Una muestra es cualquier subconjunto o parte de la poblacin. Esta muestra tiene que ser representativa de toda la poblacin objeto de estudio. Uno de los procesos para elegir de manera adecuada una muestra es el muestreo aleatorio; en l, todos los elementos de la poblacin tienen la misma probabilidad de ser incluidos en la muestra. El tamao de la muestra se representa mediante la letra n.

Ejemplos :

a) Poblacin: Socios de un club de tenis ( 500 personas (300 hombres y 200 mujeres) ). N = 500. Muestra: 10 % de los socios ( 50 personas (30 hombres y 20 mujeres) ). n = 50. b) Poblacin: Ciudadanos con derecho a voto ( 4 millones (25 millones hombres y 15 millones mujeres) ). N = 4.000.000. Muestra: 1 de la poblacin ( 4.000 personas (2.500 hombres y 1.500 mujeres) ). n = 4.000.

2. VARIABLES ESTADSTICAS. Cada uno de los aspectos que se desea conocer acerca de la poblacin se denomina variable estadstica. Las variables estadsticas pueden ser: Cualitativas: si se pueden observar o leer, pero no se pueden contar o medir. Por ejemplo: color de pelo, lugar de nacimiento, profesin. Cuantitativas: si se pueden contar o medir. Por ejemplo: nmero de hermanos, peso, nmero de discos vendidos, talla.

Las variables estadsticas cuantitativas pueden ser discretas o continuas: Una variable estadstica cuantitativa es discreta cuando slo toma un nmero finito de valores aislados (es decir, se puede contar). Por ejemplo: nmero de hermanos, nmero de discos vendidos, nmero de pulsaciones. Una variable estadstica cuantitativa es continua cuando puede tomar todos los valores posibles de un intervalo (es decir, se puede medir). Por ejemplo: peso, talla, medida del salto de longitud.

Los valores de una variable estadstica se representan por

Observacin: En algunos textos se habla de caracteres estadsticos cualitativos y cuantitativos, y slo se consideran variables estadsticas las cuantitativas, es decir las que se pueden medir. 3. FRECUENCIAS ABSOLUTAS Y RELATIVAS. TABLAS ESTADSTICAS. Con los datos desordenados obtenidos en la encuesta, se construyen unas tablas ordenadas. Estas tablas recogen el nmero de individuos que toma los diferentes valores de la variable, son las frecuencias. Frecuencia absoluta de un valor de la variable es el nmero de veces que se repite dicho valor. La frecuencia absoluta del valor se representa por . La correspondencia que asocia a cada valor de la variable su frecuencia absoluta se llama distribucin estadstica. Frecuencia relativa de un valor de la variable es el cociente entre la frecuencia absoluta del valor y el nmero total de datos. La frecuencia relativa del valor se representa por , por tanto

Frecuencia absoluta acumulada de un valor de la variable, , es la suma de las frecuencias absolutas de los valores menores o iguales a . La frecuencia absoluta acumulada del valor se representa por , as tenemos que

Frecuencia relativa acumulada de un valor de la variable, acumulada del valor y el nmero total de datos.

, es el cociente entre la frecuencia absoluta

La frecuencia relativa acumulada del valor

se representa por

, as tenemos que

Para construir las tablas estadsticas formaremos varias columnas: una en la que figuren los valores de la variable, otra de frecuencias absolutas, otra de frecuencias relativas, otra de frecuencias absolutas acumuladas, otra de frecuencias relativas acumuladas y otra de porcentajes.
Si la variable estadstica es discreta con un nmero grande de datos (por ejemplo, nmero de discos vendidos) o es continua, se realiza un agrupamiento de los datos en intervalos, que en Estadstica se denominan clases. Para realizar un buen agrupamiento debemos tener en cuenta los siguientes puntos: Es aconsejable escoger los extremos inferior y superior de cada intervalo de modo que se siten en nmeros redondos; por ejemplo, mltiplos de 5, de 10, etc. Todas las clases deben tener la misma amplitud. Los puntos medios de cada clase se llaman marcas de clase.

El nmero de clases que debemos formar es de libre eleccin, pero existe un criterio general que aconseja formar tantas clases como la raz cuadrada del nmero total de datos.

Ejemplos : 1) En un centro de enseanza secundaria hay ocho clases de tercero de E.S.O. y se quiere tener una informacin sobre el nmero de hermanos de los alumnos. Variable: Nmero de hermanos del alumno (var. estad. cuantitativa discreta). Poblacin: Curso de 3 de E.S.O. Muestra: 30 alumnos seleccionados al azar de las ocho clases. n = 30.

(n de hermanos) 0 1 2 3 4 5 8

(n de alumnos) 3 9 13 2 1 1 1 30

% 3 12 25 27 28 29 30 3/30 9/30 13/30 2/30 1/30 1/30 1/30 1 3/30 12/30 25/30 27/30 28/30 29/30 30/30 = 1 10 30 4333 666 333 333 333 9998

2) En un centro de enseanza secundaria hay ocho clases de tercero de E.S.O. y se quiere tener una informacin sobre el peso de los alumnos. Variable: Peso de los alumnos (var. estad. cuantitativa continua). Poblacin: Curso de 3 de E.S.O. Muestra: 30 alumnos seleccionados al azar de las ocho clases. n = 30.

Datos recogidos: 42, 48, 51, 55, 57, 52, 50, 58, 62, 70, 49, 52, 51, 73, 67, 61, 56, 56, 54, 46, 63, 54, 59, 61, 53, 52, 52, 57, 59, 55.

Clases (peso del alumno) (marca de clase) (n de alumnos) [ 40 , 45 ) 425 1 [ 45 , 50 ) 475 3 [ 50 , 55 ) 525 10 [ 55 , 60 ) 575 9 [ 60 , 65 ) 625 4 [ 65 , 70 ) 675 2 [ 70 , 75 ) 725 1 30

% 1 4 14 23 27 29 30 1/30 3/30 10/30 9/30 4/30 2/30 1/30 1 1/30 4/30 14/30 23/30 27/30 29/30 30/30 = 1 333 10 3333 30 1333 666 333 9998

3. REPRESENTACIONES GRFICAS. La forma ms inmediata de hacer comprensible la informacin estadstica es a travs de las grficas estadsticas. La eleccin de determinada grfica estadstica estar en funcin del tipo de datos que se manejen en el estudio que se realiza. Los principales tipos de grficas son los siguientes:

Diagrama de barras y polgono de frecuencias. Se utiliza para representar variables cualitativas o cuantitativas discretos sin agrupar en clases. Para construir el diagrama de barras se representan sobre el eje de abscisas los datos y sobre el eje de ordenadas las frecuencias absolutas. Sobre cada valor de la variable se levanta una barra de longitud igual a la frecuencia absoluta. Si unimos los extremos de las barras obtenemos el polgono de frecuencias. Ejemplo: Vamos a representar al diagrama de barras asociado a la distribucin que clasifica a los alumnos segn el nmero de hermanos ( ejemplo 1) ).

Histograma y polgono de frecuencias. Se utiliza para representar variables cuantitativas discretas agrupadas en clases o variables cuantitativas continuas. Para construir el histograma se representan sobre el eje de abscisas los extremos de las clases y sobre el eje de ordenadas las frecuencias absolutas. Se construyen unos rectngulos de base la amplitud de cada clase y de altura la frecuencia absoluta de cada clase. Si unimos los puntos medios de los lados superiores de cada rectngulo obtenemos el polgono de frecuencias.

Ejemplo: Vamos a representar el histograma asociado a la distribucin que clasifica a los alumnos segn su peso en kilogramos ( ejemplo 2) ).

Diagrama de sectores. Se utiliza para representar fundamentalmente variables cualitativas. Consiste en un crculo dividido en tantos sectores circulares como modalidades tiene la variable. El ngulo central de cada sector ha de ser proporcional a la frecuencia absoluta correspondiente. Para calcular la medida del ngulo se hace la siguiente operacin: Ejemplo: Se realiza sobre la poblacin y muestra de los ejemplos 1) y 2) el estudio de la variable cualitativa Autonoma de nacimiento del alumno. Vamos a representar mediante un diagrama de sectores la distribucin estadstica que clasifica a los alumnos segn la autonoma de nacimiento. Para el clculo del ngulo central procedemos as:

Autonoma

Nmero de alumnos 19

Medida del ngulo central

Andaluca

Castilla-La Mancha

Catalua

Galicia

Pas Vasco

El diagrama de sectores asociado sera el siguiente:

4. PARMETROS ESTADSTICOS. Observacin: El clculo de parmetros estadsticos se restringe a las variables estadsticas cuantitativas. No podemos calcular parmetros de variables cualitativas, aunque si podemos hacer sus tablas de frecuencias y representarlas grficamente. MEDIDAS DE CENTRALIZACIN. Se llaman medidas de centralizacin a los parmetros que tienden a situarse hacia el centro del conjunto de datos ordenados. Las medidas de centralizacin son valores que representan el conjunto de los datos. Las medidas de centralizacin ms importantes son: la media aritmtica, la mediana y la moda. Media aritmtica. La media aritmtica de una variable estadstica es el cociente entre la suma de todos los valores de la variable y el nmero de stos (tamao muestral). Se representa por . Si la variable toma los valores con frecuencias absolutas , la media aritmtica es:

Si los datos estn agrupados en clases, se toma para Ejemplos :

las marcas de clase.

1)

2) Mediana. La mediana de una variable estadstica es el valor de la variable que ocupa el lugar central de los datos. Se representa por Me. Si el nmero de datos es impar se toma como valor de la mediana el valor central. Si el nmero de datos es par se toma como valor de la mediana la media aritmtica de los dos valores centrales. Ejemplos : 1) Me = 2 2) Me = 575 Moda.

( los valores 15 y 16 son 2 ) ( los valores 15 y 16 estn en la clase [55,60) )

La moda de una variable estadstica es el valor de la variable que tiene mayor frecuencia absoluta. Se representa por Mo. Si los datos estn agrupados en clases se toma como valor de la moda la marca de la clase que tiene mayor frecuencia absoluta. Esta clase se llama clase modal. Ejemplos : 1) Mo = 2 . MEDIDAS DE DISPERSIN. Se llaman medidas de dispersin a los parmetros que miden las desviaciones respecto de la media. Las medidas de dispersin amplan la informacin sobre la distribucin de los datos, estableciendo si estn ms o menos prximos unos de otros. Las medidas de dispersin ms importantes son : el rango o recorrido, la varianza y la desviacin tpica. Rango o recorrido. El rango o recorrido de una variable estadstica es la diferencia entre el mayor y el menor valor de la variable. Esta medida tiene el inconveniente de que slo depende de los valores extremos de la variable. Ejemplos : 1) Rango = 8 0 = 8 . Varianza. La varianza de una variable estadstica es la media aritmtica de los cuadrados de las desviaciones respecto a la media. Se representa por . 2) Rango = 725 425 = 30 . 2) Mo = [50,55) .

Ejemplos : 1) Desviacin tpica. La desviacin tpica de una variable estadstica es la raz cuadrada positiva de la varianza. Se representa por . Ejemplos : 1) . 2) . . 2) .