Sei sulla pagina 1di 33

Definicin de Estadstica

La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos


por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Un estudio estadstico consta de las siguientes fases:
Recogida de datos.
Organizacin y representacin de datos.
Anlisis de datos.
Obtencin de conclusiones.
Conceptos de Estadstica
Poblacin

Una poblacin es el conjunto de todos los elementos a los que se somete a un


estudio estadstico.
Individuo

Un individuo o unidad estadstica es cada uno de los elementos que componen la


poblacin.
Muestra

Una muestra es un conjunto representativo de la poblacin de referencia, el


nmero de individuos de una muestra es menor que el de la poblacin.
Muestreo

El muestreo es la reunin de datos que se desea estudiar, obtenidos de una


proporcin reducida y representativa de la poblacin.
Valor

Un valor es cada uno de los distintos resultados que se pueden obtener en un


estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores:
cara y cruz.
Dato

Un dato es cada uno de los valores que se ha obtenido al realizar un estudio


estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara,
cruz, cara, cruz.

Una variable estadstica es cada una de las caractersticas o cualidades que


poseen los individuos de una poblacin.
Tipos de variable estadsticas
Variable cualitativa

Las variables cualitativas se refieren a caractersticas o cualidadesque no pueden


ser medidas con nmeros. Podemos distinguir dos tipos:
Variable cualitativa nominal

Una variable
cualitativa
nominal presenta modalidades
numricas que no admiten un criterio de orden.

no

Ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado
y viudo.
Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no nmericas, en las que


existe un orden.
Ejemplos:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1, 2, 3, ...


Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se


pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:
Variable discreta

Una variable
discreta es
aquella
que
toma valores
aislados,
decir no admite valores intermedios entre dos valores especficos.

es

Ejemplo:
El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre
dos nmeros.
Ejemplos:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la prctica medimos la altura con dos decimales, pero tambin se podra dar con
tres decimales.

Distribucin de frecuencias

La distribucin de frecuencias o tabla de frecuencias es unaordenacin en forma


de tabla de los datos estadsticos, asignando a cada dato su frecuencia
correspondiente.

Tipos de frecuencias
Frecuencia absoluta

La frecuencia
el nmero
absoluta es
determinado valor en un estudio estadstico.

de

veces que

aparece

un

Se representa por fi.


La suma de las frecuencias absolutas es igual al nmero total de datos, que se
representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma


mayscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.


Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos


los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada

La frecuencia
relativa
acumulada es
el cociente entre
la frecuencia
acumulada de un determinado valor y el nmero total de datos. Se puede
expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30,
30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a
mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia
absoluta.

xi

Recuento

fi

Fi

ni

Ni

27

0.032

0.032

28

II

0.065

0.097

29

0.194

0.290

30

16

0.226

0.516

31

24

0.258

0.774

27

0.097

0.871

32

III

33

III

30

0.097

0.968

34

31

0.032

31

Este tipo de tablas de frecuencias se utiliza con variables discretas.


Distribucin de frecuencias agrupadas

La distribucin de frecuencias agrupadas o tabla con datos agrupados se


emplea si las variables toman un nmero grande de valores o lavariable es
continua.
Se agrupan los valores en intervalos que
amplitud denominados clases. A cada clase se
correspondiente.

tengan
le asigna

la misma
su frecuencia

Lmites de la clase

Cada clase est delimitada por el lmite inferior de la clase y el lmite superior
de la clase.
Amplitud de la clase

La amplitud de la clase es la diferencia entre el lmite superior e inferior de


la clase.
Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que


representa a todo el intervalo para el clculo de algunosparmetros.
Construccin de una tabla de datos agrupados

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20,
11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1 Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y
48.
2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea
divisible por el nmero de intervalos queramos establecer.
Es conveniente que el nmero de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite inferior de una clase
pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el
siguiente intervalo.

ci

fi

Fi

ni

Ni

[0, 5)

2.5

0.025

0.025

[5, 10)

7.5

0.025

0.050

[10, 15)

12.5

0.075

0.125

[15, 20)

17.5

0.075

0.200

[20, 25)

22.5

11

0.075

0.275

[25, 30)

27.5

17

0.150

0.425

[30, 35)

32.5

24

0.175

0.600

[35, 40)

37.5

10

34

0.250

0.850

[40, 45)

42.5

38

0.100

0.950

[45, 50)

47.5

40

0.050

40

Un diagrama de barras se utiliza para de presentar datos cualitativoso datos


cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisasse colocan
los valores de la variable, y sobre el eje de ordenadaslas frecuencias absolutas o
relativas o acumuladas.
Los datos se representan
la frecuencia.

mediante barras de

una altura

proporcionala

Ejemplo:
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su
grupo sanguneo ha dado el siguiente resultado:

Grupo sanguneo

fi

AB

20

Polgonos de frecuencia

Un polgono
de
frecuencias se
las barras mediante segmentos.

forma

uniendo

los extremos de

Tambin se puede realizar trazando los puntos que representan las frecuencias y
unindolos mediante segmentos.
Ejemplo:
Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes
variaciones:

Hora

Temperatura

12

12

14

15

11

18

12

21

10

24

Un diagrama de barras se utiliza para de presentar datos cualitativoso datos


cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisasse colocan
los valores de la variable, y sobre el eje de ordenadaslas frecuencias absolutas o
relativas o acumuladas.
Los datos se representan
la frecuencia.

mediante barras de

una altura

proporcionala

Ejemplo:
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su
grupo sanguneo ha dado el siguiente resultado:

Grupo sanguneo

fi

AB

20

Polgonos de frecuencia

Un polgono
de
frecuencias se
las barras mediante segmentos.

forma

uniendo

los extremos de

Tambin se puede realizar trazando los puntos que representan las frecuencias y
unindolos mediante segmentos.

Ejemplo:
Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes
variaciones:

Hora

Temperatura

12

12

14

15

11

18

12

21

10

24

Un histograma es una representacin grfica de una variable en forma de barras.


Se utilizan para variables continuas o para variables discretas, con un gran
nmero de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectngulos que tienen porbase la amplitud
del intervalo, y por altura, la frecuencia absolutade cada intervalo.
La superficie de
cada barra es proporcional a
losvalores representados.

la frecuencia de

Polgono de frecuencia

Para construir el polgono de frecuencia se toma la marca de clase que coincide


con el punto medio de cada rectngulo.
Ejemplo:
El peso de 65 personas adultas viene dado por la siguiente tabla:

ci

fi

Fi

[50, 60)

55

[60, 70)

65

10

18

[70, 80)

75

16

34

[80, 90)

85

14

48

[90, 100)

95

10

58

[100, 110)

105

63

[110, 120)

115

65

65

Histograma y polgono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se


obtiene el histograma de frecuencias acumuladas o su correspondiente polgono.

Histogramas con intervalos de amplitud diferente

Para construir un histogramas con intervalo de amplitud


que calcular las alturas de los rectngulos del histograma.

diferente tenemos

hi es la altura del intervalo.


fi es la frecuencia del intervalo.
ai es la amplitud del intervalo.
Ejemplo:
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y
sobresaliente) obtenidas por un grupo de 50 alumnos.

[0, 5)

fi

hi

15

[5, 7)

20

10

[7, 9)

12

[9, 10)

50

Un parmetro estadstico es un nmero que se obtiene a partir de losdatos de


una distribucin estadstica.
Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla
o por una grfica.
Tipos de parmetros estadsticos

Hay tres tipos parmetros estadsticos:


De centralizacin.

De posicin
De dispersin.
Medidas de centralizacin

Nos indican en torno a qu valor (centro) se distribuyen los datos.


La medidas de centralizacin son:
Media aritmtica

La media es el valor promedio de la distribucin.


Mediana

La mediana es la puntacin de la escala que separa la mitad superior de la


distribucin y la inferior, es decir divide la serie de datos endos partes iguales.
Moda

La moda es el valor que ms se repite en una distribucin.


Medidas de posicin

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo


nmero de individuos.
Para calcular las medidas de posicin es necesario que los datos estn ordenados
de menor a mayor.
La medidas de posicin son:
Cuartiles

Los cuartiles dividen la serie de datos en cuatro partes iguales.


Deciles

Los deciles dividen la serie de datos en diez partes iguales.

Percentiles

Los percentiles dividen la serie de datos en cien partes iguales.


Medidas de dispersin

Las medidas de dispersin nos informan sobre cuanto se alejan del centro los
valores de la distribucin.
Las medidas de dispersin son:
Rango o recorrido

El rango es la diferencia entre


distribucin estadstica.

el mayor y

el menor de

los datos de

una

Desviacin media

La desviacin media es la media


las desviaciones respecto a la media.

aritmtica de

los valores

absolutos de

Varianza

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a


la media.
Desviacin tpica

La desviacin tpica es la raz cuadrada de la varianza.


a moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa


frecuencia es la mxima, la distribucin es bimodalo multimodal, es decir,
tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando
todas
las puntuaciones de
frecuencia, no hay moda.

un

grupo

tienen

la misma

2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es
el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Clculo de la moda para datos agrupados
1 Todos los intervalos tienen la misma amplitud.

Li es el lmite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:

Ejemplo:

Calcular la moda de una distribucin estadstica que viene dada por la siguiente
tabla:

fi

[60, 63)

[63, 66)

18

[66, 69)

42

[69, 72)

27

[72, 75)

100

2 Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La frmula de la moda aproximada cuando existen distintas amplitudes es:

Ejemplo:

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y


sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.

fi

hi

[0, 5)

15

[5, 7)

20

10

[7, 9)

12

[9, 10)

50

Es el valor que ocupa el lugar central de


estn ordenados de menor a mayor.

todos

los datos cuando

stos

La mediana se representa por Me.


La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana

1. Ordenamos los datos de menor a mayor.


2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin
central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5

3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre


las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me = 9.5
Clculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega


hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

Li es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.


Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Ejemplo:
Calcular la mediana de una distribucin estadstica que viene dada por la siguiente
tabla:

fi

Fi

[60, 63)

[63, 66)

18

23

[66, 69)

42

65

[69, 72)

27

92

[72, 75)

100

100

100/2 = 50
Clase de la mediana: [66, 69)

l siguiente diagrama de barras indica el color de pelo de los alumnos de la clase


de Mario. Completa la tabla con las frecuencias absolutas correspondientes a
cada color y responde las siguientes preguntas:

Color de pelo

fi

Rubio

Pelirrojo

Moreno

Qu tipo de pelo predomina en la clase?


Predomina el pelo

Cuntos estudiantes son pelirrojos?

Cuntos estudiantes hay en total en clase de Mario?

2El siguiente polgono de frecuencia muestra la media de temperatura diaria en


una ciudad polaca a lo largo los siete da de una semana. Completa la tabla y
responde a las preguntas:

Hora

Temperatura

C
C
C
C
C
C
C

Qu da hizo menos fro?


Hizo menos fro el da
La mayora de los das, la temperatura fue bajo cero o sobre cero?

cero.
Cul fue la temperatura los dos primeros das?
La temperatura fue de

3El siguiente diagrama de barras muestra las notas de los alumnos de una clase
de una clase de 3 ESO. Completa la tabla y responde a las preguntas:

Nota

fi

Insuficiente
Suficiente
Bien
Notable
Sobresaliente

Qu nota es la ms comn?

Cuntos estudiantes han suspendido la asignatura?


Han suspendido

estudiantes.

Cuntos estudiantes han aprobado la asignatura?

Han aprobado

estudiantes.

Cuntos estudiantes hay en la clase?


Hay

estudiantes.

4Los siguientes valores indican el nmero de comidas al da que hace un grupo


de
3,

quince
4,

2,

3,

4,

3,

4,

5,

amigos:
4,

5,

3,

4,

5,

3,

4.

Completa la tabla y responde a las preguntas que se plantean.

N de comidas

Personas

2
3
4
5
6

Sabiendo que los expertos recomiendan comer 5 veces al da, podemos


decir que la mayora de estos amigos come correctamente?

Cuntos de ellos comen slo 2 veces al da?

Cuntas veces al da come la mayora de las personas encuestadas?

Si tienes dudas puedes consultar la teora

Puntuacin:

l siguiente diagrama de barras indica el color de pelo de los alumnos de la clase


de Mario. Completa la tabla con las frecuencias absolutas correspondientes a
cada color y responde las siguientes preguntas:

Color de pelo

fi

Rubio

Pelirrojo

Moreno

Qu tipo de pelo predomina en la clase?

Predomina el pelo
Cuntos estudiantes son pelirrojos?

Cuntos estudiantes hay en total en clase de Mario?

2El siguiente polgono de frecuencia muestra la media de temperatura diaria en


una ciudad polaca a lo largo los siete da de una semana. Completa la tabla y
responde a las preguntas:

Hora

Temperatura

C
C
C
C
C
C
C

Qu da hizo menos fro?


Hizo menos fro el da

La mayora de los das, la temperatura fue bajo cero o sobre cero?


cero.
Cul fue la temperatura los dos primeros das?
La temperatura fue de

3El siguiente diagrama de barras muestra las notas de los alumnos de una clase
de una clase de 3 ESO. Completa la tabla y responde a las preguntas:

Nota

fi

Insuficiente
Suficiente
Bien
Notable
Sobresaliente

Qu nota es la ms comn?

Cuntos estudiantes han suspendido la asignatura?


Han suspendido

estudiantes.

Cuntos estudiantes han aprobado la asignatura?


Han aprobado

estudiantes.

Cuntos estudiantes hay en la clase?


Hay

estudiantes.

4Los siguientes valores indican el nmero de comidas al da que hace un grupo


de
3,

quince
4,

2,

3,

4,

3,

4,

5,

amigos:
4,

5,

3,

4,

5,

3,

4.

Completa la tabla y responde a las preguntas que se plantean.

N de comidas

Personas

2
3
4
5
6

Sabiendo que los expertos recomiendan comer 5 veces al da, podemos


decir que la mayora de estos amigos come correctamente?

Cuntos de ellos comen slo 2 veces al da?

Cuntas veces al da come la mayora de las personas encuestadas?

Si tienes dudas puedes consultar la teora

Puntuacin:
.

Potrebbero piacerti anche