Sei sulla pagina 1di 47

Estadstica

Ing. Iliana Rosero

Definiciones

Los datos son observaciones recolectadas.


La Estadstica es el conjunto de mtodos para
planear estudios y experimentos, obtener datos
y luego organizar, resumir, presentar, analizar,
interpretar y llegar a conclusiones basadas en
los datos.

Definiciones

La poblacin es el conjunto completo de todos


los elementos que se va a estudiar.

El censo es el conjunto de datos de cada uno


de los miembros de la poblacin.

Definiciones

Una muestra es un subconjunto de miembros de


la poblacin.

La muestra debe ser seleccionada aleatoriamente


y representativa de la poblacin

Ramas de la Estadstica

Estadstica
Descriptiva

Recoleccin,

Resumen

Presentacin de
datos.

Estadstica
Inferencial

Obtiene conclusiones
acerca de una poblacin
a partir de una muestra.

Fuente de Datos
Fuentes Primarias

Fuentes Secundarias

Coleccin de datos

Compilacin de datos

Impreso o electrnico
Observacin

Experimentacin

Encuesta

Un parmetro es una medicin numrica que


describe alguna caracterstica de la poblacin.

En la ciudad de Guayaquil, estn ubicados 10000


semforos.
Existen 2000 buses de transporte interprovincial de
los cuales el 40% son nuevas unidades.

Un estadstico es una medicin numrica que


describe alguna caracterstica de la muestra.

Al entrevistar a 30 transentes se encontr que el


30% tiene mas de dos hijos.

Ejercicio

De acuerdo con una encuesta de Goldman, cerca del


4% de los hogares estadounidense utilizan servicios
bancarios online. Una encuesta realizada por Cyber
Dialogue investig las razones por las que la gente
abandona esta opcin . A continuacin se ofrece los
resultados obtenidos:
Por qu abandon el banco online?
Demasiado tiempo... 40%
No lo necesita ..........30%
No confa en el sistema..20%.
Demasiado costoso........10%

Describa la poblacin de la encuesta Goldman


Describa la poblacin de la encuesta Cyber
Dialogue.
El 40% de quienes respondieron indicaron que el
banco en lnea era demasiado complicado .Es
esto un parmetro o un estadstico?

Tipo de datos
Datos cualitativos: se dividen en categoras que se
distinguen por caractersticas no numricas.

Ej: Estatus Marital, Color de ojos

Datos cuantitativos: consisten en nmeros que


representan conteos o mediciones.

Datos discretos: Respuesta numricas que resultan de un


conteo.

Ej. Nmero de Hijos, defectos por hora

Datos contnuos : Respuesta numrica que resulta de un


medicin.

Ej. Peso, Estatura

Ejercicio1

Para cada una de las lminas indique tres


datos: cualitativo, cuantitativo discreto y
cuantitativo continuo.

Niveles de Medicin

Nominal: Nombres o clasificaciones que se


utilizan para datos en categoras distintas y
separadas

Ej: Tipo de bebida que prefiere

Ordinal: Clasifican observaciones en categoras


con un orden significativo pero no es posible
determinar la diferencia numrica entre los
valores.

Ej: Riesgo: alto medio bajo

Niveles de Medicin

De intervalo: Nivel ordinal donde podemos


determinar magnitudes de diferencia entre los
datos. El cero no indica ausencia de valor.

Ej: Temperatura, Aos

De razn: Nivel de intervalo modificado para


que el cero indique un punto de partida

Ej: Peso de equipaje, estatura de un nio

Ejercicio
Indique el nivel de medicin utilizado:
Preferencia de vehculo segn su estilo:camion,
van,etc.
Temperatura corporal de una muestra de clientes
enojados.
Numero de cdula.
Contenido de nicotina (mg) de un cigarrillo.
Calificacin de una cita a ciegas : sobresaliente, comn
y horrible.
Ingreso anual de los gerentes en una compaa.

Ejercicio
Indique el nivel de medicin utilizado:
Aos en que ha ocurrido el Fenmeno EL nio
Calificaciones finales : MB, B, R, P
Automviles descritos como subcompactos, compactos,
medianos o grandes.
Temperatura del ambiente en el aula.
Edad de los clientes.
Ao de nacimiento de sus padres

Usos y abusos de la Estadstica

Errores comunes

Muestra autoseleccionada: Los propios


sujetos deciden ser incluidos. Encuestas por:

Internet,
Correo
Telfono.

Muestras pequeas

Errores comunes
Grficas engaosas
Ventas anuales
por ciudad

Ventas anuales por


ciudad
33500
33000
32500
32000
31500
31000
30500
30000
29500
29000
28500

35000

32996

32996

30180

30000

30180

Ventas ($)

Ventas ($)

25000
20000
15000
10000
5000
0

Guayaquil
Quito
Ciudades

Guayaquil
Quito
Ciudades

Errores comunes

Pictogramas:

Preguntas predispuestas:
Ej: Debera el presidente utilizar su poder de veto para
eliminar los desperdicios? 97% si
Debera utilizar el presidente su poder de veto? 57% si
Orden de preguntas:
Ej: Cree usted que el trnsito vehicular contribuye a la
contaminacin mas o menos que la industria? 47% trnsito
Cree usted que la industria contribuye a la contaminacin
mas o menos que el trnsito vehicular ? 24% trnsito

Correlacin y causalidad: Correlacin indica que dos


variables estn relacionadas. Sin embargo correlacin
no implica causalidad.

Estudios para el propio beneficio.

Imgenes parciales :
Ej. El 90% de todos nuestros automviles vendidos en este pas en los ltimos
10 aos continua circulando

Nmeros precisos:

Ej. En la actualidad existen 103215.027 hogares


estadounidenses.

Pensamiento Crtico

Un estudio revel que en cierta ciudad se


expiden ms multas por exceso de velocidad a
los individuos de grupos minoritarios.
Conclusin : En la ciudad los individuos de
grupos minoritarios exceden la velocidad lmite
mas que los blancos.

En un estudio sobre los sntomas del resfriado,


se encontr que todos los sujetos que estaban
resfriados mejoraron dos semanas despus de
tomar pldoras de jengibre. Conclusin: Las
pldoras de jengibre curan el resfriado.

Usted planea realizar una encuesta para


conocer el porcentaje de personas que estn
de acuerdo con cierta nueva ley. Usted obtiene
direcciones y telfonos del directorio telefnico
y enva una encuesta a 850 personas elegidas
al azar. Por qu no es correcto utilizar el
directorio telefnico como fuente de los sujetos
para las encuestas?

El Senado de Hawai entro en audiencia para


considerar una ley que obligaba a los
motociclistas
a
usar
casco.
Algunos
motociclistas testificaron que haban participado
en choques donde los cascos resultaron
intiles. Qu importante grupo no fue capaz
de testificar?

Usted necesita hacer un estudio para


determinar el tamao promedio de una familia
en la ciudad donde vive. Para esto rene datos
que consisten en el nmero de hermanos y
hermanas de los estudiantes de su universidad.
Cules
son
los
problemas
de
su
investigacin?

RESUMEN Y GRFICAS DE
DATOS

Distribuciones de frecuencia

Procedimiento para construir una


distribucin de frecuencias

Decidir el nmero de clases K=1+3,3 log(n) (entre


5 y 20)

Calcular el ancho de clase=(Valor mximo-Valor


mnimo)/nmero de clases.

Establecer el punto de partida como lmite inferior


de la primera clase y sumar el ancho de clase para
encontrar el lmite superior.

Completar todos las clases

Tabular los datos que se encuentren en cada clase.

Distribuciones de Frecuencia

Lista valores de datos junto con su frecuencia.


Edad Actrices

Frec
Absoluta
ni

Frec.
Relativa
fi

Frec.
Absoluta
Acumulad
Ni

Frec.
Relativa
Acumulad Fi

[20-30)

28

37%

28

37%

[30-40)

30

39%

58

76%

[40-50)

12

16%

70

92%

[50-60)

3%

72

95%

[60-70)

3%

74

98%

[70-80)

2%

76

100%

Ejercicios

Se tienen 50 valores, Cul es el nmero de


clases sugerido?

Un conjunto de datos contiene 100 valores, el


mayor es 315 y el menor 56. Especifique los
limites de las clases en la tabla de distribucin
de frecuencia.

Ejercicio

Cierto fabricante selecciona aleatoriamente 20


das de invierno y toma la temperatura C con
los siguientes resultados :
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Realice la tabla de distribucin de frecuencia
completa

Desarrolle la tabla de distribucin de frecuencia


completa a partir de los siguientes datos que
corresponden a ingresos de 30 ejecutivos
expresado en miles $.
58 64 79 74 69 71 65 55 73 40
76 74 38 62 54 79 75 72 50 76
89 34 56 69 56 31 47 62 64 74

En cierto pas se desea investigar el crecimiento de los


jvenes y se seleccion una muestra aleatoria de 25
jvenes y se los midi.

Construya la tabla de distribucin de frecuencia


absoluta, relativa y acumulada.

GRFICOS

Histograma
Es una grfica de barra donde la escala
horizontal representa clases de valores (
marca de clase y la escala vertical representa
frecuencias. Las barras se dibujan sin
espacios entre s.
Distribucin de edades
14
12
Frecuencia

10
8
6
4
2
0
35

45

55
Edad

65

75

Ejemplo:
Realice el histograma a partir de la siguiente tabla:

Estaturas (pulg)

Frecuencia

[56-58)

10

[58-60)

64

[60-62)

178

[62-64)

324

[64-66)

251

[66-68)

135

[68-70)

32

[70-72)

A partir del siguiente


histograma que muestra las
calificaciones de un examen
de Estadstica responda :

Cuntos estudiantes
hicieron el examen?,
Cul es la mnima
calificacin posible?
Cul es la calificacin ms
frecuente?
Cul es el ancho de clase?
Y el nmero de clases?

Polgono de frecuencia

Concepto: Grfico que utiliza segmentos lineales


conectados a puntos que se localizan
directamente por encima de los valores de la
marca de clase.
Las alturas de los puntos corresponden a la
frecuencia de clase.
Distribucin de edades
14
12
Frecuencia

10
8
6
4
2
0
0

20

40
Edad

60

80

Ojiva

Grfica lineal que representa frecuencias acumuladas.


En el eje horizontal se muestran el lmite superior de
cada clase.

Temperatura

Frec

Frec
Acum

%
Acum

[0 - 10)

0%

[10 - 20)

15%

[20 - 30)

45%

[30 40)

14

70%

[40-50)

18

90%

[50 60)

20

100%

a) Cuntos dias se
investigaron?

20

100%

18

90%

16

80%

14

70%

12

60%

10

50%

40%

30%

20%

10%

0%
10

20

30

40

Lmite de Clase

50

60

% Acum.

Frec. Acum

Ojiva: Temperatura diaria

a) El 60% de los dias


registraron
temperaturas
inferiores a .
a) Cuantos das se
registraron
temperaturas
menores a 45 ?

A 40 estudiantes en la cafetera se les pidi que


estimaran el nmero de horas que haban dedicado a
estudiar en la semana anterior. El registro de respuestas
aparece en la tabla. Construya la ojiva
Tiempo de estudio semanal en horas Frecuencia
10 y menos que 20

20 y menos que 30

11

30 y menos que 40

40 y menos que 50

50 y menos que 60

60 y menos que 70

70 y menos que 80

Diagrama tallo hojas

Permite ver cmo se distribuyen y donde estn


las concentraciones de datos.
Se organiza los datos en grupos (llamados
tallos), para que los valores dentro de cada
grupo (las hojas) ramifiquen hacia la derecha de
cada fila.
Ej: 12,13,25,28,47, 48,49,49,65,66,110
1

2 3

5 8

7 8 9 9

5 6

11

Efecte el diagrama de tallo hoja para los


siguientes conjuntos de datos

21, 24, 24, 26, 27, 27, 30, 32, 38, 41

613, 632, 658, 717,722, 750, 776, 827,841, 859, 863,


891,894, 906, 928, 933,955, 982, 1034, 1047,1056, 1140,
1169, 1224

Grficos de Pastel

Presenta datos cualitativos como si fueran


parte de un pastel.
10%

Defectos en el teclado

10%

Dao
37%

13%
15% 15%

Mancha
Raya
plateada

Potrebbero piacerti anche