Sei sulla pagina 1di 14

;-; -31-;--J.}'L*"r--.

--{--i{¡Gg='ji'*',tsiá5r€i}bl{iil¡
tl
:

.¡{
i-,

r'-
i-r
a
'*i
iJ
É
F-,

H
r-.i

n
É:r

$
br
re
g
#
it
*
#
H
H
¡E

ñ
üF
i{t ,¡-. r :.: '. ...*+r*i*t¡;'-'i/

ffisfmdTsf6ctr
y prffihmb*fr$Cad
T*sry:as de Ia unidod
,' Estadística

Probabilidad
a. A1 elegir aleatoriarnente un número firenor o
iguai q'le iC{}, ¿es ;lás probable ol-.tener un nir-
inero prillo o r,;n mtriiipio de 5?

b" C'irserva las cartas, luego esci:ibe si la proposi-


cicin es f¡rlsa o verdaclera"

..!

?:i:.i:::=
F-. ::

ftE
. Es irnposible elegir una / cle corazones.

úÉr.--,,-*.d
* Es seguro l'iegit itna carta de corazones.
.: |' ":. , Es irrrpositrie elegir: un as de tréboles.
r!. '

Si eii una boisa se tieneu dos balotas vercle s, dos


balctas biancas ), dos balotas azules, ¿cuiinias
baioi¿ls se clebr:n extÍaer de 1¿.. bois¡L }-i¡.f ii ¡:5t:tr
seg¡,r rc rie s,:i:i-' :- :

u Llna i--:_iilj rr ., ,:l'.i,, '

n 1)o.'i-.t.,i.. . - -:

.i.:,:
a::.a:-a.,,..
'1'-.
¿

f.i . 4 i'
ht rft#T*ffi#Tre#
y e! *r*p#r#d#r
lJ azar, o quizás ¿ Prorridencia, f¡e qlien en 1785 Dlez ¿ñcs ces¡rués de esle sucesa -:i-r ::,-' - , l
puso anie l'-le¡ie Simon laplace, sjenclo piolesoi'en ia obra ,-'ecrriri a¡aiiiicct ¡le lcs orcbariiii.;i.,¡,, ,.-. . -l

Escreia Vli irar de Paris, ¿ Jn Joven de l6 años qle de s maba Lc geornerria del azor.
tacaba en matemátrcas y que, en e f ¡tL.-lro, se ccn\,'eT
tiria en e homcr.o más poderoso de Fui'opa, Napo eón
A t-.cLbir e lbi'o, L¡p ¿rae se paró a pensar preais¿¡'ri-- r.:
en el azar, es¡ cralidad que i. enen os erperimentos aa
Bo na pa rie.
no 5er predeterrnrnados, y cómo é los habia at¿c. i
Ahora Las tor¡as habian cambiado, era Lapl:c. qr e.r eyes ¡-raterréiicas.
presentaba un trabalo sobr'e mecéitic¿ ce esie a !ol't-i- Tor¡¿do ¡-. iLtic¡:r,rri¡irc:r i ¡!il. :: ¡:
perador de Fraicia. F-dltorlal 5¿t.t .¡rr:. l
Monsieur la¡lace ¡¿ escrito este libro sobre las iet¡es
de universo slr- h¿bet'i¡encionado ¡i uira sola t,ez a
su creador.

que rro he lecesitado esa hipóres


S i-e, es s iepLtso
el matemático.
Dil un elemp o de experimento er e qNe no se pueda

La respuesta hrzo que e empei'ador mostt¿se une p.o ,:." .d,0 00",q
de sus escasas sonrisas )¡, después, contlnló con a
;,oirp o iC"p'¡io ""' g.
a ud iencia.
Hstadís?ietr
Conceptos fu nda menta les
La estadística es la ciencia que se encarga de diseñar, recolectar y analizar
información
para encontrar las principales características de un grupo de individuos a partir de
una o más variables.
En un estudio de estadística, en algún contexto determinado, es necesario definir
al-

gunos conceptos fundamentales pára gatanltzar que los resultados sean interpretados
y validados correctamente.
o indi-
En cualquier estudio que se quiera realizar se debe tener claro a qué personas
viduos ," di.ig" y qué característica o características se quieren explorar.

l'1lstoriador y qeógrafo griego. Es


. La población es el grupo de individuos sobre los cuales se va a real\zar el
estudio.
considerado eL prtmer h storiador, por
La población ¿eue lstar bien definida y cada uno de sus individuos debe cumplir
n¿rrar en v¿rios libros acontecimlentos
con los requisitos para estar en la población'
de mundo ant guo Descubrtó que ha-

'o .l ¿io dp ¡0)0 o.t., r' En la mayoría de casos la población es muy grande y obtener los datos de todos
'P re¿L.zo
Por
regifro para saber a cant!dad de Po
los elementos de la población resulta un trabajo largo, costoso e innecesario'
esta razón es conveniente tomar un grupo más pequeño de Ia población
sobre ei
blación y de ganancias en [gipto, efe
es el primer censo del que se teng¿ cual se realizará el estudio.
ro nocr m iefto.
. Una muestra de la población es un grupo de individuos sobre los cuales se toma
la información Para analizarla.
Al realizar un estudio de una población usando elementos estadísticos, es necesa-
rio determinar qué tipo de información se va a recolectar. Para tal fin, se elabora
una serie de preguntas que responden a los objetivos del estudio y que permiten
obtener los datos de la muestra.
. Una variable estadística es una pregunta concebida para estudiar una caracterís-
tica en la población. La pregunta se debe formular de tal forma que las respuestas
correspondan a una escala numérica o se puedan contar'
Las variables estadísticas se clasifican en: cualitativas si lo que se quiere medir
en cada individuo de la muestra es una cualidad, un gusto, una preferenci'a o una
opinión; y cuantitativas si la información que se obtiene es numérica y se puede
asociar a una escala.

*: ffij*mp[*
Determinar la población y la muestra en este caso' La muestra corresponde a las 30 familias encuesta-
Luego, identificar las variables y clasificarlas en das, ya que, de allí se obtendrán los datos para anali-
cuantitativas o cualitativas' zarlos.

El administrador del conjunto residencial quiere Como el administrador formula dos preguntas, enton-
saber si la implementación de bicicleteros en cada ces, las variables correspondientes son:

unidad residencial ha tenido un impacto positivo' . Si ha usado o no el servicio del bicicletero.


Para ello decide preguntar a 30 familias si han usado El número de bicicletas.
el bicicletero y cuántas bicicletas tienen.
"
La primera corresponde a una variable cualitativa y la
Como el servicio de bicicletero es para todas las per-
segunda corresponde a una variable cuantitativa.
sonas del conjunto residencial, entonces, esta es la
población.

. S¿rtrlLa:i¿
Corocterizoción
de uno vorioble cuolitotivo
Cuando se ha obtenido la información de la muestra en cada una de las variables, es
necesario organizar los datos y procesarlos para obtener conclusiones que permitan
identificar las características de la población. A este proceso se le denomina carac-
terización.
Para caractertzar wavariable de cualidad se tienen en cuenta tres aspectos funda-
mentales: Ias tablas de frecuencias, la representación gráfica y la moda.

Toblos de frecuencios
Una tabla de frecuencias es un resumen de los datos en la cual se agrupan las res-
puestas a la variable teniendo en cuenta las preguntas.

Por ejemplo, el director de la emisora del colegio preguntó a 20 estudiantes del grado
séptimo acercadel tipo de servicio de televisión que tienen en su casa. Las respuestas
que se obtuvieron son:
¡
r N N C C S C S C S S

d C C S C N S C S N C

Donde, N: nacional, C: cable y S: satelital.

En la tabla de frecuencias que se muestra al lado se observa que:

l- La frecuencia absoluta,f, corresponde a la cantidad de datos que


fl hay en cada uno de los rangos de respuesta a la pregunta.
Nacional 4 4,2 20
ilr Lafrecuenciarelatla,fr,corresponde al cociente de la frecuencia Cable 9 0,45 45
absoluta de cada dato entre la cantidad total de datos.
Suscripción 7 0,35 35
F. La última columna de la tabla corresponde al porcentaje de res- Total 20 r00
ts puesta de la muestra en cada uno de los rangos.

[r Representoción g rófico
n Diagrama ci¡cular
para tipo de televisión
de Una vez se ha elaborado la tabla de frecuencias es necesario utilizar diferentes re-
presentaciones que permitan visualizar la tendencia de las respuestas a la pregunta.
Las principales representaciones gráficas de una variable cualitativa son: el diagrama
circular y el diagrama de barras. Para el caso del ejemplo anterior, las representacio-
nes gráficas correspondientes se pueden observar en la figura Iylafigura2.
Para elaborar el diagrama circular, se divide 360o en partes proporcionales a los va- Cable
lores de las frecuencias dadas. En este caso es: Figura 1
Ee-
360o por tanto, x : 72o.
ü- Para Nacional, cuya frecuencia es 4, se tiene: 4 - , Diagrama de barras para
4x tipo de televisién
Para Cable, cuya frecuencia es 9, se tiene: : 360" , por tanto, x: 162". o/o

+ x 5ol '-' 45vo

Para Suscripción, cuya frecuencia es 7, se tiene:


20: 360" por tanto, x: 126".
, 40
7 x
30
Para representar datos en un diagrama de barras, se ubican los datos de la variable 20
en el eje horizontal y las frecuencias o los porcentajes en el eje vertical como en este l0
rla caso. De las gráficas se puede concluir que la mayoría de los estudiantes, el 45o/o,
0 Tipo
tiene afiliación a televisión por cable, mientras que un bajo porcentaje, el20o/o,tiene Nacional Cable Suscripción

televisión nacional. Figura 2

osantillana
lZ¿9
Lo moda
La moda es una medida de tendencia central que se puede calcular e interpretar
cuando se caracteriza una variable cualitativa.

La moda corresponde al rango de respuesta con mayor frecuencia. En un conjunto de


datos se puede determinar una moda, dos modas, varias modas o nrnguna.

La moda se interpreta como la respuesta esperada para un nuevo individuo de la po-


blación. Para el caso del ejemplo anterior, la moda corresponde a televisión por cable.

lq#Á L: r. íiril: I i

@ t" cada una de las siguientes situaciones deter- El director de una programadora de televisión na-
mina la población, la muestra y las variables rela, cional realizó una convocatoria de nuevos actores
cionadas al estudio. parala última temporada de una serie. Para cada
a. Mario quiere indagar acerca de Ia cantidad de actor tomó la información del género: hombre o
tiempo que debe estudiar un alumno del cole- mujer, y de la contextura física: delgado, normal u
gio en casa. Para ello pregunta a 10 compañeros obeso. Los resultados de los actores que se presen-
del curso cuánto tiempo dedica cada uno taron el primer día son:
a
esludiar en su casa. Actor G Cont. Actor G Cont. Actor G. Cont.
b. El dueño de la papelería del barrio quiere saber
si es lucrativo implementar el servicio de foto-
H D 9 M D 17 l\l NI

copiadora. Para ello preguntó a 57 clientes que 2 H o 0 H D IB M o


ingresaron a la papelería si usarían el servicio 3 H N M D 19 H D
y cuántas copias sacarían en una semana. 4 N,l N 2 H o 20 H D
5 H o 3 H o 21 M D
# t" secretaria del gerente del Banco Central de la 6 M D t4 N/ N 22 H o
ciudad toma una muestra de 42 hipotecas de cré- 7 H D t5 M o 23 M D
dito al que pertenecen:
B H D 16 N/ N 24 H o
F: de tasa fija V de tasa variable a. Caracteriza las variables género y contextura
B: con beneficios del gobierno
física.
Los resultados que obtiene son:
Catacteriza la variable contextura para los
FVFBBVF hombres y para mujeres.
Elabora al menos dos conclusiones.
B B F B

B B F B F ,#* En el periódico escolar apareció la siguiente infor-


B B F F B mación en uno de sus artículos.
F F F B F
Causas de muerte de jóvenes de la ciudad
B B F F B
Enfermedad
Construye una tabla de frecuencias de los datos L**'li
recolectados.
Representa gráficamente el conjunto de datos,
en diagrama circular y diagrama de barras.
c. Encuentra la moda. Violenta
d, Si la secretaria debe elaborar un informe para
¿Es posibleafirmar que más del doble de jóvenes
el gerente, ¿qué conclusiones debe incluir? mueren por causas violentas? Justifica tu respuesta.
é..- in;h$FjÉi1Fffi:r-lj:9i?iaE;i5rh;riialÉ¡5n]as

fsl* n da r : ¡;-i t1 sG [r] i e nta a I earo rio


é.ffi $1*rFe.rL:4+rffi{-st¡r¡++e5r]:iffi!+¡ÉSi+Enitisffi

..*i+¡., .,.r@..

Corocterizoción
de dos v0riobles cuolitotivos
En la mayoría de estudios estadísticos se relaciona más de una variable cualitativa.
Por esta razón se hace necesario determinar algunos criterios que permiten relacionar
dos variables cualitativas, para elio se tienen en cuenta dos herramientas de análisis:
tablas de doble entrada o tablas de contingencia y representaciones gráficas.

Toblos de contingencio
Una tabla de contingencia o tabla de doble entrada está conformada por filas y
columnas. Las filas están formadas por los rangos de respuesta de una variable y las
columnas, por los rangos de respuesta de la otra variable. En cada una de las casillas
formadas se ubica la cantidad de datos que tienen ambas características simultánea-
mente.

Por ejemplo, el presidente del comité estudiantil de un colegio de la ciudad ha con-


formado un equipo de trabajo con varios miembros de diferentes grados. La siguiente
lista relaciona el género del estudiante: masculino M o femenino F, con 1a sección
escolar a la cual pertenece: preescolar (E), primaria (P) o bachillerato (B).

Est. G. S Est. G s lEst. G S i

M E 11 F P 21 F_iB
) N4 P 12 F P )) F;P
3 F t 13 l\4 B 23 IV B

4 i\^ B l4 M P )4 NA E

5 I P
( F B 25 F B

6 \4 B 6 t\l P 26 \t B
t)
7 F P 7 F B ?7 F

B F B 8 M B 28 F B Est.: Estudiante
o NI B 9 F B 29 N/ P G : Género
10 l- E. "20 F P, .30 F E
S: Sección

En este ejemplo, se tienen dos variables cualitativas: el género y la sección escoiar a


la cual pertenece cada estudiante.

La tabla de frecuencias está formada en las filas por los rangos de una de las dos varia-
bles. Para este caso se utiliza la variable género. Por tanto, en las columnas se ubican
los rangos de respuesta de la variable sección a la que pertenece.
En cada una de las casillas se ubica el número de estudiantes que tienen ambas ca-
racterísticas simultáneamente.
La tabla de frecuencias final es:

Preescolar (E) Primaria (P) Bachillerato (B)' Total

Masculino (M)
Femenino (F)

A partir de la tabla anterior se tiene que: 2 estudiantes de la sección de preescolar


son de género masculino; 3 estudiantes de la sección de preescolar son de género
femenino.
Por otra parte, se tienen también las tablas de frecuencias de cada una de las variables.
Por ejemplo, se puede ver que hay 13 estudiantes de género masculino y l7 estudian-
tes de género femenino.

, s¿ntitl¿na I P31
t--'

lr
Toblo de contingencio de frecuencios relqtivqs
Una tabla de doble entrada o de contingencia también puede representar las frecuen-
cias relativas o porcentajes.

Para el caso de la tabla de frecuencias relativas basta con dividir cada frecuencia
entre el total de los datos. La tabla de frecuencias relativas para el ejemplo de género
y sección escolar correspondiente es:

Masculino (M) 0,06 0,13 0,23 0,43


Femenino (F) 0,10 0,23 0,23 0,56
Total 0,16 0,36 0,46 0,99

La tabla correspondiente a los porcentajes se obtiene de multiplicar cada frecuencia


relativa por cien. Para el caso del ejemplo, Ia tabla correspondiente es:

Masculino (M) 6,670/o 13,330/o 23,330/o 43,330/o


Femenino (F) l0o/o 23,330/o 23,330/o 56,670/o
Total 16,670/o 36,660/o 46,660/o 100%

En la tabla se puede ver que: solamente eI 6,670/o de la población es masculina y per-


tenece a Ia sección de preescolar, mientras que el 23,33o/o de los estudiantes encues,
tados es de género masculino de la sección de bachillerato, al igual que la población
femenina de la misma sección.
De igual forma, el 43,33o/o de los estudiantes son varones y el 56,670/o son niñas.
En cuanto a las secciones se tiene que: el 16,670/o de los estudiantes pertenecen a la
sección preescolar, el 36,660/o a la sección de primaria y eI 46,660/o a la sección de
bachillerato.
una tabla crtzada. o de contingencia debe contener el cruce de los rangos de
respuesta de las dos variables. Sin embargo, no se recomienda construir una tabla
cuando existen demasiados rangos en cada variable.

Representoción g rófico
La representación gráfica puede ser elaborada con diversos propósitos. Uno de ellos
es comparar los rangos de respuesta de una variable con respecto a la otra o viceversa.

Para el caso del ejemplo, se tiene Ia gráfica de la figura 3:


o/o
MF F&
200

150

60
50 100
40
30 50
20
10
0 0
Total
l-igura 3 Figura 4

En este caso, la gráfr,ca compara las secciones escolares a las cuales pertenecen los
estudiantes con respecto a su género.

De la misma manera se puede obtener La gráfrca de la figura 4, enlacual se comparan


las variables sección escolar y género, con respecto al
total de estudiantes por sección
escolar.

?3¿ I o santillana
I
Estándar : pensa m ie nto a I eatori o

ffiTrÉi,ffifffi5ff;ffi1l#{Hffi8fr#;: a
11

¡ S) Cu.lor, en su función de monitor de matemáticas


t del grado séptimo, debe hacer un informe para su
E profesor en el cual incluya las notas alcanzadas
por los estudiantes del curso junto con el género
I de cada uno. Para ello, Carlos tomó la siguiente
información de sus 30 compañeros:

Los resultados fueron los siguientes: E IV 6 M


2 E M 7 E M
E 3 B F B B M
* I 2 S 26 3 S 4 E lvt 9 E F i:
i:
2 3 S )7 3 S 5 B F 20 M

I
::
3 S 28 3 S 6 A M 21 A M
i:
4 2 N 29 2 S 7 F 22 A F ::

30 I N )3 M ::
5 3 S 8 A F

6 0 N 31 l S 9 B F 24 F

7 3 N 32 I N 0 E M 25 A F

8 2 S 33 2 1 A F 26 F

* 9 1 S 34 3
)
S 2 F 27
28
B F

T 0 3
0
N
S
35
36 1
N
S 4
3
A M 29
I

I F

2 2 N 37 3 S B F 30 A F

3
)
J 3B 3 S
La nota reportada para cada estudiante es E: exce-
4 1 S 39 2 N
5 0 N 40 4 N lente, B: bueno, A: aceptable e 1: insuficiente.
6 3 N 41 2 S El género de cada estudiante es M: masculino o F:
7 2 S 42 3 N femenino.
B N 43 4 S

9 4 5 44 N
a. Elabora una tabla cruzada para esta informa-
)0 0 S 45 N ción.
21 4 S 46 2 S b. Determina si se puede afirmar que la mayoría
22 3 N 47 3 S de estudiantes que perdieron la asignatura son
23 s 48 2 N
mujeres.
24 ) S 49 2 N
c. Construye una gráfica que represente la infor-
_25 0 N, .50 2 S
mación anterior.
Donde E: estrato y puede ser'. I,2,3 y 4;la varia-
** au siguiente gráfrcaapareció en la sección de Datos f.i

ble S: servicios públicos completos y la variable ia


curiosos, en el periódico de un colegio: li
N: servicios públicos incompletos. :

a. Elabora una tabla de doble entrada para esta a?"Ji.í,, nrc Fw rotallffi
situación. :.
Total
b. Construye la correspondiente tabla de doble en-
Negros
trada de porcentajes. Escribe tus conclusiones. Jscuras
c. Elabora una representación gráfica de esta si- Claros
No. de
tuación. estudiantes
d. Responde: Si la Junta Administradora Local
quiere mostrar que la mayoría de familias La gráfi,ca muestra la relación porcentual entre el ;

cuentan con los servicios, ¿qué valor debe usar género de 100 estudiantes y su color de ojos.
y por qué? á. Construye la tabla de contingencia correspon- .:

¿Se puede afirmar que la mayoría


de las fami- diente a esta situación. ::

lias de estrato uno no tiene los servicios públi- b. ¿Se puede afirmar que la mayoría de estudian- !!

tes son hombres y/ üu color de ojos es negro?


su Lvrvr
cos completos? ;;t:.t

osantillana
l¿33
:=+=:É;E.ffi#+eElri¿ElaEEs3É11

Coracterizoción
de uno vcriable cuontitotivo
La caracterización de variables cuantitativas se debe realizar aplicando dos criterios:
para datos agrupados y pari- datos no agrupados.

Dotos cgrupodos
El criterio de agrupación de datos corresponde a un análisis semejante al elaborado
para variables cualitativas. Consiste en elaborar una tabla de frecuencias y construir
algunas gráficas que representen el comportamiento de la variable.

Para agrupar datos se utilizan fundamentalmente: el diagrama de tallo y hojas, las


tablas de frecuencias, los histogramas y los polígonos de frecuencias.

Diogromo de tollo y hoios

Un diagrama de tallo y hojas es una representac¡ón gráfica de los datos que se c asifican
de acuerdo con la expresión decimal de cada uno de ellos.

El diagrama consta de dos columnas: una el tallo y la otra las hojas. Para la cons-
trucción de este tipo de diagrama se ordenan los datos y luego se divide cada dato
en tallo y hoja.

En la mayoría de los casos, la hoja corresponde a la última cifra del dato y el tallo, a
las demás cifras.

Por ejemplo, la oficina de la Secretaría de Tránsito de una ciudad ha recibido la can-


tidad de comparendos diarios por pico y placa impuestos durante el último mes. La
lista correspondiente es:

400 340 348 338 376 344


366 363 3s8 396 3s0 298
31r 368 369 393 346 354
333 329 395 334 381 330
364 400 405 368 397 348
Para el caso de 395,1a hoja corresponde al valor 5 y el tallo al valor 39; de igual forma
Tallo Hoja para el dato de 400, la hoja corresponde a 0 y el tallo al valor 40.
29 8 Tallo l1 Hoja
ll
JI 1
3e is
32 9 40 l0
JJ 034 B
34 046 8B . Se ordenan los datos, puede ser de menor a mayor, así:
35 048 298,31r,329,330,333,334,339,340,344,346,349,349,350,354,359,363,364,
36 346 889 366, 368, 369, 369, 376, 3gl, 393, 3g5, 396, 397 , 400, 400, 405.
37 6
Jó 1
. AI considerar todos los datos, el diagrama de tallo y hojas correspondiente al
_39 3567 número de comparendos por día se puede observar en la figura 5.
l0 005 En el diagrama se puede ver que, en la mayoría de días, se impusieron entre 363 y 369
'9tum 5 comparendos, seguidos por entre 340 y 348 comparendos.

¡
ffib*¡pÉLs.awñ:¡ailffi]}!+iffi'"sr¡¡.1HFq4+Bqt$gaq/4++@+crtül1ffiqrq+.q|4É{aba.ql]]]11jj1wqtrrq

Estándar: ¡;ensan't¡enlo aiec; - -


EÍF"{*lrl-}t#-*ffi*rgpi@rHrssffiBqp#HBesrF$q"rffiFÁ.#!\+til@{r1!gdeü!ryi+sE']]i-iffiqsErÉq¿*t$Éts+ir-q:4:iti@=:=

Toblqs de frecuenciq
Las tablas de frecuencia, para el caso de las variables cuantitativas, no son únicas y
dependen de los grupos que se conformen. Para un grupo de datos se pueden cons-
truir varias tablas distintas. En la mayoría de los casos, la persona encargada de ana-
lizar los datos determina el número de grupos que desea conformar. El único criterio
de garantizar que los datos queden bien resumidos cuidando de no construir
es el
pocos iniervalos con frecuencias muy altas o, al contrario, muchos intervalos con
frecuencias m uy pequeñas.

Los pasos que se siguen para construir una tabla de frecuencias de un conjunto de
datos son:
. Primero, se determina el número de grupos que se debe construir' Para este fin se
recurre a algunas aproximaciones cuando no se tiene conocimiento previo de las
variables y no se tiene un criterio adicional para determinarlo.
una de las aproximaciones más usadas y generalmente más confiable es:
Número de intervalo t:
"li
Donde n eslacantidad de datos. Generalmente se recomienda que la aproxima-
ción se haga al entero menor del resultado dela raí2.
para el caso número de comparendos por día, el número de intervalos que se debe
construir es:
Número de intervalo r: Ji: ¡30* : 5,477 = 5
. Segundo, se determina el tamaño de cada intervalo. Para hallar este valor se utiliza
la siguiente fórmula:
Tamaño de cada intervalo
Dato mayor Dato menor _ -
Número de interYalos
Para el ejemplo, el tamaño de cada uno de 1os cinco intervalos es:

Tamaño de cada intervalo


_ Dato mayor - _
Dato menor 405 - 298 : 2I,4
Número de intervalos 5

En este caso se recomienda aproximar el tamaño del intervalo a la cantidad de


decimales que tienen los datos. Para este caso, la cantidad de comparendos por día
es una cantidad entera es decir, no se tienen decimales, entonces, la aproximación
correspondiente es 21.
Tercero, se construyen los intervalos. El primer intervalo se construye desde el
dato menor hasta el dato menor más el tamaño del intervalo. Es decir, el primer
:
intervalo va desde 298, que es el dato menor' hasta 298 4- 2l 319, así el intervalo
es 298-319.
para el segundo intervalo se considera como límite inferior una unidad más del
límite superior del primer intervalo. El límite superior se obtiene sumando al
límite inierior el tamaño del intervalo ¡ así sucesivamente, hasta llegar al último
intervalo que contiene el dato mayor'
Es decir, el segundo intervalo va desde 319 + I
: 320 hasta 320 t 21 : 34I.
Por tanto, los cinco intervalos son:
298-319, 320-341, 342-363, 364-385, 386-407
En algunos casos el último dato no está incluido en el último intervalo, por lo
tanto es necesario construir un intervalo más o aumentar el tamaño del último
intervalo. Para este caso, se usará la primera opción ya que bastará con los inter-
valos creados..
Una vez determinados los intervalos es necesario contar el número de datos que
l6v hay en cada intervalo. Para ello se puede hacer uso del diagrama de tallo y hojas
o simplemente del conteo.

. Santillana I l3
Toblo de frecuencios
Para el ejemplo que venimos analizando la tabla de frecuencias correspondiente es:

298 - 319 2 0,067 2 0,067


320 -341 6 0,2 8 0267
342 - 363 8 0,267 16 4,534
364 - 385 / 0,233 23 0,767
386 - 407 7 .0,233 30 1

Total 30

Donde:
. .;[es la frecuencia del intervalo y corresponde al número de datos que están en este
rango.
. fr es la frecuencia relativa o proporción y corresponde a la frecuencia comparada
con el total.
. F es la frecuencia acumulada y corresponde a la sumatoria de las frecuencias de
Ios intervalos anteriores incluyendo su frecuencia. Es por esto que el valor de F en
el tercer intervalo corresponde a la suma de2 -l 6 * 8 : 16.
. Fr es la frecuencia acumulada relativa y corresponde a la frecuencia acumulada
comparada con el total.
En la tabla se puede ver que el 23,3o/o de los días fueron impuestos entre 364 y 385
comparendos, mientras que el 6,70/o de los días se impusieron entre 298 y 319 com-
parendos.
Según la columna de frecuencias acumuladas se puede decir que el76,70/o de los días
se impusieron 385 o menos comparendos.

Histogromos
lJn histograma corresponde al diagrama de barras de la tabla de frecuencia. En este
diagrama, las barras deben construirse pegadas ya que se trata de variables cuanti-
tativas.

En el ejemplo, los histogramas correspondientes a la frecuencia y la frecuencia acu-


mulada son:

Histograma de frecuencias Histograma de frecuencias acumuladas


para el número de comparendos para el número de comparendos
8 30
7
25
6

5
20

4 15

J
10
2
5
1

0 0
Comparendos Comparendos

En el histograma de frecuencias se puede ver que las frecuencias entre los intervalos
dos, tres, cuatro y cinco son parecidas y que las de los intervalos cuatro y cinco son
iguales.

¿36lGsantillana
Estánd a r: pen s {t rn t ento c i eata r o t

Polígono de frecuenc¡os
El polígono de frecuencias corresponde al diagrama de líneas elaborado con los
puntos medios de cada intervalo.
En el ejemplo anterior, los polígonos de frecuencias y de frecuencias acumuladas son:

v
t0 v
9 ¡sl
8
,nI
7
6 ,']-
5
4
3
i:l
r0L
2
1 ,l-

h
n $ luru pertenecer al grupo de rockde la ciudad se # fuan ha hecho un estudio acerca del número de
convocó a 40 cantantes. Sus edades son: películas que han visto sus compañeros de curso
en el último mes. juan presentó los resuitados en
la
17 22 26 15 29 el siguiente diagrama de talio y hojas:
15 24 21 25 18
¡5
34 23 25 36 13 Tallo Hojas
22 22 25 19 32 0 1338545
1-
34 17 14 14 23 I r34673567
32 36 25 32 20 945200
33 28 22 31 14 2
irs
42 35 37 17 24 ) 4830
a. Realiza el diagrama de tallo y hojas de las eda- a. Determina cuántos estudiantes hay en el curso
des de los cantantes. de luan.
b. Elabora la tabla de frecuencias correspon- b. Elabora una tabla de frecuencias para este caso'
ite diente. c. Realiza un diagrama de barras de acuerdo con
ri- Escribe las conclusiones que se pueden plan- el diagrama de tallo y hojas.
tear con los datos de la tabla. d. Elabora un histograma de acuerdo con la tabla
Construye los histogramas y los polígonos de de frecuencias del literal b.
u-
frecuencias corresPondientes. e. Compara las gráficas. ¿Existen diferencias en-
Responde: ¿Se puede afirmar que hay una ten- tre ellas? Justifica tus respuestas.
dencia en las edades de los futuros cantantes
pagaron 48 familias
del grupo de la ciudad? € tt valor en miles de pesos quepúblicos se relaciona
Elabora una tabla de frecuencias con base en por concepto de servicios
los siguientes intervalos. con la siguiente tabla.
63 69 55 58 52
50 59 54 79 62 156
tl-15 55 51 61 60 69 151
t6-20 47 54 J 49 71 147
21-25 57 164
6A 64 49 53
26-30 58 52 57 161
60 55
31-35 62 50 162
48 67 51
36-40 52 63 162
47 5B 51
4t-45.
a. Elabora un diagrama de tallo y hojas.
g. Compara la tabla de frecuencias del literal b
b. Escribe una conclusión que se puede sacar con
los con la tabla del literal f. ¿Existen diferencias
base en esta representación.
;¡f,n significativas entre ellas? fustifica tu respuesta' j
- :¡ -.:a.:a -: ::..-.' :.::-.:'.a:-:.:--:::=,,a.=,=
:
=--a-i-

osantillana lP3,
I
Dotos no ogrupados
Para caracterizar unavariable cuantitativa sin agrupar los datos es necesario recurrir
al cálculo de algunas medidas que permitan describir su comportamiento. Las me-
didas que se utilizan para caracterizar una variable cuantitativa son: las medidas de
tendencia central y las medidas de posición.

Medidas de tendencis centrol


Las medidas de tendencia central son: la media o promedio aritmético, la mediana
y la moda.

. La media aritmética o promedio es un dato que no necesariamente está en el


conjunto de datos y que representa la característica predominante del grupo. La
media es el punto de equilibrio del conjunto de datos.
Para el caso en que se considere una muestra, la media aritmética se simboliza
como X y para el conjunto de datos xr> x2, ..., xn se calcula como:

t= xtl xz|_ ... I x,


n
Para el caso en el cual se considere una población, la media aritmética se simboliza
p y se calcula de la misma forma. La media es una medida que se ve afectada por
el cambio significativo de un dato. si existe un dato muy grande o muy pequeño
con respecto a los demás, el valor de la media cambia significativamente. En otras
palabras, la media es una medida sensible al cambio de un dato.

La mediana es el dato que divide en dos partes porcentualmente iguales el con-


junto de datos.
Para el caso en el cual se considere una muestra la mediana se simboliza .o*o i
y se calcula ordenando el conjunto de datos y ubicando el que está en la posición
de la mitad.

cuando se consideran un número impar de datos, la mediana es un dato que


pertenece al conjunto. Para el caso que se considere un número par de datos,
la mediana corresponde al promedio de los dos datos de Ia mitad. Este valor en
algunos casos no pertenece al conjunto. Para el caso en el cual se considere una
población, la mediana se simboliza É y se calcula de la misma forma.
La moda de un conjunto de datos corresponde al dato que más se repite.

En aquellos casos en los cuales se analice una muestra la moda se simboliza i , si


se trata de una población, la moda se simboliza ¡i .

x f;jernpto
El número de minutos que usan cada uno de los l0 estudiantes de un colegio de
la ciudad para prepararse para una evaluación de matemáticas programadá son,
30156045100153025
Hallar las medidas de tendencia central.

Elvalordelamediaaritmética.r,X: 30 + 15 +... + 20 :25 minutos


10
Al ordenar los datos: 0, 10, 15, 15,20,25,30,30,45,60.
El promedio del dato quinto, 20, y el dato sexto, 25, es 22,5 minutos, el cual es el valor
de la mediana. Existen dos modas l5 y 30 minutos.
-38 .Santillana
¡

t
Estándar: pensan¡ento ciec:¿: : ,--{
' {-t'
'-n*wffi-ffiffi@-* -

Medidos de posición
Las medidas de posición son medidas que dividen a los datos en partes porcentual-
mente iguales. Las medidas de posición son: cuartiles y deciles'

Los cuartiles son las medidas que dlviden un conjunto de datos en cuatro partes. Cada
una represent a el 25a/o del total de los datos. Se slmbolizan Q1 Q2Y Q:

Gráficamente los cuartiles se representan como sigue:

Q, Q2 Q3

250/olZSV'lZSrolZSr"
i---t^t
& ". - ' o li,, *.*,S{** *L"
/* lle *kist"*
iltlt

Sepuede ver que el valor del cuartil dos corresponde al valor de la mediana. Atrás de1
pri-.r cuartil se encuentra el 25o/o de los datos, entre el primer y segundo cuartil se
encuentra el25o/o de los datos y así sucesivamente.
Para calcular el valor de los cuartiles se ordenan los datos de menor a mayor y se

calcula el valor de la mediana quien representa el cuartil dos.


Luego, se considera la primera mitad de los datos y se calcula la mediana, 1a cual
corresponderá al primer cuartil.
Igualmente, se considera la segunda mitad de los datos y se calcula la mediana, este
valor corresponde al tercer cuartil.

Los deciles son valores que dividen en 1O partes iguales el conjunto de datos. Cada parte

representa el 100/o de los datos. Se simbollzan como D,, Dr, Dn.

. D t: Valor que deja por debajo el i 0% de los datos y por encim a el 90o/o restante.
. D, Valor que deja por debajo e7 20o/o de los datos y por encima el 80% restante.
Y así sucesivamente hasta el Dn que deja por debajo el90o/o de los datos y por encima
I el 10% restante.

@lal'"r¡i@
{& Ut número de hermanos que tienen los 25 estu- ! # Las estaturas de nueve alumnos son 159, 168,I73,
diantes del curso se relacionan a continuación: i 168, 173,159,165' I73 y 182.

52343 a. Halla la estatura media.


22331 b. Determina la mediana y la moda.
63233
23425 i #- El preparador físico de un equipo de baloncesto
42133 toma nota de las tallas de zapato de sus 10 jugado-
a. Halla el número promedio de hermanos de un
.
. res. Al pasar la lista, el utilero extravió uno de los
estudiante del curso.
I datos. Los nueve datos en cm que existen son: 42,
b. Halla la mediana del conjunto de datos. 38,39,43,45,42,39,38,43.
c. lndica si es posible afirmar que el50% de los es- :
]

tudiantes del curso ttene 2 hermanos o menos. ¡ Sin embargo, se sabe que el promedio es 41 cm,
Justifica tu respuesta.
, ¿cuál es el dato que falta?

osant¡llana
|
¿lg

¡¡

Potrebbero piacerti anche