Sei sulla pagina 1di 100

@ casH FLow ESTADISTICA

B,l.Fl.
LAS PRUEBAS SELECTIVAS PARA EL ACCESO A
PLAZAS DE FORMACIóN SANITARIA ESPECIALIZADA PAM:

BtóLOcOS

t
ESTADISTIGA
TEONIA

C/ Montes¿,20 - 28006 MADRID - Tfno: 91 309 36 46 - lvw.cashflow-oposiciones.com


@ CASH FLOr,v ESTADiSTIC4

ESTADÍSTICA

iNntc¡

EPtD€mtoloc¡a

r. cotpARAcróN Df, uN TEsr coN su MÉToDo DE REFERENcTA.

2. SABER INTERPRXTAR UNA TABLA 2X2.

3. CONOCER EL SIGNIFICADO DE:

- Verdad€ro posifivo.
- Verd¡dero Neg¡tivo.
- Falso Positivo.
- Falso Negatiyo.

4. PARTíMETROS QUE MIDEN LA VALIDEZ Y Sf,GURIDAD


DE UN TEST: l

4,1. Se¡sibilid¡d,
4.2. Especificidad.
43. \¡.lor predicúivo positivo,
),
4.4. Valor predictivo ¡eg¡tivo,

5. coNocER L4. R¡LACIóN ENTRE pREvArENcrA y vALoR pREDrcrrvo


POSITIVO Y VALOR PRXDICTIVO NECATTYO.

CONCEPTOS BÁSICOS A CONSIDERAR EN LA MEDIDA DE LAS


ENFERMEDA.DES:

6.l.IDcideDcia.
62, P¡.evalencia.
6J, Relacio¡ar Prevaleocia e Itrcidencir-

MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD:

7.1, N¡¡hero,
7J. Prevdenci¿
73. I¡cide¡ci¡ Acumül¡d&
7.4, Densidad o Tasa de l¡cidenci..

.t rr..l. { * rr. *

o Montesa. 20 -28006 MADRD@


M CASH FLOvtl ESTADÍSTICA

-. oe esTaolsTlca ll" partel


:
"o"ro¡es
- INTRoDUCCTóN A LA EsrA.DfsrrcA

- l. Definición.

2. Clasificación de la estadística.

, Conceptos básicos.
-
EsrADf sTIcA DEscRrpTwA
..
1. Representaciótr de d¡tos Clabl¡s y gráficos),
.' 1.1. Variables cüalitativas
.. 1.2. Va¡iables cuantitativas disc¡etas
: I .3 . Va¡iables cuantitativas conti¡uas

, 2. I¡dices que defiDen un¡ distribución de datos:


2.1. Medidas de centralización.
2.2. Medidas de posicióú.
2.3. Medidas de dispersión.

- 3. Formas de uDa distúbución de dafos:

3.1. Segur la Moda.


' 3.2. Segun la Si¡netría.
3.3. Segln elApuntamiento.
,
. 4. Leyes teóricas que se ajustan a distribuciotres biológic¡s:
' 4.1. Dist ibución Binomial.
4.2. Disrribución de Poisson.
4.3. Dist¡ibución Normal o de Gauss.
-
, PROBA¡ILIDAI)

. 1. Co¡cepto.
2. Prob¡bilidadcondiciotral.

, 3, Aco¡tecimieutos cohplejos:
' 3.1. Regla de la multiplicaciór.
-,. 3.2. Regla de la sumal

- CONCEPTOS FI]NDA]ITENTALES EN INVESTIGACIóN CLÍNICA

****t*n
.-
Cl/ Mont€sa,20 - 28006 MADRID - Tfno: 91 309 36 46 - wuy.€ashflow-oposiciones.com 2
g ci¡sH Ft_Ot Y ESTADISTICA

¡OCIOll¡t D! EA"ADfAñCA f2¡ p.rtc I


:
MUESTRTO pRo&$trls¡co y No ¡Ro¡^.B¡LiSr¡CO

Y ¡, Vai¡Jú d.t hü4r¡.c


¿ l¡6nu¡.¡ó6 d.t ñuéfr.¿,
Y 3, Máodq.t. bu6tÉ preb.b[llts (tL.b.ior.
3. r . M!.ris d.lrdjo ¡iñpl.,
' 32. Mu.sré 5i@Edri@.
3.3, MEúe ál*rorio .sr¡úiÍiodo.
3,4. Mu6!!o po. .ogt6@dd
3.t, MucltrF do6t..
¡. Método¡ d. Eu6f@ !o pnb¡bilni.os:
4, ¡, Mucsr¡ó cd volhr.¡i6,
4¿ Mlesr@ {¡. @vmiñci¡.
4.3. Merr.o .r¡tie.

:, EST¡.DÍSIIC{ ÁXALtDCA O ¡NFEiRENC¡A!

l Errh¡cló. d. F¡¡¡n.ter!
LL E$in&tor., pútu..t.5 d. ¡! m.dE pobt.ciñ¡t,
12 EsiMnio po, intñ.to.
, Erituióh d. ñ.dis.
- Er¡ñeió, d. ptupo.ci@é3.
2. Colrhr. d. iipórdi¿
3. Prst.r.m¡rdó¿ dd tro¡lo ü¡ernl
¡. goEog.ndd¡d d. dd
huBaÉ..
5, ¡F.bú.¡..¡g¡¡tiú.¡ó¡ d¡.ürdo:
5.1. T¡toi
d¿ Fu.bE o t d.stuürier,

a 5.2. T.s d. KotDolo@ Seiñov.


5,3. T¡p6 .b pd.bd! o t st do sjr¡ifq.ióD
.sr.dhid
5.4. R.¡¡ción @tn vúilbt.s oüdiü!iv&.
5.5. ¡.]rción 6r! vú¡bhs o¡tiblivs
) ndibive.
).ó x.i&¡ór ¿nrÉ v¡rir¡t.s c@ri¿¡iB.
J.?. ¡lFodeción ¡ t¡ .!¡dísriq buhiv&i¡¡t¿.
5.8.I¡ftduaió¡ d ú¡lisis dc Npqvivñ.ir.

*'r¡++9*

OMúi.r..rO-rB006%
, M CASH FLOW ESTADISTICA

EPIDEIIIOLOGIA
IADICE

- I. COMPARACIÓN DE TN TEST CON SU MÉTODO DE R-EFERXNCIA.

- 2. SABER INTERPR.ETAR UNA TA-BLA 2X2.

, 3. CONOCER EL SIGNIFICADO DE¡

- Verdadero Positivo.
- V€rd¡dero N€gativo.
- F¡lso Porit¡vo.
- Fslso Neg¡tivo.

- 4. PAR,,IMETROS QLTE MIDEN LA VALIDEZ Y SEGIMIDA-D DE UN TEST:

- 4.1, S€nsibilid¡d.
- 42. EspecUicid¡d,
- 43. Velor predicúivo posifivo.
- 4,4. Valor predictivo tregativo.

- 5. CONOCER LA RILACIÓN ENTRE PREVAIENCIA Y VAI-OR PRXDICTÍVO


POSITIVO Y VAIOR PREDICTryO NEGATIVO.

- 6. CONCEPTOS BASICOS A CONSIDERAR EN LA MEDIDA DE LAS

I "*ERMEDADES:
- 6.1.Inciderci¡.
' 6,2. PreY¡lenci¡,
- 63. Rel¡cionar Prev¡lebci¡ e I¡cide¡cia.

- 1. MEDIDAS DE FR.ECUENCIA DE LA ENFERMEDADI

7.1, Número.
7.2, Prevslenci¡.
7J. I¡cidenci¡ Acumulada.
7.4. Densidsd o T¡se d€ l¡cidencia.

r.. .:l + .:l {. ..!. a

O Montes¡, 20 - 28006 MADRID - Tfno: 91 309 3ó 4ó - l$ry.cashtlow-oposiciones,cor¡¡ 5


@ CASH FLOl¡v ESTADÍSTICA

1. COMPARACIÓN DE UN TEST CON SU Ivtr'TODO DE RETERENCIA.

2. SABER INTERPRETAR UNA TABLA 2¿.

3. CONOCER EL SIGMFICA.DO DE }?, \¡I{, FP Y FN.

Muy pocas pruebas diag¡óficas, o quiá ningun4 identifican m¡ total certeza si un paciente tiene o no
una enfe¡medad, o qué tipo de enfe¡medad padece. La EFICACIA de una prueba diag¡¡óstica depende de
su capacidad paú detect¡r corectaúette la p¡esencia o ausencia de la enfermedad que se estudi4 lo cüal
se expresa matemátic¿¡mente mediante cuat¡o i¡dices:

- Sensibilidad (S).
, - Especificid¿d (E).
- Valor predictivo positivo (VPP).
- Valor p¡edictivo negativo (VPN).

Estos indices se obtienen a partir del análisis de una serie de pacienles sospechosos de padecer la
enfermedad e¡¡ estudio, en quier¡es se ¡ealiza u¡a deten¡¡inada prueba diagnósticá, que llamaremos
PRL'EBA PROBLEMA I'lESn. Los ¡esultados obtónidos con dicha prueba se compa¡an con ¡a
dist¡ibución real de la énfermedad en el mismo grupo de pacientes, mediarte una prueba de superior
¡endimiento di&gnóstico, a la que lla.ma¡emos PRUEBA DE REFERENCIA. l¡
i¡formación derivada de
ambas pruebas se dispone en una tabla de 2 filas (resultados de la prueba problema o fest), y de 2
columnas (disnibución real de la enfe¡meda4 establecida según la prueba de refere¡cia).

Pru.be dc lcfcr.nci2

FP \?+FP
WP
nl ta¡ FII+\?N
WN
1'P+FN FP+VliI

s E
Al aplicar un test di€¡óstico a uÍa poblaciór¡ pa¡a detecta¡ una enfe¡medad, podemos encont¡amos con
4 posibles situaciones:

a =VP. Individuo enfe¡mo er el que el test da un ¡esultado positivo. Enfemo clasificado por e¡
test como enfermo.
b=FP. I¡dividuo sa¡o en el que el test da un resultado positivo. Sano clasificado como
efifermo.
c = FN. Individuo enfe¡mo en el que el test da un resültado negativo. E¡fe¡mo clasificado como
sano.
d= \.t}l. lndividuo sano en el que el tesf da un resultado negativo. Sa¡o clasificado como sa¡o.

c/Montesa,20 - 28006 MA-DRID - Tftro: 9130936 46 - \p1{\ .c¡shfloiv-oposiciones.com


.. ÁE CASH FLOl,v ESTADISTICA

4. PARTíMETROS QUE MIDEN LA VALIDEZ INTERNA DE TN TEST.

- 4.1. Se¡sibilidad (S).

- Es Ia capacidad del test para detecta¡ enfe¡mos. La s€nsibilidad mide la ptobabilidad de identifica¡ a los
- enfemos con el tes! evitando la presencia de FN Es, por tanto, la p¡oporción de enfermos clasificados
como tales, respecto del total de enfermos.

Individuos enfermos con test + a VP


Se¡sibilidad =
Todos los enfermos a+c VP+FN

Cua¡to mayor sea la sensibilidad, menor será el número de FN y mayor el número de FP '

INTER.PRXTACIóN:

VP IOO
_ sensibilidad 100% = _ = ___ ó 0% FN
w+FN 100+0
_
Todos los individuos enfermos son ¿letectados.

vP 95
, - sensibilidad 95% = -- = + 5% FN
VP+FN----
95+5

El 5% de los individuos enfermos no son detectados. Si la sensibilidad de u¡ test es del 95%, significa
que de cada 100 i¡dividuos @&@9!, este test es capa¿ de detectar 95. Los 5 que no detecta, y que
también son enfermos, son FN,

Utiliza¡emos una p¡ueba muv sensible:

i. Pa¡a hace¡ un esc¡utinio inicial.


2. Cuardo lo principal sea detectar a todos los enfermos.

4r. Esp€cificid¡d (E).

Es la capacidad del test pa¡a detectar sanos. La especificidad mide la probabilidad de identifica¡ a los
sa¡os, evitando la presencia de FP. Es, por ta¡to, la proporc;ón de sanos identificados como tales,
rcspecto del total de sa¡os.

- \rrr .cashflow-opos¡cion€s.com
'1
c/ Montesa,20 - 28006 MA.DRID -Tfno: 9¡ 309 36 46
Ú CASH FLOvt' ESTADISTICA

I¡dividuos sanos con test - \4\1


Especificidad:
d+b \4,{+FP

Al aumentar la especificidad de un tes! aumenta¡ los FN y dismi¡uyen Ios FP.

INIER}RETACIóN:

l'1.¡ 100
- Especificidad i00% = .-- = ct 0% FP
M{+FP---
100+0

Todos los individuos sanos son clasificados como sanos.

\4{ 95
- Especiñcidad 95%: ------ = o 5% FP
\l}{+FP ---
95+5

El 5% de los individuos sanos son clasificados corno enfennos. Si la especificidad de un test es del 95%,
significa que de cada 100 individuos qsqs, este test es capaz de detectar 95. Los 5 que no detect4 y que
tarnbién estin sanos, y que el test identifica como enfe¡mos, son FP.

Utiliza¡emos una orueba muv esoecifica:

1. Para conf¡¡ña¡ u¡a sospecha diagnóstica.


2. Cuando Io principal sea detectar ¡ los sa¡os.

Al contrario de lo que ocurle con los VPP y VPN (colno veremos a continuación), la SENSIBILIDAD
y la ESPECIFICIDAD son caracteristicas fijas e intrínsecas del test, que no so modifican por cambios
en la frecuencia de la enfermedad (prevalencia) e¡ el grupo estüdiado.

Un test tiene una Se¡sibilidad y Especificidad determinada, pero si se desea aument¿¡ la Sensibilidad
del test necesadarnente desc;ende la Especificidad, y viceve¡sa; de ahí que la Sensibilidad y la
Especificidad guarden una relación ir¡versa, ¿unque no lineal (es deci¡ para un cierto aumento de la
sensibilidad Ia especificidad ¡o dismi¡uye exactaoente en la misma cus¡tía, y viceversa). Si se
adopt¡n criterios diagnósticos muy estrictos disminuye la Sensibilidad (menos enfermos cumplen esos
criterios) y aumenta la Especificidad (pocos sanos se clasifican erróneamente).

En muchas p¡uebas dia$¡ósticas debe decidirse a partir de qué valor se considera¡á la prueba corno
positiva, y a dicho valo¡ se le denomina punto de corte. Por ejemplo, 9l valo¡ de gluoosa en sange a
partfu del cual un paciente es diabético, o el valor sé¡ico de transaminasas en el diagnóstico de
hepatitis. Esta decisión requi€re llegar a un comp¡omiso entre una mayo! Sensibilidad y una
Especificidad disminuida, o viceversa. El investigador debe sopesar la impofancia ¡elativa de la
Sensibilidad y la Especificidad de la prueb4 definie¡do el punto de corte de acuerdo co¡ ello. Una
forma de tomar esta decisión es consjderar las implicaciones de los dos errores posibles. Si deben
evitarse los resultados falsamente positivos (FP) (p.ej., un ¡esult¿do que determinaría ei que un

C/ Montesa,20 - 28006 MADRJD - Tfno: 9t 309 36 46 - www.crshflow-oposicion€s.com


Eg CASH FLCDW ESTADÍSTICA

paciente se debe someter a una i¡tervención quirurgica), el punto de co¡te puede situarce de manera
que la Especificidad de Ia prueba sea máxima. Si, por el contrario, se desean evita¡ los resultados
falsamente negativos (FN) (como en Ia detección sistemática de la fe¡ilcetonuria neonatal), se deberá
defini¡ €l punto de corte de forma que se asegure una alta Sensibilidad de la prueba. Es decir, la
sensibilidad y Ia Especificidad de un test pueden se¡ conside¡adas constanres y aplicables ar esrudio
de cualquier paciente, siempre oue se mantensa el mismo ¡pétodo en su eiecucjón v los mismos
c¡iterios definitorios de la oositividad de Ia o¡ueba (es decir, el mismo punto de co¡te).

VALORXS PRIDDICTIVOS DE LAS PRIJEBAS DLAGNóSTICAS O PROBABILIDADES


POSTPRUEBA.

Un paso posterio¡ eD el p¡oceso diagnóstico consiste en conocer qué probabilidad existe de que el
paciente en estudio padezca o ro la enfemedad, una vez que se sabe el resultado de las pruebas
utilizadas La tabla 2x2 permite carcurar dichas probabiridades, que se denominan p.obabilidades
posleriores o va¡ores prediclivos de lá prueba diatmósrica.

4.3. Va¡or p¡ed¡ctivo del resutfedo positivo (\?p).

Es una cualidad muy importante de un Gst, y se calcula identifica¡do la proporción de pacientes con
resultado positivo en la prueba problema (a+b) que tieDen la enfermedad (a). El Vpp indica
la
probabilidad condjciona¡ de padecer la enfe¡medad si la prueba p¡oblema es positiva;
es decir, indica la
proporción de enfermos que en definitiva va a diagnostica¡ el test.

!?
v?P=-.=--__
¡+b l¡p+Fp
4.4. Valor predictiyo del resultedo negativo (V?N).

Se calcula ide¡¡tifica¡do la proporción de pacientes co¡ resultado negativo en la prueba


problema (c+d)
que no tieDen Ia enfermedad (d). El VpN indica la probabilidad cor¡dicional
de no pa¿lece¡ la enfermedad
(de esta¡ sano) si la prueba problema es negativa; es decir, indica la proporiión
de sanos que en
definitiva va a diagnostica¡ el test.

rt{
!?N = _--:
(-fd --__.
FN+\¡N

INTERPRETACIóN:

\? 100
VPP 100% = --*-- = ----- e 0% Fp
VP+FP 10010

Todos los indivjduos con test positivo son enfermos.

vP 85
vPP 85% = __-_ = -______ + t5% ¡P
VP+FP 85+15

C/ Montesa, 20 - 28006 MADRID Tfno: 9t 309 36 46 _ n*-"p*¡"¡"."".


-
"*lr"".t
@ CASH FLOt,v ESTADÍSTICA

El 85% de los i¡dividr¡os con test positivo son enfe¡mos. El l5% de los ifldividDos con test
positivo son sanos (FP)

\4'l 100
VpN 100% = -*--_ = ----- o 0% FN
!1,¡+FN 100+0
Todos los individuos con test negativo son sa¡ós.

lN 75
vPN 75% = --- = *-> 25% FN
vl{+FN ---
75+25

EI 75% de los individuos con test negativo son sa¡os. El25olo de los individuos con test negativo
son enfermos.

PRECISIÓN O VAI-,OR GLOBAL DE LA EFICIENCIA DEL TEST.

Existe oho panímetro me¡os usado, pe.o no por ello sin importa.ricia, que es el Valor Global de la
Eficiencia del Test. Este nos indica la proporción de resultádos válidos en relación a todas las
mediciones realiz¡das. Es la proporción de resultados verdaderos (VP y \n'0 entre todos los
resultados del test.

vP + \n{
P¡ecisión de uri test =
!?+vf¡+FP+¡N
A pafir del Valor Global de un test o p¡ecisión, podemos conocer las malas clasificaciones del
mi$¡o, las cuales se calculan:

Malas clasificaciones = 1 - Valo¡ Global dol Test

5. REIáCIÓN ENTRE PRXVALENCIA, !?P Y vPN.

La p¡evaiencia de una enfermedad suete denomina¡se probabilid¡d prev¡a o probabil¡d¡d


preprueb¡, Es la p¡obabilidad, basada ea caracterlsticas demog¡áficas y clinicas, de que un paciente
dado preserte una enfdmedad, estimada s¡tes de efectua¡se la p¡ueba diagnóstica.

a+c \?+FN
PREVAIENCL{ = =
a+b+c+d VP+FP+FN+1']I

--
La p¡evalencia es la propo¡ción de individuos enfermos entxe el tot¿l de individuos. El Valo¡ P¡edictivo
(\/PP y VPN) de un test depende de:

C/ Montes¡, 20 MADRID - Tfno w-$'rv.cashflow-oposiciones.com l0


- 28006 | 91 309 36 4ó -
@ CASH FLOW ESTADISTICA

i. La sensibilidad del test.

2. La especificidad.

3. De la prevalencia de la enfermedad investigada.

A especificidad y sensibilidad constantes, los va¡orcs predictivos se modifican segin la prevalencia:

- Si la P aumenta 4 aumenta el VPP y disminuye el VPN

- Si la P disminuye a disminuye el \?P y aumenta el VPN

Para la evaluación de un test se requierc el conocimignto previo y claro de ia prevalencia. Cuando Ia


prevalencia es alta y el test da positivo se puede afirmar la enfermedad con cierta t¡anquilidad (hay
valores p¡edictivos positivos altos) mie¡tras que un resultado negativo no a)arda demasiado para
descafar Ia enfermedad (hay valores p¡edictilos negativos mode¡ados). Si ia prevalencia es baja y el
test da negativo se puede rechazar la enfe¡medad con cieIta fia¡quilidad ya que los valores predictivos
negativos son altos, mient¡as que ios diagnósticos positivos no ayldan mucbo pa¡a confirmarla
(valores predictivos positivos moderados). Un test diagnóstico puede ser útil para confirmar o
rechaza¡ un¿ enfermedad dependiendo de su compoñamiento ante la p¡evalencia real de Ia
enfermedad.

6. CONCEPTOS BÁSICOS A CONSIDERAR EN LA MEDIDA DE LAS ENFf,RMEDADES:

6.1. Incidenci¡: Núme¡o de casos nuevos que aparecen en un periodo de tiempo.

6.2. Prevslencia¡ Números de casos existentes en un momento determinádo.

63. Preva¡eDcia = I¡cidenci¡ X Periodo de Tiempo (ej., Prcvalencia a los 3 años = 40 casovaño
(incidencia) x 3 años (periodo de tierrpo): 120 casos).

7. MEDIDAS Df FR.ECTJENCTA DE LA EMERMEDAD

7.1. Nú¡Íe¡o.

Ejem: en EElru hay 3.000.000 de personas parasiradas por Asca¡is. En Átrica hay 160.000. Es una
buena medida pam una primera aproximación del problema. Limitaciones: al no conoce¡se el
de¡ominador, no podemos comparar la ñecuencia en dos poblaciones, nj conocer Ia irnportancia relativa
del problema.

?.2. Prev¡lencia-

- Es una proporción.

- Concepto: Es el Dúmero de enfemos entre el total de la población.

C/ lfontes¡,20 - 28006 MADRID - Tfnor 9l 309 36 46 - \$Ín.cáshftow-oposiciones.com ]I


@ CASH FLOW ESTADfSTICA

- Es una medida que se hace en un momento d€l tiernpo.

- Permite compatar poblaciones de dili¡ttos tamaños.

Ejemplo:

3.000.000
Prcvale¡rcia en EEIIIJ = = 1,33%
22s.000.000

160.000
p¡cvale¡cia en África = ---- = O,O24o/o
655.000.000

- Describe la si ación en m momento, no tiene dimensión tiernpo.


- Es la medida de f¡ecuencia de Ia enfe¡medad en los estudios transversales.

Dentro delconcepto de Prwalencia definimos:

r) PRXVALENCIA DE PUNTO o PREVAIENCIA,

No de enfermos en el momento del estudio


PREVAIENCIA de pu¡to =
Población

2) PRXVAITNCIA DE PERIODO.

Es igual a la prevaiencia de pünto al inicio del periodo de estudio, rnás la incidencia durante dicho
pe¡iodo (casos nüevos), dividido por la población eústente a mitad de periodo.

No de casos al inicio del periodo + c¡sos nuevos


PREVAIENC1A de periodo =
Población a Íiit¡d de periodo

7.3. Incldencie Acumulada (IA),

- Es una p¡oporción.
- Conceptoi No de casos ¡uevos de wla enfermedad que se p¡oducen en un periodo de tiempo.
- Es o mide Ia probabilidad de que ua individuo desa¡¡olle la enfe¡medad en ese periodo.

No de casos nuevos en un periodo de tiempo

Tofal de población a riesgo al comiellzo del periodo

O Monlesr.20- 2800ó MA-DRID -Tfno: 91309 36 46 - $.*v.casbflow-oposic¡o¡es.com 12


- ü CASH FLOlf,f ESTAD¿STICA

] ,.0. o"orirlad rle bclderch @I) o Tstr dG Itrclde¡ci¡ (fD

- Es ü¡¿ tasa.
; - ó*[to, N" au nuovos de la o¡fcrmedad quc sc producen cn un p€¡iodo' te¡icndo
cn

- ""*¡
cucnta la iuformaoión que apora cadá uEo dg los individuos'

No de Casos NuEros
DI
Porsonas-Años

poblsción ConcePto q¡e s€


- Exprcsa la volocidad co! q¡¡c so producc la onformcdad en una
Y *o el nomtre do Füerz¡ d. l¡ Morbiüd¡d'
"*o""

o l¡*t..., zO MADRD - Tfno: 91 3{D 36 {6 - $'\tr.cishllo*'opo¡icio¡'3 com ¡'


-U80OO
EA CASH FLOvt' ESTADiSTICA

xocloilEs DE EsTADlsflca lla partel


INDICE

INTRODUCCIóN A LA ESTADÍST'ICA

1. DeliDició¡,
Cl¡sific¡ción de la est¡dístic¡.
3. CoDceptos bÁsicos.

ESTA.Df STICA DESCRIPTTVA

1, Repre¡entacióD de detos Cleblas y gráIico¡).

l. l. Va¡iables cualitativas
1.2. Variables cuantitativas disqet¿s
L3. Variables cuantit¿tivds continuas
2. f¡dices que deliDer ü¡a distribuciótr de datos:
2.1. Medidas de ceDt¡alización.
2.2. Medidas de posición.
2.3. Medidas de dispersión.

3. Formas de u¡¿ distribüción de datos:


3.1. Según Ia Moda.
3.2. Según la Simetría.
3.3. Según el Apu¡tamierito.

4. hyes teóric¡s q¡¡e se aj¡rstaü a distribücioDes biológices:

4. 1. Dist¡ibución Binomial.
4.2. Disfibución de Poisson.
4.3. Distribuciót Normal o de Gaüss.

PROBABILIDAI)

1. Corcepto.
2. Probrbi¡idadcoDdicional
3. Ac¡lteclmientoscomplejosl
3.1. Regla de la multiplicación.
3.2. Regla de la suma.

CONCEPTOS FIINDAMENTAI,I,S EN INVESTIGACIÓN CLh'ICA

6.,++$€..t

C/ MoEte$, 20 - 28006 MADRID - Tfno: 91 309 36 46 - $.n'rv.clshflow-oposicionescom l4


g] CASH FLOr,v ESTADÍSTICA

INTRODUCCIÓN A LA ESTADÍSTICA.

1. DEFINICIÓN.

La Estadística es un método de razonamiento que permite inte¡preta¡ aquellos datos cuya


caracte¡ística funda.¡nental es la variabilidad, para obtener üDas conclusiones, con una seguridad
conocida (D.Sch*ar¿). La estadística es el co¡junto de métodos necesarios para rccoger, clasificar.
representar y ¡esumir datos, así como para hacer inferencias, es decir, extraer consecuencias
científicas a panir de ellos.

2. CLASIFICACIÓN DE LA ESTADfSTICA.

EST{)ISTICA DESCRIPTM: Se encarga de ordena¡, presentar, sint€tiz¿r y organiz¿r ¡os datos


de forma inteligible y científica.

EST{)ISTICA INFER¡NCIAL; Es Ia que nos interes4 la fundarnental en Ciencias de la Salud.


Trabaja con los datos de la Estadística Descriptiva. permite establecer conclusjones de una población
(INALCANZABLE), a pafir de los daros estudjados de una muesba (ALCANZABLE). por ejempto:

POBLACIóNDE MUESTRA DE EXPERIMENTO


HIPERTENSOS 5OO HIPERTENSÓS

110 mlnHg

INFERENCIA

LA PRESIÓN DIASTO!¡CA MEDIAEN LA


POBLACION ES 110 +¡ 2 mmHg. CON UN¡
SEGUR|DAD DEL 999{l o<0,01)

3. CONCEPTOS BÁSICOS,

TOBLACIóN: El térmi¡o población se defi¡e como el conjunto de todos los elemenros que cumpjen
ciertas propiedades, enrre las cuales se desea estudia¡ u¡ determi¡ado
fe¡ómeno. Este té¡mino es
sinónimo de unive¡so. So dice que una población es filila, cuando se
conoce el núm€ro exacto de
todos los elementos que la componen. Se dice que una población
es inlinita, cuando no se pueden
conocer todos los elementos que Ia componen.

MUESTRAT EI problema qu; presenta tabaja¡ co¡ toda la población


es que las poblaciones tienden a
ser ¡nuy extensas y es prácticaDente imposible de estudiarlas
de fo¡ma completa. F¡ente al concepto
de población como conjunto, )a muestra se define como un subconjulto
o iarte de la poblacjón. Se
disti¡guen los témi¡os de muest¡a representativa y muestra no representativa:

C/ Montesa, 20 - 28006 VtA¡nm - rrno, sr ¡Os ¡¿Je_


","*:;;;;;;;i;;;; 15
IEE C>ASH FLC'l,v ESTADiSTICA

Se djce que una muestra es representativa de una població¡ cuando cada uno de los
elementos que la forman, que cumplen cjertas propiedades y de los cuales estudiaremos un
determinado fenómeDo, ha sido elegido áleatoriamente (al aza¡)

En cambio, se dice que una ñuestra no es represent¡tivt de úna población cuando los
elementos que la componen no han sido elegidos a¡eatoriamentg.

Elegir aleatoria$ente los elementos que componen una muestra significa que djchos elementos y los
rest¿¡tes que no la componen han tenido las úietlas probabilidades de se¡ elegjdos Al procedimiento
o sistemática de extraer una muest¡a se denomina muestreo.

Se considera que una muestla es pequela o grande en función de que el número de individuos que Ia
componen sea inferior o superior a 30. Trabajar con una rnuesÍa de tamaño adecuado reduce el coste
del estudio y permite aumentar la calidad de los datos.

UDn¿Dllg: Seide¡tifica al individuo de una población o de una fiuestra como cada uno de los
elementos que la co¡nponen y de los cuales obtenemos ciefa infomación mensurable del fenómeno
que se desea estudiar. Pueden se¡ penonas, animales, procedimientos .

VARIABLE (CARACTf,R): El término de variable o carácter se puede defi[ir como Ia ProPiedad o


cualidad que presenta¡ los elementos de la población que se desea estudiar, o como todo aquello
susceptible de ser medidos de los elementos de la población. Es una característica que es común a uo
ciertó grupo de individuos u objetos y que tie¡te diferentes g¡ados de magnitud o catego¡ías Las
va¡iabjes se pueden clasificar según difere¡tes criterios. La clasificación más utilizada es la siguiente:

A) CUALITATMS (atributos): Son aqueilas que reflejan una cualidad, y que por tanto no Pueden
cuantificarse, Es dec4 no pueden expresarse numéricamente, sino por medio de Palab¡as excluyentes
entre sí (categorías). Las variables cualitat¡vas 9e clasifican en:

l. CUALITATMS NOMINALES: Son aquellas variables en las que las dilintas categorías
de la variable €nume¡an, sin establece¡ un orden, a la variable. Ej. Profesionesi Arqujtectura,
Biologia, Medicina.

a. CUALITATÍVAS DIcoToMIcAs O BINA-RIAS: So¡ nominales que sólo


pueden tomar 2 valo¡es, es decir, sóJo poseen dos categorias. Ej. Sob¡evivir a una
operación: SI, NO. Es un subtipo de nominales.

2. CUALITATIVAS ORDINAIES: Son aquellas variables cualitativas en las cuales las


categorías ordenan de un modo cleciente o decreciente a la variable. Ej. Pronóstico de u¡a
enfermedad: Leve, moderado, g¡ave.

B) CUANTITATWAS: Las va¡iables cuantitativas son aquellas que pueden medirse numérica¡nente;
es deci¡, que puedgn cua¡tifica¡se, Las vatiables cuantitativas se clasifican a su vez en:

l. DISCONTINUAS o
DISCR.ETAS: Son aquellas que sólo pueden expresa¡se mediante
números naturales ente¡os. Es decir, aquellas en las que entre dos valores consecuti\os no
podomos encontrar ningún oco valo¡. Ejemplos: Núme¡o de hijos, número de eritrocitos,
ñúmero de muertos. Como ves son recuertos de individuos.

MADRID - Tfno: w$T.cashflow-oposiciones.com t6


C/ Mortesa. 20 - 28006 91 309 36 46 -
ESTADiSTICA
@ CASH FLOW
cualquier valor numérico
2, CONTINUAS: Son aquellas que pue¿len exPresa$e mediante
de un intewalo, puede¡ adoptar cualquier
localizado en la escala Je medida. Es decir, dentro
gluremia Sin embargo' el
valor intermedio. Ejemplos: Tall4 temPe¡atut4 Peso' nivel de
ya que está limitado por la precisión del
resultado de medir una variable conti¡ua no es exacto
instrumento de medida utiliz¿do

se denomina¡ datos numéricos-


Los valores nü$é¡icos que toman las variables cuantitativas

Las variables se represe¡tan con letras latinas


(x, y -), y sus valores se indicanmediante un subindice
que
iésimo de la lariable x; es deci¡' el valor de la variable x
i>rf, >rl .-, :<f ..., ,.r1, aonde xi es el valor
tiene el individuo i. Se puede decir que:

Las vúiables cualitativas se nomb¡an.


Las variables cuantitativas continuas se miden
Las variables cuantitativas discretas se enumeran'

TRANSFORMACIóN ENTRE VARLA.BLES:

Las va¡iables sl admiten t¡ansformacio¡es' que las variables NO SON siempre de un determina'lo
'a
tipo, sino que en fir¡ción ¿le Io que nos inte¡ese, LAs CONSIDERAREMOS de uno u otro tipo Si
como: Joven' No
Iá variable "edad", ¿,qué tiPo de va¡iable se¡ia? Si Ia considerahos
""*áia."r¡o. bina¡ia; si la co¡sideramos como: I¡fancia, juventud' ñadurez' senectud' es
¡ou"n,
"s "u"litatiu"
cualitativa o¡di¡al. Tomada como edad en años efite¡os, es cuafititativa discret4
y si se habla de la
va¡iable edad sin especificar ninguna co¡dición, es cua¡titativa continua Por
ello decimos que las
Las variables aceptan
variables NO SON siempre del mismo tipo, dePende de cómo las cot$ide¡emos
transformacio¡es en un sentido, pero no en el ofo:

CUANTITATiVAS CUALITATIVAS
7
Un criterio que hay que tene¡ en cuenta y que hace ¡eferencia a enfoques metodológicos de
la

esta¿lística en si misma es el correspondienfe a la ca¡tidad de va¡iables


qüe estudiamos'
es el análisis
Evi¿lentemente, cuanto mayor es el nrtmero de va¡iables estudiadas, más complejo
estadistico que se realiza. Si se maneja una sola variable, se habla de est¡dístice
univarianie' si se
manejan dos va¡iables simuitáneamente, de estadística biveriante'
y si se rna¡ipulan muchas
va¡iables a Ia vez de estadísticá multiveriante o ¡nálisis multiv'ri¡¡te'

Ejercicio 1: clasificar I(s siguientes variobles:

. Estado ciril. ,-,,.-.üü\,.r' -,,-*,*,-{


. Ni,¿¿l de tensión art¿'ia¡: C-cu-l'\"1'v¿- 'c-¡-l\'
¡'r'c' , \'
. Hiperlensión arterial nedido cono hipertenso o no hiPertenso
(ci.l lc¡l vr' ((rt;\-*-'l(-ct
. Nj,eles de glucenia, C ¡lt.d,.¿ r.¿L{l¡ i
{'!r(.
. "<,-*i ("o-{,{t\
Número de paci?ntes fumadorcs: ru,-. c\'\rc ¡--'l'¡¡ ql
. Habito de b?ber tno. moderado. inpo ante). ¿'.4-! {','l ,r"tr orJ
'-u..1

$rrr'*'crsbflow-oPosicion€s com
'll
cltllont"o, zo -ZsOOe ITADRID - Tfno: 9l 309 36 46 -
[O GASH FLC'vt' ESTADISTICA

Se designan corno p¡rámetros a aquellos valotes que ¡esumen una deteminada información
referente a una Población, y como estadíst¡cos a aquellos valores que expresan una detemlinada
;nformación de una muestra extraÍda al azar,

Símbolos más usüales Població¡ (Parimetros) Muestra (Estadísticos)

Ta¡naño de Ia muestra N n

Media aritrnética M lE

V^ri^nz.a S'

Desviación estándar S

Proporc;ón P p

EEE4]¿S-D,E-!4EEQ4:

Las escalss de medida se deñnen como ün sistema para la asignació¡ de números a los objetos
fe¡ómenos que se estudian. Las escalas de medida se clasifican en:

1. ESCALA NOMINAL: La operación matemática que realiza este sistema de medida es la


clasificación de los individuos según padicularidades de na.t)rateza cualifativa. Las va¡iables
cualitativas nominales y dicotómjcas son ejemplos concretos de varjables iue se miden segúD una
escala nominal. Enf¡e las distintas categorias sólo son Posibles relacioDes de igualdád o
desiguálded (Arquitectura I Biologia).

2. EscAI"A ORDINAL: La operación ñatemática que realiza este sistema de media es la


ordenación de los individuos; es decir, se establece entre los individuos estudiados u¡a relación
de mayo¡ igual o menor que (orden). Esta ordenación puede se¡ creciente o decreciente. Las
variables cualitat¡vas o¡diriaies son variables que se miden según u¡a escala ordiial. Entre las
distintas categorias son posibles relacio¡es de iguelded o desigualdad (leve + moderado) y de
orden (leve < moderado).

3. ESCALA DE INTERVALO: La operación matemática que ¡ealiza este sistema de r¡edida es la


comprobación de la iguatdad o desigualdad de Ias dista¡cias entre los valo¡es que toman los
individuos estudiados- Las va¡iables úedidas en esta escala deberán ser cuantitativas, pero bo
teDdÉn uD cero absoluto sino que será rclativo. La tempe¡atura cotporal en gtados centígrados
es un ejemplo de variab)e cuantitativa que se mjde en esta escala- Asi por ejemplo, un objeto que
esté a 40'C y otro a 39'C tienen la misma diferencia de calo¡ que un objeto que est¿ a 29'C y otro
a 28'C. En ca¡nbio, al no disponer de un cero absoluto (00 no es aDsencia de temperatura sino una
temperatura arbitra¡ia), un objeto a 40'C no tiere el doble de calor que otro a 20'C. Entre los
distintos valores son posibles relacioDes de igu¡ldad o desigualdad, de orde¡ y de sum¡ y
resfá-

4. ESCALA DE PROPORCIóN O RAZÓN: La operación matemática que realiza este sistema de


medida es el establecimiento de proporcjo¡es o ¡azones entre valores de la variable, lo que supone
un mayor grado de cuantificación de la variable y la existencia dé un cero absoluto Pa¡a ella-

28006 MADRID Tfnor 9l 309 36 rr\vn.cashnow-oposiciones com t8


C/Montesa,20 - - 4ó -
gs casH gsrlpfsnc¿
-i FLovu

- Esta escala ¿sumc todas las oporaoioúes matomáticas de l¡ csc¿la antcrior, y lo qüe cs p¡gpio de
- estr csoala de qedida, establcce pmpolciones entle dos v¿lorcs de la vali¿ble. Ejemplós de
- va¡idbles cua¡tit¿tivas medida¡ cn e¡ta cscala de proporció¡ sotr la talla' el p98o o el nivol de
' glucosa d9 los individuos. O$o ej€mplo setía el nlnc¡o do ciga¡rillos con$-¡midos, ya que el
origo! d9 la esc¿l¡ indic¿ la auscncia de cot¡sut¡o dé tab¿c¡ (0 ciganillos). Entrc los disti¡tos
- valoros son porlbler rel¡cio¡é de lgü¡ld¡d o deeigualdad' de orde!' de sum., .est¡
" r¡ultlplie¡c¡ó¡ y dlvisió!,
*l

C/ Mo¡te¡l,20 - 28006 M^DRID - Tfno: 91 309 36 46'wrv?.c¡shllow-opolicion€s.com 19


ü CASH FLOW ESTADíSTICA

ESTADÍSTICA DESCRIPTIVA.

r, REPRESENTACIÓN DE DATOS (Tablas y Gráficos),

Se e¡tiende por tab¡rlsción la operación de rcsu$i¡ de manera ordenada un co¡junto de datos


numéricos en una tabla; y por tabla de frecuenci¡s, a üla tabla en la que se expresá d€ úanem
orde¡ada un conjunto de obse¡vacior¡es con el Íúmero de veces que éstas se repiten'

1.1. VARIABLES CTJALTTATÍVAS

Cotceptos previos:

- Frecuencia ab¡olutr (fe). No de veces que Preseuta cada uná de Ias categorías de la variable'
tr=tfa
- Frecuencia relativa (fr). Cuando exPresamos las frecuencias absolutas con respecto al total
de individuos estudiados. fr = faln; % = fi x 100

La distribución de frecue¡cia¡ son una se¡ie de clases prcdeteminadas con el núme¡o de sujetos que
se incluyen en cada cl¿se.

A) Tabla de ñecuencias:

Estado civil fa f¡ %
Solte¡o 54 0,27 27
Casado t30 0,65 65
viüdo t6 0,08 8
200 1.00 100

B) Gnáficos:

I. DIAGRAMA DE BARRAS: Pa¡a su mnstucción se necesita¡ u¡os ejes de coordenadas. En el


eje d€ abscisas se representan las distintas categorias y en el de ordenadas las frecuencias (absolut¿s o
relativas) de cada categoría. Las ba¡¡as (que están separadas entre sí, ya que la variable no es
continua) son de la misma aíchura y su altura es propo¡cional a la f¡ecuencia (absolüta o relativa) de
cada catego¡ía. La base tiene un ancho a.¡bit¡ado pero oonlante.

124

30

?0

$'rna,.cashflow-oposicioDes com 20
C/ Montesa, 20 - 28006 MA-DRID-Tfno:91 30936 46 -
[A CASH FLC'W xrloisnc¿t

cada valor de la
2. DIAGRAMA DE SECTORXS o DE PASTELI Se construye reprcsentando
de cada sector
variable estudiada dediante una porción de circulo (secto¡), en donde el áng]rlo central
es proporcional a las frecuencias (b!en absolutas o relativas)

fr
Viudos
8o/o Solteros
270/,

3. PiCTOGRAMAT Son representaciones gráficas e¡ las que se utilizan Ias superficies enmarcadas
en un dibujo o pintura.

4. CARTOGRANIA: El cafograrna definir como aqu€l g¡áfico qüe utiliza una suPerficie
se puede
¡epresentativa relacjonada con mapas geognificos. E la práctica eflplea como soporle del imPacto
visua¡ uü mapa en el que se indica¡ las zonas que coñesponde¡ a cada u¡o de los valores de la
va able estudiada.

5. DIAGRAMA POLAR: Esta ¡epresentación gnifica es menos utilizada que las anteriores. Por la
fo¡ma de p¡esentación (no po¡ su construcción) es parecido a los sectores circulares Pa¡a elabora¡ un
diagrama pola¡ se sigue la siguiente sistemáticat se toman las frecuencias absolutas o relatjvas de cada
una de las categoías de la variable y, con dichos valores, se lÚa la longitud de los radios
correspor¡djentes, que parten todos ellos de un punto cent¡al teórico. De esta fo¡ma se "polariz n"
todas las categorías en un mismo punto central, a Part¡r del cual se van trazando gráficamente las
rectas correspondientes a los ¡adios.

rnr"rv.c¿sh flow-oposiciones. com 21


CJ Montesa,20 - 28006 MADRID - Tfnor 9l 30936 46 -
ü GASH FLOW ESTADiSTICA

EJ¿rp¡¿. R.pÉr¡. ns,iúl! ú dirtm poli ¡!¡ r¡8!idc5 .r{ót DhE


leücnr.¡ ilé dlico E$n ¡ot dra ¿. I¡ ¡.D¡r:

rsÉ .-.--..-...-.......,....,. ¡5
M¡r¡s ....,.,....,...,,........ rO
MiéFo¡B .... ,. . ,. . . , ,. ..,,. .... 9
t¡cvs . . . . - . . . , , , . . . , , . , . , . . . . . . ?
vihs ....,..,.,......,,.,,,.-. ll
S¡b¡do..........,....,,,,..,,... 2l
Doñ6t6 ,. . . . . . .,.,..,.,,.,.... . 20 virú
Dl.qBh. por{ d. l. Eri¡!¡. .¡cddlnlú d. tAfi@ t.trrñ lot drÚ
El d¡¡l:sr D.lÉ Eúbr. B.¡ nothdo 6 l¡ fitn l¡¡.m.nr'.

1.2. VAXIABLES CUANTTTATWAS DISCR¡TAS

Conceptos p¡evios:

- Frecüercia absoluta (fs). No de veces que presenta cada una de las categorias de la variable
¡=Ifa
- Frccüencie rel¡tiva (fr). Cu¿ndo expresamos las frecuenciás absolutas con respecto al total
de individuos estudiados. fr - faln. 7o = fi x i00

- Frecuencia acumul¡d¡ absolut¡ (F¡). Fa = X fa, Expresa l¿ suma del ¡úmero de veces que
ocu¡¡en dete¡minados valoros de la variable hastá un valor dado.

- Frecuencia ecumul.d¡ relativ¡ (Fr). Suña de las sucesivas frecuencias relativas. Fr =: fr.

A) Tabla de frecuencias:

N' de fe fr Fr Fr
hijos
0 50 0.33 33 50 0.33
1 30 0.196 19.6 80 0.526
z 40 0.26 26 120 0.786
3 20 0.13 t3 r40 0.916
4 10 0.065 6.5 150 0.981
3 0.02 2 153 1.000

B) Gñáfico:

1. DLdGRA¡{A DE BARRAS.

- En el eje de abscisas se representan las distintas categorias.


- En el de o¡denadas las frecueocias (absolutas o ¡el¿tivas) de cada categoria.
' La altu¡a de cada ba¡ra es proporcional a Ia fecuencia (absoluta o relativa) de cada categoría.
- Las baras están separadas (ya qüe la variable no es coirtinua).

c/ Montesa.20- 28006 MADRID - Tfno:91 309 36 46 - w$'w.csshflow-oposiciones.com 22


ESTADiSTICA
@ CASH FLOW

50

40

30

20

10

0
23
N' d6 Hüos

2. DIAGRAMA DE Lft{EAS.

de los extremos superio¡es de las ba¡ras


Es la rcpresentación que resülta de unir el punto medio

3. DTAGRAMA DE BARRAs AcRrJ?ADAs Y DTAGRAMA DE r'Íluls utrr'rpr-¡s'

Correspo¡de a Ios gráficos ante ores pero sübdivididos por subpoblaciones


definidas (en este
ejemplo por el sexo).

$-rrw ctshflow-oposiciones com 23


E¡ V.tr"."" ZO- Z¡0061\tADRID - Tfno: 91 309 36 46 -
EO CASH FLOW ESTADíSTTCA

4. DTAGRA]\{A DE BARRAS A-PILA.DAS Y DIAGRAMA DE AREAS APILADAS.

:
¿

E
!

En ambos casos es imprescindible representar las frecuer¡cias relativas (o el po¡centaje), de forma


acumulada o no, para que las banas o á¡eas sea¡ comparables,

VARIABI-DS CIJANTITATÍVA S CONTIM]AS


'3.
CoDceptos prcvios:

Corno esta variable puede tom valorcs inte¡medios enhe dos números dados, Ia rep¡esentación
gráfica requjere, como paso previo, la agrupación de datos (ver posteriormente). Para ello, hemos de
dividi¡ la va¡iable en intervalos geDe¡almente iguales y conta¡ los i¡dividuos que presentan valores
comprendidos en cada uno de ellos. Estos inte¡valos se denominan qb$eg; los valo¡es extremos de
cada uno de los i¡tervalos se denominan, límites inferior v superio¡ de cada clase; la distancia entre
ambos limites, generalmente consta¡te se denomina, i¡tervalo de clasei y el valor cent¡al de cada
intervalo se denomina, marca de clase.

En ocasiones, puede surgir la duda de dónde incluú un dato que, casualñente coincide con el limite
del intervalo: si incluirlo en la clase inmediata a¡te¡ior, o bien en la siguiente. Se acepta el criterio de
"siempre que un dato coincida con un limite, será incluido en la clase siguiente".

El número de intervalos o clases ¡o


debe ser ni superior a 20 ni inferio¡ a 5, para evitar qüe la
información esté muy dispersa o por el cont¡a¡io muy concentrada. El ¡úmero debe oscila¡ en tomo a
10. A los intervalos exhemos se le asigra la úisrna amplitud que la de los intervalos má6 próximos.

C/Montesa,20- 28006 MADRID - Tfno: 9l 30936 **av.cashflow-opos¡ciones. 24


46 - com
ESTADiSTICA
@ CASH FLOW

Ejemplo: Talla de 50 individuos

A) Tabla:

T¡lla l^ fr % Fa Fr
150-155 5 0.1 l0 5 0.1

9 0.18 18 T4 0.28
155-160
l5 0.3 30 29 0.58
160-165
10 0.2 20 39 0.78
165-170
,7
0.14 14 0.92
170-175
>1?5 4 0.08 8 50 1.00

50 t.00 r00

B) G¡áficos:

en el eje de '
B,1" mSTOGRAMAI Se constn¡ye me¿liante banas adyaoentes' representandose
abscisas los ittervalos e¡ los que se agrupa la variable oase
de la bafa), y en el de oldenadas las
frccuencias (absolutas o ¡elativas) (altura de la barra) de cada intervalo'

.t5o 155

gñáfica más
8.2, POLÍGONO DE FRECLTENCIAS: A pesar de ser el histog¡ama Ia ¡€P¡esentación
con el
utilizada en el campo de las variables cuantfativas cotltinuas, a veces' 3e compleme¡ta
sobre el histograma; ello' es
denomi¡a¡lo "polígono de fiecuencias". Este gnifioo se constn¡ye Por
en cuestión En
condición previa habe¡ rcalizado Pftviamente el histograña de ls vanable continua
ocasiones, resulta conveniente sustituir el histograma por este otro gráfico,
pero su utilización es
obligad¿ cuando se ¿lesee p¡esent¿r cn un mismo gráfico dos o más histog$rnas comparables'

lmaginemos que quisiéramos rePresentd de folma simultánea la talla de hombres


y de muje¡es y
pr.rlnt rlu, ,up"rpu".t¿s; la suPe¡posicióD de rectÁngulos haria dificilmente inteligible la lectura El
íolígono de frecuencias no es otra cosa que una q!!br4b que une los puntos medios de las bases
superiores de los rectinguJos del histograma.

25
C¡ lr.ront saJo-z¡OOe UADRID-Tfno:91 309 36 46 - h$1v'cashíow-oposiciones'com
ü G>ASH FLG'l¡v ESTADISTICA

h
'15

lib a55 t,o 4a5 nt fts 19o 185

8.3. POLÍGONO DE FRICUENCIAS ACUMULADAS¡ También pueden presenta$e los


Histogramas y PoligoDos de fiecuedcias como gráficos aoumulativos, si en cada clase se recogen
todos los individuos comp¡endidos en ella más los comp¡endidos en todss las anteriores a dicha clase.

Hemos comentado anteriomente que la magnitud de los intervalos de clase suele ser Ia misma en los
diferentes interyalos c¡eados, pero en cieftos Aabajos de investigación suele interesar qüe los
intervalos no sean de magnitud constante. Los intervalos de clase dife¡e¡tes se emplean, como caso
tipico, en ¿quellos estudios en que se analiza un fenómeno eri función de la edad de los componentes
de la úuestú y cuando se quiere dest¿car, no año por año, o por gn¡pos iguales de años sino, por
ejemplo, etapas clave de la vida: primera infancia, segunda infanci4... que, natu¡almente, no están
constituidas po¡ el mismo núme¡o de años. Ante tal situación, no existe incoDveniente en subdjvidir Ia
va¡iable "edad" e¡ intervalos.de lo¡gifud dife¡ente. SiIr emba¡go, es necesado toma¡ u¡a precaución
impo¡tante, pa¡a que la representación gráfica no ¡esulte incorecta: Las alturas de los recüinqulos del
histoe¡aúa (que representaban, como sabeúos, las frecuencias absolutas de cada clase) deben ir
previanente divididas po¡ el intervalo de clase pa¡a que asi, los rectángulos tengan áreas
verdade¡a¡De¡te comparables ente sí.

C/ Moífesa! 20 - 28006 M-{DRID - Tfnor 91 309 36 46 - *'nv.cashflorv-oposicionei.com 26


EA CASH FLOl¡v ESTADiSTICA

2. Í]\IDICES QUE DEFINEN LTNA DISTRIBUCIÓN DE DATOS'

2.1. MEDIDAS DE CENTRALIZACIóN.

la dishibución
Son í¡dices numé¡icos que orientan sobre qué valo¡es se agrupar¡ los datos de

A) MEDIA ARITMÉTICA.

ConceDto:

- Es una ñedida de te¡¿lencia ce¡t¡al que se defi¡e como la suma de cada u¡o de los valo¡es
dividido por el número de observaciones. Las unidades son las mismas qüe las de la variable a
la que se refiere.
- Es la medida de centratización más impo¡ta¡te.
- Es el valor promedio.
- De fácil manejo matemático.
- Se afecta mucho po¡ los valo¡es exttemos de la se¡ie
- En la dist¡ibución Normal, coincide con la Moda y Mediana
- Es un valor único.
- No tiene po¡ qué coincidir con u¡ valor del expeimento.
- La media poblacional se ¡epresenta por: p
- La media muelral se represenla Por -.

e4q!O: Se divide la suma de los elementos de la serie o distribución de frecuencia por el número de
Ios mismos.

n x¡.fa
Para varisbles disctetas: ¡= I -------
i=l n
xi : valo¡ de la variable
fa = frecuencia absoluta

n fa mi
Para \ariables continuas: n= L -----
i=l n
fa = frecre¡cia absoluta de cada clase.
mi = Mar€ de clase.
n=I fa

Ejercicio 2: el número de h\divid os ml@rtos por cólera en ú1determinado país por año' a lo largo de
I I años, ha sido de: 2, 17, 3, 12, 5, 8, 12, 3, 2, 8, 12. Calcular la media aríffiética

__ 1,,t1¡\+tZ * 5-&- rz. g. z*(. É t5.


_
x: \l
1,1

ctl:
wc¡lhflow-oPos¡c¡ones'com 2l
O ftlont"o, Zo -:¡OO¡ ¡IADRJD -Tftro:91309 3ó 46 -nr
ÉA CASH FLOl,v ESTADiSTICA

B) MEDIANA.

Concepto:

Se denomi¡a Mediaria a aquel vdor que, una vez o¡denados los datos de menot a úayor,
divide la serie dejando el mismo número de individuos a un lado y a otro. Es el valor cenfal
de la serie.
Es de dificil manejo matemático.
Es un valor único.
En caso de tamaio ir¡par, la mediana coincide con un valor existente en la serie de datos,
pero en caso de tamaño pa¡, no tiene por qué coincidir con un .valor hallado en el
experimento. En este caso la mediana se calcula como Ia media de los dos valo¡es centrales de
la muestra,
No se afecta por los valores ext¡emos de la se¡ie, por ello, en se¡ies muy dispersas se paefiere
a lamedia,

c:ibt{p: Pa¡a su cálculo, es necesa¡io ordenar todos los valores de la serie.

Ejeñplo: Si las edades de un grupo de pacjentes soñt 20,20,21,21,30, 31, 36, la medi¿na seú 27
alos. Si por el confario las edades so¡: 20,20,21,27,30,31 años, la mediana se calcula como la
modia do los dos n¡lmeros certales, 2l y 27; total, 24 años.

Si l¡ medi¡na es un valor semejante a la media la dist¡ibución de datos es homogénea, siendo


preferible utiliza¡ en estos casos la media como medid¿ de ceDtralización y la desviación tipica como
medida de dispersión. En cambio, ri m€diar¡ y media difiere¡r mücho los datos son muy
heterogéneos, y es prefe¡ible utiliz¿r la mediana como medida de centralización y el rango
intercuafílico ó el rango como medida de dispersión.

Ejercicio 3: calcular la nediana Ia distibución del núrñeto de hüos que tienen diez fami¡ias: 5, 4, 0, 8,
3,6,2,9,3,7.
if,? 7=.tt1
c) MoDA.

ConceDto:

Ta¡nbién se llama valo¡ dominante.


Es elvalor más fiecuente de la distribución.
A diferencia de la media y median4 en una serie pueden existir más de una moda
(distribuciones bimodales, trimodales...).
La moda siempre coincide con un valordel expeúmento.

Ejercicio 4: calcular la moda de la disttíbución de dafos especificada et el eiercício 3.

=
j
^^.J"

Cll Montesa,20 - 28006 MADRID - Tfno: 91309 36 46 - wnw.cashflow-oposiciones.com


E] CASH FLOl,v ESTADÍSTICA

2.2. MEDIDAS DE POSICIÓN.

A) CUARTILES.

Concepto:

- Se denominan cuartiles a los 3 valores que divjden la distribució¡ ordeDada de datos en 4


partes iguales.

' - El primer cuafil dej¿rá a un ¡ado Ia cuafa pa¡te del colectivo, y a ot¡.o, Ias tres c\¡anas pafes;
el segundo coincidirá con la mediana y el te¡cero deja¡á tres pa¡tes a un lado y la cuarta al
otro.
- Ql deja a su izquie¡da el 25o¿ de los datos.
- Q2 deja a su izquierda et 50% de tos datos (e2=MediaDa).
- Qi deja a sü izquierda el 75% de los daros.

B) DECILES.

Concepto:

- Se de¡ominan deciles a los 9 valores que dividen la distribución ordenada de datos en 10


partes iguales.
- Dl deja a su izquierda el lO% de los datos.
- D5 deja a su izquierda el 50oZ de los datos (Ds=Media¡a).
- D7 deja a su izquierda ei 70% de los datos.

C) Pf,RCENTILES.

Concepto:

- Se denominan percentiles a los 99 valores que dividen la dishibució¡t


ordenada de datos en
I00 pafes igüa¡es.
- Pi deja a su izqui€¡da el loz de los datos.
- P50 deja a su izquie¡da el 50o% de los datos (p50=Mediana).
- P98 deja a su izquie¡da el 98% de los datos.

Desde el puDto de vista estadístico, el v¡lor del percentil se incluye


en el i¡fer.ra¡o itrferior, es
decir, que si el percentil 85 fuera jgual a 76, que¡¡ía decir que el SS;/o
de tos valo¡es valdrían 76 o
menos de 76, y que el 15% de los valores estaría por encima de
76.

La mediatrs es el segundo cu¡rtil (e2), qüiDto decil (D5) ó pe¡cenril50 (pso).

Ejercicio 5: el número de ¡ngresos prev¡os que presenta un determihado


número de pacientes es de..
8, 12, 6, 5, 8, 11, 8, I0, 7, 10, 7, 10, g.
s,6, 1, +, s,5, &, q, rc' rcr, rú, tt /t?
Calculdr la mediatla. ,\
Calculat la moda ji 1 \ó
Calcular el primer y tercer cuartil. }. to
Calcular elrecorrido íntercuartítico_
7 3
Cilronreso,:0 -:8006 IIADRTD - rrno: 91 309 36 46 _;;;;¡n-;;;;;;;;;- :a
M GASH FLOW ESTADISTICA

2.3. MEDIDAS DE DISPERSIÓN.

Da¡ u¡a información que col¡pleta a la apoÍada por las medidas de centralización. lndican si los

valores de una dist¡ibucjón de datos están poco o ñuy agrupados en tomo a ün valor
central'

A) Rá]ICO, AMPLITIT'D O R.ECORRIDO. Rango = Máximo - Mínimo

La manera más eleñental de medir la dispersión de una colección de datos consiste en


calcula¡ la extensión del intervalo sobre el que todos ellos est¡in contenjdos A este índice se
le denomina "rango o recorrido" y se hall4 restando del dato mlis alto el más bajo obtenido en
el €xperimento.
EI rango da una p¡imera idea de la dispersión de los datos, aunque su interés es muy ¡elativo,
puesto que utiliza pa¡a su cálculo únicamente dos números de la serie; Precisamente los
menos representativos, Po¡ tratarse de los valores exfemos o más ra¡os de la va¡iable

B) RANGOINTERCUARTILICO' RI=Q3 - Q1

- Mide la distancia que existe entre los cua¡tiles 3 y l. Elrango intercuartílico determina cuáles
son los valores entre los que está comp¡endida el 50% cent¡al de la distibución'

C) DESVLACIÓN INTERCUARTILA-R.

- Mide Ia mitad de la distancia a la que estin el 50% de los valores centrales de las
observaciones,
- Es tma medida rnás "estable" que el rango
- Es la medida de dispe¡sión usada cuando los datos son asimétricos.

Q3-Ql
DQ =
-----
2

Los anteriores indices dan luga¡ a üna ¡ep¡esentación gráfica muy utilizada que es el DL{GRAMA
DE CAJA, que pe¡rDite ver Ia tendencia central, la dispersión, Ia simetría y los valorcs anómalos. Es
un rectángulo de anchura arbit¡aria cuyas dos bases representa¡ los cuaños Primero (Ql) y te¡cero
(Q3). La mediaaa viene defi¡ida po¡ un tr¡¿o grueso horizontal en el interior del ¡ectángulo L¿s
"patillas" que salen de la caja señalan ios valores adyaceÍ¡tes, que sod los valores mó(imos y mínimos
de la dilribución que no se consideran valo¡es arómalos. Estos valores anómalos pueden ser
"exte o¡es" (representados por un círculo, el núme¡o de al lado ¡epresenta el número del caso)
cuando se alejan más de Ql - 1.5 veces el rango intercuartílico o Q3 + 1.5 veces el Éngo
intercua¡tilico. Los valores "alejados" (representados po¡ un asterisco, el número de al lado representa
el número del caso) son aquellos que se distancia¡ en vez de 1.5 veces 3 veces el rango inte¡cuafílico

La serie 5,5,6,6,7,E,10,12,13,15,30,62 (mediana:g, Q1=6, Q3:1a.5) da luga¡ al siguiente diag¡ama de


caJa,

28006 MADRID Tfno: 9l 30936 46-wr w.cashfiow-oPos¡ciones.com t0


C/ Montess, 20 - -
@ CASH FLOW ESTADÍSTICA

D) DESI,'IACIóN MEDIA.

Pe¡mite calcular la ,'desviación rnedia,, de todos


los datos respecto a su rnedia a¡itmética. Es
la media aritmética de las desviaciones absolutas
de cada valo¡ a la media.
A cdda dato se le resta la media arjtnáica sin hac€r caso de
los signos negativos (en valor
absoluto), y se divide luego po¡ el número
total de té¡minos.

DM= :

E) vARraNza (J ó s1.
Esta n¡edida de dispe¡sjó¡ se obtiene
sumarido tas difcrenoias al cuadrado de cada
datos respecto a su media y dividiendo a¡ uno cle los
final dicho ¡esulado entre ei"¡rn"r. J" i"o",O*"
de la muestla.
Es una exc€lente medid¿ de dispcrsión, y
es junto con Ia desvjación típica
medjda de dispersión mir usada o estánda¡, la
Únicamenr presenta un inconveniente, y es que
ra varia¡za tiene como unidad Ia misma
los datos pero elevada al cuadrado de

(ri - ¿)-
l=:*__-
¡r

F) DESVIACIóN Tfuice ó nsr.,furnm s¡.


1o o

- Est¡ medida de dispe¡sió¡ se calcul¿ sumando


las dife¡encias al cuad¡ado de cada uno
datos ¡especto a su medi4 dividie¡do de los
dicho *""1"¿"
muest¡a y ext¡ayendo ¡l final la raíz de Ia
cuadrads (por ello, ""*'"f-a]"iie''individ¡os
presenta ta _is_a uniaaA qrr"
lo"

CY Montesa, 20 - 28006 MADRD@ 3l


EA CASH FLOW ESTADíSTICA

(por tanto, la vaflanza


La desviación tíPica no es otla cosa que la raíz cuadrada de la va¡ianza
es el cuadra¿lo de la desviación tipica) Constjtuve el meior indice
de disDersjón

(xi - e)-
: --------

En generall

Se puede co¡sidera¡ a una dist¡ibución como suficienternente concentrada si su desviación


típica no excede de la terce¡a parte de la media.
Se habla de dispersiones grandes cuando la desviación típica está cor¡prendida entre
un tercio
y la mitad de la media.
Dispersiones excesivÁs cuando la desviación típica es superior a la mitad de la media

Propi€dades de le medi¡ y de I¡ varianzs:


- Si a todos los valores de uDa distribución se les suma o resta ona constante su media aumenta
o disminuye eri dicho valor, mient¡as que la desviación tipica y Ia varianzano se modifican'
- Si a todos los valo¡es de una dist¡ibució¡ se les multiplica o divide por una constante su
media y su desviación tipica se multiplica¡ o dividen por dicha consta¡te' mientras que Ia
varianza se Ílultiplica o divide por el cu¡drado de la constante.
- Si se suman o se restan dos vaxiables aleatorias, la media es siempre la suma o la diferencia de
l¿s medias, y la va¡ianza es la suma o la dife¡encia de las va¡ia¡zas si arnbas va¡iables son
independientes.

G) COEFICIENTE DE VARIACIóN de PesrsoD (C9.

Es una medida de dispetsión adimensio¡al, que petrnite comParar, desde un punto de vista
descriptivo, la dispersión (en foma de desviación tipica) de dos o más vadables ent¡e sí o la
dispersión de una va able en distintos g¡upos. Pa¡a ello no debe¡ tom¿tse e¡ valor absoluto,
sino que será preciso toma¡las en relación a la media de donde proceden
A este valor que indica el porce¡taje que las desviaciól típica rePresenta de la media
a¡ihnétic4 se der¡oúina coeficiente de variación, y se calcula de la siSuiente fo¡ma:

o
CV = --- (si se quiere d¡r eD porceht¡je el resultldo se multiPlic¡ por 100)

Ejemplo: Un espectrómetro mide 50 veces Ia misma muesha de sang¡e, y da niveles de glucemia de t


= 85mg, o = 8 mg. Un ecógafo mide 50 veces la misma dista¡cia ente dos objetos, y obtiene: = t
120 Km, o :I I Km. ¿Cuál de los dos roétodos d¿ mediciones más precisas?, o dicho de otra form4
¿cuál de los dos métodos tiene ñenos variación?.

Tfno: 9l 309 36 46 - ü'irav.c¡shno*-oposicion€s com i2


c/ Montesa, 20 - 28006 ILA.DRID -
@ cAsH FLOI^I ESTADiSTIC,I

8 ñg.
CV (Espect¡ó¡¡eto) = ------ x 100 = 9,41
85 mg.

11 Krn.
CV (Ecógrafo) = --------,( I00 = 9,17
120 Krn.

Añbos métodos sor parecidos, pero el ecógrafo tjene menos variación.

Ejercicio 7: si abtenehos una tabld con datos la talla y gl p$¿ de n¡ños en dos periodos de
crecimiento. ¿Qué es más variable: el peso o talla.' ,A gu¿ edad estos parámetros son más
tariables?

Edad en eños Peso Peso Talla Talla


media desviación tipica media desviación tipica
3 12,1 4,1
l5 60,8 6,69 r47,3 5,9

CONCEPTOS MATE]\'TITICOS

MEDIA GEOIdTRICA: Es una medida de tendencia c€nt¡al que se define como la miz enésima del
producto de los n valores observados xt. Es muy utilizada e¡ Microbiologia y
en Serologíq do¡lde se
trabajan con datos con una marcada asimefía positiva (m¡ás hacia la derecha),
al trabajar con esta media
Iogcamos que Ia distribución de datos sea más simétrica (ver mfu adelanie). por
e]empto, titulos de
A¡ticuerpos ó 2, 4, E, 16.

r; ¡r:
j= ¡If
i=1
t/4.r,..*_
I

En vez de aplicar Ia anterior fórmula habitualmenle se t¡abaja con logadtrDos


nepe¡ianos (ln xi) (lo qüe
más adelante ¡lama¡emos fa¡sformación logarítmica) y una vez que
se ha calc;lado la,.media,,de los
logaritmos nepe anos de los valores de la va¡iabie (te da el ln t), ¡a
media ( 6) será e elevado al ln ,.
Mf,DIA PONDERADA: PodreDos calcula¡ una media ponderada cuando estemos t_¿baja¡do
con
distintas muestras. Es una media general que se calcula ñultjplicando
de ca¿la muestr€, su media por el
tarnaño de la mism4 y dividie¡do el total por el total de individuos de
las n mueshas.

I
I
Cy Montesa, 20 - 28006 I\LA.DRID - Tfno: 91 309 36 46 - ñ;ñ;"*;"", 33
I
""-"r.b
L
@ CASH FLOW ESTADiSTICA

mtxnr+,...+mkxn*
M=
N
Se utiliza cua¡do se desea da¡ más peso (importancia o i¡fluencia) a unos valores que a ot¡os

MIDIA ARMóNICA: Es el i¡verso de la media aritrnética de los inversos de los vatores de la va¡iable.

N
tt¡
> l/x

Generalmente se utiliza cuando se precisa que las fnuestras con las que estamos trabajando tenga¡ el
rnismo tamalo. Po¡ ejemplo, en el sriálisis dc la va¡ia¡za paIa dos facto¡es, se reqüiete que los tama¡os
de las muestms, con las que estamos fabajando, se¡¡ iguales en cada una de las o¿sillas de la tabla
ilicial (lo veremos e¡ el ter¡a del A¡¡ilisis de lavanazz). Si esto no sucede, debería¡ sustituirse los
tamaños reales de cada casilla pot un ta$año ú¡ico, igual a la media anhórica de todos ellos, es decir:

axb a = no de filas
b = nó de columnas
1t nr = tama¡o de las sucesivas muest¡as
-- +.., + ---
nr nk

MEDLA CUADR Á.TICA: Es la ralz cuad¡ada de la media aritmética de los cuadmdos de los valores de
la va¡iable. Con ello eliminaaos todos los signos negativos.

pc=

3. FORMAS DE UNA DISTRIBUCIÓN DE DATOS,

3.f . SEGúN LA MODAr Uniñod¿les, Bimodales....

UNIMODAL BIMODAL

C/ Mont€ra.20 - 28006 MADRID - Tfno: 9l 309 36 {6 - snr1{.c8shflorv-oposiciones..{m 34


EE CASH FLOr,v ESTADiSTICA

3.2. SEGÚI{ LA SIMETRÍAI

- .Simétrica: Sus dos mitades puede¡ supe¡pone¡se y su pico o punto máximo se sifúa en el
centro,

- Asimétrica (sesgada)r El pico está fue¡a del centro y una cola es más la¡ga que la ofra.

La simetría de una distribución se mide mediante el Coeficiente de Asimetria (S).

- En una distribución simétrica, S=0


- En una distribución asimétrica, S=0

Las distribuciones asimétricas pueden ser de dos tipos:

- Con sesgo positivo, S>0, la cola es más larga (la caida es más lenta) a la derecha (asimetria a
Ia derecha).
- Con sesgo negativo, S<0, Ia cola es más larga a la izquierda (asimetría a la izquierda).

33. SEGÚN EL "APTNTAMIENTO'' O KURTOSIS:

El apuntamiento o kürtosis determina €l grado de apuntamiento o picudez de una curva con respecto a
la distribución o curva ¡orftal; se usa para mostrar el grado de conce¡t¡ación (cu¡,,a con gran
apuntamie¡¡to) de los datos o dispersión de ¡os mismos (curva achatada).
Segrln el "apuntamierto o kurtosis" una dist¡ibución puede ser:

- lsokú¡tica: Presenta el mismo apuntamieDto que la curva normal (La¡rtosis = 0).


- Platicúrtica: La dispe¡sión de ¡os valores es g¡ande, resulta¡do una distribución más aplanada
que la nomal (ku¡tosis < 0).
- Lépfocúrtica: Presenta mayor epuntamiento que ld curva no¡mal, existiendo mayor
ooncentació¡ de los datos alrededo¡ de Ia media, menos dispersión ftufosis > O).

El "apurtamiento o curtosis" de una dist¡ibución (cómo se ¡ep¡esenta la frecuencia ¡elativa ent¡e le


ce¡tro y los extremos), se mide media¡te el Coeficiente de Kufosis o Coeficiente de Apuntamiento
(K).

- En una distribución Isocúrtica. K = 0


- En una dist¡ibución PlaticL¡rtjc4 K < 0
- En u¡¡a Leptocúrtic4 K > 0

C/ Montesa, 20 - 28006 MA-DRID - Tfno: 9t 309 36 46 - Í nr.cashflow-oposiciones.com 35


ea casll FLow ESTADISTICA

Se dice que una distribución es MESoCURTICA cuando el Coeficiente de Kurtosis es 0 y el


Coeficiente de Asimet¡ía es igual a 0. Es la distribución Normal o de Gauss

Mesocúrtica

Platicúnica

4. LETTS TEÓRICAS QT,IE SE AJUSTAI A DISTRIBUCIONES BIOLÓGICAS.

Nos proponemos encont¡a¡ leyes ñate¡náticas que sean seguidas po¡ distribuciones biológicas de
datos, ya que si fuéramos capaces de encontrarlas, podriamos sustituir tod¿ la colección de datos de
nuesto estudio por una fórmula teórica que siguiera la misma dist¡ibuc;ón que aquéllos; es decir,
sintetiz¿remos todos los datos en una fórmu¡a.

Vamos a describir tres leyes teó cas que tienen la parlicularidad de se¡ seguidas por la inmensa
mayo a de los fer¡ómenos biológicos habituales:

- Dishibución Binomial.
- Distribución de Poisson.
- DisÍibución No¡mal o de Gauss.

4.1. DISTRIBUCIÓN BINOMIAL: B(N,P)

- Es una ley teórica que aplicaremos siempre que conozcamos Ia probabilidad (p) de aparición
de un fenómeno biológico.
Aplicable a un experimento que conste de "¡" pruebas.
El resultado es dicotómico y puede ser evaluado como "éxito" o "fracaso", siendo la variable
de interés el número de éxitos "k" alca¡zados en "n" p¡uebas.
Es una distrjbución de va¡iables discretas: por ello, la disfibució¡ binomial constioye
siempre u¡ diagama de ba¡¡as discontinuo.
- La selección de la muest¡a se hace con reposición, es decir, todos los elementos tienen igual
probabilidad de ser elegidos.
- Ejemplo: en una uma hay 6 bolas blar¡cas y 4 neg¡as. Si se extraen con reposició¡ (cada vez
que sacás una bola Ia vuelves a meter en el saco) 5 bolas (n), ¿cuál es la prcbabilidad de que 3
(k) sean neg¡as:

Media aritmética - = n.p.


n: número de individuos.

C/ Montes!, 20 28006 MADRID -Tfnor 9l 30936 $rvw.eshnow-oposiciones.co¡n 36


- 46 -
[O CASH FLC'W ESTADISTICA

p= probabilidad de tener una ca¡acterística dicotórnicai siendo la probabilidad de tener esa


caracteristica constante para cada uno.
q=l-p
Desviación Típica: o =
Va¡ianza=npq

Se dice que una variable aleatoria sigue uria distribución Binomial de media (n p) y de desviación
tioicao= l/no.o
'V
A?RO) MACIÓN DE LA DISTRIBUCIóN BINOMIAL A LA DISTRIBUCIÓN NORITtrA,L:

Cuando el tamaño de una se¡ie de datos que sr'guen una distribució¡ Binomial va aumentando, la
distribución se va pareciendo cada vez más a un distrjbución Normal. Esa Normal, procedente de una
Binomial, tiene de media y de o, la media y Ia o de la distribució¡ de la que procede.

rl lr,l It,,,ll lr,


n=7 n=1'1 ¡=grande

Una Distrjbución Binomial se aproxima a u¡a Distribución No¡mal si: n.p >5, n.q >5 y p q >0,05.

4.2. DTSTRIBUCIóN DE polssoN.

- Constjtuye un caso particular de la ley binomial para aquellas situaciones en las que la
probabilidad (p) de aparición de un fenómeno sea muy pequefia. Es, por lo tanto, la ¡ey
adecuada para "sucesos ¡sros" (cuando p<0,05) estudiada en mDestras grandes (¡r > 100).
- La siguen variables discretás qüe sólo toman valores ente¡os, no negativos, con probabilidad
no nul4 pero sí pequeña.
- Cüanlo menor sea la p¡obabilidad de aparicióD de un suceso (p tienda a 0), y mayor sea el
número de i¡dividuos al que hemos de aplicarla (¡l tienda a infinito), más exacta será la
sustitución de la ley binomial por Ia de Poisson.
- La dist¡ibución de Poisson está ligada a un expe¡imento que tiene como finalidad cu¡ntilicar
el númerc de iDd¡viduos por unidad de tiempo, volumen, superficie, que presentan un
determinado carácter. Se utiliza para contejes.

Son distribuciones de Poisson:

- De cada 2000 pa¡tos, un recién nacido presenta u¡a malformación ca¡diaca. ¿Cuál es la
probabilidad de que en 100 partos apatezca¡ 2 malforrnaciones cardiacas?
- El número de g¡anulocitos por mm3 es de 2. ¿Qué probabilidad hay de que ap^rezca\ 4
granulocitos por mrn3?

C/ Mont€s.,20 2800ó MADRID - Tfno: 91309 36 46 - t"r*v.cashflow-oposiciones.com 37


-
@ casH FLOl,v ESTADfSTICA

- El número de accide¡tes nucleares graves en u¡a cettral nucleai es de 1 cada 30 años ¿Cuál
es la probabilidad de que ocurran 3 cada 30 meses?

- Media adtñética ¡, (Lamda) = n p

- Desviación ripica (o) = ll " -ll


- v,rianza = ¡. Y " I ^

En la dítlribución de Poisson Ia medía y la varianza coincíden.

4.3. DISTRIBUCIÓN NORMAL O DE GAUSS.

Es la distribución que sigue¡ la mayoría de las vari¿bles biológicas. Cualquier va¡iable cuantitafiva
puede ser estudiada en principio, de acuerdo con la ley do Gauss.

Características:

Tiene fo¡ma de campana-


Es asintótica respecto al eje de 4bcisas: va de - a + oo .

Es simétrica respecto a la media a¡iunética.
Es unimodal.
Ls media coincide con Ia moda y cor¡ la mediana.
Es la dist¡ibución de las va ables cuantitativas continuas.
se define por la ñedia y por la dósviación típica.
Presenta 2 puntos de hflexión (puntos eri los que Ia curva cambia de concavidad) que coinciden
coo la desviación típica-
Sus coeficientes de Asimetrla y Curtosis son iguales a 0.
El ¡írea total er¡cerrad¿ por la cu¡va de Gauss es igual a I (100%).

Areajl0O%

Imporfa¡cia de Ia distribución NoÍhal:

Cuando u¡a variable se dist¡ibuye normalmente:

- El 6870 de los v¡lores está¡ comprendidos entre


- El 9570 de 1os valores estátr compretrd¡dos eotre dt1,96o

Montes8, 20 28006 I,I-{DRID - Tfno: 9f 309 36 16 - n$\{,cash flow-oposiciones.com 38


Cy -
EÜ CAS1I FLOvl' ESTADiSTICA

f,l enlre i !257.6


9970 d€ los válores esfá¡ compreDdidos
El 99,7yo d€ tos valores están comprendidos €ntre t * 3.d

NOL4. el valor de I,96 habitualr¡ente se redonóea a2i y 2,51 a2,6.

95'/o 99."1o/t

E-q I l+o t -2o t i +2q ,-3a

Estos valores 95% y 99% que ahora describen la muestra, más adelante, en la pafe analítica, van a ser
Ios que nos f¡jen las següidades del 95% y del 99%; y por tanto ¡as probabilidades de e¡ror p<0,05 y
p<0.01.

Ejemplo: Imaginemos que hemos realizado un expe mento midiendo las pulsaciones por minuro a
1000 pacientes ( t=80p/m o=10p/m). ¿Entre que vaiores de pulsaciones se encontra¡án el 95o% de
nuesbos pacientes?

f +/- 2 a --> 95yo de nüestros pacientes


80 +/- 2 10 -> 95yo , (ó0-100 lpm) -> 950 pacientes

Ejercicio 8: si hemos tomedo la temperofura a todos los pacientes ingresados en uta planta de
digestito (50 pacíentes) y la üedia es de 36,81: y la desúación tipica es de 0,5'C, ¿entre qu¿ ra¡ores
de tempetahna se enconÍaún el 99%o de los pacientes?

A partir de estos datos pod¡iamos exigir el cálculo de aquellos pacientes que tuviera¡ p lsaciones
comprendidas entle los valores m¡is diversos, por ej. entre 68y 107 plm. Bastaría co¡ aplica¡ la
ecuación (muy compleja) qüe defi¡e la disr¡ibución normal y aplicar los límites 68 y 107 pa¡a obtener
la probabilidad de encontra¡ individuos entre estas cifras, p¡obabilidad qüe multiplicada por n (1000
individuos) nos da¡ia el número buscado. Pa¡a evitar estos cálculos hab¡ía que tabular la curva <le
Gauss (pero esto es algo que no se püede hacer si¡¡ más, porque la curva de Gauss depe¡de de la
media y de la desviación típica de los datos con los que estemos trabajando, y cada experime¡¡to
tendrá unos valores distintos). Hay una tabl4 denominada Disfribución Normel Tipiñcad¡, a la que
se puede acceder mediante üna transform¿ción de los datos, o lo que es io &ismo, mediante una
tipificació¡.

C/ Mont€sa,:0 - 28006 MADRID - Tfno: 9l 30936 4ó- qlrr.cashflow-opos¡ciones.com 39


@ CASH FLOl,v ESTADiSTICA

añ.,d. r¡.úñrñoh.rI ñ r o,ri 1t

El valor tipificado se calcula:

La curva de Gauss tipilic¡d¡ tiene de media 0 y de Desviación Típ¡c¡ 1, y tiene todas la¡
propiedades de la curva de Gauss.

1 ryolvie¡ldo a nuest¡o ejemplo) ¿Cuántos individuos p¡esentarán pulsáciones süperiores a I I0


p/m? Para poder caloular lo que nos piden, hay que tipificar este va¡or.

110 - 80

10

En la tabla, pa¡a x-3, se obtiene un á¡ea 3=0,4987. Pero es el área comp¡endida ente el eje y x-3.
Nosot¡os necesitamos, no esta superficie, sino Ia cola de la ourva. Pacie¡tes con ñÁs de 110 p/ñ,
equivale en la curva falsa a pacientes con más de 3; es decir, la cola. CoElo el a¡ea de la mitad de la
cürva cs 0,5, el área de la cola será: 0,5 - 0,4987 = 0,0013. Por consiguie¡te el ntlmero de pacientes
con pulsaciones superio¡es a 110 seú 1000.0,0013=1.3.

Tfno: 91 309 3ó 46 *'r'rv.cashflow-oposiciones.com 40


C./ Montess,20 - 28006 MA.DRID - -
EQ CASH FLOl,y ES7'ADíSTICA

2. ¿Cuá¡tos paci€ntes presenta¡¡in pulsaciones comprendidas entre 65 y 96plm?

Tipificamos efos dos valores:

65-80 96-80
1,6
l0 l0

0,¡332

Se busca en ¡a t¿bla 1,6 y 1,5 (en vez de -1,5 po¡que la tabla es simétrica).

X=l,5 5=0,4332
X=1,6 5=0,4452

Por tanto la probabilidad pedida será: 0,4332 + 0,4452 = 0,8784, y el rúmero total de pacientes con
pulsaciones comprendidas ent¡e 65 y I l0 p/m será: 1000.0,8784= 878,4 individuos.

DISTRIBUCIÓN HIPERGEOI\,f ETRICA.

L¡ distribucióD hipergeométrica es equivelent€ a la distribución Binomial pero cuaDdo €l


muestreo se hace sin reeú¡plszamieDto. Porello, es una diseibución de probabilidad que co¡responde o
una va¡iable aleatoria discreta- Cuando n tiende a infinito, la distribución hipergeoméb-ica coillcide con
la Binomial. Ejemplo: Si en u¡a uma hay N bolas, de las cuales A son bls¡cas, y B (N-A) son neg¡as, y
se toman al az¿r n bolas, la va¡iable aleato¡ia "x= número de bolas bla¡cas ente las n extraidas',, sigue
una distribución hipergeométrica.

C/ Montesa, 20 - 28006 M{)RID - Tfno: 9t 309 36 46 - wrw.cashflow-oposiciones.com 4l


ffi CASH FLOr,v ESTADíSTICA

TRANSFORMACIOMS MATENIITICAS.

Ls simplicidad es un objetivo centml en la descripció¡ de los datos, po¡ tanto, cuando podamos elegit las
ufúdades de medida de una va¡iable escoge¡emos aquella que conduzca a una representación ¡¡as
se¡cilla. L dist¡ibución de f¡ecuencias simétticas resPecto a la media son mrís simples que las
asimétricas ya que:

1. En dist¡ibuciones simét¡icas tíPicas, la medi4 la mediana y la moda coinciden Hay pues ¡¡na

sola medida de cent¡aliz ción.

2. El coeficiente de asimetría será cero.

Por tanto, cuan¿lo exista una ttansfo¡mación de la variable, f(x), tal que la ¡ueva variable, y:f(x) tenga
distribución siméfica, es co¡veniente trabaja¡ con esta variable transfo¡mada. Las transformaciones más
utiliz das son:

- La tra¡sformación y = x2 comprime la escala para valores pequeños y la expande para valores


altos (al elev¿¡ al cuadrado los números pequeños aume¡tan pero no t nto como los g¡andes) Se
us¿n en casos de asi¡¡etría a la izquierda (asimet¡ia negativa).

- Por el conÍa o, las hansformaciones rñ, Lr x, y l/x comprimen los valo¡es altos y expa¡¿len

los bajos, produciendo adem¡is este efecto en orde¡ creciente (mmos Ji, más l¡ x, y más
¡odavía l/x). Se usa¡ en casos d9 asimehia a la derecha (asimetria positjva).

-rfh
'.;

La t¡a¡sloroación más utilizada es la transformación logarí¡rlica. Muchas dist¡ibuciones que describen


el tamá.ño de las cos¿s so¡ aproximad¡mente siméfioas al expresar la variable en logaritmos. El efecto
de una transfo¡mación depende del ¡a¡go de los datos, ya que cualquie. transformación es
aproxinadamente lineal en un €ngo sr¡mamente pequeño. Como regla general:

42
C/ Montesa,20 - 28006 MADRID - Tfno: 91 309 36 46 - $Y¡{ cashflow-oposiciones.com
E] CASH FLOW ESTADiSTICA

t. Si el cocientei Valo¡ máximo,Ay'alor mínimo es pequeño (menor


de 2) Ia fansfo¡mación ¡o
variani ap¡eciablemente la foma de la dishibución.

2. Mjentras qt¡e cua¡do este cociente se¿ g¡ande (mayo¡


de lO) el efecto seÉ muv acusado.

TR ,NSFORI.ÍACIONES I{riS L"¡tr_tZA_DAS:

4 y = log(x)

Es Ia t¡ansformación rnás utilizáda. Muchas distribucior¡es


que desc¡iben er tamaño de las cosas soh
aproximadape¡te simét¡icas ar expresar ra va¡iable €n ioga¡itmo.
A modo de ¡esur¡en, utiriza¡emos ra
fansformación logarítnica pa¡a:

l. Transfolm¡r ütra DistribucióD exponeDcial eD u¡a Distribución Norme!,

2. Trstrsformar un¡ furcién exponeDcisl eD u¡¿ lineal,

2. t:
Se suele uriJiz¿¡cuando los daros son contajes,
por ejemplo: número de gérme¡es por unidad
de volumen
de lechc, número de muetes que ocure¡ en varios
resumen, utilizaremos la transformación de
gnpos e*pe.irnentj", i"
an.i'.¡J., ¡rnoao ¿"
la ra íz cuaój lda para.: "t".

1. Tr¡nsforh¡r üBa Disb¡buciól de poissotr en üDa Di¡trib[ción Normal.

3. TRANSFORIUACIóN ARCO-SENO y a¡cseD(x)


=

Se usa cuando los datos son proporciones o po¡cent¿jes de uria disfibución


binomial.

4.
y=ux
Se usa cua¡do la va¡ianzz aw¡¡enta hast¿
la cua¡A potencia de la medi4 es decir, cuando
dispersión. existe mucha

C/ Molters, 20 - 28006 MADRD - T@ 43


@ CASH FL('W ESTADTSTICA

PROBABILIDAD.

1. CONCEPTO.

Espacio muestral o coDjunto fundamental es el conjunto de todos los resultados posibles de un


experimento. Cada elemento del Espacio Muestral se denomina suceso elemental (cada uno de los
posibles resultados). El resultado obtenido al efectuar el experimento aleatorio se llarna observación.

lmaginemos tira¡ una moDeda muchas veces, obtenemos ulra secueDcia aleato a, qüe se ca¡acteriza
po¡ la falta absolut¿ de un pahón de P¡edicció¡ AI ir aüne¡t¿¡do Ia secuenci4 la proporción de
pruebas con un resultado particula¡ va vadando cada vez menos y tiende a un valor límite. Esta
proporción se llama probabilidad de u¡ suceso en Particular. Clásicamente se ha definido la
probabilidad como el oociente entrc los casos favorables y los casos posibles o totales. Por ello
podemos decir que la probabilidad (Pr) de un acontecimiento A es iguall

no de veces que ocurre A


Pr (A) =
n'tol¡l de veccs que puede ocuri¡ A

La probabilidad se puede exp¡esar como fracción decimal o como porcentaje; y siempre que se
exprese como fracción decimal debe estar comprendida dent¡o del orden de 0 a l De forma que: P¡
(no ocu¡ra el acontecimiento A) = I - Pr (ocuna el acontecimienfo A).

Ejemplo: En una epidemia de intoxicación alimenta¡ia, entre las i5E personas que asistieron al
banquete ocufie¡on 99 casos de enfermedad. La probabilidad de que una persona, seleccionada al
aza¡, esté enfenna es:

99
Pr (enfermedad) = ------- = 0,63 ó 630/o
r 58

2. PROBABILIDAD CONDICIONAL.

En el ejemplo anterior de intoxicación alimentaria, la probabilidad de que una pe¡sona sana enferrne
e¡a de 0,63. Sin embargo, la probabilidad de enlelma¡ tendria q¡ie modificarse si se conociera qué
atimento ingirió la persona. Esto introduce la noción de p¡ob¿bilidad co¡¡dicional o, dicho de otro
manera, la probabilidad de que ocurra A, una vez que ya ha ocurrido B.

La probabilidad de A condicionada a B, o dicho de otro modo, la probabilidad de que sabiendo que ha


ocurido B suceda A, se define de esta mane¡a:

Pr(AyB) Pr (A) Pr (B/A)


Pr (A,ts) =
P¡ (B) Pr (B)

C/ Montesa,20 MA¡RID - Tfnor wwwcashflow-oposicioDes.com 44


- 28006 91 309 36 46 -
M CASH FLOW ESTADÍSTICA

Si los acontecimiehtos A y B so¡ iDdepe¡dieDtes, es


decir, si le aparic,ón de uho no i¡fluye en la
aparició¡ del otro, entotrces: pr (A{B) = p¡ (A)

una aplicación importanre de las probabilidades condicionadas,


de inte¡és en la investigación médica,
en especiai en la teoría probabiljstica dei diag¡óstico,
es lo que se el ¡ombre de
TEORXMA DE BAYES. "ono"" "on

P(Ai) P(B/A,
P (AiB) =
: P(A) P(B/A'

Ejemplo de ¡pljcación de este teorema: En un


se¡vicio clínico de digestivo se sabe que, de cada
pacientes con dolor de esúmago: 700 l0O0
oresenta¡ gastrilis. 200 presentan úlcera y 100 presentan
0.. Ia sinromarotogta general gásrrica- ," t,
li"ll]:_l:_1-:lr,."O
oe presentar vómilos son: en ¡a gastriris 0,J. -,np,ot"ao fu. tas probabitidades
en la ülcera O.e y en et cáncer 0.9. Llega un
paciente con dolor de estómago que, además, nuevo
presenta vómitos. [uere.o. r, prou"uiriaua a"
que tenga cánce¡ gástrico. ""r"uru,

Llamamos: A1 al suceso ,,gastritis',, A2 a1 suceso',rilcera,,, 43 al suceso .cá¡cer*; y llamamos B al


suceso "vómitos',

- Probabilidad de gastriris p(Al) = 700/1000


= 0,7
- Probabilidad de que p¡esertando gast¡iris, tenga
vónjtos. p(B/Al) = 0,3
- Probabilidad de úlce¡a p(A2) = 200/1000
= 0,2
- Probabiljdad de qle presentando úlce¡4 tenga
vómitos . p(B/A2) = 0,6
- Probabilidad de cáncer p(A3) = l0O/1000
= 0,1
- Probabitdad de que presentaDdo cánce¡, tenga
vómitos. p(B/A3) = 0,9

medio del reorema de Baves' la probabilidad


de que, renjendo vómitos, presenta
:#::]:IT"H
P(A¡) P(B/A¡) 0,t 0,9
P(A3/ts)=
P(Al) P(B/A1) + p(A2) p(B/A, + p(A3) p(B/A3) 0,7.0,3 + 0,2.0,7 + 0,1.0,9

3. ACONTECIMIE¡ÍTOS COMPLEJOS.

Los acontecimientos expresados co¡no combinaciones


específicas, porejempJo,AyB,ylos
acontecimientos expresados como aitemativas
especificadas, de la índole de A ó
acontecimientos complejos. B, se llama¡

Pr (A y B) = pr(AnB) = probabilidad de que A y


B ocurran simultátreemeure.
Si A yB no pueder¡ ocuri¡ sim¡rltánearhente, se dice que se excluyen &utuamente y p(AnB)= O

c/ Montess, 20 - 28006 MADRD@


A CASH FLOr,V ESTADiSTICA

Pr (A ó B) = Pr (AUB) = Prob.de que ocurra A, de que ocurra B, ó de que ocurran ambos'

Dicho de otra manera, Pr (AUB) expresa 1a probabilidad de que ocu¡ra por lo menos uno de los
sucesos ("aJ menos uno").

Hay dos reglas para combinar probabilidades que petmiten trata¡ con más facilidad los
acontecimientos complejos. Son las reglas de la multiplicación y la ¡egla de la suma.

3.I. RXGLA DE LA MULTIPLICACIóN.

La rcgla de la multiplicación dice Io siguiente: Pr (AnB) = Pr (A¡B) x Pr (B)

De modo qüe cuando A y B son independientes: Pr (AnB) = Pr (A) x Pr (B)

Ejemplor Se sabe que ocurren efectos secundarios con un fiírmaco en el l0% de los pacientes que lo
reciben. Un médico tiene dos enfe¡mos a quienes adminisÍa el medicamento ¿Cuál es la probabilidad
de que ¿$bos pacientes presenten efectos colaterales?

1'¿Qué nos piden?: Pr (AnB).


2o Acordamos de la fó¡mula.
3'Ir sustituyendo en la fórmula los datos con los que contemos, e i¡ solucionaldo los problemas que
rios enconfemos. :
En este caso Pr (AnB) Pr (A,lB) x Pr (B).

La Pr (B) Ia conoceÍ¡os (0,1), y como nos enconfarnos P¡ (A,41), debemos ver si estos sucesos son
independientes o no lo son. Si la aparición de €fectos colate¡ales en un paciette modifica la
probabilidad de que aparezcar efectos colaterales en el otro, los sucesos no será¡ indePendientes, por
el contrario si la aparición de efectos colateraies en un paciente es independiente de la apa¡ición d€
efectos colaterales en el oro, los sucesos será¡ i¡dependientes. Una vez acla¡ada esta duda: Pr (8mbos
presenten efectos secündarios)= 0,1 x 0,1 - 0,01 ó 1%

3.2. RXGLA DE LA SUMA.

La regla de la suma dice lo siguiente: Pr (A ó B) = Pr (A) + Pr (B) - Pr (AnB)

y cuaDdo A y B se excluye¡ mutuamente: Pr (A ó B) = Pr (A) + Pr (B)

Ejemplo: ¿Cuál es la probabilidad de que aI menos uno de los pacientes aíteriores presente efectos
colaterales?

l"¿Qtlé nos piden?: P¡ (AUB).


2o Acordardos de la formula.
3o Ir sustituyendo en la fórñula los datos con los que contemos, e i¡ solucionando los problemas que
nos encont¡emos. En este caso, la Pr (AUB) = Pr (A) + P¡ (B) - Pr (AnB). La Pr (A) y la Pr (B) Ias
conocemosJ y como nos encontramos Pr (AnB), lo q¡re ¡os debemos pregunt¿¡ en esta ocasión es si
)os sucesos se excluyen o no mutuame¡te, Una vez acla¡ada esta cuestión, la Pr de que al meDos uno
de los pacientes prcsente efectos colaterales es igual a 0,1 + 0.1 - 0,01 :0,19 ó 19%.

Tfnor 9l 309 36 46
CyMontesa,20- 28006 MADRID - 46 - w1rv.$shflow-oposiciooes,com
SQ CASH FLOW ESTADiSTICA

PR.ECISIóN de üna estimación.

- Ause¡cia de error a¡eatorio (enor debido al aza¡), ausencia


de dispersión. po¡ ello se dice que
cuanto menor sea la dispersión de una serie de
datos (medidá por ejemplo mediante su
desviación tipica), mayor se¡á la precisión de la estimación.

- La precisión de una estimacjón aumenta al aumenta¡ el tamaño


de la muestra. Se dice qüe con el
ernpleo de una muestla de r¡ayores dimensiones disminuyen
las probabilidades de que apare¿ca
un Ésult¿do eróneo, puesto que se eleva la p¡ecisión
de la estimación.
- La precislón de una estimación puede medirse mediante p¡ueba¡
de significación estadística.
Cua¡to mayo¡ es Ia precisión, ñenor es el papel qu"
el rn el ,"lltado obtenido en un
esírdio. "rarlu"ga
- Se acepta que t¡-abajar con valores pror¡edio
o cori valores medjos, es más prcciso que trabajar
con valores individuales.

VALIDEZ de una estimecióD.

- Se define como Ia ausencia de enor sistemático


o sesgo.
- Elaumento del tamaño de lamues6¿ ¡q 6jsrce efecto
alguno sobre ldvalidez de una estimació¡.

EXACTITUD de una esrimacióh-

- Se define como elgrado de aproximación


de nuestra estiñación al valo¡real.
- Se dice que un método de medids
es p¡eciso (ause¡cia de e¡ror areatorio)
insessado (ausencia de e
s""rr.
" "*'"::r"f;;?;i,;:;
FIABILIDAD.

Se dice que un estudio es fiable, si ti-as la


¡epetición del estudio en condiciones simila¡es,
obtienen ¡esultados si¡nila¡es. se

La fiabilidad es el grado de estabilidad consegujdo


en los resultados cua¡do se repjte una
medición en condiciones idéntjcas. po¡ ello, Ia
fiaUitiaaa es el graao ae *i..i"",ii,o"o
estudio. a" *

C/ Mor¡tes¡, 20 - 28006 MA¡RD@ 47


M GASH FLC'W ESTADiSTICA

NOC|OIIES OE ESTAD¡SflGA {2a partel

ÍNDrcE

MtrEsrR.Eo pRoBA¡r¡-isr¡co v ¡o rnoB¡¡r¡,isrrco


1, Ventajas del muestreo.

2. Inconve entes del muestreo.

3. Métodos de mu€streo probabilísticos (ale¡torios):

3.1. Muestreo alcatorio simple.


3.2. Muesf¡eo sistemático.
3.3. Muest¡eo aleatodo estratificado.
3 .4. Muestreo por conglomerados.
3.5. Muestreo doble.

5, Métodos de muestrm no prob¡bilisticos:

4. I . Muestreo convolu¡¡ta¡ios.
4.2. Muesheo de coúvenienci¡-
4.3. Muest¡eo ernitico.

EsrADf srlcA ANALÍrrc¡ o ¡r'¡tn¡xcr¡.r,


1. Estimeción d€ parálnetros:

1.1. Estimadores puntuales de la rnedia poblacional.


1.2. Estimación por inter,r'alo.
- Estimación de medias.
- Estimaciór de proporcjones.

2. Contraste de bipótesis,

Predetermi[ación del tamaño muestral.

4, Homogeneidad de dos muestr¡s.

5. Prüebas de signifi caciótr estadística:

5.1. Tipos de p¡uebas o test estadisticos.


5 .2. Test de Kolrnogorov Smimov.
5.3. Tipos de pruebas o test d€ significación €stadístic&
5.4. Relación e¡Íe va¡iables cualitativas.
5.5. Relación entre valiables cualitativas y cua¡titativas.
5 .6. Relació[ entre vari¿bles cuantitativas.
5.7. lnhoducción a la estadística multiva¡iante.
5.8. lnt¡oducción al análisis de supervivencia-

a .:' .:. 4 .:. ..r .'

28006 M^DRID 48
C/ Montesa.20 - - Tfno: 9l 30s 36 46 - nav.cashflo$-oposiciones.com
üa caslt FLow ESTADiSTICA

En los tiabajos de investig¿ción pranteados en er campo de ras ciencias de la sarud,


a veces es posib¡e
evita¡ Ios procesos de muesbeo y sus correspordientes sesgos, estudiando
a toda la población accesibre
(por ejemplo, todos los casos de enfermedad d€l legiona¡io en la
epidemia de Filaderfia de 1976). En
caso de se¡ factible, éste es el mejor plante¡mjento. Sin embargo, Io
más normal qu" .uuJo
realizamos un esfudio de investig¿ción no podamos trabajar con poblacjo¡es ",
completas, por cuatro
órdenes de motivos:

1. Est¡atésicos: no disponer de un listado co¡npleto de los individuos


de la población, existir
una gla¡ dificultad en la captaci&r de Ia población objeto de estudio.

2. Económims: esürdia¡ a todos los individr¡os de una población supone un coste


extrao¡dinariamente elevado cuando ésta es muy g¡ande,

3. Te¡nporales: la urgencia por disponer de la inforoación puede


imposibilitar el estud;o de
toda la población.

4. I¡t¡insecos al estudio: cuardo las observaciones a efectua¡ ocasionan


alte¡aciones o incluso
ia destrucción de los elementos, lógicamer¡te es imposibie estudiar
todos los individuos de
r¡na población.

Por esto, Jo que debemos hace¡ es extraer de la co¡¡espondiente


población un grupo d€ individuos más
¡estringido para el estudio, lo que denominamos muestra, y
a pa¡tir de las observaciones realiz¿das en
ell4 generalizar o exhapola¡ nuestros resultados a colectivos
mis amplios (al resto de la pob)ación). Al
fámaño de la muestra se le llama tameño mucstral.
Al ser el objetivo último del experimento llegar a
conclusiones válidas para toda Ia pob¡ación en estudio, ra muesfa debe reuli¡ una se.ie de
caracteristicas:

L Homogénea con la poblacjón oue representa:La muestra ha de ma¡tener las


mismas
p¡oporcjones que la población en todas aquellas
variables que te¡ga¡ influencia en el
experimento que se ha de realiz¿¡ (no es ¡ecesaria
la iromogJneidad en aquellas
car¿cte¡ísticas que no irifluyan en los resultados).
La dificultad estrib; e¡ que no siempre se
conocen de antemano las variables que pueden influir
en los resultados. por ejemplo, si
traüi¡aDos de estudia¡ la estah¡¡a en un colectivo,
Ia muestra deberá ."rnJ¡a¡t" u lu
mujeres, puesto que el "".
población en cuanto a la proporción hombres /
."ro innuy" tu
talla; pero no se¡ía íeces¿¡io mantener tal proporcióú "n
si se tratara de estudiar la agudeza
visual del colectivo.

2.

ll: y:l:: es homogénea con.ta población que representa y/o no es representativa de ta mism4
nada c¡e Io que se concluya a panir de ella será
válido. por ejemplo, pa¡a determina¡ el nivel medio de
colesterol de todos los espa6oles, la muestra ¡o aeUe
tomarse sOto de pe..onas d"
que Ias cifras de colesterol varía¡ con la edad), "d"d.. "rurrrrdu. 1y"
ni en base a individuos a" un^ sol^ reg;On (yu qu" la
alimentación vaiía en las diferentes ¡egiones).

C/Moltesa,20 -28006 [LA.Dnm - frno@ 49


Ñ CASH FLOW ESTADiSTICA

1. I'ENTAJAS DEL MI]ESTRXO.

Las vent¿jas de estudiar un número ¡educido de individuos de una muesfa e¡ lugar de toda la población
se resumen en:

I Menor cosle.
2. Mayor rapidez.
3. Mayor f¡cilidad: esta operatividad deriva de las dos a¡teriores ¡azo¡es.
4. M¡yor exactitud: esta posibilidad, aparentementecontradi$ori4 se exPiica porque, al ser
más ¡educido el número de individuos a investigar, se puede emplear r¡n personal más
cualificado pan llevar a cabo el estudio o la e¡cuesta, se puede ap¡ovecha¡ mejor el
contenido de la info¡mación solicitada y se facilita la supervisión de los encuestadores.

2. INCOI{VENIENTES DEL MUESTREO.

El muestreo presenta inconvenientes que en general pueden ser superados y que consisten en la falta
de representatividad de la población y en la posibilidad de comete¡ erores en su selección (a estos
erro¡es se les denomina sesgos).

La teo¡ía del muestreo se basa en los siguientes conceptos:

L llo¡nogeneid¡d.
2. Representatividad.
3. Aleator¡edad. P¡esupone que todos los individuos tienen la misma p¡obabilidad
(oportunidad) de formar parte de la muestra.

La obtención de una muesüa aleatoria requie¡e en prime¡ luga¡ Ia ide¡tificación completa


de ta población a estudia.¡. Si a co¡tinuacjón se enumera¡ los irdividuos de la población y,
de fo¡ma aleatori4 se sejecciona a un conjunto de ellos, se dice que dicha muesüa es una
muestra aleatoria de la población.

4. IndepeDdeDcis. La selección de un i¡dividuo no influye en la selección o no de otro


individuo.

Sobre u¡a muestra así dete¡minada y que curnpla l¿s condicio¡es de homogeneidad, aleato¡iedad y
representatividad, se aplica¡iá¡¡ las pruebas estadísticas adecuadas, pudiéndose inferir los resultados
del estudio a toda Ia población de ¡eferencia con u¡ nivel de confianza previamente establecjdo.

3. tdToDos DE MLESTR¡o pRoBABTlÍsrlcos (ArEAToRIos).

De entre los diliffos tipos de muestreo destaca el muesheo p¡obabilistico puesto que es el ú¡ico en el
que cada individuo de la población tiene una probabilidad conocida y distiDta de ceto de ser incluido
en la muestra. De esta mane¡a se puede obtener de forma objetiva una medida para el enor de
muest¡eo.

Tfno: 91 309 36 46 50
C/ MoDtess, 20 - 28006 NLA.DRID - - w\rv.cashflow-opo5icion€s.com
E] CASH FLOvt' ESIADiSTTCA

3.1. Muestreo aleatorio simple.

Es una técnica basada en qüe cualqujer elemento


de la población tiene Ia misma probabiJidad de
formar parte de la ftuestra. Requiere confeccionar previamente
población, asignándoles un orden co¡reiali.vo des¡e
una Iirt" tJ* lo, a" ru
el I hasta el "¡l-."onU"^ "r"_"nto.
p*¿o"minado
ta¡naño muestral, se extraen de forma aleatoria (por "i.
azar) ¡os ,.n,. elementos de lairlestra,
el
de ent¡e los
"N" elementos de la población. para ello se pueden utilizff diversos métodos:
tablas de núr¡eros
aleato¡ios, sistema de bolas como la lotería o cualquier
otro procedim;"nio i" otru""iOn ut u*q a"
todos, el ¡nás utilizado es e¡ de Ia tabla de nrlmeros
O"nt.o lJ.u"rt."o ."
distinguen: "l"uto.ior. "j"^to.¡o

Müestreo aleatorio siD reposiciótr: el p¡oceso se realiza unidad por unidad, y en cada
extracción, existe la misúa posibr'lidad de selección para
todas y caá" J" i"J""¡¿^¿".
que no hayan saiido. """
b. Muestreo ale¿to¡io coD reposición: en cada extracción
todos ros.N,,miembros de Ia
población reciben la misma opo¡runidad
de extracción, ,in q* iri"n;'"i"";i".o o"
veces que se extmjerc¡ antes.

Ambos métodos p¡ácticamente coinciden si


el númerc de miembros en la población es muy g¡ande.
Respecto a la tabla de números aleato
os vamos a detenemos en algunos aspectos: Los
aleatorios son un conjunto de cifras del 0 ¡úme¡os
al ! s¡y¿ ¡¡¿s¡¿;;; sin J;;;il;
respo¡der
pla¡ alguno. Este conjunto de cif¡as cumple
la propiedad de que:
a
"J;r,
P (a) = I / l0; sie¡do a = 0, 1, 2, ....., 9.

La utirización de Ia tabra de números areatorios


en estadística pe¡mite que inrerverga er azar
de operaciones, sin necesidad de rccur¡i¡ en ¡rna se¡ie
cada rez a unu urn" UiÁ rrrl"r¡¡" de lotería. La
e\.tracció¡ de una muestra en una población "on ""
finita se puede hacer a¡ora;;; ;;;;^a
Por lo qr.re se ¡efierc a Ia selecció¡ de los ¡úmeros
que co¡stituye¡ la muestr4 conviene
sjguiente: destacar lo

Si se tomá¡ los números que se val seJeccionaado,


aunque algu¡o de ellos salga más de una
ve?, se EaErá de una huesra con reemplazamtento-

Si Por el contra¡io, se¡eccjonamos los números


de forma que aparezcan una sola vel
seleccionando los que hayan apa¡ecido no
p¡eviame¡te, oir"ndr"ro,
";;-;;;;r;, "*
.T:.iunque si se cumple la-primera condición del
lielemento
:u".*T".0.
de ¡a población tenqa idént¡ca
muestreo aleatorio, esro es, que cada
n
L ".r*g". r",;;;a; ";i;:"';:#ffi iJ;:::l;:Í,j:,ilff:";ffi j:
;:""'A n il:Tl,; ::l
L etesida. Aunque récnicarnenre ."¡* ¿ir.."*;- .no-. l#**i ;iliJ""Jf ,u,^,n,"n,o, ,"
t- práctica el €¡ror que se produce ar
ut izár ras segundas en vez de ras "J;
p m€ras es mínimo cuando "n el
t t3maño de "n'es r€¡arivamente pequeño e¡ relación a ,.].,1...

a
a

L
C/ Monlesa, 20
- 28006 tVtADnm@ 5l
t
g CASH FLOW ESTADiSTICA

TABLA DE NTMEROS AIEATORIOS


(Reproducción de una parte de üna tabla de números aleato¡ios)

¡0 09 7.',1 25 l-i 7ó 52 0l 35 Eó l4 ó7 35 48 7ó 80 95 90 9l l7 39 29 27 49 45
37 54 20 48 05 ó4 80 .{7 42 96 24 80 52 40 ól ól 04 02 00 82 29 t6 ó5
08 12 2ó 89 5l 19 64 50 9l 0.1 23 20 90 25 ó0 t5 95 3J 47 ó4 35 08 03 3ó 0ó
99 0l 90 t5 29 09 l7 67 t)7 l5 l8 3t It l¡ ó5 88 ó7 ó7 43 07 04 43 62 16 59
t2 80 79 99 70 80 t5 ?l 6l 47 64 ()] 2J óó 53 9E 95 ll 68 71 t2 t7 t7 ó8 33

óó 0( 51 41 t7 14 07 27 ()8 50 36 69 i3 6t 70 65 81 33 98 85 t9 92 0t 70
JI 06 0t 08 05 45 57 lE 2.1 0ó 35 l0 J4 26 r1 8ó 19 90 74 39 2.1 40 30 97 l2
85 26 97 16 0Z 02 05 16 5ó 92 ó8 6ó 57 4E r8 73 05 38 s2 47 t8 62 l8 85 i9
óJ 5l ll 2l 15 05 32 54 70 4lt 90 55 35 75 48 28 46 82 8? 09 83 49 l2 56 24
1l 19 ó4 57 53 0l 52 96 47 78 l5 80 8l 42 82 60 93 52 03 44 35 21 38 84 35

3.2. ¡4c9$ree-!.¡!&Ei¡!is9.

El proceso de selección de la muestra se realiza mediante una regla sistemática simple, elegir uno de
cada "n" individuos. Pa¡a ello se ha de calcular la conslanle o fiaccíón de mueslreo diridiendo el total
de la población e¡tre el tamaño muesÍal previamente dete¡minado.

Población
Constante de muestreo (k) :
Muestra

Técnicame¡te esta modalidad es una forma de muestreo probabilistico ya que el punto de partida se
elige al azar entre los k p¡ime¡os númercs. Po¡ ejemplo, si partiésemos de una población de 10000
individuos y precisáramos una muestra de 500, la constante de muestreo seria igual a 20. El prime¡
individuo qüe formara pafe de la muesba se debería seleccionar de forma a¡eatoria de entre los 20
primeros individuos de la población. A este primer valor, habría que sum¿!¡le sucesivamente la
constante de müestreo, hasta completar el tsmaño rnuestral predeterminado.

33. Muestreo aleatorio estratificádo.

Es ma form¿ de muestreo que pe¡mite mantener en la muesfa las mismas proporciones qüe en la
poblacjón ¡especto a las diferenfes características que ésta prese¡ta. Con lo cual aseguramos que la
muestra ¡enga Ia misma p¡opo¡ción de una o más lr'a¡iables qr¡e la población de la cual ésta procede.
Consiste en dividir Ia poblacióIl en subgrupos de acuerdo con cie¡tas caracte¡ísticas, como el seto o la
raz¿- y luego ext¡aer u¡a müestra al az¿r a pa¡tir de cada u¡o de dichos "estratos".

3'4'M!99r99-p9r-s9!c!ss9 .

Es el proceso de extraer u¡a muestra al azar a parti¡ de ag¡¡paciones naturales de individuos


(conglomerados) dentlo de la población. Este tipo de muest¡eo es muy útil cua¡do la población está
muy dispersa y resülta poco práctico o muy costoso confeccionar una lista de todos sus eleñentos.
Pam obtener una muestra de conglomerados, primero dividir la población en grupos que soD
convenientes para el müest¡eo. Luego, seleccionar una porción de los grupos al azar o por un método
sistemático. Fi¡almente, tomar bdos ¡os elernertos o pafe de ellos al aza¡ o po¡ un método

C/ Montesa. 20 - 28006 MADRID - Tfno: ol 309 J6 4ó - wws.cáshflotr-oposiciones.com 52


EÜ GASH FLC'lñf ESTADiSTICA

sistemático de los grupos seleccio¡ados pa¡a obtener una muestra. Bajo


este método, aunque no todos
los grupos son muestreados, cada grupo tiene una igualprobabilidad
de ser seleccionado. por ro tanto
la muestra es aleato¡ia. Una Duestra de conglomerados, usualmente produce
un mayor elTo¡ muestral
(por lo tanto, da menor p¡ecisjón de Ias estimacio¡es acerca
de la població¡) que una muestra
aleatoria simple del mismo tamaño. por ejemplo la gente rica puede
vivir en el mismo ba¡rio, mie¡tras
que Ia gente pobre puede vtvir en ot¡a ¿irea. No todas las ár;as
son muestreadas en un muestreo de
á¡eas. La variación entre los elementos obtenidos de las áreas
seleccionadas es, por lo ta¡¡to,
frecuenterrente mayor que la obtenida si la población entera
es muesbeada medianie muestreo
alealorio si¡nple.

Müestreo bietápico (o por conglomer¡¿los en dos etap¡s): En este caso no fdrma¡ parte
de la
muest¡a todos los elementos de Ios coÍglomerados, sino que,
una vez se¡eccionados estos, se efectúa
uña nueva selección o se construye üna submuesfa deato
de cada uno.

Müestreo polietápico: Consiste en hacer va¡ias etapas pa¡a llega¡


a constituir Ia muest¡a con ia que
vamos a trabajar. Los cong¡ooendos seleccjo¡¿dos
en la p¡im; etapa pueden estar constjtuidos por
nuevos conglomerados incluidos en ellos, de modo que
pue¿la procederse a un submuestreo de
unidades de co¡lglomerados dentro de conglom"rudos, y
*cesiu"a"nt", u^ri* et"pur.
"rí "n
La combinación de la técnica por conglomerados y la estratific¿cióD
pe¡mite perfeccionar Ia
rcpresentatividad de las muest¡as, dado que aleda a
contr.ola¡ variables qu; p;;i"."" influi¡ en los
¡esultados de la investigación.

3.5. Muestreo doble-

En este caso se selecciona una muestra, generalmente grande,


de forma rápida, sencilla y poco
costosa, a fin de que su ir¡fo¡mación sirva de
base para la selección a" orru rna. p"qr.nu. S"
que en la muestra grande la variabje considerada .upon"
es una variable ,"Liionua" .on l" qu"
interesa de mane¡a especial. "u"itia,

En estos métodos los diferentes eleme¡tc


a partir de ra cual se va a
sereccionar ia muesrr4 Do r;"n"n t" .;,." jiolll#ffiJ::,:1"!ltj::'ón
4.1..luueqtreo cqp vo¡ubtarios: Aquí no exife como
tal un proceso de selección de Ia mueslra. La
pa¡ticipación en el estudio es como su propio nombre
inaljca, voluntaria.

4.2. Muestrm de convenie¡cia: Realiz¿do eo


fi¡¡ción de Ias necesidades del estudio.

4.3. Muestreo errático: Sin ninguna norma.

NorA: El test de ra rachas sin'e para comproba¡ la areatoridad


de una muest¡a: A veces a¡ realizar un
muestreo, puede llegar a influir el orden temporal
o espacial en q¡re las muestras han sido elegidas,
con lo cual no estamos en las condiciones uo _u"rtr"o
probabilidad varía de una obse¡\,ación a otra. _de "¡""*¡.i.pj", i" que la Jey de
Como ilustracjón obsé-.." ir-i,g;'"A¡*.u. f"'''Uien

C/ Montesa, 20 - 2800ó MAIRD@ 53


@ CASH FLOUI' ESTADíSNCA

podcmos denomi¡8r a este contr¿ste como te6t de inilependelcia de las ob¡erv¡cioD$ de o¡a
mr¡ettr¡.

(]/ MoDtcs¡, 20 - 2t006 MADruD - Tftro¡ 91 309 36 46 - Íww,c¡5hfow-opo¡ic¡ones.com 54


úA GASH FLcDr,v ESTADiSTTCA

ESTADÍSTICA ANALÍTICA O INFERENCIAL.

La Estadistica A¡alítica estudia muest¡as procedentes de pobraciones inaccesr'bres para, a partir


de su
estudio iñferir p¡opiedades sobre Ia población ge¡erar. Es fundamental para ra Medicina. Dentro
de ra
Estadística Analítica, destacamos 2 grandes apartados:

- Estimacjón de parárnetros.
- Cont¡aste de Hipótesis.

con ¡a estimación de parárnetros se realiz€¡ afirmaciones de una població¡, a pa¡tir de ros resurtados
obtenidos de la muestra Es deci¡, "estima¡" significa "calcurar" el varor de un ¡eterminado
parámetro
poblacional (medi4 varianza,...) a partir de un determi¡ado valo¡ muestral (estadistjco
muest¡al), ya
que el valor del panimetro poblacional es desconocido. l¿ estimación puede asumir dos formas:

L Estimación puntuáI.
2. Estimación por intervalo.

La primem eomprende el cálculo de una sola cifm numé¡ica, esto es, de un


único esradístico para
ev¿luar el parámeüo desconocido en Ja poblacióD (por ejemplo, de
la media de nuestra muestra infiere
la media poblacional). El problema de las estimaciones puntuales es que
no apo¡tan datos respecto a
la precisión de ia estimación. por ello es más útil la estimación de uo parámetro
por intervalos, ya
que entonces se indican Ios límites de valores deDtro de
los cuales el parámetro poblacional tiene una
p¡obabilidad dete.minada de est¿r (es decir, estimamos por ejemplo
Ja media poblacional a panir de la
ftedia de nuest¡a ñuestra (esti¡nación puntual), pero además calculamos un intervalo
de valores por
eDcima y por debajo de la r¡edia pa¡a aba¡car un lango más amplio
de valores y así tene¡ menos
probabilidades de equivocamos). Los intervalos de estimación
se denominan intervaros de
co'fianz¡' y los limites inferior y superio¡ de dicho intervaio, reciben el nombre
de lí,oifes de
confianza,

l.l. Estimadores puntuales de Ia medie poblacional.

La media, moda y mediana muest¡al, son esti&adores cent¡ados de


la media poblacionai
(están ce¡tradas en tomo al parámetro poblacjonalque queremos
estimar).
Cuando la dist¡ibución es simétrica, el estimado¡ cenÍado de
la media poblacjonal es la
media muestral.

Cua¡do Ia dist¡ibución es asimétrica, el estimado, centrado de Ia media pobiacional


es Ia
mediana muesÍal.

l.z. E$¡¡gsll¡-pg¡i¡tcnalg. Usando la media o la me¿lia¡a según sea más útil, y un intenalo de
confianza dentao del cual está¡ la media o la mediana con una probábilidad
de ace¡ar conocida.

En función del tipo de va¡iable con el que estemos trabajan¿lo, el paráñetro


estimado y el cálc'lo de
intervalo de confianza es diferente:

C/Moniesa.20 - 28006 MADRID - Tfno: ol 309 J6 46 _,^-*;;rhfñl;;;;;;;; 55


[E CASH FLOW ESTADiSTICA

- Sitrabajamos con variables cuantitativas, estima¡emos medias.


- Si trabajamos con va¡iables cualitativas, estimaremos Proporciones.

ESTIMACIÓN PI'NTUAI-I

Estimadores iDsesgados y de mínima varianz¡.

Se dice que un estiDado es !¡89!g?dg-9-!g¡@d9, si el valor muestal es o mayor o menor que el


pa¡iímetro poblacional que se va a estima¡, pero siempre está en tomo a é1.

Se dice que un estimador es sessado, si el valo. muesfal no se cent¡a sobre el valor poblacional que

Se dice que un estimador es de minima va¡ia¡z¿, si Ias variaciones que experimenta son las mínimas

Estimadores puntua¡es de la rüedia poblacional,

Lamedi4 moday media¡a muestal, son estimadores cenfados o insesgados de Ia Media Poblacional

- Cüando la distribució¡ es siméhic4 el estima¿lor centrado de la Media Poblacional es Ia medi,


muest¡al (que es el efimado¡ de mínima va¡ia¡za, por ello es el estimador de elecciór).

- Cua¡do la distribución es asimétrica, el estimado¡ ceritiado de la Media Poblacional es la Mediana.

Estirnadores puntu¡les de la varianza y desy¡acióD poblacional.

La,¡^r,a]¡za y desviación típica muestral son estimadores sesgados de la vária¡za y desviación


poblacional.

cua¡do la dist¡ibucióí es simét¡ic4 el estimador centrado o insesgado de la va¡ianza poblacional es


la Cuasiv¡rianzs muestrel; y de la desviación típica poblacional la Cuasidesviación típica
muestr¡1.

Cuando la dist¡ibución es asir¡é1¡icq el mejor estimador de la dispersión poblacional es el R¡ngo


lntercuartílico-

Estimación de la desviación dpicá poblacional.

PaIa es¡imar Ia Desvi¿ción Tipica Poblacional (S), se admite una corrección denominada de Bessel, que
calcüla la desviació¡ tipica en ta población igual que si fueÉ la desviación típica de la m¡restr4 pero
oblenida con un individuo menos, es decir en el denominador en vez de "n" ponemos "n-1"
(cuasidesviación típica muestral S):

\I-l
\ / (xrx)'
\f\ i (xrx)".
\/---- + s=\/---
V'-'
V'

56
C/ Montesr,20 - 28006 MADRID -Tfno: 9l 309 36 46- sa{H.cashflow-oposicloner.com
Eg CASH FLC}W ESTADiSTICA

o = DT de la muest¡a.
So = DT de Ia población lsi es que alguna vez se conoce).
S = DT de Ia población, esrlnada a parti¡ de la conespondiente de la mtrestra = Cuasidesviación
típica muestral

n
S'= d' ------
n-1

s1= cuasivarianza muestral. Por tratarse de üna cor¡ección de ra varia¡za de la muest¡4 estima mejor
la varianza de la poblacjón.

En muestms grandes, el factor de corección r/n-l prácticamenle es igual a Ia unidad, por Io que puede
estimarse la desviación típica poblacior¡a.l con la ¡¡isma desviación típica que Ia obtenida en la
muestra.
A medida qüe el tarnaño muestral dismi¡uye, Ia Cuasivarianza va siendo disrinta de la va¡ianza.

ESTINÍACIÓN POR INTERVALO:

Estimació¡ de medias.

Al estimar una media, pretendemos determinar cuál es la media de la población (inaccesible para
nosotros), a pa ir del estudio de una muestra de dicha població¡ (que si es accesible para
nosotros);
es decir que¡emos calcular un paflimetro poblacional (la media poblacional),
a pañir de u¡ parámetro
muest al (la medi¿ muestral). carcular un inte¡varo de confianza alrededo¡ de ia
media de una
muestr4 establece ios dos límites de varores (superior e inferior) entre los que se encontrará
el
verdade¡o parámetro poblacional y también la probabilidad de que así sea.

¿Cór¡¡o se calcula €l intervelo de confianza etr une estimación dé medias?

¿Cómo estim¿mos la Hemoglobina Media de una población?; es deci¡, ¿cuál es la Hemoglobina


Media de una población?

Muestra l. 100 pacientes i=12,5 a=4


Muesfa 2. 100 pacientes E=10 o:6
Muesfa 3. 100 pacientes t=I1 6=5
Muestra 4- 100 pacientes É-7 ú=2
Muestra 5. 100 pacientes t=14 o=3

De una población podemos extraer infi¡ita¡ muestas (cada una tendrá su y su desviación
me¿lia
tipica)- Si en Ja población de origen, la variable que estamos estudiando
sigue una distribución
normal, en cada una de las muestras obtenidas, también seg¡irá una distribuciórinonnal,
y además el
conjunto de todas las medias muesftales obtenidas tambjén se distribuián
Dor¡nalmente. Su media (la
¡¡¡edia de todas esas medias) es la Medis poblaciotrel, y su desviación típica
se denomi¡a Error
Típico o Error Está¡dar de Ia Medi. (SE ó Sm ó eeh), que es la dispersión
de las meatias
muestrales respecto a Ia rnedia poblscional. hav oue confunali¡lo por lo tanto con Ia desviación
^_o

C/ Mo¡t€s¡, 20 - 28006 ]\IL{DRID - Tfno: 9t 309 36 4e _ *."r.t ¡*op*¡"¡*rüi 5',7


ÉA CASH FLOlll' ESTADISTIC4

tiDica de la media Doblacional. El ElTor Estándar de la Media se calcula a partir de resultados de la


muestra,

d
Sm = --------

o = Desviación típica de la muesha


n = tamafo de la mDestra

Ejemplo: Quie¡o estimar la Hemoglobina Media de una población; para €llo obtengo una muestm de
100 individuos. La Hb media de dicha muestra = 1l. La o = 4.

Srn = --- = 0,4 ---------> Inferencia

V;
La media poblacional estará comprendida entre l1 t 2 x 0,4 ó 1l f 0,8 con una confianza (de
acerta¡) del9sYo.

La media poblacional esta¡á comp¡endida e¡t¡e I I t 2,6 x 0,4 4 1l 1 1,04 con una co¡fianza (de
acertar) del95o/o.

Dicho de ot¡o modo (au¡que es menos exacto, es útil pa¡a el exame¡t):

En mi muestr¿, he obtenido una Hemoglobina media de ll,


si ¡epitiésemos infinitas veces el
expe¡imento, la media poblacional estsria compreDdida ent¡e 10,2y 1l,E (11r0,8 ti2.Sm)un =
95oZ de las veces. La media no estaria comprendida ent¡e esos valores en un 50¿ de las veces.

Hb media = I I Media muestral obtenida.

l1 i 0,8 = E t 2 Sñ ............ Infervalo de Confianz¿.

95o% de las veces .................. Seguridad.


5% ........................................ P¡obabilidad de error.

(E t 2 Sn) = (10,2-11,8) ......, Intervalo de confta'¡zapara el95yo

p<0,05 -..................-............. Probabilidad de e¡ror

C/Montesa,20 28006 MADRID Tfno: 91 309 36 46 n'mr.cashtlow-oposiciohes.com 58


- - -
@ CASH FLOW ESTADfSTICA

ANTE IJN VALOR OBTEMDO EN Tf¡¡ EXPERMENTO ÚNICO, PUEDO ESTTMAR


ESE
VAIOR EN LA POBLACIÓN, CON TNA SEGURIDAD CONOCIDA; Y LINA
PROBABILIDAD
DE ERROR CONOCIDA.

Ejemplo:

La ñecuencia ca¡diaca media en fumadores es de 70 I 4 Iprn, p<0,05

Signiñca:

1. La frecuencie cardlaca media dc los fumadores estará comprend ida entre


66 y 74lpm en más del
95% de los casos.

2. La fecuencia ca¡díaca media de los fumadores no estará comprendida entre


66 y 74 lpm en
menos del 50% de los casos.

3. La probabilidad de que Ja fiecuencia cardlaca media esté comprendid¿ enrre 66 y 74 Ipm es


m¡yor del 95%.
4. La probebilid¡d de que la frecuencia ca¡díaca media no esté comp¡e¡dida
e¡tre 66 y 74 lpm es
me¡or del 5oZ.
5. Con una segurid¡d del 95% la f¡ecuencia cardíaca
media estará camp¡endida e¡tre 66 y 74 lpm,
6. con una prob¡biridad de equivocarme < der syo, la f¡ecuencia cardiaca media estará
comprendida enrre 66 y 74 lpm.

7. La frecuencia cardiaca de los fur¡adores estii comprendida e¡tre


66 y 74 lpm; p<0.05.

Pasos que hemos de segub pav realizar una estihacíón de media::

L Detemina¡ si ia muest¡a es gmnde


2. Conocer el pa¡ámet¡o Duest¡a¡ (media muestral)
3. Calcular el S*
4. Calcula¡ la tnedia poblacior¡al con ¡ln intervalo de confianza (95%,99% ...) y, po¡
consiguie¡te,
con una probabilidad conocida de equivocafe (p<0,05,
p<0,01)

¿Muest¡a glande?

sí No
n>30 n <30
I
I
+
DISTRIBUCIÓN DISTRIBUCIÓN t DE
NORMAL STUDENT

c Vontess. :0 - :8006 lrtADRD _1@ s9


@ CASH FLOW ESTADISNCA

DISTRIBUCIÓN T DE STUDENT o distribución t de Strrdent-Fisher.

Caract€risticss:

Es una distr'ibución de variables conti¡uas.

Es pa¡ecida a la No¡mal, solo que más achatada.

Los valores det área baj o la cijl-va gíyo, ggyo no són 2 y 2,6 sino que hay que calcularlos (mirarlos
e¡ tab¡as).
Cuando el tamaño de una t de Student va aümeritando, la curva se va pareciendo cada vez más a

una Normal. En general, ct¡ando ¡ t0, una t de Sfudent se puede aproxiña¡ a una Nomal

Ld media de la distribución teóricá (al set una dist¡ibución teórica en vez de media se la llarna
"espe¡¿nza matemática") es O, de fo¡ma que la distribución t de Student es parecida a la normal
tipiñcada [N(0,]), no¡mal, media 0, desviación tfpica 11.

n-2,3, nr¡ñ m m+¡ñ m+?.3s

La estimación de una media, cwindo se trate de una muestra menor de 30 i¡dividuos, tendrá en la
población co¡¡o ma¡gen de tole¡ancia o intervalo de corlfia¡¡za:

tit.Sm

donde E = valo¡ de la media muestral


t = valo¡ de Student obtenido de la tabla pa¡a el grado de seguridad deseado
Sm = El erro¡ estánda¡ de la media.

Nota: al b¡¡sca¡ e¡ la tabla el valor t de Student, debe hace¡se Do con l individuos sino con n-l (ya
que tiene n-l grrdos de Iibenad).

Gr¡dos d€ libertád. Este concepto sig¡ifica "núme¡o de téminos rcalñente libres" y se representa
po¡ g.l. o por v. En la distribución de la t de StudFnt para estimación de medias trabajaremos con n-l
grados de Iibenad.

L¡ diltribución t de Stüdert se usa:

- Para estimar medias poblacionales a partir de muestras Pequeñas (n<30)

60
C/ Motrtesa,20 - 28006 MADRID - Tfno: 91 309 36 46 - s$1r.cashllow-oposiciones.com
EQ CASH FLOW ESTADÍSTICA

Para comparar dos medias a partir de rduestras independientes.

Para estudia¡ la ¡elación e¡tre una variable cuantitativa y otra cualitatjva (2 categorías).

Para comparar dos medias a parti¡ de muestras apareadas.

V.lorct I d. Snnh¡,t ! Drúzb[k!2d p ¡É'oci.da


.h t1tñctón d. tos gt dos óa t¡b.thd gt.

3*i 8i;l lS i::á iñ l*i lff r.f, i*! t¡i


iil ili !j4 ;;i3 $f itx ::s :fi ;;: iil:
is idi ili :s i# itr iiü i8 t+i !Éi
¡lrr¡¡'¡u¡s¡

II iÉig ¡üiiü illifi ,¡;a ii i# $tiir isj# l#j#,


1;¿
3#t
i?;

i ¡rl ifi;#lit i+;#i*l ií*H;il ii itr iix


ifr
i{ iff
1:: 93: l?','
:::,; ii:; l::i i*; ;fl?

€ iü iii ;:il 3tr r:E :# :F; 3lt; j;""

*. fii{ i# ifr ifi ifi i$ i# ;# i# i*


EJEMPLO L Quiero calcüla¡ el colesterol medio de los
mad¡ileños. Muestra: n = 100, ñ= 130, o =

I. n>30: sigue una distribución Nomal o de Gauss.

2. -=130
4
3. S- = ----- = 9,4
ln*
4. El colesterol medio en Mad¡id es I30 i Zo .S¡D

Zc¡ : Valores de la normal

130 i 1,96 0,4 = l30 t 0,784 p<0,05 seguridad 95%


130 t 2,57.0,4 = 130 r t,O4 p<0,01 seguridad 99%

EIEMPLO 2. Quie¡o calcula¡ el colesterol medio de los mad¡ileños. Muestr¿: n = 20, ,= l3 O, o : 4.

Ll < 30: sigue una distrjbución t de Studeff.

c.r ltonresa. :0 -:8006 lt¡.¡n-o - r¡no, sitñ;a6:ffi;;i;;;;;i*-;;; 6)


EÜ EASH FLOW ESTADISTICA

130

4
3.Sm
IE
v

4. El ooleste¡ol medio e¡ Madrid es 1 3 0 { t v srn

t v : V¡lo¡er de l¡ t de StEdeDt

130 a f,09 0,92 = 130 a1,92 p<0,05 scgurid¿d 95% (re úi!¿ ao I¿ aolunna 0,025 ¡l sot la t¿bla de
una cola)

130 t 2,86 0,92 = 130 t 2,63 p<0,01 seguridad 99% (se mira oo la colürnne 0,005 ¡l sor l¿ tabla do
un¿ col¡)

Los valores da 2,09 y 2,E6 que figur"¡n en l¿s cxp¡erio¡es ¿trtcriorcs, s€ ha¡ obt.oido de la tabla dc la t
d€ Studer¡t para n-l grados de libcrtad, es d6cir pa¡¿ 19 gr¿dos dc libert¿d.

Estl¡¡r¡clóü de üü¡ proporcióp lDorcert¡lé).

¿ n<100 ? DISTREUCIÓN BINOMIAL (P)

No

iD-o Dróximo a Sl
i lo0? ----------''DISTRBUCION
a BINOMIAL
I
Nol
ü
DISTRIEUCIóN NORMAL

Pasos a s.gr¡ir cn l¡ climsción d. una proporción:

l. Determi¡a¡ 6i vs¡¡¡os ¿ trabqj¿¡ scg¡ln un¿ disfibución Bi¡omial o según una distribución Normal.
2. Colocer el pa¡ámebo muesbal (propo¡ción müestral: p = 0,2, p 0,4 ,..), :
3, Calcular ol enor cstÁndar del porcentaj. (Sp ó c.p).

p (l-p)
s-=

l)9 62
Cy MoÍtcc{, 20 - 2801}6 M.ADR¡D - Tfto: 91 36 46 - *nw.c¡s¡flov-opolicio¡eccot¡
@ easH FLOlltt ESTADúSTICA

4. Calcüla¡ el po¡ce¡lt8je poblacior¡al co¡ un i¡¡terv¿lo


d9 confianz¿ (9 syo, ggr/o .,) y, pot )o tarrto, aon
u¡a probabilidad co¡ocida de €qüvoc¡mos (p<0.05, p<0.01).

¡H¡y rnuch¡s "pi,! ¡No os cotrfq¡dái!!

EJEMPLO ].

E¡ mi área de s¿lud de 250 paoie¡tes, ¡¿ p¡oporción de hipertensos


es de 0,2 (2}yo\. ¿Cuál es Ia
proporción dc HTA el Mad¡id?, Muestra: D 2SO, proporciOa
= = O (20%),'
'
1p¡ ,2

Como n > 100y el poroentajo ouestral no está proxiño a 0 ni a l00Zo,


¿sumimos distribuoión ¡orm¿l
a la bom de ¡galizs¡ la estiftación.

3, Calcüla¡ el e¡¡o¡ estándá¡ del porcentaje

0,2.0,8
Sp= --_-..-_ = 0,025
250

4. En M¡drid la propolció¡ dc hipe¡tensos es de:

i
0,2 t2.0,025 = 0,2 0,05; con un¿ segu¡id¿d
del 95% y una p<0,05.
0,2 r 2,6.0,025 = O,Z r 0,065; una seguridad
.cor¡ del 99% y utr¿ p<0,01 .

Si la distribución siguiese una bi¡omial no hace


fatta haccr cálculos pucsto quc el ¡esultado está
tabulado (cs dccir, se mira cn táblas }" he¡bas)

g Vout""", :O U¡,O%
- ¡¡OOe
63
M CASH FLOW ESTADISTICA

¿QUE ES IJN CONTRASTE DE HIPóTESIS?

Es un método de razonamiento que nos pe¡mife decidir si una hipótesis es o no cjerta, y con cua¡to
margeí de en'or, es decir, con qué probabilidad de equivocamos.

¿PARA QI.IE SIRVE UN CONTRASTE DE HIPÓTESIS1

Para poder demostra¡ una hipótesis. Es decir, para establece¡ una conclusión en un ámbito
determinado de la ciencia, sobre un problema p¡evio, sin que nadie pueda poner eo doda la afirmación
que has realizado, ya que dicha conclusión la has de acompañar de una p¡obabilidad de ero¡, que si es
muy pequeña (menor de un 5olo) en la comunidad científica es como si no te equivocaras.

MÉToDo: rDóTEsIs.

Pa¡a realizar un contrasfe de hipótesis, en primer luga¡ debemos establecer las hipótesis que se han de
comparar. Y siempre se establece¡¡ 2 hipótesis, que han de se¡:

1.Mutuamente excluyentes: Sólo puede ser cierta una.


2.E)ihaustivas: Ambas hipótesis deben abarca¡ todas las posibles respuestas a un problema.
Las dos hipótesis que se han de contrast¿.¡ son:

1. Ilipótesis Nula (Eo):

Llamamos Ho a Ia hipótesis que se cont¡asta.

Ho nrmca se conside¡a probada, aunque puede ser rechazada. Por ejemplo, la hipótesis: Todos
los elementos de las poblaciones A y B son iguales, puede se¡ rechaza encontraodo elementos
de AyB diferentes, pero no puede ser demost¡ada a no ser que se estudien todos los
elementos de ambas poblaciones, ta¡ea que püede ser imposible.

Plantea la no difereDci¡ ent¡e lo que estemos comparando, de ahi que se formule en el


sentido de la igüaldad. Lo que equivale a decir que la pequeña difere¡cia que existe entre lo
que estemos comparando podría ser explicable por el azar.

2. Ilipétesis Alternativa (H1).

- Llamamos (H1), a la hipótesis que qu€remos demost¡ar (con una p¡obabilidad de eno¡). Po¡
ejemp]o, si hubiéramos pla¡teado el coriÍaste de hipótesis para demostrar la eficacia de un
nuevo fármaco, H1 plantearía la existencia de diferencia en la eficacia entre ambos fÁrmacos,
si por ejemplo quisiéramos demostrar la eficacia de un fii¡maco, sin compararlo con otro, Hl
diría que el fármaco es eficaz.

- Ge¡eralmente se pla¡tea antes que la Hipótesis Nul4 ya que es la hipótesis que quiero
demosksr y esto es algo que debemos tener claro a¡tes de empezar el estudio.

C/ Montesa, 20 28006 MADRID Tfno:91 309 3ó 61


- - 46 - wl?w.cashflow-opos¡ciones.com
E8 CASH FLOW ESTADíSTIC4

- Plantea la existencia de diferencia entre Io qr¡e estemos compamndo, de


ahíque se fo¡muje er¡
el se¡tido de lá desigualdad. Lo que equivale a decir, que la diferencia obseryada
entre Io
compalado, al ser excesiva, ho puede ser atribuida al azar.

EJEMPLO.

EI tratamjento del Cólera con tet¡aciclinas tiene una mortalidad del 7%; y con sue¡ote¡apia
de un 3oZ.
¿Es un batamiento mejo¡ que otro? para pode¡lo demostrar, hay que realizar un contraste de hipótesis
(sólo con estos datos no podemos establecer que el tratamiento de elección
para t¡atar a pacien¡es con
cólela es la suerote¡apia). ¿Cómo establecemos el contraste de hipótesis?

Ho: Tl = T2
Ht: Tl + T2

L Hipótesis Nula: No hay diferencias entre ambos tlatamie¡tos, o, Io que


es igual, Ia pequeña
diferencia que pudiera existi ente ellos es explicabie en principio, poi
el azai
2. Hipótesis altemativa: Sl hay difere¡cjas ent¡e ambos tratamientos,
o, Io que es igual, que la
dife¡encia observada entre ambos hatamientos, al ser excesiv4
no puede si¡ atribiida al az¿¡,
sino a que realmente los dos tratamientos son dife¡entes.

Una vez establecidas las hipótesis, mediante cálculos matemáticos,


taata¡er¡os de demosfa¡ la
hipótesis altemativ4 dando siempre una probabilidad de equivocamos qsi
somos capaces de
demgstra¡la).

¿EN QUE VA A CONSISTIR TODO CONTRASTE DE HIPóTESIS?

RECHMAR Ho y por lo tanto ACEPTAR Hl (Con una probabilidad


de e¡ror).

Si no podemos rechazar Ho: ACEPTAR Ho, queda¡do


i¡lplícito el rechazo de Hi.

TIPOS DE CONTRASTE DE I{IPóTESIS.

Todo contraste de hipótesis puede ser bidireccional (o


de dos colas) o u¡¡idi¡eccional (o de u¡a cola),
es deci¡ cualquier hipótesis altemativa puede ser bidireccional
o unidi¡eccional. La hipótesis
alte¡¡ativa será bidireccional cuando únicamente dfirma que
Ia ¿if"."nliu * á¡tntu de cero, siD
especificar la direcció¡ o signo con que el valor se aparta
áe c".o, pu"d; r;;;u;;;o, o infe¡ior. L¿
hipótesis altemativa será u¡idircccion¡l o'ando el
investigado*orr"ngu qr" la iife¡encia ha de ser
o bjen cuando sosrenga que ha de ser -siempre o"itiu". t-" uxp..siOn ,,ain"ren
:iif-" -1":*1"": lleva consigo
s,gnrt,cattvamente" la aceptación de una hipótesis bidireccional; en ca¡hbio, Ia
expresión "es significatjvamente mayor,,, implica una
hipótesis unidireccional.

C, Itobtes¡, :0 -28006 lt_ADR-D _@ 65


@ CASH FLOW ESTADiSTICA

¿QÜE DEBEMOS FIJAR A PRIORI EN UN CONTRASTE DE IIIPOTESIS?

Lo que se denomina ¡ivel de siglificeción estadísticá = d. fuesgo que voluntariamente asume el


investigador, de equivocarse aj rechazar Ho, cuando ésta sea cierta Detetmina la probabilidad de
error con la que nosotros vamos a dar nuestro rcsultado (en caso de deñostrar la hipótesis
alter¡ativa). Como máximo hemos de t¡abaja¡ con un cÚ de 0,05 ó del 5olo.

¿QUE DEBEMOS TENER CLARO EN TODO CONTRASTE DE HIPOTESIS?

A partir de qué valor vamos a podet rechazar Ho, es decir, debemos fijar el valor a parti¡ del cual
nuestros rcsultados no sean en priúcipio explicables pot el azÚ (por Ia casualidad). Dicho de otra
fo¡ma: cuál es la "probabilidad ñáxima de que nuest¡os ¡esultados sean debidos al azar" Este valor
vie¡e dete¡miñado por lo que en estadística se denomina grado de significación estadística (p).
Depende del número de individuos utilizzdos y de la magnitud de la diferencia o asociación
obsedadas. Se calcula a partir de la tabla de la distribución corespondiente y establece la
probabilidad de obtener un resultado tan exÍemo o más (igual o mayor) que ei obtenido en el
experimento, bajo la suposición de que Ho sea cierta. El grado de sig¡ificación estadística sólo
descarta que la diferencia observada entre lo qug estemos comParando, sea fruto del azar.

Por convenio, siempre que se rechace Ia Hipótesis Nul4 nuestro ¡esultado vend¡á acompañado de una
probabilidad de error (nü¡rca podemos estar seglros de que no nos equivocamos), pero ¡os va a dar
igual si Ia probabilidad de equivocamos es muy pequeia (concretamente me¡or de¡ 5o/o), y )a forma
de expresar este concepto, es acompafiar nuestro resultado de "p<0,05" (que coincidüá con el valor
delnivel de significación co¡ el que decidimos trabaja¡ antes de realizar el contraste de hipótesis).

p<0,05 ----> Acepto Hl (Difere¡cias reales, improbab)e que se deba¡ al azar).


p>0,05 ---> Acepto Ho @iferencias probablemente debidas al azar).

Cuatrdo l¡s difereDcias halládas son erplicables bajo le H0, se dice due les diferencias no son
estadisticame¡te sig¡rificalivas, para el nivel de sigtrificació¡ con el que estés trabajando.

Cusndo las diferetrcias halladas no son exp¡icables bajo la Ho se dice que las diferencias son
estadíst¡camenle signilicativas, p¡r¡ el Divel de sigDificación con el que estés trabajando, y el
resultado se acompaúará siempre de "p<0,05".

IMPORTANTE:

Nunca debe concederse na por supüesto que ana


especial iúportahcía a la "p". Nunca debe darse
prueba de signif¡cacíón esladística (coh p<0,05) ínplica aulotkáticamenle la exislenc¡a de
signúcación c¡ikica (entendiendo pot signifcación clhlica la imporÍancía o relevancia próctica qlte
r i ene unos r es ultados ).

C/Monlesr,20 -28006 MADRID Tfno: 66


- 91 309 36 46 - w *'w.cashflow-opos¡ciones.com
@ CASH FLc'rñ' ESTADÍST]CA

ERRoRES coN Los euE sf, TRABAJA f,N UN coNTRAsrE


DE HFóTEsrs.

- Si IIo e3 ciert¡ y rechezas Ho: Error Tipo I. probabilidad de cometerlo (o).

a= Nivel de significación, que frja el investigado¡ antes de realizar


el contraste de hipótesis. En Ia
priáctica se urilizan niveJes de significación de
0,05 (5%) ó de O,0t qtZl. así si se Jigese un
nivet ae
significación del 5% al diseñar un cont¡aste de hipótesis, querría
decir'qr" a" tOO u""., qu" ,"
rechazase la hipótesis nur4 en 5 ocasiones, se rechazaría "ua"
c'ando debería aceptarse. un niver de
significación del5% implica trabajar con un nivelde confianza
del95o/o.

Cuando se compara¡ más de una va¡iable a Ia vez aume¡ta


la posibilidad de cometer ün error tipo I_
Pa¡a evitarlo se aumenta
Ja exigencia delnivel de sig¡ificación:

0,05 (o el nivei de significación e)egido)

¡ó de compa¡aciones

- Si Ho es cierta y aceptas Hot Decisión correcta (l_a).


Nivel de Confianza,
- Si Hl es ciertr y aceptas Ho: Error Tipo If, probab¡lidad de
cometerlo (p).
- Si El es ciefa y acepfas H1t Decisión cor¡ecta, poder o potencia
del tesi (l_p).

¿QUE ES EL PODER DE CONTRA,STE O POTENCL4. DE


UN Tf,ST?

EI Poder o Potencia de un test es;

o l-p.
o La capacidad del test de encontrar diferencias
sjgniñcativas, iua¡do éstas existeD.
o La capacidad del test de demostrar Ia Hipótesis
Altemativa.
o Es Ia probabilidad de aceptáx la Hipótesis
Aiternativa cuando ésta es ciena.
o Habitualmente l_F es > g0%.

El Poder de un test depe¡de de:

A) Elnivei de significación elegido (cr).


B) La ¡ragnitud de la diferencia.
C) El tamaio de la muestra.

El Poder de ün test AUMENTA:

A) A medjda que d aumente; esto es, a medida que eJ nivel


de confianza disminuya.
B) A medida que aumente la mag¡jtud de la diferencia.

c yonresa. 20
- 28ooó MA¡R_D _@ 6',7
EA CASH FLOvtf ESTADiSTICA

C) A modida que aumente el larDaf,o de la muefra

RESUMEN DEL CONTRASTE DE EIPÓTESIS.

El rechazo de la hipótesis nula presenta un ricsgo dc c4uivocación, que hemos denominado


probabilidad dc enor (p<0,05). A esto valor "p' se le suele denominar Erro¡ d€ tipo I' o error ct.

Cuando ro se pueds domost¡a¡ qug ambos tratamie¡tos diñcrcn sigdficativameDte no podemos


recharar Ho, y la forma de eíu¡ciar la coDclusión seú dicic¡¡do quc "nuestro €xperime¡to ¡o puede
probar quc ¿mbos ratrmientos son distintos".

Si nos ¿t¡eüéscmos a aseg¡¡¿F que ambos t¡¿t¡mientos ¡o diñeron sigDiñc¿tivamentc, y lealoente


fuera¡ distintos, oometeriamos otro erro¡ difo¡enG: ac€pta¡lamos la hipótesis ¡ula siendo falsa.
Comete¡i¡mos ün f,rror de tipo II, o ermr p.

So puoden p¡cscnta! por lo a¡terio¡,¡rent€ comcntado cu¿tro posibilidades:

Rcchszar H0
Dccisión oo¡recta
(Aoeptar Hl) E¡ror tipo I
(Diferencias Prob¿bilidad = (r
Probabilidad= l- I
Podcr o Pote¡cia del tcst.
signiñcativas)

Si Ho (no hay diferencias) es cie¡tA y se ¿cepta (se acepta quc no hay difere¡cias), es u¡a decisión
9e@!@. La p¡obabilidad de qu. eso ocurra, u¡a vez fúado d, es l-d.

Si Ho (flo h.y diferc¡cias) cs cierta, y se rechaza (se afi¡ma qüc hay difcrcDcias), la decisió¡¡ no es
cor¡ecta. Se está cornetiendo utr ero¡ que se denominá E!!g!lipq-I. La probabilidad de que cso ocura
es Cl.

Mo¡te¡¡, 28m,6 MADRID Tf¡¡o: 91 309 3ó 46 www.casbflow-oposlcionercom 68


C/ 20 - - -
M CASH FLOUI' ESTADiSTICA

Si Ho (no hay diferencias) es falsa, y se rechaza (se afirma


que hay diferencias), la decisió¡ es
correcta. La probabilidad de que esto ocurra, conocido
B, es su complementario: l_8. Este va¡or (l_p)
se denomina Poder de cont¡aste. poder del test o potencia
del test; y no qu" l"
test" sea
¿o. rnuártru., ".'ot
probabilidad de que existiendo una dife¡encia "oau
sig¡ificativa .l capaz de
detectarla. "nt."

Si Ho (no hay diferencias) es farsa, y se acepts'


la decisión no es co,.ecra. se está cometiendo un
que se denomina Er¡o¡ tipo IL La probabilidad
eno¡
de cometerlo es p.

Sinónimos:

. Rechazo Ho
. Acepro HI . Rechazo IJI
. El az¿¡ no explica Ias diferencias . El az¡r explica las difere¡cias
. Result¿doesradislicamentesjgnificativo . Resuhado no efadisricamente significativo
. Muestras no ¡omogéneas . Muesrras homogéneas

EI sigüjente paso, una vez definido el nivel


de confianza, es determ inar las zonas de aceptaciófi
rechazo de lahipótesjs pianteada. primero y de
se define el tipo de ensayo ur"..-H"l
una o de dos colas, de acuerdo a si en la hipótesis "
J,
tipo., .n.uyo a"
respectivamente. Luego se calcura er varor
nula hay una d;;l;;;d"d o una iguatdad
crítico der ensayo que áelr.¡t" Iur?n"s iu""^.u..
la hipóresis nula sea de igualdad, el ensa) cuun¿o
o ser á de dos calas filgt ta d" uU4o, poiqr"
¡os casos de mayor y de menor a ¡a vez. ,n,.r.r" ,.o.",
Fso impri"" ."r""i*
zona de aceptación de la (Ho) y a cada lado
i"ii_i". o.ir"-lir"i. ."r,", ..,"r, ,"
dos zonas de ¡echazo. C._J" i;pu*ri.
alguno de )os sjgnos de desiguardad, eI ensayo ""i" ;ísoro varor ng*"
tendtá uka co¡o, ¿""i., ¡uiJ ""1"
que separa las zonas de crítico
aceptación y de rechazo ",

3.

Una.de.las,primeras cuesriones gue se pla¡tea


u¡ investigador cuando inicia un trabajo científico
slguiente: "¿Con cuántos indjviduos he de es la
realizar el trabajo para poa", J"_o.rau.-fo qu.
p."t.naoZ,,.
Todos somos conscientes de que acümular
datos de una fo¡ma indisc¡iminada, ,,cuantos
no puede constituir u¡a práctica recomendada --.JJl'co-n- más mejor,,,
en una experimentacion ,oou
podremos quedarnos co¡tos, con la p.ouuuiriara
consecuencja de no p.a". O"a".rr_."r"fi"a"s
bien excedemos en la recogida de información, significativos; o
*nsigrri"nr" , '"
.r,"".luoa p"."
probar algo q'e podria haber sido demostrado
c"""on "t ,n.""r,,;;;;;,;;;;'''"
"sÁ"rlo-yl_o"rr.

Cada experimento tiene un tamaño idóne


prerende, con ,-, ,"gu.iaua u""pou":r.1;1Xl"Tiiil1#1H]::::i,:?ff.ff::::.1:_3ff;
estadistica de un resuhado y esfuerzo reo
diseño de un
n-^ a"o'oarla constjtuve el punto de partida del
fiu"ld1
"."0-;.;;;;;;; n"br; ;;::""j:r*#:'ffdffJ:::"T.""ff::r,"J"",üTrj;
mantensa, er ¡esurrado *,.á,,á,

C/ Monresa, 20 - 28006 M.ADRD


-@ 69
Ü C}ASH FLOvlf ESTADíSTICA

mayor a la hora de su presentación. Pe¡o también es cierto que, alcatrzado un oivel de signiticscióo
determin¡do (p<0,05), el resultado va a ser unánime acept¡do; y puede set que reducir esta
probabilidad de el¡or no nos comPense el trabajo necesario.

Para poder estimar el tamaño de una muestra hemos de parti¡ de algo concreto conocidoi lo que se
denomina a pa¡tir de cuyos resültados vamos a calcular el número mínimo de
!¿peliElqoiiLolq
individuos necesarios. Una vez conocido lo que esperamos o deseamos obtene¡ en el estudio, el
p¡oblema de p¡edete¡mina¡ el t¿maño muestral se ¡educe fundamentalmente a estudia¡, en cada caso,
el correspoDdiente error estándar (el cual mide el intervalo de confiana de cada parámetro que se
a¡aliz¿. sea una medi¿ a¡itmétic4 un porcentaje o una diferencia de medias).

En todo momento hemos entrado en las fó¡mulas con los tamaños de las muesüas y hemos obteoido el
ma¡gen del az r para vna segr¡ridad dada. Ahora e1 problema es inverso: damos po¡ conocido el
intervalo del azar y hernos de despeja¡ el tamaio. Como en todas las exPtesiones del €¡ror estrinda¡, el
tamaño de Ia muestra figura en el denominador, afectado de la Miz c\Jadrad4 sabemos que ta
precisióD estadistica aumenta (o lo que es lo mismo' el error estáÍdar disminuye) cuando el
tamrño ñüestral auñetrte.

PR.EDETERMINACIÓN DEL TAMAÑO MTIESTRAL EN LA ESTI]\AACIóN.

1, Para predeterminar I¡ muestra necesaria p¡rs €stimar una proporción con un e¡ror máximo
determi¡ado, tenemos que aplicar la siguiente fórmula:

z' * p e-o)

e2

zo, =1,96 (para un Intervalo de Confianza del 95%) (y luego eleva¡lo al cuadrado)
p = Propo¡ció¡ muest¡al
€ = erro¡ máximo que estamos dispuestos a acepta¡ (p¡ecisión),

si no hubiéramos realizado u¡ experimento piloto, y no tuviéramos u¡r valor previo, nos debemos
poner en el caso más desfavorable, qr¡e es: p=0,5 y l-p=0,5.

2. Para predeterminsr l¡ muestr¡ necesari¡ p¡ra estim¡r ulla media con un e¡ror máximo
deie¡minado, tenemos que aplica¡ Ia siguiente fórmula:

z, on. 6

E2

Za, =1,96 (pa¡a un lntervalo de Confianza del95%)


o2 = varianza muestrai
€ = e¡ror máximo que estamos dispuestos a aceptar (precisión)

O Monlesa. ADRID - Tfno: 9t 30s 36 46 - $lrw.cashtow-oposiciones.com 10


20 - 28006 M
@ GASH FLOI,V ESTADiSTIC4

PRXDETERMINACIóN DEL TAMAÑO MUESTRAL EN EXPERIMENTOS


DE
COMPARACIóN DE GRL?OS.

Una aplicación importante del aspecto teórico de los e¡ro¡es


cr y p, es en la predete¡minación del
tamaño muestral en experirientos de co¡¡pa.ación
de grupos.

Se, puede. diseñar u¡ expe¡imento que garantice


valo¡cs p¡elúados de ambas probabilidades de er¡ol
calculando adecuadament€ los ta¡naños de muestras
¡ecesarios que, lógicamente, deberán ser mayores
cuanto más pretendamos ga¡antiz¿, la segu¡idad
¡
por consiguiente, menores senin d y p.

6
d B Unilateral Bilater¿l
040 2,12 2,80
0,05 0,10 2,56 3,24
0,05 2,92 3,60
020 3,t6 3,42
0,01 0,10 3,60 3,86
0,05 3,96 4,22
020 3,93 4,13
0,00t 0,t0 437 4,57
0,05 4,73 4,93

l. Comperaciótr de medias.

ol2 o22
----- + -_-___

2. Comparación de proporciones,

pl -p2= e.

Las fórmulas anleriores permiten oredetermina¡


el tahafio muestral necesario para eslimar una
diferencia de medias (variabJes cuanriurivas;
o a" propo," ion", iuuri""i,.,
""l,i.i"t"u. a, ,*, o.
conúaste de hipótesis (expljcados m¿is u"
adetantel, al._"¡"rn*ri"i¿"p*¿*¿
ii,.''
o Ia variabilidad de Ia va¡iable p ncipal (a mayor varjabilidad, se¡á necesario un
ta¡naño muestral) mayor

ClUont""r, ZO-:eOOe U% 71
E] CASH FLOl,v ESTADISTICA

enor tipo I
er¡or tipo II
pode¡ estadistico

o la propo¡cióD de pacientes perdidos du¡a¡te el estudio (d) U¡a vez calculado el


tamaño muestral lo tenernos que mültiplica¡ Po¡ 1/(1-d), para así pa¡tir de un tamaño
muestral mayor y aunque haya pérdidas que estas no nos impidan demostrar Io que
queremos porque el tamaio muestral sea demasiado pequeño

4. HOMOGENEIDA.D DE DOS MUESTRAS.

Mediaote el estudio de hoñogeneidad estudiaremos dos mueshas, ataliz¿ndo en ellas u¡a sola variable,
que podrá ser cua¡titativa o cualitativa. Se trata de estudiar si la dife¡encia hallada en los resultados de
una y otra muestra puede ser atribuida a\ azat o si, por el contrario, es gxcesiva para que el ázar la
explique.

Ils siguie¡tes f¡ases expresa¡ si¡ónimos de la misma situación:

- Muest¡-¿s homogér¡eas = P¡ocedentes de la Í¡isma población = El azar, en principio, explica las


diferencias = Igual comport¿miento = Diferencias no signiñcativas.

- Muestras no homogéneas = Procedentes de poblaciones distinras = El azar, en principio. no


explica las diferencias = Comportamiento difere¡te = Dife¡encjas estadisticahente
significativas.

En el estudio completo de la homogeúeidad de dos medias hay que pa¡ti¡ de la base de que la variable
se distribuye normalmente en la población (según ulla curva de Gauss). Si esto no es así, o no se puede
p¡esuponer, no pod¡án aplicarse estas pruebas de hor¡ogeneidad, y habni que acudi¡ al análisis mediante
pruebas no paramétricas, menos precisas, más conservadoms y qüe necesita¡án que las dife¡Encias
obse¡vadas sea¡ mayo¡es, pa¡a que puedan ser demoshadas como significativas.
Cuando se t¡ata de comprobar Ia homogeueidad de dos dispersiones (que vienen dadas por las
desviaciones típicas o por las vs¡ia¡"¡s), la compa¡ación se ¡ealiz¿ por cociente, es decir, por
desproporción. El cociente F que obtengarnos se corDpara con los valor€s de la tabla de la [1!g.S4p¿9L

5. PRIJEBAS DE SIGNIFICACIóN ESTADÍSTICA.

Son pruebas estadísticas cuyo objetivo es rechazd la Hipótesis Nul4 calculando qué probabilidad
tienen los resultados obtenidos de ser debidos al azar.

s.r' IlP!!-dlrIcÉbsLQ$ .

PRUEBAS o TEST PARAIdTRICOS: Pruebas que se utilizan cua¡do las va¡iables analizadas en
Ia población de origen siguen una distribución No¡mal o cuando ésta puede presüpotgrse.

72
C/ Montesa,20- 28006 trLA.DRID - Tfno: 91 309 36 46 - r*lv.cashnow-opos,ciones-com
[a cas]t FLow ESTADiSTICA

PRUEBAS o TEST NO PARAMÉTRICOS: Estas pruebas se utilizan cuando las variables


analizadas €n la población de origen oo s¡guen u¡a distribucióD No¡mal o cuando ésta no puede
presupone¡se. Las pnrebas no paramétricas no dependen de la dist¡ibució¡ de la variable, por ello
también reciben el nomb¡e de test de distribució¡ libre, y no p¡ecisan la condición previa de
normalidad de las poblaciones. No se maneja¡ en ellas, los valores cuantjtatjvos que toma la va¡jable en
cuestión sino, ú¡jcamente sus rangos. Son pruebas de menor precisión qüe las paramétricas; es decir,
solame¡te demostrará¡ como significativas diferencias mayores. Por ello, cuando se tiene Ia evidencia
de que las poblaciones son normales, siempre serán de elecció¡ ¡os test paramétricos. podemos
resuftir las condiciones de aplicabilidad de un test no paramétrico a los sigr.¡ientes casos:

1. Cuando con muestr¡¡s meno¡es de 30 indivjdüos, Ias poblaciones de origen no p edan ser
consideradas nor¡nales.

2. Cuando ¡a variable represe¡ta solame¡te una medida aproxiñada del carácter, sin una
valoración exacta (el paciente "ha mejo¡ado,,o "ha empeorado").

3. En un primer paso de control del expe¡imento cuando, todavía con pocos datos, querernos
hacemos idea de la marcha aproximada del mismo.

Si las muest¡as son > de 30, no existe inconveniente en utilizar pruébas paramétricas, a pesar de que
Ia distribución de los datos no sea ¡ormal. Se puede demostra¡ que, aunque la variable no siga una
curva de Gauss, la repetición hjpotética del experimento propo¡cio¡aría medias sucesivás que sí se
ajüsta an a la curva normal, siempre que la muestra sea gande. El in¡,,estigador debe, pues,
preocuparse por utiiiza¡ p¡uebas no paramétricas únicamente en el caso de que, con muestms <
de 30
individuos, sus datos no sigan cuñas de Gauss.

En funcióD del tañaño de Ia muesta con la que trabajemos, establecerer¡os el tipo de pruebas
o test a
utilizar:

Sin)30v I variables normeles


- Pruebas P¿ramétricas.
1 va¡iables no normales P¡uebas Paramétricas.

Sin<30v vari¡bles ¡ormales Prueb¡s Paramétricas,


variables no ¡orúsles pruebas No peramétricas.
{ ---->
Las pruebas no par¿métricas más importantes son:

Test de los Signos.

Test de la T de Wilcoxon (también llamado del Rango con Signo de Wilcoxon).

Test de la U de Mann-Wlit¡ey.

Test dé Kruskal-Wallis.

Test de Friedman.

C/ Montesa,20 -28006 MADRID Tfnor 9l 309 36 46- rnm.cashflow-oposiciones¡om '7i,


-
EO CASH FLOIñ' ESTADíSTICA

5-2- Te3t dé Kolmororov Smir¡ov.

Es la prucba estadlstica que se utiliza pa¡a demost¡sr si ur¡a oolecció¡ de datos sigue una dist¡ibuciót
Normal (una curva dc Gauss).

s3.@.
CONCEPTO DE DATOS APA-RXADOS

Detos apa¡oados son ¡quellos quo sc mid€n 2 veccs, antcs y después de um intervpnción (f¿¡m¿oo,
vacür¿..), Po¡ lo tarto, vemos oomo hay !ólo ¡¡¡ v¡riable ¡ st¡dlo y uD¡ ¡ol¡ Eueatr¡ cn la quc
se mido la vaiiable Entls y dcspués de la inte¡ve¡¡ción.

lnte¡venoión
Dato antcs Dato después

TEST PARA DATOS APAREADOS (Df,PENDIENTES).

Cu¿ntitativ¿ Pa¡amét¡ioo: Test dc la t do Studért ap¡¡rada


(coñp¡ración dc 2 medias
aparoadas) No paranétrico: T d. WilcoxoD

l'

Monters, M^DRID - Tfnor ns1v.c$hllow-oporic¡o¡€r.com 74


Cy 20 - 28006 91 309 36 ,16 -
@ GASH FLOr,v ESTADíSTIC4

TEST PARA DATOS NO APAREA'OS (INDEPENDIENTES).

V¡ri¡ble 1 Varirble 2 Test

Cuaütativa >2 catego¡ías


(c-ompaÉción de >2 p¡oporciones Cu.litativ¿ 2 ó úás
catego¡ías x2
independientes)

Cu¿litativ¿ >2 categorías


(comparación de >2 medias Cuantitativa
independientes) No paramétrico: Kruskal-wallis

5.4. Relació¡ lesociaciópl e¡t¡e variables cualit¡tivss.

a Con csta prueba de significación estadístic¿ se ari¿liza


l¿ posible ¡eiación ent¡e variables ci¡alit¿tivas,
/ Por ejemplo; El color del cabello y el oolor de los
ojos, el nivel sociocconómico fel padecimiento de
) Esquizoñenia el sexo y ap¡oba¡ o Do un determi¡ailo examen.
t El test estadístil que nos pe¡mite
estudiar la existencia o no de asociación cnho aros va¡iabrcs
r Chicuadrado. Dicha disfibución nos pe¡mire ¡ealiza¡:
cualitativas es el test o ra distribución
t
t - P¡uebas de l¡depe¡dencia:
t, ¿El sexoy el coeficie¡te inteleotual son independientes?.
L
- P¡uebas de Homogeneidad: ¿El cánc€r ¡ect¿l y el cá¡cer gásüico tier¡en distinta
t supervivencia?.
t
t Co¡cepto:
,
L pla¡teada la Hipótesis Nula y la Altemativ4 el test
t ]J_!¿_vez de chi-cuad¡ado tÉta¡á de rechaza¡ 16
Hipótcsis Nula (Ho), con un niver de significactón determinado,
L
;;o;;; ras diferencias
,
L c/ Montc5& 20 - 2800ó IrADnm - rrno, gláct;-G;;;;;;;;"io-;;;;
t
t
L
@ CASH FLOW ESTADiSTICA

existentes entre las f¡ecuencias obse¡vadas y las que se esperadan enco¡trar, bajo la suposición de
que Ho fuese ciefta. Poste orI¡¡ente, se estudia si esas dife¡encias pod¡ian ser o no exPlicadas por el
azar, par¡ un nivel de sig¡ificación determinado. Los ¡esultados obtenidos se recogen en una tabla
llar¡ada fabl¡ de contingenci¿.

Ejemplo: En un exa$en, aproba¡on 40 de 60 chicas (66,6%) y l0 de 30 chicos (33,3%). Queremos


sabe¡ si en TODA la población de opositoies, el sexo influye en el resultado del examen.

¿Existe asociación ente el s€xo y el hecho de ap¡oba¡ un examen?

PASO I i Plasmamos estos datos en una tabla 2x2: es deci¡, const¡uimos una tabla que se denomina
Tabla de valo¡es expe¡imentales (observados).

TABLA DE VALORES EXPERIMENTAIES U OBSERVADOS

Aprobados

si No
Chicas 40 20 60
Chicos l0 20 30
50 40 90

PASO2| Establecemos el co¡rt¡aste de Hipótesis, y hjamos el nivel de significación con el que


vamos a t¡abajar (d=0,05 por ejemplo).

H0; El sexo no influye en el ¡esulrado (el sexo no está relacionado con aprobar un examen).
No hay diferencias significativas en elpo¡centaje de aprobados en frrlción del sexo.

H1: EI sexo sí influye en el resultado (el sexo está relacionado con aprobax üri exame¡).
Hay diferencias significativas en el porcentsje de aprobados e¡ filnción del sexo.

PASO3: Calculamos la tabla de valo¡es teó¡icos o esperados: bajo la suposición de que Ho es


ciert¿.

Si no tuviérahos en cuenta el sexo de los opositores: ¿Cuál seria Ia p¡obabilidád de ap¡oba¡ el


exar¡ron? 50/90, y de forma análog3, ¿Cuál sería la probabilidad de no aprobar el exame¡? 40/90.
Estas probabilidades son las que hemos de aplicar a la totalidad de chicas y de chicos que se presentan

C/ Montesa, 20 - 28006 MADRID - Tfno | 9l 309 36 46 - wl,w.cashflow-oposiciones.com 76


: Ea GASH Fl.ovrt ESTADíSTICA

- TABLA DE VALORES TEóRICOS O ESPEMDOS

ados
No
Chicas (50/90)60 - (u9q'60 - ó0
33
Chico (50/90)30= r7 (49/eo).30 = 30
s 13
50 40 90

G.D2 (o-E) 2
" PASO 4r Calculamos el 12 B¡pe¡¡¡¡cntal = :-*.__ = t -.--
T E

(V¿lores Expcrimentsles - Valores Teóricos)2

Valo¡es Tcó¡icos

(Valores Observados - Valores Esperados)2

Valo¡es Espe¡ados

, Utiliza¡do la primera fórmula:

(40-r)2 eo-2ry2 eo-n)2 eolr)2


12Exp. =
--*
*
---- + -..*-.r --.-.-_ = 9,95
13
:1327t7

- PASO 5: Buscamos ea le Tabla de la dishibución


12 dc pearson, el valor 12 1"6r¡6o.

:
" El_valor 12 Teó¡ico nos dice cuál es el valor máximo qu. el azJ puede
explioa¡, cs deci¡, cuál es la
maxr¡a drterencia explicable por el az¿¡, pa¡a el nivel d€ significación elegido, y con
-, libe¡tad' de l¿ disribución.
los ,,grados de

c/ Motrtess, 20 - 28(x)6 MADRID - Tf¡or 91 309 3616 - **.,n;.hñ;;ñ;i;;;;;;-- 77


ru casl{ FLow ESTADiSTICA

Trbh d? ¡r ñJ:ció! CE Cistrilu¡c'¡:

t;:\.dorubuhdr
p: Flbrbüdad'.crrodrd¡

ti

p<
t1
0,05 p < 0,01

Pam acudir a la Tabla de Chi-cuadrado, debemos calcular previ¿mente los grados de libertad de la
tabla de contingencia con la que estamos trabajando. Dichos g¡ados de libertad (gl) se calcular¡
multiplicando: (n" de filas-l).(n' de coluñ¡as-1).

Tablas 2x2 gl=l


Tablas 3x2 gl=2

PASO 6: REGLA DE DECISION:

Si 12E*p""i."nt"l ) 1.2Teór¡co: Rech¡zamos Ho, p<0,0.,. (nive¡ de sigtrificación elegido).

Si l2Experirnental < I2Teórico: No podemos rechazar Ho pa¡a el Divel de signilicaciótr


establecido.

C/ Montesa, 20 28006 MADRID Tfno: 9t 309 36 \rrv,cashflow-oposiciones.com 78


- - 46 -
@ caslf FLow ESTADiSTICA

En nuest¡o caso:

A) p<0,05

X2Experirental = 9.95
72¡¿6r. = 3 ,84

Rechazo Ho --> EI sexo influye en el resrjltado; p<0,05

B) p<0,01

l2Exp. = 9,95
x2Teo, = 6,63

Rechazo Ho --> El sexo influye en el resultado; p<0,01

Co¡diciones de vslidez de lá d¡stribuciótr chi_cua¿lr¡do:

TAIILAS MAYORES 2x2 (NxN).

si algunas de ¡as casitas de rs tabla de contingencia contieben ü¡¡a


cantidad de individuos tan escasa
que en la correspondiente tabla de frecüencias teó cas
o esperadas aparecen valores esperados
menores de 5 eleoentos, la prueba de la
12 puede no ¡esulta¡ suficientemente fiabie. La forma de
solucionar esta falta de fiabilidad consiste en agrupar ¿los filas
o dos colum¡as en una sola (siemp¡e
que las condjcjones del experimento Io permita¡), o si
esta agrupación no es conveniente, suprimir la
fila o la columna correspondie¡te a la categoria del carácter Jon escasu
,.p."s"nt""ión nulné.i"" pu.^
compa.ra¡, solamente, aquéllas que contie¡en un efectivo
suficie¡te de i¡dividuos. podemos tomer
com-o regla práctica ra necesidad de agrupar o suprim¡r
columna. o filas, cuatrdo er número de
fiecuencias teóricas o espera¿les inferiores a 5 supere el20¿
T.l¡¡l..:on
de Ia tabla.
de las casiltas totales

TABLAS 2x2

PRÚ'EBA f,XACTA Df, FISIIER.


CORX.ECCIóN DE YATIS.

En ]lna tabla de 2x2, una casilla teórica (una frecuencia


esperada) meno¡ de 5 individuos (25% de las
casillas, es decir, una casilla), haria preciso rechaz¡¡
la prueba; e¡ tal caso, la solución de este
problema se resuelve po¡ medio de la PRUEBA EXACTADE
FISHER, Ia cu;l permite detectar la
posible asociación existente e¡tre dos variabres cuaritativas
e¡ ios casos dá tabras cin .scasa muest .-

C/ Montess, 20 - 28006 tr(tDno - rrno, giJosJea6:ñ;fl;;;;;;;;;; 19


CE CIASH FLC'W ESTADISTICA

Calcula la p¡obabilidad exacta bajo la hipótesis nula de obtend una distribución de frecuencias
teóricas igual a las observadas o más desfavo¡able.

Cuando ia tabla de conti¡gencia se de 2x2 y el efectivo total de todas ellas no llegue a 100
individuos ó existan frecuencias teóricas menores a 10, se ha propuesto la denomi¡ada
CoRRECCIÓN DE CO¡{TINUIDAD DE YATES (actualmente la mayoría de autores
desacons€jan su empleo). Pe¡mite mejorff Ia estimación, hacié¡dola más conse¡vado¡¿. Pa¡a la
aplicación rüti¡aria de la co¡rección de Yates se resta 0,5 a la diferencia, en valor absoluto, entr€ ¡os
vatores experimental y teórjco, antes de elevar al cuadrado:

(lo-El-0.5)2

Otros üsos de la distribüción chi-cuadrado:

HOMOGENEIDAD DE VARIAS MLIESTRAS CUALITATIVAS:

Consiste en comprobar si varias muestras de un ca¡ácter cu¿litativo, p¡oceden de la misma población.

Ejemplo: ¿Proceden de la misma población, hes muest¡'¿s de grupos sanguíneos?


H0: Las muesfas proceden de la misma población.
H : Las muesúas no proceden de Ia misma población.

BONDAD DE AruSTE DE DISTRIBUCIONES:

Sirve pa¡a comproba¡, a través del estudio de una muestl4 si una variable aleatoria sigue una cierta
distribr¡ción (Normal, T de Student Binomial, Poisson).

Il¡: I-a variable sigue una distribución Binomial.


H¡ : La variable no sigue una dist¡ibución Binomial.
NOTA: Par¿ comp¡obar que una muestra de datos sigue u¡a distribución normal podemos usar el 12, la
prueba de Kolmogorov-Smimov, el test de no¡malidad D'Agosti¡o ó la prueba de Shapiro.Wilks
(usada pa¡a ñüefras pequeñas, n<30). También se pueden usa.r métodos g¡áficog (por medio de
histogramas, diagamas de cajas o gráficos de normalidad).

TEST DE HOMOGENEIDAD DE VARIOS PAR,AJúETROS DE POISSON:

Pemite comprobar si varios panimet¡os de Poisson son iguales.

Ho: La proporción de tubercülosos es igual en 4 ciudades.


Hr: La proporció¡ de tuberculosos es distinta en alguna ciudad.

Cu¡ntilicación de l¡ asocisc¡ón:

Cuando se ha encont¡ado üna asoci¿ción estadísticamente sig¡ificativa entre dos va¡iables


cualitativas, y se quiere cuantificar el grado de asociación existente entre ellas, el estadístico x2 no es

C/ Montesa,20 -28006 MADRID - Tfno: 9l 309 36 46- w$'rrv.csshflow-oposieiones.coln 80


E CASH FLC'W ESTADÍSTICA

válido, ya que dicbo estadístjco depende del tamaño de la muest¡a er¡ la cual se haya calculado. Existe
una g¡an vaiedad de medidas que pueden damos es¿ información, algunas de las cuales so¡ las
sigüientes:

1. COEFICIENTE DE CONTINGENCIA (de Pearsor).

Esle coeficienle expresa el grado de asociación entre dos variabJes cualitativas.

- Puede toma¡ valores desde 0 a l-

C = 0 ---> Ausencia de asociación e¡tre las dos varjables. Ildependencia


absoluta.

C =I ---> Máxima asociación entre las variab¡es. Depende¡cia absolufa.

- Su valor vie¡e dado por la expresión:

2. COEFICIENTE Phi.

Es u¡a medida del grado de asociación ent¡e dos variables dicotómicas. Este coeficierte
varia ent¡e 0
y 1. Valores próximos a 0 indican no asociación entre las variables y valo¡es próximos a 1, indican
fueie asociación.

3. INDICE KAIPA DE CONCORDA-¡,ÍCrA.

Este indice, que en Epidemiologia se utiliza para medir la reproducibilidad de los tesr
diag¡ósticos, es
ur índice de concordancia. se utiliza en tablas NxN cua¡do ra misma va¡i¿bre se observ¿ en los
mismos i¡dividuos en dos sjtuaciones o períodos de tiempo diferentes. Mide si
las f¡ecuencias
esperadas son significativamente mayorcs que las que cab¡ia espe¡a¡ po¡ pr¡ro
aza¡. Indices de Kappa
(Iieiss, 1981):

Inferio¡es a 0,40, reflejan poca concordalcia.

Entre 0"40 y 0,75 indican que la conco¡dancia empieza a ser buena.

Superio¡es a 0,75 indican la existeDcia d; ur¡¿ fi¡erte concordanci¿_

C/ Mo¡¡tesa,20 - 28006 MADRTD - TfDo: 9l 309 .36 16 8l


-,roo."ashflow_oposiciones.cii
[E CASH FLOW ESTADíSTICA

5.5. Relacióú lasociación) enlre v¡riables cualitativas v cuantitatives.

RELACIÓN ENTRE DOS VARITIBLES, UNA CUALITATTVA DE DOS CATEGORIA Y


OTRA CUANTTTATIVA (COMPA-RACIÓN DE DOS MEDTAS INDEPENDIENTES): TEST
DE LA T DE STI'DENT.

Uno de los análisis estadisticos más comunes en la práctica es probablemente el utilizado para
comparar dos grupos independientes de obseFaciones con respecto a una variable numérica (por
ejemplo ia coñparación de dos medias).

Cor¡o ya se ha adela¡tado, la aplicación de un conhaste pa¡amétrico requiere la normalidad de las


observaciones paia cada uno de los gnrpos. La comprobación de esta hipótesis puede realizarse tanto
por métodos g¡áficos (por medio de histogramas, diag¡a$as de cajas o gráficos de normalidad) como
mediante tests est¿dísticos (test de Kolmogorov-Sa¡ir¡lov, tesl de Shapiro-Wilks). Un núme¡o
suficiente de obseFaciones (mayor de 30) justific4 no obsta¡te. la utilizació¡ de este test (al poder
asumir la normal al ser de más de 30 i¡dividuos). Así mismo, este tipo de metodología exigirá que la
varianza en ambos g¡upos de observaciones sea la misma.

Bajo las hipótesis de normaiidad e igual va¡ia¡za la comparación de ambos grupos puede realizarse en
términos de un único parámet¡o como es Ia medi4 de modo que en el siguiente ejemplo planteado la
hipótesis de pafida será, po¡ lo ta¡to:

Ha: La media de peso ínicial es igual eh ambos grupos

Se denotará por {¡, J,,...,XJ e lYyyz,...,y-l al peso observado en cada uno de los sujetos sometidos,
por ejemplo, a la dieta A y a la dieta B respectivamente. En general no se exigirá que coincida el
núme¡o de observaciones en cada uno de los grupos qüe se compara¡r, de rnodo que por ejemplo n=40
y m=35.

El t test para dos muestras independientes se basa en el estadístico:

donde Ie l, denotan el peso medio en cada uno de los grupos, y rI . "2 las cuasivarian?ás
mu€st¡ales correspondientes. Si la hipótesis de pafida es cierta el estadístico segui¡á una dist¡ibución
t de Student con n+m-2 g¡ados de libertad.

En todá comparación de medias i¡depe¡úientes, hemos de establecer si las varian2as de las poblaciones
de las que se han obtenido las muestras son co¡ocidas o desconocidas.

L Si son conocidas (raro, pues no conocemos los paúmet¡os reales de la población, por eso ¡os
esiimamos pero no sabemos el exacto), el test estadistico que utiliza¡emos pai¡ ¡a
coñpalación de medias será la Z de cornparáción de medias (distribución normal).

2. Si por el contrario mn desconocidas (lo habitual), tendremos que establecer si las muestras
son gÉ¡des o pequeñas.

CY MoDt€s¡, 20-28006 MADRID- Tfno: 91 309 36 46-nr .cashflow-oposiciones.com 81


M EASH FLOW ESTADISTICA

- Muestras grandes (nt y n, >=30): t de Student.

- Muestras peqDeñas (nr y/o n? < 30): En este caso, antes de comparar las medias se
han de compara¡ las varianzas Poblacionales media¡te el test de la F de Súedecor:

Si ést¿s ¡esultan homogéneas (= homocedastidad: homogeneidad de varianzas):


t de Student con n + m - 2 grados de libertad (grados de libertad de la t de
Student pa¡a la comparación de medias)

Si resültan dife¡entes: t de Student, pero pa¡a calcular los gados de libertad con
los qüe acu¿li¡ a la tabla de la t de Student es necesario utilizar una fórmula que
se denomina fórmula de Welch. Fn esie caso. el lest esladistjco pierde
sensibilidad.

n¡i¡.cIÓN ENTRE DOS VARIABLES, UNA CUALITATIVA DE DE DOS


CATEGORÍA Y OTRA CUANTITATTVA (COMPA¡ACIÓN DE T{?iS DE DOS MEDIAS
INDDPENDIENTES): ANÁüSIS DE LA VARIANZA (ANOVA).

Esta plueb4 debida a Fisher, constituye un "elega¡te proceso matemático" que Pe¡mite @4p¡¡gt
indirectamente. varias medias arif¡éticas obtenidas en diferentes muestras, po¡ medio de Ia eqEpa¡eg:é¡
directa de sus dispersiones.

ANOVA, ANOVA simple o d€ ün solo frctor o de una vía.

Permite estudiar la influencia que un factor Püede tene¡ sobrc los valores medios de una var¡able en
varias muesfas (>2). Po¡ ejemplo, Ia influencia de la raza sobre la estatura

ANOVA pert dos f¡ctores o de dos vías.

Pemite esirdiar la influencia que dos faoto¡es pueden te¡e¡ sobre los valores medios de una variable e¡
varjas muest¡as. El ANOVA pa¡a dos factores permite estudia¡, a la vez, los efectos individuales y el
efecto interacción de ambos factotes, sobre la va¡iable que estanos estudiando Por ejemplo, la
influencia de Ia raza y de la clase social (po¡ separado y combinadas) sobre Ia estatlra.

El ANOVA pennite:

1. Comparar más de 2 rnedias procede¡tes de muestras indepeDdientes. Por ej ¿Existen


dife¡encias ent¡e la edad de los alumnos que aprueba¡ el BIR" Fl& MIR y QIR? (en el
fondo es cornparar una cuaniitativa [edadi con una cualitativa de más de dos categorias
ltipo de examen: BIR, FIR, MIR y QIR])
2. Comprobar si hay asociación entre una variable cuar¡titativa y una va¡iable cualitativa de
>2 categorias. Por ej. ¿lnfluye el tipo histológico de cáacer pulmonar (3 tipos) en la
supefvivencia en meses de los pacientes con cáücer pulmonar?

3. Comparar >2 medias apareadas (ANOVA para datos apareados) Por ej. La altura media
saltada por un grupo de atletas, ¿va¡ía txas u¡ ent¡enamiento de 2, 4, 6 y 8 meses?

83
C/ Montesa. 20 - 28006 MADRID-Tfno:9t 309 3ó 46 - ¡d*1¡"cashflo.tv-oposiciones.com
q CASH FLOW
ESTADfSTICA

EJEM?LO de asociación enbe u¡a va¡iable


cuantit¿tiva y ot¡a variable cualjtativa
¿Influye el tipo de tumor pulmonar en la supervivencia e2 cafegorías):
Cáncer de pulmó¡?. Disponemos de 1m"o,O" ,os pacientes con
los siguientes daro<: ""-r*",j,'O"'

Supervivencia en meses

Ca.Epidernoide Adenoca¡ci¡ol¡¡a Ca.Cél¡rlasG¡andes

30 t2 I5
40 23 20
45 28 25
50 35 30
60 45 35
66 50 60
69 60 62
72 60 66
85 90
85 9t 76

K = Nút¡¡e¡o de muest¡as
N = Número total de individuos
= n1 + n2 + n3

Planteamos las hipótesis:

Ho: EI tipo de tumor no influye en


¡a supervivencia de los pacientes.
Hl: EJ ripo de rumor sj influye en la supen
iver"i" d" lo, p;";;;;;..'

El ANOVA compaxa, en esencia- dos rtispersiones:


pulmonar que, por ser e¡ ,,facro¡,, que
Una es la dispersión debjda al lipo
de tumor
diferencia a las.muestras, se denomi¡a
la otre, es Ia debida al az¿r, que
denon
dispersión f¡ctori¡1. y
disPersió¡ d€ ¡¿¡r (hav autores que
aispersión resid.ar¡.-Eoitir' ¡a llarna¡
-n,i¿*"¿* "o,"olí" ;i,.,o; #i:#|il::,:"f:.#ilff,
"""""1,"#1*,lmos tue
|;.
presenren rodos ros daros

ta va¡iación debida al factor,


i.,f,"rtp;; """"t- que en este caso será ta va¡iación
debida at fipo de

(nt xl2 + ... + ¡k.xk2) _ N.M2


= 1392,8
K-l
2. Hemos de calcular la va¡iación
debida at aza¡ (VA)

x;2 - (n1.x12 +... +¡¡.¡¡2¡


= 177,l
N_K

Oltto¡t*", ZO-:¡OOO%
84
ü] CASH FLOW ESTADISTICA

"TEST DE BARLETT',

Se dice que dos muestras son HOMOCEDÁSTICAS cuando sus dispe¡siones son homogéneas.

4. Aditividad de los efectos de los factores.

Test a posteriori.

Si la "F" enfre g¡upos resulta se¡ estadisticame¡te significativa (algún grupo ¡o es igual), para saber
qué grupos son los diferentes, se realizan los denominados test "i posteriori":

- TEST DE TTJKEY
. TEST DE DI]NNET

- TEST DE BONFERRONI (o de compa¡aciones Múitiples)


. PRIJEBA DE NEWMAN-K¡ULS

ANÁIISIS DE LA VAITIANZA D¡ra dos factores.

Como se expuso al principio del tem4 r¡ediante el Análisis de la va¡ianza para dos factores podemos
estudi¿¡, a la vez, Ios efectos i¡divid¡rales de dos facto¡es y el efecto interacción de ambos factores sobre
una variable cuantitativa.

EJEMPLO; Comprobar la itrfluenci, que dos v¡riables cualitativas de mas de 2 calegoríás tietren
sobre u¡a vsrisble cugntitativa,

l,a raza (blanc4 negra amarilla) y la clase social (alt4 media-alta, media-baja, baja ¿lnfluyen
significativamente en la mayor o me¡or est¿tura de los individüos?. Es decir, queremos estudiar la
influencia sobre la estatur4 no sólo de la raza si¡o también de la clase social, por separado y
combinadas. Pa¡a ello, coúshuiriamos una tabla de doble ent¡ada, en la cual, uno de los facto¡es seria la
r¿z¿ con sus dive$as categorías (blanc4 negra y ama¡illa), y el ofo factor seria la clase socia¡ (dividida
también eD alt4 media-alta, media-baja y baja). DispoDdriamos entonces de una tabla de 4x3 casillas,
deDfo de cada una de las cuales escribi¡íarnos la sede de valo.es de la variable estatura que presentan los
individuos de las 12 muest¡as que así se forman y que contitüyen el objeto de la invedgación.

RAZA
FACTOR
Bla¡ca Negra Amarilla
Alta
Media-alta
CLASE
Media-
SOCLAL
baja
Baja

C/ Montesa,20 - 28006 MADRID - Tfno: 91309 36 46 - w*v.crshflow-oposicion€s.com 86


ESTADISTICA
M CASH FLOvl'

esticto, se requjere que los tamaños de las


En el A¡álisis de la va¡ianza pan dos factores, en sentido
sean iguales. Algunos autores aceptan la
muesfas en cacla una de las casiilas de la tabla inicial
las ñuestras no coincidan Si¡ embargo' en estos
t"""."ii-"i¿" del método au¡que los tañáños decada casilla por un tamaño único' igual a la media
iasos, debe¡ían sustitui¡se los tamaios reales de
armónica de 1odos ellos, es decir:

axb
n = ------------ ; siendo a y b et no de filas y colum¡as de la tabla
11
-- +...+ --
nl

ANÁLISIS DE LA COV

compa¡aban en bloque los valores


Dentro del estudio del A¡álisis d€ la va.ianza, hemos visto cómo se
con un nivel de
m"iio, qu" pr"rent b" ,lna va¡iable mediala en más de dos muest¡as Para poder asegura¡'
la raza (blanca'
rigrin"*iOt, si eran o no homogéneas. Un ejemplo de ANOVA es el estudio de si
problema se complicaría mas
ariarilla y negr4 por ejemplo) itfluia o no en la t¿lla de los individuos El
.i qu" l" s" ."locion" con otra va¡iable cuantitativ4 como el régimen dietético
"o*proburio" "st"t'-rru medio de calorías/día de los iñdividuos) Podría ocurrir
1qu" pod"rno.."dir, por ejemPlo, en número
qu" u"t u",i.".o, u un l".u- sobre la estatura ¿lel que, eo ¡ealidad' es responsahle el hábito de
"l""to
alimentación.

efectos sobre la talla: el


El ADálisis de la covariádze permite aclarar esta influenci4 separaüdo ambos
de la ¡aza er¡ la estatur4
de la raza y el de la dieta. El objetivo de la inT estjgación es ve¡ la influencia
p"ro "d"sg"¡-do" d"l la influencia de la alimentacjón que, Por fuerz4 no puede ser la misma en
"studio
jos indiviáuos de las muestras de diferentes razas. Naturalmente, si las muestms fueran homogéneas en
cuanto al régimen dietético, este análisis sería innecesa¡io'

PRUEBAS DE HOMOGENEIDAD DE VARIANZAS.

patologías?
Ei. ¿Es distinta la va¡iación de los niveles de transaminasas en individuos con 4

l{¡: = sr2 = 5r2 = ro2


s12

Hr : Alguna es diferente.

2 va¡ia¡z¿s: F de Snedecor
>2 vanaI.zas'.
o Test ¿le Bartlett (la distribución de p¡obabilidad que ütiliza es la de la Chiz de
Pea¡son)
o Test de Levene (la disi'ibución de probabilidad que utiliza es la F de Snedeco¡)

87
E¡ m-rt"t , ZO -:AOO6 U¡DRID - Tfno; 91 309 36 46 - ir"ñw cashflo*-oposiciones com
EO GASH FLOW ESTADISTICA

5.6. Relrclén entre variables cuántit¡tiv¡s.

1. CORR.ELACIóN LINEAL.

¿Qué diferencid hay ent¡e oorrelaoión y ¡egtesió¡? En 1¡ conelación las dos váriables cuaDtitativas
son "siñétricas", es decir, una no depende de Ia otra (por ejernplo peso y talla). Sólo queremos ver si
existe alguna asociación enfte ellas, pe¡o no calcula¡ una sabiendo la otra (sabiendo el peso calcular la
talla, por ejeñplo). NO existe por lo ta¡to una variable dependienté y otra indePendiente. En la
reg¡esión intewie¡ren 2 va¡iables cuantitativas (denominadas dependiente lrespuesta o resultado] e
independiente lpredictor, factor de riesgo]) que están, de alguna forma relacionadas; es decir,
v¿riaciones de una de ellas implica variaciones en la otra. Po¡ ejemplo, si el peso de un ¡ecién nacido
aumenta al aumentar el peso de su madre (se der¡ota con la let¡a / a la va¡iable dependiente y con la
letra x a Ia vadable indeperdiente).

En la correlación se pueden calcular dos ¡ectas de rcgresión: e¡ el ejemplo, la de la talla sobre el peso
y la del peso sob¡e la talla (pues ambas variables son simét¡icas). En la regresión sólo tiene seritjdo
calcular una ¡ecta de regresión: eo el ejcmplo, la del peso de la madre sobre el peso del recién nacido
(es absurdo estudiar si el peso del recién nacido determin¿ el peso de la mad¡e).

La rccta o rectas de regresión vienen definidas por Ia fónnul¿ de ¡a línea rect¿ (y = a + bx), donde a y
b son consta¡tes y '1" e 'y' los valo¡es de las va ables. No todas las co¡relaciones o reg¡esiones
siguen una líne6 recta sino que tal asociación podría ser exponencial, Ioga¡ítmic4 etc 6/ no següirian
ests fórmula), pe¡o en este manual sólo vamos a ve¡ la ¡elación lir¡eal.

La representacióo g¡áfica de la relación entre dos vadables cuantit¿tivas forma lo que se denomina
una nube de puntos, por ello, el gláfico recibe el nombre de ¡ube de pu¡tos, o di¿gr¡m¡ de
dispersión.

El siguie¡te pa¡o, después de la ¡epresentación gráfica de ambas variables cuantitativas, consiste er¡
cuantiñca¡ esta posible relación. En el diagrama de dispersió¡ vemos que una variable aümenta ¿l
aumenta¡ la otra, porque la nube crece diagonalmente hecia la de¡echa. Si deqeciese hacia la derecha,
una variable disminui¡ia cuando aume¡tase la otra. Para cua¡tifica¡ est¿ tendencia diagonal crecie¡te

C/ Mont€ss, 20 28006 MADRID Tfno: 9l 309 36 4ó \¡'*'lv,c¡shflow-oposlciones.com 88


- - -
ESTADiSTICA
É CASH FLOvtf
de variación conjunta entre 2
o decrecjonte, se define la CoVARIANZA' la cual es una medida
y que pasen por el "cenüo
Ttaz!¡do dos ejes paralelos a los ejes de coordenadas'
"^ri"¡n,
de
"t"*i ",i""..
gravedad" de lu nube de püÍtos, quedan definidos cuaho cuadÉntes

oua¿lraútes I y IiI' la nube es creciente


Si el mayor acumulo de puntos se concenÍa en los
"x"' aumenta "v"); por €l contra¡io' si se
ióo'uüloaÑ POSITTVI o DIRlcrA: al aume¡t¿¡ NEGATIVA O
:#;:;l;. n y IV, la fube seria ¿tec¡eciente (CORRELACION
"uu¿ru*", puntos se reparen homogéneamente ent¡e los
cuatro
Ñ-rg*S¡, u"a** "x", dismi¡uye "y") Si los
"i entre sl'
a 0: IndePendencia de las variables
cuadra¡tes, Ia Cova¡ianza es próxima
.'x''
de las desviaciones de la varjable
La covarianzá se defi¡e como la media ar;t¡nética de los productos
aritmética'
il"-*rp""" " * *"0" aritúética por las desviaciones de la variable "y" ¡especto a su media
p = Cova¡iarEa de las vadables 'x' e "y'

1r -l ¡ x (y, -
r )

P=t
n

neqativos, y no es adimensional' Es \¡n bue¡ indicador de la


La coyaliaflz^ Duede tomar valores
2 inconvenientes:
relación existente entre dos va¡iables, pero presenta

l. Sus unialadesl por ser un p¡oducto de variables' tiene unidades cuadráticas' las
'los
unid¿des en las que se midan cada una de l¿s dos variables'

grandes o muy pequeños' lo que no


2. Sü m¡gnitud' que puede preser¡ta' valores muy
variables'
permiáomparar entre sí covarianzas de parejas distintas de

un nuevo indice' el Coeficiente de


Los inconvenientes de Ia cova¡ianza se evitan ¿lefinien'lo
por el producro de las dos
lo.r"i""i¿n r de pe¡fson, que se obtiene dividiendo la covarianza
desviaciones tipicas de ambas va¡jables:

drx oy

.x" e "y".
p = Cova¡ianza de las va¡iables

o,= Desviación típica de la variable "x"

oy= Desviación tíPica de la variable "y"'

qr-re sea un coeficiente'


Este indice ca¡eca de unidades (es adimensional), de ahi
Puede variar entre _1 Y +1.

89
*'1'Fr'calhflow-oposiciones'com
C/M"ttt"*. r0 J8006 MADRD - Tf";91 309 36 46 -
CQ CASH FLOI'I' ESTADISTICA

Sus prircipales c¿r¿ctorlsticds so!:

Sa ¡epresenta por Ia letr¿ r.


Es uo fndicc que info¡ma de Ia mamitud y de la diE9giéq de la Corlelación.

l. El signo (+ o -) deúemins la di¡ección de la c¡Íelacióü:

- Positivo:Al a!¡Ete¡ta¡ un¿ ¿uEe|tt4 la otr¡.


- Ncg¿tivoi Al aumcqtrr una disminuy. ls oh¿,

2, La magnitud dc la conetación vienc i¡dicada por cl valor absoluto del.coeficiente:

Valor ¿bsoluto d€ r G¡ado dc asooi&ció¡¡

0,8 . 1,0 Fucrte


0,5 - 0,7 Moderado
0,2 - 0,4 DébiI
0- 0,1 Insigíificante

- C¡¡ece da u¡id¿d.s.
Sólo es apliaabl€ cu¿¡¡do le relación entc las vari¿bles es li¡€¿I.
¡: Iucrza dc l¿ asociación enhe 2 variables.
El ooefioientc de co¡¡elació¡ de Pe¡¡so¡ oomprucbB hipót$i6 dc carel¿ción entre dos variables,
siernpre que su valor sca significativarneltc mayor do 0 para rcchazar Ho.

r;ñ-l

F-;'-1
...,. .'J '-
,+is

i.'¡ii i.

C:/ Motrtc¡& 20 - 2t006 MADRID - TfDo: 91 309 36 16 - qr'*.c¡shflow.oposlciones.com 90


@ casl{ FLow ESTADISTICA

Asumimos que para cada valot de X, Y no está determinada, sito que: Y = a + b X

a: presión arteriai media de los que no toman nada de sal

b: cambio de la media de presión alerial por aumentar I gI el consumo de sal. Si b fuera 0,


quiere decir que la presión no cambia con el consumo de sal, por tanto ambas variab¡es son
independientes (aceptamos Ho y no podemos calcula¡ la ¡ecta de reg¡esión); un v¿lo¡ distinto
de cero indica que están correlacionadas (acepto Hr, puedo calcula¡ la aecta de regresión) y su
magnitud mide la fuerza de la asociación.

Una vez calculado el Coeficiente de Co¡relación entre dos variables cuantitativas, Podamos calcular Ia
recta que mejot define esa nube de puntos. El fiétodo que se utiliz¿ Pa¡a ello se denomita de
Mlnimos Cu¡dredos: coD este método se pretende, a partir de la nube de dispersión que compone
una muestr4 encontra¡ la recta que mejor se ajuste por toda la serie de püntos. Esto se traduce en
busca¡ la ¡ecta qDe haga minima ia süma de desajustes, los cu¿les se elevan al cuadrado pa¡a evita¡
qüe estas diferenci¿s pueda[ contrarestarse de forma engañosa en función del signo que las
acompañe (al elevar las dife¡encias al cuadrado tendián siernpre signo Positivo, y así se previene este
posible efecto). De esta úane¡a, cuando la suma de.todos los cuadrados sea mínima, la recta que lo
consiga será la que buscarnos.

Bo¡rded de uD ajuste ¡iDe¡lr R¡¿ótr de correl¡ción.

Es una p¡ueba estadistica que permite analiz¿¡ si el ajuste lineal de una nub€ de puntos, o diag¡ama de
dispersión, es o Ío adecuado. Es decil si la sustitución de la rlube Por una recta de ¡eg¡esión es co¡rect¿
Sabemos quo existen posibilidades de ajuste m¡is adecuadas pa¡a muchos fenómenos biológicos que no
son líneas rectas sino curyas de los m¡ás diversos tipos. ta determinación de un indice especial,
denominado razi¡ de correlación pe¡mite obtener una conclusión acerca de la bondad de u¡ ajusle
rectilineo sustitutivo del fenómeno estudiado.

3. RXGRXSION NO LINEAI.

No siempre estájustificado el i¡tenta¡ sustituir u¡a nube de pl¡ntos, obtenida al estudiar la relación
existente entre dos variables, por una recta que ¡epresenta el fenómeno biológico que se analiza.
Muchos de estos fenómenos no se ajusta¡r a ecr¡aciones li¡eales rectilíneas, sino que sigueD otro tipo
de curvas o ecuaciones ñás o menos complicadas,

MADRID - Tfno:9I 30936 46- wn?,c¡rhfloti-oPosiciones.coh 94


Cll Mont€sa, 20 - 28006
@ CDAslt FLC'l,v ESTADfSTICA

Curvá losari¡ñi¿¿:
Cu¡va e¡ponéncial
Y ct€ ciéñ te:

Curvá !rponencial

arguno¡ iror d..cu¡croñ.r 9.ñ.r¡t.r p¡.. rr r.9i.eóñ ¡o tÁ¿rt.

5.7. Introducción a le estadística multivaria¡te.

EI Análisis Multivariante engtoba métodos y técnicas estadísticas qre permiten estudia¡ y t¡atar en
bloque un conjünto de vatiables medidas u observadas e¡¡ una colección de i¡dividuos. Estas variables
podnin ser sólo cua¡titativas, sólo cualitatjvas, o simuhineamente de a¡nbos tipos. Cua¡do el
investigado¡ se enfienta con la realidad de un estudio, dispone habitualmente de muchas va¡iables
medidas u observadas en u¡a colección de individuos. Si pretende estudia¡las conjuntamente, debe
acudir al Alrálisis Multivarja¡te. A¡te la diversidad de técnicas existentes, debe selecciona¡ la más
adecuada para los datos que maneja pero, sobre todo, Ia tec¡¡ica elegida dependená de su objetivo
cienlfico.

Tipos de lécnicas multivaria¡|tes,

1. TÉcMcAs ML,.I,TIVARIANTES DEscRIPTTvAs.

Si a todas las variables con las que se fabaja se les asigna u¡a impo¡iancia equivalente, es decir, si
¡inguna de ellas se destaca como dependjente principal en el objetivo de Ia investigación, para su
trat¿miento en bloqüe se pueden utilizar las de¡ominadas TÉCMCAS MULTTVARL{NTES
DESCRIPTfVAS. Estas técnicas pueden tener dos orientaciones dife¡enles:

- Por una pafe, pe¡miteri .REDUC1.,R la din¡ensión de una tabla de datos €xcesivarnente grande
por el elevado núme¡o de variables que contienel y pemite al investigador fabaja¡ con unas
cua¡tas variables "fioticlas" que, aunque no observadas, sea¡ combinación de las reales y
sinteticen la mayor paft€ de la información contenida e¡ sus datos. En este caso se debe
lener en cüenta el Iipo de variables que maneja:

c/ Montesa, 20 - 2800ó MADRID - Tfno: 91 309 36 46 - wr-rv.c¡shflo*-oposiciones.com 95


[Ü CASH FLOW ES7'ADíSTlCA

Si son cBantitativas, Ias técnicas que le pe¡miten este tratamiento son:

- ANÁIISIS DE COAEONENTES PRINCIPAIES.


. ANÁI-ISIS DE F'ACTORES COMUNES.

Si son cualitativas, acudirá al:

- ANÁLISIS DE CORRXSPONDENCIAS.

- La oÍa orjentación posible ante um colección de variables, sin ninguna destacada


dependencia, se¡ia la de gIl!üMSalos iidividuos en gmpos más o menos homogéneos
en relación al perfil que en aquéllas presenten. E¡ este caso, utilizará e! ANÁ SIS DE
CLUSTERS, en que los g¡upos, no defi¡idos previamente, sefli¡ configurados por l¿s
propias va¡iables que utiliza.

2. TÉcMcAS MULTWARIANTES ANALiTICAS O INT'ERENCIALES.

Si no fuera científicamente aceptab¡e una importancia equivalente en las varjables que se marejan,
po¡que una de ellas se dest¿c¿ra corno dependie¡te principal en el objetivo de la investigación, se
deberán utiliz¡' TÉCMCAS MULTIVARIANTES ANALÍTICAS o INFERXNCIALES,
considera¡¡do la variable dependiente mmo va¡iable "explicada" por las demás independientes
"erplicativas", y tratando de RELACIONAR todas ellas por medio de una posible ecuación que las
Iigue.

Si todas las variables son cuantitativas, el método el€gido debe ser REGR¡SIóN
LINEAI-. Una vez configurado el modelo ñatemático, éste podrá llegar a PREDECIR el
valor q¡¡e en la va¡iable dependiente p¡esenta¡ia un nuevo individuo cua¡do se conociera el
perfil de todas las demás.

Si la va¡iable dependiente fue¡a cualitafiva dicotómica, ésta podrá se¡ utilizada como
"clasificadora", estudia¡do su ¡elación con el resto de va¡iables "clásificaliva-s" a t¡avés de
una ecuación d€ REGRESIóN LOGISTICA que, adenás de ac€pta¡ conjuntamente
variables cuálitativas y cuantitatjvas, presenta import¿ntes propiedades epidemiológicas.

Si la va¡iable dependiente observada es cualitativa y constata¡a l¿ asignación de cada


individuo a g¡upos previamente definidos (dos, o miás de dos), puede ser utilizada pa.¡a
CLASIFICAR nuevos casos en que se desco¡orca el gnrpo a que probablemente pe¡tenecen;
el ANÁUSIS DISCRIMINANTD resuelve este importante prcblema de asignación en
fimción de un perfil cua¡titativo de variables clasific¿tivas.

Objetivos de Ias diferentes técnicas de ¡nilisis multivaria¡te.

1. RXDUCIR

Combinar las va ables observadas para obtener escas¿s yariables ficticias que representen casi Ia misma
información:

A¡álisis de Componentes Principales.

C/ Montesa, 20 28006 MADRID wlr.w.cashnow-oposiciones.com 96


- -Tfno: 91 309 36 46 -
EQ CASH FLOvl' ESTADiSTICA

- A¡iilisis de Facto.es comunes.


Análisis de Correspondencias.
,
_ Eliminar variables de nulo o escaso poder explicativo, predictivo o clasificativo: p¡ocedimientos de
- selección de va¡iables aplicados enl

Regresión Lineal.

_ - Regresión Logístrca.
A¡álisis Discriminante.

- 2. CLASIFICAR
_
Analizar las relacioües ente variables pa¡a ve¡ si se pueden sepa¡ar los individuos en agrupaciones
a
port".iori por ellos m;smos definidas:
-
A¡álisis de Clusrers.
-
A¡te gruPos re¿les comprobados a priori, diseñar modelos, co¡struidos con las variables
observadas,
capaoes de asignar individuos al gn¡po más probable:

- Reg¡esión Logística.

3. RELACIONAR.

Reunir las variables en ecuaciones combinadas que valoren ¡o mejor posible el ,,peso,,de
cada una en la
explicación de ofta depe¡dientel
-
- Regresión Lineal.
- Reg¡esión Logística.

_ Diseña¡ va¡iables sintélicas, por combinación de todas Iás observadas, para


explicar el m¡iinro de
_ info¡mación:

A¡álisis de Componentes principales.


A¡álisis de Factores Comunes.
A¡álisis de Cor¡espondencias.

_ Busca¡ asociaciones escondidas entre las variables cualitativai


observadas:

A¡álisis de Cor¡€spondencias.

4. PREDECIR.

' A pa¡ti¡ de las variab)es, constluir moderos capaces de estiñar la vari¿bre


dependiente en firnción de ras
_ demás:

- Regresión Lineal.

C/ Montela, 20 - 28006 I,Í-{DRID - Tfno: 9t 309 36 4r _,r\n"n."r.¡¡o."-p*¡"¡oiiüi-- S;


G CAAH FLOI'tf ESTADISTICA

- Reg¡€sión lpglstica"
- A¡álisisDiscriúina¡¡to

5.8. Iútroducció! ¡l ¡¡állsi! dc ¡üpcrvlv¿¡ci¡.

El a¡¡álisis d9 ls supervivcncia colgtituyc u¡a llne¿ metodológica quc engloba diversas técnicrs
osú¡dísticas que p€rmiton:

1. Obto¡€¡ de un¿ muesha ir€gula¡, d¡los relativos a la p'robabilidad de sobreviür a lo largo del
tiempo ¿ntc la prcsolsia de u!¿ deteF¡inada enfcrmcdad.
Estimar tasas do supervivcucia.

3. Poder compa¡a¡ oon seguridad estsdlstica l¿ cfic¡cia do distiÍos t¡at¿mientos gobre dicha
supe¡vivencia-

Entre los diferentes ñ¿todos qüe permite¡¡ snaliz¡¡ taras d€ süpewivcnci¡, sc encuent¡¡m:

- Máodo directo.
- Méodo del producto o de l&plan-Meicr.
- M&odo aefi¡arial.

Los dos rlltimo$ méfodos se b¡¡aq e¡ el oálculo dc probabilidades oondicionad¡s, Las pn¡ebas
estadfsticas que se utiliz¡¡ pa¡a la comparación de grupos en el ¡nólisis de supervivéncia son:

El lest de Cox-Mantel.
El tost de Log-R¿nk.

Cy Mont!¡¡, 20 - 28006 MADRJD - Tho: 91 309 36 ,16 - rl*,s,.crshflow.oposlcion€s"com 98


@ CASH FLOW ESTADíSTIC4

EJERCIüO
'
Estado civil: cualitativa nomi¡al.
Nivel dc tensió¡ arte¡ial: cuantitativa continua.
Hipertensió¡ dterial medido como hiportenso o no hipertenso:
cualitatjva bina¡ia.
Niveles de glucemia: cua¡tit¿tiva continu¿.
Núme¡o de pecientes fuittadores: cuantitativa discret¿.
Hábito de bebcr (no, moderado, impo¡tante): cualitativa
Dominal.

ETERCICIO 2

2+ 1 7+ 12 + 3+ j+ B+ I 2+ 3 +2 + g+ I 2
Media :
11

EIERCICIO 3

0,2,3,3,4,5,6,7,8,9

EJERCICIO 1

Moda= 3

EJENüCIO
'
Medíana: ti otdendmos los datos en orde¡ crecien e: S, 6, 7, 7, g, g, g, g,
10, l0, 10, lO, I I. Colro se
trata de ú1fttimerc iñpú de datos la mediana
co¡ncAir¿ il crnt"á, i"r' t"-r*Or*. _ A.
"on ",
Moda = t 0, gue es el valor que tiene mát
Íecuencia
Cua,til pr¡ñefo: es la medlaúa de la semiseríe
de la izquierdd en que la mediana divüe a Ia serie
datos dada. de

6+7
nt= _..
2
-
q Mor¡t ¡., 20 - 28006 MADRD@ 99
@ GASII FLOllt ESTADiSTICA

Cuartil lercero: será la median4 de la o*a temí'erle.

10+ 10
e3- =10

-
Re c oft ido int elcuar t íI ic o = a3 - 81= 10- 6,5- 3,s

EJERCICIO 6

Media= 3,25

Vúialta= 0,19

Defliació típica = 0,43

HZBEISIQJ

Pard con lratd esto lo idóneo es utilizat ¿l coefciente d¿ vari@iti,tt de ?eartoñ, deforña qu:
'tás
o
CV p¿so= x 100 =16,53 a lot 3 años
-
6
CY peso- x 100 =11,00 a las 15 tños
¡ -
o
cy t4 a--x100=1,71 a los 3 años
x
o
CV tdlla =.-.-- x 100 = 1,00 d las 15 años

Se ptede comprob* coño el Wso es ¡ñás ratiable que la talla tdn o a lor 3 @xos (16,53>1,71) cdno
a los 15 años (11>4).1los 3 úot lot paárrEttos soñ t rh t'@iables.

EftNqCIO E

El 997¡ de los psciertg est¿r¡ ertre 36,8 +/- 2,6x0¡= 35,5 y 38,1"C.

tr*€f *O{

100
cy Monte¡& 20 - 28006 MADRID - TfDo: 91 309 36 46 - wwtd,c¡shflot-oPosiclo¡cr'corñ

Potrebbero piacerti anche