Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
B,l.Fl.
LAS PRUEBAS SELECTIVAS PARA EL ACCESO A
PLAZAS DE FORMACIóN SANITARIA ESPECIALIZADA PAM:
BtóLOcOS
t
ESTADISTIGA
TEONIA
ESTADÍSTICA
iNntc¡
EPtD€mtoloc¡a
- Verdad€ro posifivo.
- Verd¡dero Neg¡tivo.
- Falso Positivo.
- Falso Negatiyo.
4,1. Se¡sibilid¡d,
4.2. Especificidad.
43. \¡.lor predicúivo positivo,
),
4.4. Valor predictivo ¡eg¡tivo,
6.l.IDcideDcia.
62, P¡.evalencia.
6J, Relacio¡ar Prevaleocia e Itrcidencir-
7.1, N¡¡hero,
7J. Prevdenci¿
73. I¡cide¡ci¡ Acumül¡d&
7.4, Densidad o Tasa de l¡cidenci..
.t rr..l. { * rr. *
- l. Definición.
2. Clasificación de la estadística.
, Conceptos básicos.
-
EsrADf sTIcA DEscRrpTwA
..
1. Representaciótr de d¡tos Clabl¡s y gráficos),
.' 1.1. Variables cüalitativas
.. 1.2. Va¡iables cuantitativas disc¡etas
: I .3 . Va¡iables cuantitativas conti¡uas
. 1. Co¡cepto.
2. Prob¡bilidadcondiciotral.
, 3, Aco¡tecimieutos cohplejos:
' 3.1. Regla de la multiplicaciór.
-,. 3.2. Regla de la sumal
****t*n
.-
Cl/ Mont€sa,20 - 28006 MADRID - Tfno: 91 309 36 46 - wuy.€ashflow-oposiciones.com 2
g ci¡sH Ft_Ot Y ESTADISTICA
l Errh¡cló. d. F¡¡¡n.ter!
LL E$in&tor., pútu..t.5 d. ¡! m.dE pobt.ciñ¡t,
12 EsiMnio po, intñ.to.
, Erituióh d. ñ.dis.
- Er¡ñeió, d. ptupo.ci@é3.
2. Colrhr. d. iipórdi¿
3. Prst.r.m¡rdó¿ dd tro¡lo ü¡ernl
¡. goEog.ndd¡d d. dd
huBaÉ..
5, ¡F.bú.¡..¡g¡¡tiú.¡ó¡ d¡.ürdo:
5.1. T¡toi
d¿ Fu.bE o t d.stuürier,
*'r¡++9*
OMúi.r..rO-rB006%
, M CASH FLOW ESTADISTICA
EPIDEIIIOLOGIA
IADICE
- Verdadero Positivo.
- V€rd¡dero N€gativo.
- F¡lso Porit¡vo.
- Fslso Neg¡tivo.
- 4.1, S€nsibilid¡d.
- 42. EspecUicid¡d,
- 43. Velor predicúivo posifivo.
- 4,4. Valor predictivo tregativo.
I "*ERMEDADES:
- 6.1.Inciderci¡.
' 6,2. PreY¡lenci¡,
- 63. Rel¡cionar Prev¡lebci¡ e I¡cide¡cia.
7.1, Número.
7.2, Prevslenci¡.
7J. I¡cidenci¡ Acumulada.
7.4. Densidsd o T¡se d€ l¡cidencia.
Muy pocas pruebas diag¡óficas, o quiá ningun4 identifican m¡ total certeza si un paciente tiene o no
una enfe¡medad, o qué tipo de enfe¡medad padece. La EFICACIA de una prueba diag¡¡óstica depende de
su capacidad paú detect¡r corectaúette la p¡esencia o ausencia de la enfermedad que se estudi4 lo cüal
se expresa matemátic¿¡mente mediante cuat¡o i¡dices:
- Sensibilidad (S).
, - Especificid¿d (E).
- Valor predictivo positivo (VPP).
- Valor p¡edictivo negativo (VPN).
Estos indices se obtienen a partir del análisis de una serie de pacienles sospechosos de padecer la
enfermedad e¡¡ estudio, en quier¡es se ¡ealiza u¡a deten¡¡inada prueba diagnósticá, que llamaremos
PRL'EBA PROBLEMA I'lESn. Los ¡esultados obtónidos con dicha prueba se compa¡an con ¡a
dist¡ibución real de la énfermedad en el mismo grupo de pacientes, mediarte una prueba de superior
¡endimiento di&gnóstico, a la que lla.ma¡emos PRUEBA DE REFERENCIA. l¡
i¡formación derivada de
ambas pruebas se dispone en una tabla de 2 filas (resultados de la prueba problema o fest), y de 2
columnas (disnibución real de la enfe¡meda4 establecida según la prueba de refere¡cia).
Pru.be dc lcfcr.nci2
FP \?+FP
WP
nl ta¡ FII+\?N
WN
1'P+FN FP+VliI
s E
Al aplicar un test di€¡óstico a uÍa poblaciór¡ pa¡a detecta¡ una enfe¡medad, podemos encont¡amos con
4 posibles situaciones:
a =VP. Individuo enfe¡mo er el que el test da un ¡esultado positivo. Enfemo clasificado por e¡
test como enfermo.
b=FP. I¡dividuo sa¡o en el que el test da un resultado positivo. Sano clasificado como
efifermo.
c = FN. Individuo enfe¡mo en el que el test da un resültado negativo. E¡fe¡mo clasificado como
sano.
d= \.t}l. lndividuo sano en el que el tesf da un resultado negativo. Sa¡o clasificado como sa¡o.
- Es Ia capacidad del test para detecta¡ enfe¡mos. La s€nsibilidad mide la ptobabilidad de identifica¡ a los
- enfemos con el tes! evitando la presencia de FN Es, por tanto, la p¡oporción de enfermos clasificados
como tales, respecto del total de enfermos.
Cua¡to mayor sea la sensibilidad, menor será el número de FN y mayor el número de FP '
INTER.PRXTACIóN:
VP IOO
_ sensibilidad 100% = _ = ___ ó 0% FN
w+FN 100+0
_
Todos los individuos enfermos son ¿letectados.
vP 95
, - sensibilidad 95% = -- = + 5% FN
VP+FN----
95+5
El 5% de los individuos enfermos no son detectados. Si la sensibilidad de u¡ test es del 95%, significa
que de cada 100 i¡dividuos @&@9!, este test es capa¿ de detectar 95. Los 5 que no detecta, y que
también son enfermos, son FN,
Es la capacidad del test pa¡a detectar sanos. La especificidad mide la probabilidad de identifica¡ a los
sa¡os, evitando la presencia de FP. Es, por ta¡to, la proporc;ón de sanos identificados como tales,
rcspecto del total de sa¡os.
- \rrr .cashflow-opos¡cion€s.com
'1
c/ Montesa,20 - 28006 MA.DRID -Tfno: 9¡ 309 36 46
Ú CASH FLOvt' ESTADISTICA
INIER}RETACIóN:
l'1.¡ 100
- Especificidad i00% = .-- = ct 0% FP
M{+FP---
100+0
\4{ 95
- Especiñcidad 95%: ------ = o 5% FP
\l}{+FP ---
95+5
El 5% de los individuos sanos son clasificados corno enfennos. Si la especificidad de un test es del 95%,
significa que de cada 100 individuos qsqs, este test es capaz de detectar 95. Los 5 que no detect4 y que
tarnbién estin sanos, y que el test identifica como enfe¡mos, son FP.
Al contrario de lo que ocurle con los VPP y VPN (colno veremos a continuación), la SENSIBILIDAD
y la ESPECIFICIDAD son caracteristicas fijas e intrínsecas del test, que no so modifican por cambios
en la frecuencia de la enfermedad (prevalencia) e¡ el grupo estüdiado.
Un test tiene una Se¡sibilidad y Especificidad determinada, pero si se desea aument¿¡ la Sensibilidad
del test necesadarnente desc;ende la Especificidad, y viceve¡sa; de ahí que la Sensibilidad y la
Especificidad guarden una relación ir¡versa, ¿unque no lineal (es deci¡ para un cierto aumento de la
sensibilidad Ia especificidad ¡o dismi¡uye exactaoente en la misma cus¡tía, y viceversa). Si se
adopt¡n criterios diagnósticos muy estrictos disminuye la Sensibilidad (menos enfermos cumplen esos
criterios) y aumenta la Especificidad (pocos sanos se clasifican erróneamente).
En muchas p¡uebas dia$¡ósticas debe decidirse a partir de qué valor se considera¡á la prueba corno
positiva, y a dicho valo¡ se le denomina punto de corte. Por ejemplo, 9l valo¡ de gluoosa en sange a
partfu del cual un paciente es diabético, o el valor sé¡ico de transaminasas en el diagnóstico de
hepatitis. Esta decisión requi€re llegar a un comp¡omiso entre una mayo! Sensibilidad y una
Especificidad disminuida, o viceversa. El investigador debe sopesar la impofancia ¡elativa de la
Sensibilidad y la Especificidad de la prueb4 definie¡do el punto de corte de acuerdo co¡ ello. Una
forma de tomar esta decisión es consjderar las implicaciones de los dos errores posibles. Si deben
evitarse los resultados falsamente positivos (FP) (p.ej., un ¡esult¿do que determinaría ei que un
paciente se debe someter a una i¡tervención quirurgica), el punto de co¡te puede situarce de manera
que la Especificidad de Ia prueba sea máxima. Si, por el contrario, se desean evita¡ los resultados
falsamente negativos (FN) (como en Ia detección sistemática de la fe¡ilcetonuria neonatal), se deberá
defini¡ €l punto de corte de forma que se asegure una alta Sensibilidad de la prueba. Es decir, la
sensibilidad y Ia Especificidad de un test pueden se¡ conside¡adas constanres y aplicables ar esrudio
de cualquier paciente, siempre oue se mantensa el mismo ¡pétodo en su eiecucjón v los mismos
c¡iterios definitorios de la oositividad de Ia o¡ueba (es decir, el mismo punto de co¡te).
Un paso posterio¡ eD el p¡oceso diagnóstico consiste en conocer qué probabilidad existe de que el
paciente en estudio padezca o ro la enfemedad, una vez que se sabe el resultado de las pruebas
utilizadas La tabla 2x2 permite carcurar dichas probabiridades, que se denominan p.obabilidades
posleriores o va¡ores prediclivos de lá prueba diatmósrica.
Es una cualidad muy importante de un Gst, y se calcula identifica¡do la proporción de pacientes con
resultado positivo en la prueba problema (a+b) que tieDen la enfermedad (a). El Vpp indica
la
probabilidad condjciona¡ de padecer la enfe¡medad si la prueba p¡oblema es positiva;
es decir, indica la
proporción de enfermos que en definitiva va a diagnostica¡ el test.
!?
v?P=-.=--__
¡+b l¡p+Fp
4.4. Valor predictiyo del resultedo negativo (V?N).
rt{
!?N = _--:
(-fd --__.
FN+\¡N
INTERPRETACIóN:
\? 100
VPP 100% = --*-- = ----- e 0% Fp
VP+FP 10010
vP 85
vPP 85% = __-_ = -______ + t5% ¡P
VP+FP 85+15
El 85% de los i¡dividr¡os con test positivo son enfe¡mos. El l5% de los ifldividDos con test
positivo son sanos (FP)
\4'l 100
VpN 100% = -*--_ = ----- o 0% FN
!1,¡+FN 100+0
Todos los individuos con test negativo son sa¡ós.
lN 75
vPN 75% = --- = *-> 25% FN
vl{+FN ---
75+25
EI 75% de los individuos con test negativo son sa¡os. El25olo de los individuos con test negativo
son enfermos.
Existe oho panímetro me¡os usado, pe.o no por ello sin importa.ricia, que es el Valor Global de la
Eficiencia del Test. Este nos indica la proporción de resultádos válidos en relación a todas las
mediciones realiz¡das. Es la proporción de resultados verdaderos (VP y \n'0 entre todos los
resultados del test.
vP + \n{
P¡ecisión de uri test =
!?+vf¡+FP+¡N
A pafir del Valor Global de un test o p¡ecisión, podemos conocer las malas clasificaciones del
mi$¡o, las cuales se calculan:
a+c \?+FN
PREVAIENCL{ = =
a+b+c+d VP+FP+FN+1']I
--
La p¡evalencia es la propo¡ción de individuos enfermos entxe el tot¿l de individuos. El Valo¡ P¡edictivo
(\/PP y VPN) de un test depende de:
2. La especificidad.
63. Preva¡eDcia = I¡cidenci¡ X Periodo de Tiempo (ej., Prcvalencia a los 3 años = 40 casovaño
(incidencia) x 3 años (periodo de tierrpo): 120 casos).
7.1. Nú¡Íe¡o.
Ejem: en EElru hay 3.000.000 de personas parasiradas por Asca¡is. En Átrica hay 160.000. Es una
buena medida pam una primera aproximación del problema. Limitaciones: al no conoce¡se el
de¡ominador, no podemos comparar la ñecuencia en dos poblaciones, nj conocer Ia irnportancia relativa
del problema.
?.2. Prev¡lencia-
- Es una proporción.
Ejemplo:
3.000.000
Prcvale¡rcia en EEIIIJ = = 1,33%
22s.000.000
160.000
p¡cvale¡cia en África = ---- = O,O24o/o
655.000.000
2) PRXVAITNCIA DE PERIODO.
Es igual a la prevaiencia de pünto al inicio del periodo de estudio, rnás la incidencia durante dicho
pe¡iodo (casos nüevos), dividido por la población eústente a mitad de periodo.
- Es una p¡oporción.
- Conceptoi No de casos ¡uevos de wla enfermedad que se p¡oducen en un periodo de tiempo.
- Es o mide Ia probabilidad de que ua individuo desa¡¡olle la enfe¡medad en ese periodo.
- Es ü¡¿ tasa.
; - ó*[to, N" au nuovos de la o¡fcrmedad quc sc producen cn un p€¡iodo' te¡icndo
cn
- ""*¡
cucnta la iuformaoión que apora cadá uEo dg los individuos'
No de Casos NuEros
DI
Porsonas-Años
INTRODUCCIóN A LA ESTADÍST'ICA
1. DeliDició¡,
Cl¡sific¡ción de la est¡dístic¡.
3. CoDceptos bÁsicos.
l. l. Va¡iables cualitativas
1.2. Variables cuantitativas disqet¿s
L3. Variables cuantit¿tivds continuas
2. f¡dices que deliDer ü¡a distribuciótr de datos:
2.1. Medidas de ceDt¡alización.
2.2. Medidas de posición.
2.3. Medidas de dispersión.
4. 1. Dist¡ibución Binomial.
4.2. Disfibución de Poisson.
4.3. Distribuciót Normal o de Gaüss.
PROBABILIDAI)
1. Corcepto.
2. Probrbi¡idadcoDdicional
3. Ac¡lteclmientoscomplejosl
3.1. Regla de la multiplicación.
3.2. Regla de la suma.
6.,++$€..t
INTRODUCCIÓN A LA ESTADÍSTICA.
1. DEFINICIÓN.
2. CLASIFICACIÓN DE LA ESTADfSTICA.
110 mlnHg
INFERENCIA
3. CONCEPTOS BÁSICOS,
TOBLACIóN: El térmi¡o población se defi¡e como el conjunto de todos los elemenros que cumpjen
ciertas propiedades, enrre las cuales se desea estudia¡ u¡ determi¡ado
fe¡ómeno. Este té¡mino es
sinónimo de unive¡so. So dice que una población es filila, cuando se
conoce el núm€ro exacto de
todos los elementos que la componen. Se dice que una población
es inlinita, cuando no se pueden
conocer todos los elementos que Ia componen.
Se djce que una muestra es representativa de una població¡ cuando cada uno de los
elementos que la forman, que cumplen cjertas propiedades y de los cuales estudiaremos un
determinado fenómeDo, ha sido elegido áleatoriamente (al aza¡)
En cambio, se dice que una ñuestra no es represent¡tivt de úna población cuando los
elementos que la componen no han sido elegidos a¡eatoriamentg.
Elegir aleatoria$ente los elementos que componen una muestra significa que djchos elementos y los
rest¿¡tes que no la componen han tenido las úietlas probabilidades de se¡ elegjdos Al procedimiento
o sistemática de extraer una muest¡a se denomina muestreo.
Se considera que una muestla es pequela o grande en función de que el número de individuos que Ia
componen sea inferior o superior a 30. Trabajar con una rnuesÍa de tamaño adecuado reduce el coste
del estudio y permite aumentar la calidad de los datos.
UDn¿Dllg: Seide¡tifica al individuo de una población o de una fiuestra como cada uno de los
elementos que la co¡nponen y de los cuales obtenemos ciefa infomación mensurable del fenómeno
que se desea estudiar. Pueden se¡ penonas, animales, procedimientos .
A) CUALITATMS (atributos): Son aqueilas que reflejan una cualidad, y que por tanto no Pueden
cuantificarse, Es dec4 no pueden expresarse numéricamente, sino por medio de Palab¡as excluyentes
entre sí (categorías). Las variables cualitat¡vas 9e clasifican en:
l. CUALITATMS NOMINALES: Son aquellas variables en las que las dilintas categorías
de la variable €nume¡an, sin establece¡ un orden, a la variable. Ej. Profesionesi Arqujtectura,
Biologia, Medicina.
B) CUANTITATWAS: Las va¡iables cuantitativas son aquellas que pueden medirse numérica¡nente;
es deci¡, que puedgn cua¡tifica¡se, Las vatiables cuantitativas se clasifican a su vez en:
l. DISCONTINUAS o
DISCR.ETAS: Son aquellas que sólo pueden expresa¡se mediante
números naturales ente¡os. Es decir, aquellas en las que entre dos valores consecuti\os no
podomos encontrar ningún oco valo¡. Ejemplos: Núme¡o de hijos, número de eritrocitos,
ñúmero de muertos. Como ves son recuertos de individuos.
Las va¡iables sl admiten t¡ansformacio¡es' que las variables NO SON siempre de un determina'lo
'a
tipo, sino que en fir¡ción ¿le Io que nos inte¡ese, LAs CONSIDERAREMOS de uno u otro tipo Si
como: Joven' No
Iá variable "edad", ¿,qué tiPo de va¡iable se¡ia? Si Ia considerahos
""*áia."r¡o. bina¡ia; si la co¡sideramos como: I¡fancia, juventud' ñadurez' senectud' es
¡ou"n,
"s "u"litatiu"
cualitativa o¡di¡al. Tomada como edad en años efite¡os, es cuafititativa discret4
y si se habla de la
va¡iable edad sin especificar ninguna co¡dición, es cua¡titativa continua Por
ello decimos que las
Las variables aceptan
variables NO SON siempre del mismo tipo, dePende de cómo las cot$ide¡emos
transformacio¡es en un sentido, pero no en el ofo:
CUANTITATiVAS CUALITATIVAS
7
Un criterio que hay que tene¡ en cuenta y que hace ¡eferencia a enfoques metodológicos de
la
$rrr'*'crsbflow-oPosicion€s com
'll
cltllont"o, zo -ZsOOe ITADRID - Tfno: 9l 309 36 46 -
[O GASH FLC'vt' ESTADISTICA
Se designan corno p¡rámetros a aquellos valotes que ¡esumen una deteminada información
referente a una Población, y como estadíst¡cos a aquellos valores que expresan una detemlinada
;nformación de una muestra extraÍda al azar,
Ta¡naño de Ia muestra N n
Media aritrnética M lE
V^ri^nz.a S'
Desviación estándar S
Proporc;ón P p
EEE4]¿S-D,E-!4EEQ4:
Las escalss de medida se deñnen como ün sistema para la asignació¡ de números a los objetos
fe¡ómenos que se estudian. Las escalas de medida se clasifican en:
- Esta escala ¿sumc todas las oporaoioúes matomáticas de l¡ csc¿la antcrior, y lo qüe cs p¡gpio de
- estr csoala de qedida, establcce pmpolciones entle dos v¿lorcs de la vali¿ble. Ejemplós de
- va¡idbles cua¡tit¿tivas medida¡ cn e¡ta cscala de proporció¡ sotr la talla' el p98o o el nivol de
' glucosa d9 los individuos. O$o ej€mplo setía el nlnc¡o do ciga¡rillos con$-¡midos, ya que el
origo! d9 la esc¿l¡ indic¿ la auscncia de cot¡sut¡o dé tab¿c¡ (0 ciganillos). Entrc los disti¡tos
- valoros son porlbler rel¡cio¡é de lgü¡ld¡d o deeigualdad' de orde!' de sum., .est¡
" r¡ultlplie¡c¡ó¡ y dlvisió!,
*l
ESTADÍSTICA DESCRIPTIVA.
Cotceptos previos:
- Frecuencia ab¡olutr (fe). No de veces que Preseuta cada uná de Ias categorías de la variable'
tr=tfa
- Frecuencia relativa (fr). Cuando exPresamos las frecuencias absolutas con respecto al total
de individuos estudiados. fr = faln; % = fi x 100
La distribución de frecue¡cia¡ son una se¡ie de clases prcdeteminadas con el núme¡o de sujetos que
se incluyen en cada cl¿se.
A) Tabla de ñecuencias:
Estado civil fa f¡ %
Solte¡o 54 0,27 27
Casado t30 0,65 65
viüdo t6 0,08 8
200 1.00 100
B) Gnáficos:
124
30
?0
$'rna,.cashflow-oposicioDes com 20
C/ Montesa, 20 - 28006 MA-DRID-Tfno:91 30936 46 -
[A CASH FLC'W xrloisnc¿t
cada valor de la
2. DIAGRAMA DE SECTORXS o DE PASTELI Se construye reprcsentando
de cada sector
variable estudiada dediante una porción de circulo (secto¡), en donde el áng]rlo central
es proporcional a las frecuencias (b!en absolutas o relativas)
fr
Viudos
8o/o Solteros
270/,
3. PiCTOGRAMAT Son representaciones gráficas e¡ las que se utilizan Ias superficies enmarcadas
en un dibujo o pintura.
4. CARTOGRANIA: El cafograrna definir como aqu€l g¡áfico qüe utiliza una suPerficie
se puede
¡epresentativa relacjonada con mapas geognificos. E la práctica eflplea como soporle del imPacto
visua¡ uü mapa en el que se indica¡ las zonas que coñesponde¡ a cada u¡o de los valores de la
va able estudiada.
5. DIAGRAMA POLAR: Esta ¡epresentación gnifica es menos utilizada que las anteriores. Por la
fo¡ma de p¡esentación (no po¡ su construcción) es parecido a los sectores circulares Pa¡a elabora¡ un
diagrama pola¡ se sigue la siguiente sistemáticat se toman las frecuencias absolutas o relatjvas de cada
una de las categoías de la variable y, con dichos valores, se lÚa la longitud de los radios
correspor¡djentes, que parten todos ellos de un punto cent¡al teórico. De esta fo¡ma se "polariz n"
todas las categorías en un mismo punto central, a Part¡r del cual se van trazando gráficamente las
rectas correspondientes a los ¡adios.
rsÉ .-.--..-...-.......,....,. ¡5
M¡r¡s ....,.,....,...,,........ rO
MiéFo¡B .... ,. . ,. . . , ,. ..,,. .... 9
t¡cvs . . . . - . . . , , , . . . , , . , . , . . . . . . ?
vihs ....,..,.,......,,.,,,.-. ll
S¡b¡do..........,....,,,,..,,... 2l
Doñ6t6 ,. . . . . . .,.,..,.,,.,.... . 20 virú
Dl.qBh. por{ d. l. Eri¡!¡. .¡cddlnlú d. tAfi@ t.trrñ lot drÚ
El d¡¡l:sr D.lÉ Eúbr. B.¡ nothdo 6 l¡ fitn l¡¡.m.nr'.
Conceptos p¡evios:
- Frecüercia absoluta (fs). No de veces que presenta cada una de las categorias de la variable
¡=Ifa
- Frccüencie rel¡tiva (fr). Cu¿ndo expresamos las frecuenciás absolutas con respecto al total
de individuos estudiados. fr - faln. 7o = fi x i00
- Frecuencia acumul¡d¡ absolut¡ (F¡). Fa = X fa, Expresa l¿ suma del ¡úmero de veces que
ocu¡¡en dete¡minados valoros de la variable hastá un valor dado.
- Frecuencia ecumul.d¡ relativ¡ (Fr). Suña de las sucesivas frecuencias relativas. Fr =: fr.
A) Tabla de frecuencias:
N' de fe fr Fr Fr
hijos
0 50 0.33 33 50 0.33
1 30 0.196 19.6 80 0.526
z 40 0.26 26 120 0.786
3 20 0.13 t3 r40 0.916
4 10 0.065 6.5 150 0.981
3 0.02 2 153 1.000
B) Gñáfico:
1. DLdGRA¡{A DE BARRAS.
50
40
30
20
10
0
23
N' d6 Hüos
2. DIAGRAMA DE Lft{EAS.
:
¿
E
!
Corno esta variable puede tom valorcs inte¡medios enhe dos números dados, Ia rep¡esentación
gráfica requjere, como paso previo, la agrupación de datos (ver posteriormente). Para ello, hemos de
dividi¡ la va¡iable en intervalos geDe¡almente iguales y conta¡ los i¡dividuos que presentan valores
comprendidos en cada uno de ellos. Estos inte¡valos se denominan qb$eg; los valo¡es extremos de
cada uno de los i¡tervalos se denominan, límites inferior v superio¡ de cada clase; la distancia entre
ambos limites, generalmente consta¡te se denomina, i¡tervalo de clasei y el valor cent¡al de cada
intervalo se denomina, marca de clase.
En ocasiones, puede surgir la duda de dónde incluú un dato que, casualñente coincide con el limite
del intervalo: si incluirlo en la clase inmediata a¡te¡ior, o bien en la siguiente. Se acepta el criterio de
"siempre que un dato coincida con un limite, será incluido en la clase siguiente".
A) Tabla:
T¡lla l^ fr % Fa Fr
150-155 5 0.1 l0 5 0.1
9 0.18 18 T4 0.28
155-160
l5 0.3 30 29 0.58
160-165
10 0.2 20 39 0.78
165-170
,7
0.14 14 0.92
170-175
>1?5 4 0.08 8 50 1.00
50 t.00 r00
B) G¡áficos:
en el eje de '
B,1" mSTOGRAMAI Se constn¡ye me¿liante banas adyaoentes' representandose
abscisas los ittervalos e¡ los que se agrupa la variable oase
de la bafa), y en el de oldenadas las
frccuencias (absolutas o ¡elativas) (altura de la barra) de cada intervalo'
.t5o 155
gñáfica más
8.2, POLÍGONO DE FRECLTENCIAS: A pesar de ser el histog¡ama Ia ¡€P¡esentación
con el
utilizada en el campo de las variables cuantfativas cotltinuas, a veces' 3e compleme¡ta
sobre el histograma; ello' es
denomi¡a¡lo "polígono de fiecuencias". Este gnifioo se constn¡ye Por
en cuestión En
condición previa habe¡ rcalizado Pftviamente el histograña de ls vanable continua
ocasiones, resulta conveniente sustituir el histograma por este otro gráfico,
pero su utilización es
obligad¿ cuando se ¿lesee p¡esent¿r cn un mismo gráfico dos o más histog$rnas comparables'
25
C¡ lr.ront saJo-z¡OOe UADRID-Tfno:91 309 36 46 - h$1v'cashíow-oposiciones'com
ü G>ASH FLG'l¡v ESTADISTICA
h
'15
Hemos comentado anteriomente que la magnitud de los intervalos de clase suele ser Ia misma en los
diferentes interyalos c¡eados, pero en cieftos Aabajos de investigación suele interesar qüe los
intervalos no sean de magnitud constante. Los intervalos de clase dife¡e¡tes se emplean, como caso
tipico, en ¿quellos estudios en que se analiza un fenómeno eri función de la edad de los componentes
de la úuestú y cuando se quiere dest¿car, no año por año, o por gn¡pos iguales de años sino, por
ejemplo, etapas clave de la vida: primera infancia, segunda infanci4... que, natu¡almente, no están
constituidas po¡ el mismo núme¡o de años. Ante tal situación, no existe incoDveniente en subdjvidir Ia
va¡iable "edad" e¡ intervalos.de lo¡gifud dife¡ente. SiIr emba¡go, es necesado toma¡ u¡a precaución
impo¡tante, pa¡a que la representación gráfica no ¡esulte incorecta: Las alturas de los recüinqulos del
histoe¡aúa (que representaban, como sabeúos, las frecuencias absolutas de cada clase) deben ir
previanente divididas po¡ el intervalo de clase pa¡a que asi, los rectángulos tengan áreas
verdade¡a¡De¡te comparables ente sí.
la dishibución
Son í¡dices numé¡icos que orientan sobre qué valo¡es se agrupar¡ los datos de
A) MEDIA ARITMÉTICA.
ConceDto:
- Es una ñedida de te¡¿lencia ce¡t¡al que se defi¡e como la suma de cada u¡o de los valo¡es
dividido por el número de observaciones. Las unidades son las mismas qüe las de la variable a
la que se refiere.
- Es la medida de centratización más impo¡ta¡te.
- Es el valor promedio.
- De fácil manejo matemático.
- Se afecta mucho po¡ los valo¡es exttemos de la se¡ie
- En la dist¡ibución Normal, coincide con la Moda y Mediana
- Es un valor único.
- No tiene po¡ qué coincidir con u¡ valor del expeimento.
- La media poblacional se ¡epresenta por: p
- La media muelral se represenla Por -.
e4q!O: Se divide la suma de los elementos de la serie o distribución de frecuencia por el número de
Ios mismos.
n x¡.fa
Para varisbles disctetas: ¡= I -------
i=l n
xi : valo¡ de la variable
fa = frecuencia absoluta
n fa mi
Para \ariables continuas: n= L -----
i=l n
fa = frecre¡cia absoluta de cada clase.
mi = Mar€ de clase.
n=I fa
Ejercicio 2: el número de h\divid os ml@rtos por cólera en ú1determinado país por año' a lo largo de
I I años, ha sido de: 2, 17, 3, 12, 5, 8, 12, 3, 2, 8, 12. Calcular la media aríffiética
ctl:
wc¡lhflow-oPos¡c¡ones'com 2l
O ftlont"o, Zo -:¡OO¡ ¡IADRJD -Tftro:91309 3ó 46 -nr
ÉA CASH FLOl,v ESTADiSTICA
B) MEDIANA.
Concepto:
Se denomi¡a Mediaria a aquel vdor que, una vez o¡denados los datos de menot a úayor,
divide la serie dejando el mismo número de individuos a un lado y a otro. Es el valor cenfal
de la serie.
Es de dificil manejo matemático.
Es un valor único.
En caso de tamaio ir¡par, la mediana coincide con un valor existente en la serie de datos,
pero en caso de tamaño pa¡, no tiene por qué coincidir con un .valor hallado en el
experimento. En este caso la mediana se calcula como Ia media de los dos valo¡es centrales de
la muestra,
No se afecta por los valores ext¡emos de la se¡ie, por ello, en se¡ies muy dispersas se paefiere
a lamedia,
Ejeñplo: Si las edades de un grupo de pacjentes soñt 20,20,21,21,30, 31, 36, la medi¿na seú 27
alos. Si por el confario las edades so¡: 20,20,21,27,30,31 años, la mediana se calcula como la
modia do los dos n¡lmeros certales, 2l y 27; total, 24 años.
Ejercicio 3: calcular la nediana Ia distibución del núrñeto de hüos que tienen diez fami¡ias: 5, 4, 0, 8,
3,6,2,9,3,7.
if,? 7=.tt1
c) MoDA.
ConceDto:
=
j
^^.J"
A) CUARTILES.
Concepto:
' - El primer cuafil dej¿rá a un ¡ado Ia cuafa pa¡te del colectivo, y a ot¡.o, Ias tres c\¡anas pafes;
el segundo coincidirá con la mediana y el te¡cero deja¡á tres pa¡tes a un lado y la cuarta al
otro.
- Ql deja a su izquie¡da el 25o¿ de los datos.
- Q2 deja a su izquierda et 50% de tos datos (e2=MediaDa).
- Qi deja a sü izquierda el 75% de los daros.
B) DECILES.
Concepto:
C) Pf,RCENTILES.
Concepto:
Da¡ u¡a información que col¡pleta a la apoÍada por las medidas de centralización. lndican si los
valores de una dist¡ibucjón de datos están poco o ñuy agrupados en tomo a ün valor
central'
B) RANGOINTERCUARTILICO' RI=Q3 - Q1
- Mide la distancia que existe entre los cua¡tiles 3 y l. Elrango intercuartílico determina cuáles
son los valores entre los que está comp¡endida el 50% cent¡al de la distibución'
C) DESVLACIÓN INTERCUARTILA-R.
- Mide Ia mitad de la distancia a la que estin el 50% de los valores centrales de las
observaciones,
- Es tma medida rnás "estable" que el rango
- Es la medida de dispe¡sión usada cuando los datos son asimétricos.
Q3-Ql
DQ =
-----
2
Los anteriores indices dan luga¡ a üna ¡ep¡esentación gráfica muy utilizada que es el DL{GRAMA
DE CAJA, que pe¡rDite ver Ia tendencia central, la dispersión, Ia simetría y los valorcs anómalos. Es
un rectángulo de anchura arbit¡aria cuyas dos bases representa¡ los cuaños Primero (Ql) y te¡cero
(Q3). La mediaaa viene defi¡ida po¡ un tr¡¿o grueso horizontal en el interior del ¡ectángulo L¿s
"patillas" que salen de la caja señalan ios valores adyaceÍ¡tes, que sod los valores mó(imos y mínimos
de la dilribución que no se consideran valo¡es arómalos. Estos valores anómalos pueden ser
"exte o¡es" (representados por un círculo, el núme¡o de al lado ¡epresenta el número del caso)
cuando se alejan más de Ql - 1.5 veces el rango intercuartílico o Q3 + 1.5 veces el Éngo
intercua¡tilico. Los valores "alejados" (representados po¡ un asterisco, el número de al lado representa
el número del caso) son aquellos que se distancia¡ en vez de 1.5 veces 3 veces el rango inte¡cuafílico
D) DESI,'IACIóN MEDIA.
DM= :
E) vARraNza (J ó s1.
Esta n¡edida de dispe¡sjó¡ se obtiene
sumarido tas difcrenoias al cuadrado de cada
datos respecto a su media y dividiendo a¡ uno cle los
final dicho ¡esulado entre ei"¡rn"r. J" i"o",O*"
de la muestla.
Es una exc€lente medid¿ de dispcrsión, y
es junto con Ia desvjación típica
medjda de dispersión mir usada o estánda¡, la
Únicamenr presenta un inconveniente, y es que
ra varia¡za tiene como unidad Ia misma
los datos pero elevada al cuadrado de
(ri - ¿)-
l=:*__-
¡r
(xi - e)-
: --------
En generall
Es una medida de dispetsión adimensio¡al, que petrnite comParar, desde un punto de vista
descriptivo, la dispersión (en foma de desviación tipica) de dos o más vadables ent¡e sí o la
dispersión de una va able en distintos g¡upos. Pa¡a ello no debe¡ tom¿tse e¡ valor absoluto,
sino que será preciso toma¡las en relación a la media de donde proceden
A este valor que indica el porce¡taje que las desviaciól típica rePresenta de la media
a¡ihnétic4 se der¡oúina coeficiente de variación, y se calcula de la siSuiente fo¡ma:
o
CV = --- (si se quiere d¡r eD porceht¡je el resultldo se multiPlic¡ por 100)
8 ñg.
CV (Espect¡ó¡¡eto) = ------ x 100 = 9,41
85 mg.
11 Krn.
CV (Ecógrafo) = --------,( I00 = 9,17
120 Krn.
Ejercicio 7: si abtenehos una tabld con datos la talla y gl p$¿ de n¡ños en dos periodos de
crecimiento. ¿Qué es más variable: el peso o talla.' ,A gu¿ edad estos parámetros son más
tariables?
CONCEPTOS MATE]\'TITICOS
MEDIA GEOIdTRICA: Es una medida de tendencia c€nt¡al que se define como la miz enésima del
producto de los n valores observados xt. Es muy utilizada e¡ Microbiologia y
en Serologíq do¡lde se
trabajan con datos con una marcada asimefía positiva (m¡ás hacia la derecha),
al trabajar con esta media
Iogcamos que Ia distribución de datos sea más simétrica (ver mfu adelanie). por
e]empto, titulos de
A¡ticuerpos ó 2, 4, E, 16.
r; ¡r:
j= ¡If
i=1
t/4.r,..*_
I
I
I
Cy Montesa, 20 - 28006 I\LA.DRID - Tfno: 91 309 36 46 - ñ;ñ;"*;"", 33
I
""-"r.b
L
@ CASH FLOW ESTADiSTICA
mtxnr+,...+mkxn*
M=
N
Se utiliza cua¡do se desea da¡ más peso (importancia o i¡fluencia) a unos valores que a ot¡os
MIDIA ARMóNICA: Es el i¡verso de la media aritrnética de los inversos de los vatores de la va¡iable.
N
tt¡
> l/x
Generalmente se utiliza cuando se precisa que las fnuestras con las que estamos trabajando tenga¡ el
rnismo tamalo. Po¡ ejemplo, en el sriálisis dc la va¡ia¡za paIa dos facto¡es, se reqüiete que los tama¡os
de las muestms, con las que estamos fabajando, se¡¡ iguales en cada una de las o¿sillas de la tabla
ilicial (lo veremos e¡ el ter¡a del A¡¡ilisis de lavanazz). Si esto no sucede, debería¡ sustituirse los
tamaños reales de cada casilla pot un ta$año ú¡ico, igual a la media anhórica de todos ellos, es decir:
axb a = no de filas
b = nó de columnas
1t nr = tama¡o de las sucesivas muest¡as
-- +.., + ---
nr nk
MEDLA CUADR Á.TICA: Es la ralz cuad¡ada de la media aritmética de los cuadmdos de los valores de
la va¡iable. Con ello eliminaaos todos los signos negativos.
pc=
UNIMODAL BIMODAL
- .Simétrica: Sus dos mitades puede¡ supe¡pone¡se y su pico o punto máximo se sifúa en el
centro,
- Asimétrica (sesgada)r El pico está fue¡a del centro y una cola es más la¡ga que la ofra.
- Con sesgo positivo, S>0, la cola es más larga (la caida es más lenta) a la derecha (asimetria a
Ia derecha).
- Con sesgo negativo, S<0, Ia cola es más larga a la izquierda (asimetría a la izquierda).
El apuntamiento o kürtosis determina €l grado de apuntamiento o picudez de una curva con respecto a
la distribución o curva ¡orftal; se usa para mostrar el grado de conce¡t¡ación (cu¡,,a con gran
apuntamie¡¡to) de los datos o dispersión de ¡os mismos (curva achatada).
Segrln el "apuntamierto o kurtosis" una dist¡ibución puede ser:
Mesocúrtica
Platicúnica
Nos proponemos encont¡a¡ leyes ñate¡náticas que sean seguidas po¡ distribuciones biológicas de
datos, ya que si fuéramos capaces de encontrarlas, podriamos sustituir tod¿ la colección de datos de
nuesto estudio por una fórmula teórica que siguiera la misma dist¡ibuc;ón que aquéllos; es decir,
sintetiz¿remos todos los datos en una fórmu¡a.
Vamos a describir tres leyes teó cas que tienen la parlicularidad de se¡ seguidas por la inmensa
mayo a de los fer¡ómenos biológicos habituales:
- Dishibución Binomial.
- Distribución de Poisson.
- DisÍibución No¡mal o de Gauss.
- Es una ley teórica que aplicaremos siempre que conozcamos Ia probabilidad (p) de aparición
de un fenómeno biológico.
Aplicable a un experimento que conste de "¡" pruebas.
El resultado es dicotómico y puede ser evaluado como "éxito" o "fracaso", siendo la variable
de interés el número de éxitos "k" alca¡zados en "n" p¡uebas.
Es una distrjbución de va¡iables discretas: por ello, la disfibució¡ binomial constioye
siempre u¡ diagama de ba¡¡as discontinuo.
- La selección de la muest¡a se hace con reposición, es decir, todos los elementos tienen igual
probabilidad de ser elegidos.
- Ejemplo: en una uma hay 6 bolas blar¡cas y 4 neg¡as. Si se extraen con reposició¡ (cada vez
que sacás una bola Ia vuelves a meter en el saco) 5 bolas (n), ¿cuál es la prcbabilidad de que 3
(k) sean neg¡as:
Se dice que una variable aleatoria sigue uria distribución Binomial de media (n p) y de desviación
tioicao= l/no.o
'V
A?RO) MACIÓN DE LA DISTRIBUCIóN BINOMIAL A LA DISTRIBUCIÓN NORITtrA,L:
Cuando el tamaño de una se¡ie de datos que sr'guen una distribució¡ Binomial va aumentando, la
distribución se va pareciendo cada vez más a un distrjbución Normal. Esa Normal, procedente de una
Binomial, tiene de media y de o, la media y Ia o de la distribució¡ de la que procede.
Una Distrjbución Binomial se aproxima a u¡a Distribución No¡mal si: n.p >5, n.q >5 y p q >0,05.
- Constjtuye un caso particular de la ley binomial para aquellas situaciones en las que la
probabilidad (p) de aparición de un fenómeno sea muy pequefia. Es, por lo tanto, la ¡ey
adecuada para "sucesos ¡sros" (cuando p<0,05) estudiada en mDestras grandes (¡r > 100).
- La siguen variables discretás qüe sólo toman valores ente¡os, no negativos, con probabilidad
no nul4 pero sí pequeña.
- Cüanlo menor sea la p¡obabilidad de aparicióD de un suceso (p tienda a 0), y mayor sea el
número de i¡dividuos al que hemos de aplicarla (¡l tienda a infinito), más exacta será la
sustitución de la ley binomial por Ia de Poisson.
- La dist¡ibución de Poisson está ligada a un expe¡imento que tiene como finalidad cu¡ntilicar
el númerc de iDd¡viduos por unidad de tiempo, volumen, superficie, que presentan un
determinado carácter. Se utiliza para contejes.
- De cada 2000 pa¡tos, un recién nacido presenta u¡a malformación ca¡diaca. ¿Cuál es la
probabilidad de que en 100 partos apatezca¡ 2 malforrnaciones cardiacas?
- El número de g¡anulocitos por mm3 es de 2. ¿Qué probabilidad hay de que ap^rezca\ 4
granulocitos por mrn3?
- El número de accide¡tes nucleares graves en u¡a cettral nucleai es de 1 cada 30 años ¿Cuál
es la probabilidad de que ocurran 3 cada 30 meses?
Es la distribución que sigue¡ la mayoría de las vari¿bles biológicas. Cualquier va¡iable cuantitafiva
puede ser estudiada en principio, de acuerdo con la ley do Gauss.
Características:
Areajl0O%
95'/o 99."1o/t
Estos valores 95% y 99% que ahora describen la muestra, más adelante, en la pafe analítica, van a ser
Ios que nos f¡jen las següidades del 95% y del 99%; y por tanto ¡as probabilidades de e¡ror p<0,05 y
p<0.01.
Ejemplo: Imaginemos que hemos realizado un expe mento midiendo las pulsaciones por minuro a
1000 pacientes ( t=80p/m o=10p/m). ¿Entre que vaiores de pulsaciones se encontra¡án el 95o% de
nuesbos pacientes?
Ejercicio 8: si hemos tomedo la temperofura a todos los pacientes ingresados en uta planta de
digestito (50 pacíentes) y la üedia es de 36,81: y la desúación tipica es de 0,5'C, ¿entre qu¿ ra¡ores
de tempetahna se enconÍaún el 99%o de los pacientes?
A partir de estos datos pod¡iamos exigir el cálculo de aquellos pacientes que tuviera¡ p lsaciones
comprendidas entle los valores m¡is diversos, por ej. entre 68y 107 plm. Bastaría co¡ aplica¡ la
ecuación (muy compleja) qüe defi¡e la disr¡ibución normal y aplicar los límites 68 y 107 pa¡a obtener
la probabilidad de encontra¡ individuos entre estas cifras, p¡obabilidad qüe multiplicada por n (1000
individuos) nos da¡ia el número buscado. Pa¡a evitar estos cálculos hab¡ía que tabular la curva <le
Gauss (pero esto es algo que no se püede hacer si¡¡ más, porque la curva de Gauss depe¡de de la
media y de la desviación típica de los datos con los que estemos trabajando, y cada experime¡¡to
tendrá unos valores distintos). Hay una tabl4 denominada Disfribución Normel Tipiñcad¡, a la que
se puede acceder mediante üna transform¿ción de los datos, o lo que es io &ismo, mediante una
tipificació¡.
La curva de Gauss tipilic¡d¡ tiene de media 0 y de Desviación Típ¡c¡ 1, y tiene todas la¡
propiedades de la curva de Gauss.
110 - 80
10
En la tabla, pa¡a x-3, se obtiene un á¡ea 3=0,4987. Pero es el área comp¡endida ente el eje y x-3.
Nosot¡os necesitamos, no esta superficie, sino Ia cola de la ourva. Pacie¡tes con ñÁs de 110 p/ñ,
equivale en la curva falsa a pacientes con más de 3; es decir, la cola. CoElo el a¡ea de la mitad de la
cürva cs 0,5, el área de la cola será: 0,5 - 0,4987 = 0,0013. Por consiguie¡te el ntlmero de pacientes
con pulsaciones superio¡es a 110 seú 1000.0,0013=1.3.
65-80 96-80
1,6
l0 l0
0,¡332
Se busca en ¡a t¿bla 1,6 y 1,5 (en vez de -1,5 po¡que la tabla es simétrica).
X=l,5 5=0,4332
X=1,6 5=0,4452
Por tanto la probabilidad pedida será: 0,4332 + 0,4452 = 0,8784, y el rúmero total de pacientes con
pulsaciones comprendidas ent¡e 65 y I l0 p/m será: 1000.0,8784= 878,4 individuos.
TRANSFORMACIOMS MATENIITICAS.
Ls simplicidad es un objetivo centml en la descripció¡ de los datos, po¡ tanto, cuando podamos elegit las
ufúdades de medida de una va¡iable escoge¡emos aquella que conduzca a una representación ¡¡as
se¡cilla. L dist¡ibución de f¡ecuencias simétticas resPecto a la media son mrís simples que las
asimétricas ya que:
1. En dist¡ibuciones simét¡icas tíPicas, la medi4 la mediana y la moda coinciden Hay pues ¡¡na
Por tanto, cuan¿lo exista una ttansfo¡mación de la variable, f(x), tal que la ¡ueva variable, y:f(x) tenga
distribución siméfica, es co¡veniente trabaja¡ con esta variable transfo¡mada. Las transformaciones más
utiliz das son:
- Por el conÍa o, las hansformaciones rñ, Lr x, y l/x comprimen los valo¡es altos y expa¡¿len
los bajos, produciendo adem¡is este efecto en orde¡ creciente (mmos Ji, más l¡ x, y más
¡odavía l/x). Se usa¡ en casos d9 asimehia a la derecha (asimetria positjva).
-rfh
'.;
42
C/ Montesa,20 - 28006 MADRID - Tfno: 91 309 36 46 - $Y¡{ cashflow-oposiciones.com
E] CASH FLOW ESTADiSTICA
4 y = log(x)
2. t:
Se suele uriJiz¿¡cuando los daros son contajes,
por ejemplo: número de gérme¡es por unidad
de volumen
de lechc, número de muetes que ocure¡ en varios
resumen, utilizaremos la transformación de
gnpos e*pe.irnentj", i"
an.i'.¡J., ¡rnoao ¿"
la ra íz cuaój lda para.: "t".
4.
y=ux
Se usa cua¡do la va¡ianzz aw¡¡enta hast¿
la cua¡A potencia de la medi4 es decir, cuando
dispersión. existe mucha
PROBABILIDAD.
1. CONCEPTO.
lmaginemos tira¡ una moDeda muchas veces, obtenemos ulra secueDcia aleato a, qüe se ca¡acteriza
po¡ la falta absolut¿ de un pahón de P¡edicció¡ AI ir aüne¡t¿¡do Ia secuenci4 la proporción de
pruebas con un resultado particula¡ va vadando cada vez menos y tiende a un valor límite. Esta
proporción se llama probabilidad de u¡ suceso en Particular. Clásicamente se ha definido la
probabilidad como el oociente entrc los casos favorables y los casos posibles o totales. Por ello
podemos decir que la probabilidad (Pr) de un acontecimiento A es iguall
La probabilidad se puede exp¡esar como fracción decimal o como porcentaje; y siempre que se
exprese como fracción decimal debe estar comprendida dent¡o del orden de 0 a l De forma que: P¡
(no ocu¡ra el acontecimiento A) = I - Pr (ocuna el acontecimienfo A).
Ejemplo: En una epidemia de intoxicación alimenta¡ia, entre las i5E personas que asistieron al
banquete ocufie¡on 99 casos de enfermedad. La probabilidad de que una persona, seleccionada al
aza¡, esté enfenna es:
99
Pr (enfermedad) = ------- = 0,63 ó 630/o
r 58
2. PROBABILIDAD CONDICIONAL.
En el ejemplo anterior de intoxicación alimentaria, la probabilidad de que una pe¡sona sana enferrne
e¡a de 0,63. Sin embargo, la probabilidad de enlelma¡ tendria q¡ie modificarse si se conociera qué
atimento ingirió la persona. Esto introduce la noción de p¡ob¿bilidad co¡¡dicional o, dicho de otro
manera, la probabilidad de que ocurra A, una vez que ya ha ocurrido B.
P(Ai) P(B/A,
P (AiB) =
: P(A) P(B/A'
3. ACONTECIMIE¡ÍTOS COMPLEJOS.
Dicho de otra manera, Pr (AUB) expresa 1a probabilidad de que ocu¡ra por lo menos uno de los
sucesos ("aJ menos uno").
Hay dos reglas para combinar probabilidades que petmiten trata¡ con más facilidad los
acontecimientos complejos. Son las reglas de la multiplicación y la ¡egla de la suma.
Ejemplor Se sabe que ocurren efectos secundarios con un fiírmaco en el l0% de los pacientes que lo
reciben. Un médico tiene dos enfe¡mos a quienes adminisÍa el medicamento ¿Cuál es la probabilidad
de que ¿$bos pacientes presenten efectos colaterales?
La Pr (B) Ia conoceÍ¡os (0,1), y como nos enconfarnos P¡ (A,41), debemos ver si estos sucesos son
independientes o no lo son. Si la aparición de €fectos colate¡ales en un paciette modifica la
probabilidad de que aparezcar efectos colaterales en el otro, los sucesos no será¡ indePendientes, por
el contrario si la aparición de efectos colateraies en un paciente es independiente de la apa¡ición d€
efectos colaterales en el oro, los sucesos será¡ i¡dependientes. Una vez acla¡ada esta duda: Pr (8mbos
presenten efectos secündarios)= 0,1 x 0,1 - 0,01 ó 1%
Ejemplo: ¿Cuál es la probabilidad de que aI menos uno de los pacientes aíteriores presente efectos
colaterales?
Tfnor 9l 309 36 46
CyMontesa,20- 28006 MADRID - 46 - w1rv.$shflow-oposiciooes,com
SQ CASH FLOW ESTADiSTICA
ÍNDrcE
4. I . Muestreo convolu¡¡ta¡ios.
4.2. Muesheo de coúvenienci¡-
4.3. Muest¡eo ernitico.
2. Contraste de bipótesis,
28006 M^DRID 48
C/ Montesa.20 - - Tfno: 9l 30s 36 46 - nav.cashflo$-oposiciones.com
üa caslt FLow ESTADiSTICA
2.
ll: y:l:: es homogénea con.ta población que representa y/o no es representativa de ta mism4
nada c¡e Io que se concluya a panir de ella será
válido. por ejemplo, pa¡a determina¡ el nivel medio de
colesterol de todos los espa6oles, la muestra ¡o aeUe
tomarse sOto de pe..onas d"
que Ias cifras de colesterol varía¡ con la edad), "d"d.. "rurrrrdu. 1y"
ni en base a individuos a" un^ sol^ reg;On (yu qu" la
alimentación vaiía en las diferentes ¡egiones).
Las vent¿jas de estudiar un número ¡educido de individuos de una muesfa e¡ lugar de toda la población
se resumen en:
I Menor cosle.
2. Mayor rapidez.
3. Mayor f¡cilidad: esta operatividad deriva de las dos a¡teriores ¡azo¡es.
4. M¡yor exactitud: esta posibilidad, aparentementecontradi$ori4 se exPiica porque, al ser
más ¡educido el número de individuos a investigar, se puede emplear r¡n personal más
cualificado pan llevar a cabo el estudio o la e¡cuesta, se puede ap¡ovecha¡ mejor el
contenido de la info¡mación solicitada y se facilita la supervisión de los encuestadores.
El muestreo presenta inconvenientes que en general pueden ser superados y que consisten en la falta
de representatividad de la población y en la posibilidad de comete¡ erores en su selección (a estos
erro¡es se les denomina sesgos).
L llo¡nogeneid¡d.
2. Representatividad.
3. Aleator¡edad. P¡esupone que todos los individuos tienen la misma p¡obabilidad
(oportunidad) de formar parte de la muestra.
Sobre u¡a muestra así dete¡minada y que curnpla l¿s condicio¡es de homogeneidad, aleato¡iedad y
representatividad, se aplica¡iá¡¡ las pruebas estadísticas adecuadas, pudiéndose inferir los resultados
del estudio a toda Ia población de ¡eferencia con u¡ nivel de confianza previamente establecjdo.
De entre los diliffos tipos de muestreo destaca el muesheo p¡obabilistico puesto que es el ú¡ico en el
que cada individuo de la población tiene una probabilidad conocida y distiDta de ceto de ser incluido
en la muestra. De esta mane¡a se puede obtener de forma objetiva una medida para el enor de
muest¡eo.
Tfno: 91 309 36 46 50
C/ MoDtess, 20 - 28006 NLA.DRID - - w\rv.cashflow-opo5icion€s.com
E] CASH FLOvt' ESIADiSTTCA
Müestreo aleatorio siD reposiciótr: el p¡oceso se realiza unidad por unidad, y en cada
extracción, existe la misúa posibr'lidad de selección para
todas y caá" J" i"J""¡¿^¿".
que no hayan saiido. """
b. Muestreo ale¿to¡io coD reposición: en cada extracción
todos ros.N,,miembros de Ia
población reciben la misma opo¡runidad
de extracción, ,in q* iri"n;'"i"";i".o o"
veces que se extmjerc¡ antes.
a
a
L
C/ Monlesa, 20
- 28006 tVtADnm@ 5l
t
g CASH FLOW ESTADiSTICA
¡0 09 7.',1 25 l-i 7ó 52 0l 35 Eó l4 ó7 35 48 7ó 80 95 90 9l l7 39 29 27 49 45
37 54 20 48 05 ó4 80 .{7 42 96 24 80 52 40 ól ól 04 02 00 82 29 t6 ó5
08 12 2ó 89 5l 19 64 50 9l 0.1 23 20 90 25 ó0 t5 95 3J 47 ó4 35 08 03 3ó 0ó
99 0l 90 t5 29 09 l7 67 t)7 l5 l8 3t It l¡ ó5 88 ó7 ó7 43 07 04 43 62 16 59
t2 80 79 99 70 80 t5 ?l 6l 47 64 ()] 2J óó 53 9E 95 ll 68 71 t2 t7 t7 ó8 33
óó 0( 51 41 t7 14 07 27 ()8 50 36 69 i3 6t 70 65 81 33 98 85 t9 92 0t 70
JI 06 0t 08 05 45 57 lE 2.1 0ó 35 l0 J4 26 r1 8ó 19 90 74 39 2.1 40 30 97 l2
85 26 97 16 0Z 02 05 16 5ó 92 ó8 6ó 57 4E r8 73 05 38 s2 47 t8 62 l8 85 i9
óJ 5l ll 2l 15 05 32 54 70 4lt 90 55 35 75 48 28 46 82 8? 09 83 49 l2 56 24
1l 19 ó4 57 53 0l 52 96 47 78 l5 80 8l 42 82 60 93 52 03 44 35 21 38 84 35
3.2. ¡4c9$ree-!.¡!&Ei¡!is9.
El proceso de selección de la muestra se realiza mediante una regla sistemática simple, elegir uno de
cada "n" individuos. Pa¡a ello se ha de calcular la conslanle o fiaccíón de mueslreo diridiendo el total
de la población e¡tre el tamaño muesÍal previamente dete¡minado.
Población
Constante de muestreo (k) :
Muestra
Técnicame¡te esta modalidad es una forma de muestreo probabilistico ya que el punto de partida se
elige al azar entre los k p¡ime¡os númercs. Po¡ ejemplo, si partiésemos de una población de 10000
individuos y precisáramos una muestra de 500, la constante de muestreo seria igual a 20. El prime¡
individuo qüe formara pafe de la muesba se debería seleccionar de forma a¡eatoria de entre los 20
primeros individuos de la población. A este primer valor, habría que sum¿!¡le sucesivamente la
constante de müestreo, hasta completar el tsmaño rnuestral predeterminado.
Es ma form¿ de muestreo que pe¡mite mantener en la muesfa las mismas proporciones qüe en la
poblacjón ¡especto a las diferenfes características que ésta prese¡ta. Con lo cual aseguramos que la
muestra ¡enga Ia misma p¡opo¡ción de una o más lr'a¡iables qr¡e la población de la cual ésta procede.
Consiste en dividir Ia poblacióIl en subgrupos de acuerdo con cie¡tas caracte¡ísticas, como el seto o la
raz¿- y luego ext¡aer u¡a müestra al az¿r a pa¡tir de cada u¡o de dichos "estratos".
3'4'M!99r99-p9r-s9!c!ss9 .
Müestreo bietápico (o por conglomer¡¿los en dos etap¡s): En este caso no fdrma¡ parte
de la
muest¡a todos los elementos de Ios coÍglomerados, sino que,
una vez se¡eccionados estos, se efectúa
uña nueva selección o se construye üna submuesfa deato
de cada uno.
podcmos denomi¡8r a este contr¿ste como te6t de inilependelcia de las ob¡erv¡cioD$ de o¡a
mr¡ettr¡.
- Estimacjón de parárnetros.
- Cont¡aste de Hipótesis.
con ¡a estimación de parárnetros se realiz€¡ afirmaciones de una població¡, a pa¡tir de ros resurtados
obtenidos de la muestra Es deci¡, "estima¡" significa "calcurar" el varor de un ¡eterminado
parámetro
poblacional (medi4 varianza,...) a partir de un determi¡ado valo¡ muestral (estadistjco
muest¡al), ya
que el valor del panimetro poblacional es desconocido. l¿ estimación puede asumir dos formas:
L Estimación puntuáI.
2. Estimación por intervalo.
l.z. E$¡¡gsll¡-pg¡i¡tcnalg. Usando la media o la me¿lia¡a según sea más útil, y un intenalo de
confianza dentao del cual está¡ la media o la mediana con una probábilidad
de ace¡ar conocida.
ESTIMACIÓN PI'NTUAI-I
Se dice que un estimador es sessado, si el valo. muesfal no se cent¡a sobre el valor poblacional que
Se dice que un estimador es de minima va¡ia¡z¿, si Ias variaciones que experimenta son las mínimas
Lamedi4 moday media¡a muestal, son estimadores cenfados o insesgados de Ia Media Poblacional
PaIa es¡imar Ia Desvi¿ción Tipica Poblacional (S), se admite una corrección denominada de Bessel, que
calcüla la desviació¡ tipica en ta población igual que si fueÉ la desviación típica de la m¡restr4 pero
oblenida con un individuo menos, es decir en el denominador en vez de "n" ponemos "n-1"
(cuasidesviación típica muestral S):
\I-l
\ / (xrx)'
\f\ i (xrx)".
\/---- + s=\/---
V'-'
V'
56
C/ Montesr,20 - 28006 MADRID -Tfno: 9l 309 36 46- sa{H.cashflow-oposicloner.com
Eg CASH FLC}W ESTADiSTICA
o = DT de la muest¡a.
So = DT de Ia población lsi es que alguna vez se conoce).
S = DT de Ia población, esrlnada a parti¡ de la conespondiente de la mtrestra = Cuasidesviación
típica muestral
n
S'= d' ------
n-1
s1= cuasivarianza muestral. Por tratarse de üna cor¡ección de ra varia¡za de la muest¡4 estima mejor
la varianza de la poblacjón.
En muestms grandes, el factor de corección r/n-l prácticamenle es igual a Ia unidad, por Io que puede
estimarse la desviación típica poblacior¡a.l con la ¡¡isma desviación típica que Ia obtenida en la
muestra.
A medida qüe el tarnaño muestral dismi¡uye, Ia Cuasivarianza va siendo disrinta de la va¡ianza.
Estimació¡ de medias.
Al estimar una media, pretendemos determinar cuál es la media de la población (inaccesible para
nosotros), a pa ir del estudio de una muestra de dicha població¡ (que si es accesible para
nosotros);
es decir que¡emos calcular un paflimetro poblacional (la media poblacional),
a pañir de u¡ parámetro
muest al (la medi¿ muestral). carcular un inte¡varo de confianza alrededo¡ de ia
media de una
muestr4 establece ios dos límites de varores (superior e inferior) entre los que se encontrará
el
verdade¡o parámetro poblacional y también la probabilidad de que así sea.
De una población podemos extraer infi¡ita¡ muestas (cada una tendrá su y su desviación
me¿lia
tipica)- Si en Ja población de origen, la variable que estamos estudiando
sigue una distribución
normal, en cada una de las muestras obtenidas, también seg¡irá una distribuciórinonnal,
y además el
conjunto de todas las medias muesftales obtenidas tambjén se distribuián
Dor¡nalmente. Su media (la
¡¡¡edia de todas esas medias) es la Medis poblaciotrel, y su desviación típica
se denomi¡a Error
Típico o Error Está¡dar de Ia Medi. (SE ó Sm ó eeh), que es la dispersión
de las meatias
muestrales respecto a Ia rnedia poblscional. hav oue confunali¡lo por lo tanto con Ia desviación
^_o
d
Sm = --------
Ejemplo: Quie¡o estimar la Hemoglobina Media de una población; para €llo obtengo una muestm de
100 individuos. La Hb media de dicha muestra = 1l. La o = 4.
V;
La media poblacional estará comprendida entre l1 t 2 x 0,4 ó 1l f 0,8 con una confianza (de
acerta¡) del9sYo.
La media poblacional esta¡á comp¡endida e¡t¡e I I t 2,6 x 0,4 4 1l 1 1,04 con una co¡fianza (de
acertar) del95o/o.
Ejemplo:
Signiñca:
¿Muest¡a glande?
sí No
n>30 n <30
I
I
+
DISTRIBUCIÓN DISTRIBUCIÓN t DE
NORMAL STUDENT
Caract€risticss:
Los valores det área baj o la cijl-va gíyo, ggyo no són 2 y 2,6 sino que hay que calcularlos (mirarlos
e¡ tab¡as).
Cuando el tamaño de una t de Student va aümeritando, la curva se va pareciendo cada vez más a
una Normal. En general, ct¡ando ¡ t0, una t de Sfudent se puede aproxiña¡ a una Nomal
Ld media de la distribución teóricá (al set una dist¡ibución teórica en vez de media se la llarna
"espe¡¿nza matemática") es O, de fo¡ma que la distribución t de Student es parecida a la normal
tipiñcada [N(0,]), no¡mal, media 0, desviación tfpica 11.
La estimación de una media, cwindo se trate de una muestra menor de 30 i¡dividuos, tendrá en la
población co¡¡o ma¡gen de tole¡ancia o intervalo de corlfia¡¡za:
tit.Sm
Nota: al b¡¡sca¡ e¡ la tabla el valor t de Student, debe hace¡se Do con l individuos sino con n-l (ya
que tiene n-l grrdos de Iibenad).
Gr¡dos d€ libertád. Este concepto sig¡ifica "núme¡o de téminos rcalñente libres" y se representa
po¡ g.l. o por v. En la distribución de la t de StudFnt para estimación de medias trabajaremos con n-l
grados de Iibenad.
60
C/ Motrtesa,20 - 28006 MADRID - Tfno: 91 309 36 46 - s$1r.cashllow-oposiciones.com
EQ CASH FLOW ESTADÍSTICA
Para estudia¡ la ¡elación e¡tre una variable cuantitativa y otra cualitatjva (2 categorías).
2. -=130
4
3. S- = ----- = 9,4
ln*
4. El colesterol medio en Mad¡id es I30 i Zo .S¡D
130
4
3.Sm
IE
v
t v : V¡lo¡er de l¡ t de StEdeDt
130 a f,09 0,92 = 130 a1,92 p<0,05 scgurid¿d 95% (re úi!¿ ao I¿ aolunna 0,025 ¡l sot la t¿bla de
una cola)
130 t 2,86 0,92 = 130 t 2,63 p<0,01 seguridad 99% (se mira oo la colürnne 0,005 ¡l sor l¿ tabla do
un¿ col¡)
Los valores da 2,09 y 2,E6 que figur"¡n en l¿s cxp¡erio¡es ¿trtcriorcs, s€ ha¡ obt.oido de la tabla dc la t
d€ Studer¡t para n-l grados de libcrtad, es d6cir pa¡¿ 19 gr¿dos dc libert¿d.
No
iD-o Dróximo a Sl
i lo0? ----------''DISTRBUCION
a BINOMIAL
I
Nol
ü
DISTRIEUCIóN NORMAL
l. Determi¡a¡ 6i vs¡¡¡os ¿ trabqj¿¡ scg¡ln un¿ disfibución Bi¡omial o según una distribución Normal.
2. Colocer el pa¡ámebo muesbal (propo¡ción müestral: p = 0,2, p 0,4 ,..), :
3, Calcular ol enor cstÁndar del porcentaj. (Sp ó c.p).
p (l-p)
s-=
l)9 62
Cy MoÍtcc{, 20 - 2801}6 M.ADR¡D - Tfto: 91 36 46 - *nw.c¡s¡flov-opolicio¡eccot¡
@ easH FLOlltt ESTADúSTICA
EJEMPLO ].
0,2.0,8
Sp= --_-..-_ = 0,025
250
i
0,2 t2.0,025 = 0,2 0,05; con un¿ segu¡id¿d
del 95% y una p<0,05.
0,2 r 2,6.0,025 = O,Z r 0,065; una seguridad
.cor¡ del 99% y utr¿ p<0,01 .
g Vout""", :O U¡,O%
- ¡¡OOe
63
M CASH FLOW ESTADISTICA
Es un método de razonamiento que nos pe¡mife decidir si una hipótesis es o no cjerta, y con cua¡to
margeí de en'or, es decir, con qué probabilidad de equivocamos.
Para poder demostra¡ una hipótesis. Es decir, para establece¡ una conclusión en un ámbito
determinado de la ciencia, sobre un problema p¡evio, sin que nadie pueda poner eo doda la afirmación
que has realizado, ya que dicha conclusión la has de acompañar de una p¡obabilidad de ero¡, que si es
muy pequeña (menor de un 5olo) en la comunidad científica es como si no te equivocaras.
MÉToDo: rDóTEsIs.
Pa¡a realizar un contrasfe de hipótesis, en primer luga¡ debemos establecer las hipótesis que se han de
comparar. Y siempre se establece¡¡ 2 hipótesis, que han de se¡:
Ho nrmca se conside¡a probada, aunque puede ser rechazada. Por ejemplo, la hipótesis: Todos
los elementos de las poblaciones A y B son iguales, puede se¡ rechaza encontraodo elementos
de AyB diferentes, pero no puede ser demost¡ada a no ser que se estudien todos los
elementos de ambas poblaciones, ta¡ea que püede ser imposible.
- Llamamos (H1), a la hipótesis que qu€remos demost¡ar (con una p¡obabilidad de eno¡). Po¡
ejemp]o, si hubiéramos pla¡teado el coriÍaste de hipótesis para demostrar la eficacia de un
nuevo fármaco, H1 plantearía la existencia de diferencia en la eficacia entre ambos fÁrmacos,
si por ejemplo quisiéramos demostrar la eficacia de un fii¡maco, sin compararlo con otro, Hl
diría que el fármaco es eficaz.
- Ge¡eralmente se pla¡tea antes que la Hipótesis Nul4 ya que es la hipótesis que quiero
demosksr y esto es algo que debemos tener claro a¡tes de empezar el estudio.
EJEMPLO.
EI tratamjento del Cólera con tet¡aciclinas tiene una mortalidad del 7%; y con sue¡ote¡apia
de un 3oZ.
¿Es un batamiento mejo¡ que otro? para pode¡lo demostrar, hay que realizar un contraste de hipótesis
(sólo con estos datos no podemos establecer que el tratamiento de elección
para t¡atar a pacien¡es con
cólela es la suerote¡apia). ¿Cómo establecemos el contraste de hipótesis?
Ho: Tl = T2
Ht: Tl + T2
A partir de qué valor vamos a podet rechazar Ho, es decir, debemos fijar el valor a parti¡ del cual
nuestros rcsultados no sean en priúcipio explicables pot el azÚ (por Ia casualidad). Dicho de otra
fo¡ma: cuál es la "probabilidad ñáxima de que nuest¡os ¡esultados sean debidos al azar" Este valor
vie¡e dete¡miñado por lo que en estadística se denomina grado de significación estadística (p).
Depende del número de individuos utilizzdos y de la magnitud de la diferencia o asociación
obsedadas. Se calcula a partir de la tabla de la distribución corespondiente y establece la
probabilidad de obtener un resultado tan exÍemo o más (igual o mayor) que ei obtenido en el
experimento, bajo la suposición de que Ho sea cierta. El grado de sig¡ificación estadística sólo
descarta que la diferencia observada entre lo qug estemos comParando, sea fruto del azar.
Por convenio, siempre que se rechace Ia Hipótesis Nul4 nuestro ¡esultado vend¡á acompañado de una
probabilidad de error (nü¡rca podemos estar seglros de que no nos equivocamos), pero ¡os va a dar
igual si Ia probabilidad de equivocamos es muy pequeia (concretamente me¡or de¡ 5o/o), y )a forma
de expresar este concepto, es acompafiar nuestro resultado de "p<0,05" (que coincidüá con el valor
delnivel de significación co¡ el que decidimos trabaja¡ antes de realizar el contraste de hipótesis).
Cuatrdo l¡s difereDcias halládas son erplicables bajo le H0, se dice due les diferencias no son
estadisticame¡te sig¡rificalivas, para el nivel de sigtrificació¡ con el que estés trabajando.
Cusndo las diferetrcias halladas no son exp¡icables bajo la Ho se dice que las diferencias son
estadíst¡camenle signilicativas, p¡r¡ el Divel de sigDificación con el que estés trabajando, y el
resultado se acompaúará siempre de "p<0,05".
IMPORTANTE:
¡ó de compa¡aciones
o l-p.
o La capacidad del test de encontrar diferencias
sjgniñcativas, iua¡do éstas existeD.
o La capacidad del test de demostrar Ia Hipótesis
Altemativa.
o Es Ia probabilidad de aceptáx la Hipótesis
Aiternativa cuando ésta es ciena.
o Habitualmente l_F es > g0%.
c yonresa. 20
- 28ooó MA¡R_D _@ 6',7
EA CASH FLOvtf ESTADiSTICA
Rcchszar H0
Dccisión oo¡recta
(Aoeptar Hl) E¡ror tipo I
(Diferencias Prob¿bilidad = (r
Probabilidad= l- I
Podcr o Pote¡cia del tcst.
signiñcativas)
Si Ho (no hay diferencias) es cie¡tA y se ¿cepta (se acepta quc no hay difere¡cias), es u¡a decisión
9e@!@. La p¡obabilidad de qu. eso ocurra, u¡a vez fúado d, es l-d.
Si Ho (flo h.y diferc¡cias) cs cierta, y se rechaza (se afi¡ma qüc hay difcrcDcias), la decisió¡¡ no es
cor¡ecta. Se está cornetiendo utr ero¡ que se denominá E!!g!lipq-I. La probabilidad de que cso ocura
es Cl.
Sinónimos:
. Rechazo Ho
. Acepro HI . Rechazo IJI
. El az¿¡ no explica Ias diferencias . El az¡r explica las difere¡cias
. Result¿doesradislicamentesjgnificativo . Resuhado no efadisricamente significativo
. Muestras no ¡omogéneas . Muesrras homogéneas
3.
mayor a la hora de su presentación. Pe¡o también es cierto que, alcatrzado un oivel de signiticscióo
determin¡do (p<0,05), el resultado va a ser unánime acept¡do; y puede set que reducir esta
probabilidad de el¡or no nos comPense el trabajo necesario.
Para poder estimar el tamaño de una muestra hemos de parti¡ de algo concreto conocidoi lo que se
denomina a pa¡tir de cuyos resültados vamos a calcular el número mínimo de
!¿peliElqoiiLolq
individuos necesarios. Una vez conocido lo que esperamos o deseamos obtene¡ en el estudio, el
p¡oblema de p¡edete¡mina¡ el t¿maño muestral se ¡educe fundamentalmente a estudia¡, en cada caso,
el correspoDdiente error estándar (el cual mide el intervalo de confiana de cada parámetro que se
a¡aliz¿. sea una medi¿ a¡itmétic4 un porcentaje o una diferencia de medias).
En todo momento hemos entrado en las fó¡mulas con los tamaños de las muesüas y hemos obteoido el
ma¡gen del az r para vna segr¡ridad dada. Ahora e1 problema es inverso: damos po¡ conocido el
intervalo del azar y hernos de despeja¡ el tamaio. Como en todas las exPtesiones del €¡ror estrinda¡, el
tamaño de Ia muestra figura en el denominador, afectado de la Miz c\Jadrad4 sabemos que ta
precisióD estadistica aumenta (o lo que es lo mismo' el error estáÍdar disminuye) cuando el
tamrño ñüestral auñetrte.
1, Para predeterminar I¡ muestra necesaria p¡rs €stimar una proporción con un e¡ror máximo
determi¡ado, tenemos que aplicar la siguiente fórmula:
z' * p e-o)
e2
zo, =1,96 (para un Intervalo de Confianza del 95%) (y luego eleva¡lo al cuadrado)
p = Propo¡ció¡ muest¡al
€ = erro¡ máximo que estamos dispuestos a acepta¡ (p¡ecisión),
si no hubiéramos realizado u¡ experimento piloto, y no tuviéramos u¡r valor previo, nos debemos
poner en el caso más desfavorable, qr¡e es: p=0,5 y l-p=0,5.
2. Para predeterminsr l¡ muestr¡ necesari¡ p¡ra estim¡r ulla media con un e¡ror máximo
deie¡minado, tenemos que aplica¡ Ia siguiente fórmula:
z, on. 6
E2
6
d B Unilateral Bilater¿l
040 2,12 2,80
0,05 0,10 2,56 3,24
0,05 2,92 3,60
020 3,t6 3,42
0,01 0,10 3,60 3,86
0,05 3,96 4,22
020 3,93 4,13
0,00t 0,t0 437 4,57
0,05 4,73 4,93
l. Comperaciótr de medias.
ol2 o22
----- + -_-___
2. Comparación de proporciones,
pl -p2= e.
ClUont""r, ZO-:eOOe U% 71
E] CASH FLOl,v ESTADISTICA
enor tipo I
er¡or tipo II
pode¡ estadistico
Mediaote el estudio de hoñogeneidad estudiaremos dos mueshas, ataliz¿ndo en ellas u¡a sola variable,
que podrá ser cua¡titativa o cualitativa. Se trata de estudiar si la dife¡encia hallada en los resultados de
una y otra muestra puede ser atribuida a\ azat o si, por el contrario, es gxcesiva para que el ázar la
explique.
En el estudio completo de la homogeúeidad de dos medias hay que pa¡ti¡ de la base de que la variable
se distribuye normalmente en la población (según ulla curva de Gauss). Si esto no es así, o no se puede
p¡esuponer, no pod¡án aplicarse estas pruebas de hor¡ogeneidad, y habni que acudi¡ al análisis mediante
pruebas no paramétricas, menos precisas, más conservadoms y qüe necesita¡án que las dife¡Encias
obse¡vadas sea¡ mayo¡es, pa¡a que puedan ser demoshadas como significativas.
Cuando se t¡ata de comprobar Ia homogeueidad de dos dispersiones (que vienen dadas por las
desviaciones típicas o por las vs¡ia¡"¡s), la compa¡ación se ¡ealiz¿ por cociente, es decir, por
desproporción. El cociente F que obtengarnos se corDpara con los valor€s de la tabla de la [1!g.S4p¿9L
Son pruebas estadísticas cuyo objetivo es rechazd la Hipótesis Nul4 calculando qué probabilidad
tienen los resultados obtenidos de ser debidos al azar.
s.r' IlP!!-dlrIcÉbsLQ$ .
PRUEBAS o TEST PARAIdTRICOS: Pruebas que se utilizan cua¡do las va¡iables analizadas en
Ia población de origen siguen una distribución No¡mal o cuando ésta puede presüpotgrse.
72
C/ Montesa,20- 28006 trLA.DRID - Tfno: 91 309 36 46 - r*lv.cashnow-opos,ciones-com
[a cas]t FLow ESTADiSTICA
1. Cuando con muestr¡¡s meno¡es de 30 indivjdüos, Ias poblaciones de origen no p edan ser
consideradas nor¡nales.
2. Cuando ¡a variable represe¡ta solame¡te una medida aproxiñada del carácter, sin una
valoración exacta (el paciente "ha mejo¡ado,,o "ha empeorado").
3. En un primer paso de control del expe¡imento cuando, todavía con pocos datos, querernos
hacemos idea de la marcha aproximada del mismo.
Si las muest¡as son > de 30, no existe inconveniente en utilizar pruébas paramétricas, a pesar de que
Ia distribución de los datos no sea ¡ormal. Se puede demostra¡ que, aunque la variable no siga una
curva de Gauss, la repetición hjpotética del experimento propo¡cio¡aría medias sucesivás que sí se
ajüsta an a la curva normal, siempre que la muestra sea gande. El in¡,,estigador debe, pues,
preocuparse por utiiiza¡ p¡uebas no paramétricas únicamente en el caso de que, con muestms <
de 30
individuos, sus datos no sigan cuñas de Gauss.
En funcióD del tañaño de Ia muesta con la que trabajemos, establecerer¡os el tipo de pruebas
o test a
utilizar:
Test de la U de Mann-Wlit¡ey.
Test dé Kruskal-Wallis.
Test de Friedman.
Es la prucba estadlstica que se utiliza pa¡a demost¡sr si ur¡a oolecció¡ de datos sigue una dist¡ibuciót
Normal (una curva dc Gauss).
s3.@.
CONCEPTO DE DATOS APA-RXADOS
Detos apa¡oados son ¡quellos quo sc mid€n 2 veccs, antcs y después de um intervpnción (f¿¡m¿oo,
vacür¿..), Po¡ lo tarto, vemos oomo hay !ólo ¡¡¡ v¡riable ¡ st¡dlo y uD¡ ¡ol¡ Eueatr¡ cn la quc
se mido la vaiiable Entls y dcspués de la inte¡ve¡¡ción.
lnte¡venoión
Dato antcs Dato después
l'
existentes entre las f¡ecuencias obse¡vadas y las que se esperadan enco¡trar, bajo la suposición de
que Ho fuese ciefta. Poste orI¡¡ente, se estudia si esas dife¡encias pod¡ian ser o no exPlicadas por el
azar, par¡ un nivel de sig¡ificación determinado. Los ¡esultados obtenidos se recogen en una tabla
llar¡ada fabl¡ de contingenci¿.
PASO I i Plasmamos estos datos en una tabla 2x2: es deci¡, const¡uimos una tabla que se denomina
Tabla de valo¡es expe¡imentales (observados).
Aprobados
si No
Chicas 40 20 60
Chicos l0 20 30
50 40 90
H0; El sexo no influye en el ¡esulrado (el sexo no está relacionado con aprobar un examen).
No hay diferencias significativas en elpo¡centaje de aprobados en frrlción del sexo.
H1: EI sexo sí influye en el resultado (el sexo está relacionado con aprobax üri exame¡).
Hay diferencias significativas en el porcentsje de aprobados e¡ filnción del sexo.
ados
No
Chicas (50/90)60 - (u9q'60 - ó0
33
Chico (50/90)30= r7 (49/eo).30 = 30
s 13
50 40 90
G.D2 (o-E) 2
" PASO 4r Calculamos el 12 B¡pe¡¡¡¡cntal = :-*.__ = t -.--
T E
Valo¡es Tcó¡icos
Valo¡es Espe¡ados
:
" El_valor 12 Teó¡ico nos dice cuál es el valor máximo qu. el azJ puede
explioa¡, cs deci¡, cuál es la
maxr¡a drterencia explicable por el az¿¡, pa¡a el nivel d€ significación elegido, y con
-, libe¡tad' de l¿ disribución.
los ,,grados de
t;:\.dorubuhdr
p: Flbrbüdad'.crrodrd¡
ti
p<
t1
0,05 p < 0,01
Pam acudir a la Tabla de Chi-cuadrado, debemos calcular previ¿mente los grados de libertad de la
tabla de contingencia con la que estamos trabajando. Dichos g¡ados de libertad (gl) se calcular¡
multiplicando: (n" de filas-l).(n' de coluñ¡as-1).
En nuest¡o caso:
A) p<0,05
X2Experirental = 9.95
72¡¿6r. = 3 ,84
B) p<0,01
l2Exp. = 9,95
x2Teo, = 6,63
TABLAS 2x2
Calcula la p¡obabilidad exacta bajo la hipótesis nula de obtend una distribución de frecuencias
teóricas igual a las observadas o más desfavo¡able.
Cuando ia tabla de conti¡gencia se de 2x2 y el efectivo total de todas ellas no llegue a 100
individuos ó existan frecuencias teóricas menores a 10, se ha propuesto la denomi¡ada
CoRRECCIÓN DE CO¡{TINUIDAD DE YATES (actualmente la mayoría de autores
desacons€jan su empleo). Pe¡mite mejorff Ia estimación, hacié¡dola más conse¡vado¡¿. Pa¡a la
aplicación rüti¡aria de la co¡rección de Yates se resta 0,5 a la diferencia, en valor absoluto, entr€ ¡os
vatores experimental y teórjco, antes de elevar al cuadrado:
(lo-El-0.5)2
Sirve pa¡a comproba¡, a través del estudio de una muestl4 si una variable aleatoria sigue una cierta
distribr¡ción (Normal, T de Student Binomial, Poisson).
Cu¡ntilicación de l¡ asocisc¡ón:
válido, ya que dicbo estadístjco depende del tamaño de la muest¡a er¡ la cual se haya calculado. Existe
una g¡an vaiedad de medidas que pueden damos es¿ información, algunas de las cuales so¡ las
sigüientes:
2. COEFICIENTE Phi.
Es u¡a medida del grado de asociación ent¡e dos variables dicotómicas. Este coeficierte
varia ent¡e 0
y 1. Valores próximos a 0 indican no asociación entre las variables y valo¡es próximos a 1, indican
fueie asociación.
Este indice, que en Epidemiologia se utiliza para medir la reproducibilidad de los tesr
diag¡ósticos, es
ur índice de concordancia. se utiliza en tablas NxN cua¡do ra misma va¡i¿bre se observ¿ en los
mismos i¡dividuos en dos sjtuaciones o períodos de tiempo diferentes. Mide si
las f¡ecuencias
esperadas son significativamente mayorcs que las que cab¡ia espe¡a¡ po¡ pr¡ro
aza¡. Indices de Kappa
(Iieiss, 1981):
Uno de los análisis estadisticos más comunes en la práctica es probablemente el utilizado para
comparar dos grupos independientes de obseFaciones con respecto a una variable numérica (por
ejemplo ia coñparación de dos medias).
Bajo las hipótesis de normaiidad e igual va¡ia¡za la comparación de ambos grupos puede realizarse en
términos de un único parámet¡o como es Ia medi4 de modo que en el siguiente ejemplo planteado la
hipótesis de pafida será, po¡ lo ta¡to:
Se denotará por {¡, J,,...,XJ e lYyyz,...,y-l al peso observado en cada uno de los sujetos sometidos,
por ejemplo, a la dieta A y a la dieta B respectivamente. En general no se exigirá que coincida el
núme¡o de observaciones en cada uno de los grupos qüe se compara¡r, de rnodo que por ejemplo n=40
y m=35.
donde Ie l, denotan el peso medio en cada uno de los grupos, y rI . "2 las cuasivarian?ás
mu€st¡ales correspondientes. Si la hipótesis de pafida es cierta el estadístico segui¡á una dist¡ibución
t de Student con n+m-2 g¡ados de libertad.
En todá comparación de medias i¡depe¡úientes, hemos de establecer si las varian2as de las poblaciones
de las que se han obtenido las muestras son co¡ocidas o desconocidas.
L Si son conocidas (raro, pues no conocemos los paúmet¡os reales de la población, por eso ¡os
esiimamos pero no sabemos el exacto), el test estadistico que utiliza¡emos pai¡ ¡a
coñpalación de medias será la Z de cornparáción de medias (distribución normal).
2. Si por el contrario mn desconocidas (lo habitual), tendremos que establecer si las muestras
son gÉ¡des o pequeñas.
- Muestras peqDeñas (nr y/o n? < 30): En este caso, antes de comparar las medias se
han de compara¡ las varianzas Poblacionales media¡te el test de la F de Súedecor:
Si resültan dife¡entes: t de Student, pero pa¡a calcular los gados de libertad con
los qüe acu¿li¡ a la tabla de la t de Student es necesario utilizar una fórmula que
se denomina fórmula de Welch. Fn esie caso. el lest esladistjco pierde
sensibilidad.
Esta plueb4 debida a Fisher, constituye un "elega¡te proceso matemático" que Pe¡mite @4p¡¡gt
indirectamente. varias medias arif¡éticas obtenidas en diferentes muestras, po¡ medio de Ia eqEpa¡eg:é¡
directa de sus dispersiones.
Permite estudiar la influencia que un factor Püede tene¡ sobrc los valores medios de una var¡able en
varias muesfas (>2). Po¡ ejemplo, Ia influencia de la raza sobre la estatura
Pemite esirdiar la influencia que dos faoto¡es pueden te¡e¡ sobre los valores medios de una variable e¡
varjas muest¡as. El ANOVA pa¡a dos factores permite estudia¡, a la vez, los efectos individuales y el
efecto interacción de ambos factotes, sobre la va¡iable que estanos estudiando Por ejemplo, la
influencia de Ia raza y de la clase social (po¡ separado y combinadas) sobre Ia estatlra.
El ANOVA pennite:
3. Comparar >2 medias apareadas (ANOVA para datos apareados) Por ej. La altura media
saltada por un grupo de atletas, ¿va¡ía txas u¡ ent¡enamiento de 2, 4, 6 y 8 meses?
83
C/ Montesa. 20 - 28006 MADRID-Tfno:9t 309 3ó 46 - ¡d*1¡"cashflo.tv-oposiciones.com
q CASH FLOW
ESTADfSTICA
Supervivencia en meses
30 t2 I5
40 23 20
45 28 25
50 35 30
60 45 35
66 50 60
69 60 62
72 60 66
85 90
85 9t 76
K = Nút¡¡e¡o de muest¡as
N = Número total de individuos
= n1 + n2 + n3
Oltto¡t*", ZO-:¡OOO%
84
ü] CASH FLOW ESTADISTICA
"TEST DE BARLETT',
Se dice que dos muestras son HOMOCEDÁSTICAS cuando sus dispe¡siones son homogéneas.
Test a posteriori.
Si la "F" enfre g¡upos resulta se¡ estadisticame¡te significativa (algún grupo ¡o es igual), para saber
qué grupos son los diferentes, se realizan los denominados test "i posteriori":
- TEST DE TTJKEY
. TEST DE DI]NNET
Como se expuso al principio del tem4 r¡ediante el Análisis de la va¡ianza para dos factores podemos
estudi¿¡, a la vez, Ios efectos i¡divid¡rales de dos facto¡es y el efecto interacción de ambos factores sobre
una variable cuantitativa.
EJEMPLO; Comprobar la itrfluenci, que dos v¡riables cualitativas de mas de 2 calegoríás tietren
sobre u¡a vsrisble cugntitativa,
l,a raza (blanc4 negra amarilla) y la clase social (alt4 media-alta, media-baja, baja ¿lnfluyen
significativamente en la mayor o me¡or est¿tura de los individüos?. Es decir, queremos estudiar la
influencia sobre la estatur4 no sólo de la raza si¡o también de la clase social, por separado y
combinadas. Pa¡a ello, coúshuiriamos una tabla de doble ent¡ada, en la cual, uno de los facto¡es seria la
r¿z¿ con sus dive$as categorías (blanc4 negra y ama¡illa), y el ofo factor seria la clase socia¡ (dividida
también eD alt4 media-alta, media-baja y baja). DispoDdriamos entonces de una tabla de 4x3 casillas,
deDfo de cada una de las cuales escribi¡íarnos la sede de valo.es de la variable estatura que presentan los
individuos de las 12 muest¡as que así se forman y que contitüyen el objeto de la invedgación.
RAZA
FACTOR
Bla¡ca Negra Amarilla
Alta
Media-alta
CLASE
Media-
SOCLAL
baja
Baja
axb
n = ------------ ; siendo a y b et no de filas y colum¡as de la tabla
11
-- +...+ --
nl
ANÁLISIS DE LA COV
patologías?
Ei. ¿Es distinta la va¡iación de los niveles de transaminasas en individuos con 4
Hr : Alguna es diferente.
2 va¡ia¡z¿s: F de Snedecor
>2 vanaI.zas'.
o Test ¿le Bartlett (la distribución de p¡obabilidad que ütiliza es la de la Chiz de
Pea¡son)
o Test de Levene (la disi'ibución de probabilidad que utiliza es la F de Snedeco¡)
87
E¡ m-rt"t , ZO -:AOO6 U¡DRID - Tfno; 91 309 36 46 - ir"ñw cashflo*-oposiciones com
EO GASH FLOW ESTADISTICA
1. CORR.ELACIóN LINEAL.
¿Qué diferencid hay ent¡e oorrelaoión y ¡egtesió¡? En 1¡ conelación las dos váriables cuaDtitativas
son "siñétricas", es decir, una no depende de Ia otra (por ejernplo peso y talla). Sólo queremos ver si
existe alguna asociación enfte ellas, pe¡o no calcula¡ una sabiendo la otra (sabiendo el peso calcular la
talla, por ejeñplo). NO existe por lo ta¡to una variable dependienté y otra indePendiente. En la
reg¡esión intewie¡ren 2 va¡iables cuantitativas (denominadas dependiente lrespuesta o resultado] e
independiente lpredictor, factor de riesgo]) que están, de alguna forma relacionadas; es decir,
v¿riaciones de una de ellas implica variaciones en la otra. Po¡ ejemplo, si el peso de un ¡ecién nacido
aumenta al aumentar el peso de su madre (se der¡ota con la let¡a / a la va¡iable dependiente y con la
letra x a Ia vadable indeperdiente).
En la correlación se pueden calcular dos ¡ectas de rcgresión: e¡ el ejemplo, la de la talla sobre el peso
y la del peso sob¡e la talla (pues ambas variables son simét¡icas). En la regresión sólo tiene seritjdo
calcular una ¡ecta de regresión: eo el ejcmplo, la del peso de la madre sobre el peso del recién nacido
(es absurdo estudiar si el peso del recién nacido determin¿ el peso de la mad¡e).
La rccta o rectas de regresión vienen definidas por Ia fónnul¿ de ¡a línea rect¿ (y = a + bx), donde a y
b son consta¡tes y '1" e 'y' los valo¡es de las va ables. No todas las co¡relaciones o reg¡esiones
siguen una líne6 recta sino que tal asociación podría ser exponencial, Ioga¡ítmic4 etc 6/ no següirian
ests fórmula), pe¡o en este manual sólo vamos a ve¡ la ¡elación lir¡eal.
La representacióo g¡áfica de la relación entre dos vadables cuantit¿tivas forma lo que se denomina
una nube de puntos, por ello, el gláfico recibe el nombre de ¡ube de pu¡tos, o di¿gr¡m¡ de
dispersión.
El siguie¡te pa¡o, después de la ¡epresentación gráfica de ambas variables cuantitativas, consiste er¡
cuantiñca¡ esta posible relación. En el diagrama de dispersió¡ vemos que una variable aümenta ¿l
aumenta¡ la otra, porque la nube crece diagonalmente hecia la de¡echa. Si deqeciese hacia la derecha,
una variable disminui¡ia cuando aume¡tase la otra. Para cua¡tifica¡ est¿ tendencia diagonal crecie¡te
1r -l ¡ x (y, -
r )
P=t
n
l. Sus unialadesl por ser un p¡oducto de variables' tiene unidades cuadráticas' las
'los
unid¿des en las que se midan cada una de l¿s dos variables'
drx oy
.x" e "y".
p = Cova¡ianza de las va¡iables
89
*'1'Fr'calhflow-oposiciones'com
C/M"ttt"*. r0 J8006 MADRD - Tf";91 309 36 46 -
CQ CASH FLOI'I' ESTADISTICA
- C¡¡ece da u¡id¿d.s.
Sólo es apliaabl€ cu¿¡¡do le relación entc las vari¿bles es li¡€¿I.
¡: Iucrza dc l¿ asociación enhe 2 variables.
El ooefioientc de co¡¡elació¡ de Pe¡¡so¡ oomprucbB hipót$i6 dc carel¿ción entre dos variables,
siernpre que su valor sca significativarneltc mayor do 0 para rcchazar Ho.
r;ñ-l
F-;'-1
...,. .'J '-
,+is
i.'¡ii i.
Una vez calculado el Coeficiente de Co¡relación entre dos variables cuantitativas, Podamos calcular Ia
recta que mejot define esa nube de puntos. El fiétodo que se utiliz¿ Pa¡a ello se denomita de
Mlnimos Cu¡dredos: coD este método se pretende, a partir de la nube de dispersión que compone
una muestr4 encontra¡ la recta que mejor se ajuste por toda la serie de püntos. Esto se traduce en
busca¡ la ¡ecta qDe haga minima ia süma de desajustes, los cu¿les se elevan al cuadrado pa¡a evita¡
qüe estas diferenci¿s pueda[ contrarestarse de forma engañosa en función del signo que las
acompañe (al elevar las dife¡encias al cuadrado tendián siernpre signo Positivo, y así se previene este
posible efecto). De esta úane¡a, cuando la suma de.todos los cuadrados sea mínima, la recta que lo
consiga será la que buscarnos.
Es una p¡ueba estadistica que permite analiz¿¡ si el ajuste lineal de una nub€ de puntos, o diag¡ama de
dispersión, es o Ío adecuado. Es decil si la sustitución de la rlube Por una recta de ¡eg¡esión es co¡rect¿
Sabemos quo existen posibilidades de ajuste m¡is adecuadas pa¡a muchos fenómenos biológicos que no
son líneas rectas sino curyas de los m¡ás diversos tipos. ta determinación de un indice especial,
denominado razi¡ de correlación pe¡mite obtener una conclusión acerca de la bondad de u¡ ajusle
rectilineo sustitutivo del fenómeno estudiado.
3. RXGRXSION NO LINEAI.
No siempre estájustificado el i¡tenta¡ sustituir u¡a nube de pl¡ntos, obtenida al estudiar la relación
existente entre dos variables, por una recta que ¡epresenta el fenómeno biológico que se analiza.
Muchos de estos fenómenos no se ajusta¡r a ecr¡aciones li¡eales rectilíneas, sino que sigueD otro tipo
de curvas o ecuaciones ñás o menos complicadas,
Curvá losari¡ñi¿¿:
Cu¡va e¡ponéncial
Y ct€ ciéñ te:
Curvá !rponencial
EI Análisis Multivariante engtoba métodos y técnicas estadísticas qre permiten estudia¡ y t¡atar en
bloque un conjünto de vatiables medidas u observadas e¡¡ una colección de i¡dividuos. Estas variables
podnin ser sólo cua¡titativas, sólo cualitatjvas, o simuhineamente de a¡nbos tipos. Cua¡do el
investigado¡ se enfienta con la realidad de un estudio, dispone habitualmente de muchas va¡iables
medidas u observadas en u¡a colección de individuos. Si pretende estudia¡las conjuntamente, debe
acudir al Alrálisis Multivarja¡te. A¡te la diversidad de técnicas existentes, debe selecciona¡ la más
adecuada para los datos que maneja pero, sobre todo, Ia tec¡¡ica elegida dependená de su objetivo
cienlfico.
Si a todas las variables con las que se fabaja se les asigna u¡a impo¡iancia equivalente, es decir, si
¡inguna de ellas se destaca como dependjente principal en el objetivo de Ia investigación, para su
trat¿miento en bloqüe se pueden utilizar las de¡ominadas TÉCMCAS MULTTVARL{NTES
DESCRIPTfVAS. Estas técnicas pueden tener dos orientaciones dife¡enles:
- Por una pafe, pe¡miteri .REDUC1.,R la din¡ensión de una tabla de datos €xcesivarnente grande
por el elevado núme¡o de variables que contienel y pemite al investigador fabaja¡ con unas
cua¡tas variables "fioticlas" que, aunque no observadas, sea¡ combinación de las reales y
sinteticen la mayor paft€ de la información contenida e¡ sus datos. En este caso se debe
lener en cüenta el Iipo de variables que maneja:
- ANÁLISIS DE CORRXSPONDENCIAS.
Si no fuera científicamente aceptab¡e una importancia equivalente en las varjables que se marejan,
po¡que una de ellas se dest¿c¿ra corno dependie¡te principal en el objetivo de la investigación, se
deberán utiliz¡' TÉCMCAS MULTIVARIANTES ANALÍTICAS o INFERXNCIALES,
considera¡¡do la variable dependiente mmo va¡iable "explicada" por las demás independientes
"erplicativas", y tratando de RELACIONAR todas ellas por medio de una posible ecuación que las
Iigue.
Si todas las variables son cuantitativas, el método el€gido debe ser REGR¡SIóN
LINEAI-. Una vez configurado el modelo ñatemático, éste podrá llegar a PREDECIR el
valor q¡¡e en la va¡iable dependiente p¡esenta¡ia un nuevo individuo cua¡do se conociera el
perfil de todas las demás.
Si la va¡iable dependiente fue¡a cualitafiva dicotómica, ésta podrá se¡ utilizada como
"clasificadora", estudia¡do su ¡elación con el resto de va¡iables "clásificaliva-s" a t¡avés de
una ecuación d€ REGRESIóN LOGISTICA que, adenás de ac€pta¡ conjuntamente
variables cuálitativas y cuantitatjvas, presenta import¿ntes propiedades epidemiológicas.
1. RXDUCIR
Combinar las va ables observadas para obtener escas¿s yariables ficticias que representen casi Ia misma
información:
Regresión Lineal.
_ - Regresión Logístrca.
A¡álisis Discriminante.
- 2. CLASIFICAR
_
Analizar las relacioües ente variables pa¡a ve¡ si se pueden sepa¡ar los individuos en agrupaciones
a
port".iori por ellos m;smos definidas:
-
A¡álisis de Clusrers.
-
A¡te gruPos re¿les comprobados a priori, diseñar modelos, co¡struidos con las variables
observadas,
capaoes de asignar individuos al gn¡po más probable:
- Reg¡esión Logística.
3. RELACIONAR.
Reunir las variables en ecuaciones combinadas que valoren ¡o mejor posible el ,,peso,,de
cada una en la
explicación de ofta depe¡dientel
-
- Regresión Lineal.
- Reg¡esión Logística.
A¡álisis de Cor¡€spondencias.
4. PREDECIR.
- Regresión Lineal.
- Reg¡€sión lpglstica"
- A¡álisisDiscriúina¡¡to
El a¡¡álisis d9 ls supervivcncia colgtituyc u¡a llne¿ metodológica quc engloba diversas técnicrs
osú¡dísticas que p€rmiton:
1. Obto¡€¡ de un¿ muesha ir€gula¡, d¡los relativos a la p'robabilidad de sobreviür a lo largo del
tiempo ¿ntc la prcsolsia de u!¿ deteF¡inada enfcrmcdad.
Estimar tasas do supervivcucia.
3. Poder compa¡a¡ oon seguridad estsdlstica l¿ cfic¡cia do distiÍos t¡at¿mientos gobre dicha
supe¡vivencia-
Entre los diferentes ñ¿todos qüe permite¡¡ snaliz¡¡ taras d€ süpewivcnci¡, sc encuent¡¡m:
- Máodo directo.
- Méodo del producto o de l&plan-Meicr.
- M&odo aefi¡arial.
Los dos rlltimo$ méfodos se b¡¡aq e¡ el oálculo dc probabilidades oondicionad¡s, Las pn¡ebas
estadfsticas que se utiliz¡¡ pa¡a la comparación de grupos en el ¡nólisis de supervivéncia son:
El lest de Cox-Mantel.
El tost de Log-R¿nk.
EJERCIüO
'
Estado civil: cualitativa nomi¡al.
Nivel dc tensió¡ arte¡ial: cuantitativa continua.
Hipertensió¡ dterial medido como hiportenso o no hipertenso:
cualitatjva bina¡ia.
Niveles de glucemia: cua¡tit¿tiva continu¿.
Núme¡o de pecientes fuittadores: cuantitativa discret¿.
Hábito de bebcr (no, moderado, impo¡tante): cualitativa
Dominal.
ETERCICIO 2
2+ 1 7+ 12 + 3+ j+ B+ I 2+ 3 +2 + g+ I 2
Media :
11
EIERCICIO 3
0,2,3,3,4,5,6,7,8,9
EJERCICIO 1
Moda= 3
EJENüCIO
'
Medíana: ti otdendmos los datos en orde¡ crecien e: S, 6, 7, 7, g, g, g, g,
10, l0, 10, lO, I I. Colro se
trata de ú1fttimerc iñpú de datos la mediana
co¡ncAir¿ il crnt"á, i"r' t"-r*Or*. _ A.
"on ",
Moda = t 0, gue es el valor que tiene mát
Íecuencia
Cua,til pr¡ñefo: es la medlaúa de la semiseríe
de la izquierdd en que la mediana divüe a Ia serie
datos dada. de
6+7
nt= _..
2
-
q Mor¡t ¡., 20 - 28006 MADRD@ 99
@ GASII FLOllt ESTADiSTICA
10+ 10
e3- =10
-
Re c oft ido int elcuar t íI ic o = a3 - 81= 10- 6,5- 3,s
EJERCICIO 6
Media= 3,25
Vúialta= 0,19
HZBEISIQJ
Pard con lratd esto lo idóneo es utilizat ¿l coefciente d¿ vari@iti,tt de ?eartoñ, deforña qu:
'tás
o
CV p¿so= x 100 =16,53 a lot 3 años
-
6
CY peso- x 100 =11,00 a las 15 tños
¡ -
o
cy t4 a--x100=1,71 a los 3 años
x
o
CV tdlla =.-.-- x 100 = 1,00 d las 15 años
Se ptede comprob* coño el Wso es ¡ñás ratiable que la talla tdn o a lor 3 @xos (16,53>1,71) cdno
a los 15 años (11>4).1los 3 úot lot paárrEttos soñ t rh t'@iables.
EftNqCIO E
El 997¡ de los psciertg est¿r¡ ertre 36,8 +/- 2,6x0¡= 35,5 y 38,1"C.
tr*€f *O{
100
cy Monte¡& 20 - 28006 MADRID - TfDo: 91 309 36 46 - wwtd,c¡shflot-oPosiclo¡cr'corñ