Sei sulla pagina 1di 116

A-PDF Image To PDF Demo. Purchase from www.A-PDF.

com to remove the watermark

'

nclitivnn skala Svaka > skala (opazanja ili/i mjerenja) na kojoj je nume-
rickc vrijcunosti opravdano podvrgnuti aritmetickoj operaciji zbrajanja.
Takve su, primjerice, > intervalna skala i > omjema skala, aline i > no-
minalna skala ili > ordinalna skala. K

• • an.rmativna hip'oteza > direktivna hipoteza

alfanumericki niz Svaki niz koji za oznacavanje necega koristi isto-


.i

dobno slova i brojeve. K

alfa i beta pogreske > pogreska tipa 1 i tipa 2

algoritam Niz tocno definiranih pravila za (racunsko) rjesavanje nekog


I
I
problema uz pomoc odredenog broja operacija ("koraka"), pa je zato
' •

svojedobno izraz bio koristen ka·o sinonim za formulu. Danas se pojam


opcenito koristi u znacenju svakog "korak po korak" postupka za rjesa-
vanje nekog problema, kao npr. "korak po korak" postupka za pro-

vodenje racuna analize varijance. Naziva se prema arapskom matema-
ticaru iz IX. stoljeca Al-Khwarizmi. P

alijenacije, koeficijent > koeficijent alijenacije


- . .. - - . . .. . ... . .. .
' . -;< "'
I
-------------------------------------,--·------------------------------------------------·E~

...12.. .. _..
~ , ___ A --HIPOTEZA
__ .. -----· -·-·---- ALTERN A TIVN' -
-...:::::.::..:--~· ·--· -'-"-=;_:_
----· - -~--=...:.-- - -·=-=---------
ANALIZA VARIJANCE
l'
ultcrnativna hipotcza Hipoteza, koja je suprotna > nul-hipotezi, tj. hi- gijsko istr3Zivanje organizira u tzv. prirodnim (nelaboratorijskint )
poteza koja predstavlja alternativu hipotezi kojaje podvrgnuta provjeri uvjetirna u kojima je tesko provediv slucajan odabir ispitanika iii ispit a
(> testiranje hipoteze, > nul-hipoteza). Na prirnjer, ako bi nul-hipoteza. nici nisu izjednaceni po tzv. relevantnim faktorirna. Tako npr. ako bi
glasila "pogadanje ovog parapsihologa ne odstupa statisticki znacajno ispitavala djelotvornost dvije metode poducavanja u stvarnim skolsk illl
od slucajnog pogadanja", pa nam obrada rezultata pokaze da nul--hipo- prilikama, bilo hi zbog prakticnih razloga najjednostavnije uzeti dva {t it
tezu moramo odbaciti, prihvacamo alternativnu hipotezu, tj. njegovo vise) postojeca skolska razreda kao dvije sku pine ispitanika ina svakom
pogadanjeodstupa od slucajnog pogadanja. Nozasto odstupa, to vise ne- od njih primijeniti jednu metodu poducavanja. Medutim, ako se dogodt
ma veze s alternativnom hipotezom. Drugim rijecima, ako smo nul-hi- da se ucenici u ta dva razreda razlikuju po inteligenciji, o kojoj cc ta
potezu formuliiali u obliku "ne postoji ekstrasenzorna percepdja", koder ovisiti rezultati poducavanja, onda zakljucci o eventualnim ra~ lt
onda odbacivanje nul-hipoteze nika1:o ne znaci prihvacanje alternativ- kama u brzini kojom je nauccna ista kolicina gradiva, prezentirana jr' I
ne hipoteze u obliku "ekstrasenzoma percepcija postoji". Neki statisti- nom iii drugom rnetodorn, necc biti valjani. Buduci da > kovarijllllt•l
cari alternativnu hipotezu nazivaj1.l i > direktivna hipoteza. P ukazuje na stupanj kovariranja dvije varijable, moguce je > sume kvad
rata u zavisnoj varijabli s pomocu kornponenata kovarijance stattst i kl

analiza cestica Statisticka analiza elementarnih dijelova (cestica) psi- kontrolirati s obzirom na eksperimentalno nekontroliranu varijablu. Nn
hologijskog mjernog instrumenta (testa, upitnika itd.). U angloameric- cfekte tc statisticke kontrole utjece velicina kore!acije izmedu nekon
koj se literaturi upotrebljava izraz item analysis. Obicno se sastoji u troliranc i zavisne varijablc (efekt se potpuno gubi aka je korelal'ij
odredivanju tefine zadataka izrazene postotkom tocno rijesenih zada- nu!a ), ali utjcce i veliCina razlika izrnedu sku pin a ispitanika u nekont ru
taka iii odgovora odredenog tipa u upitniku i odredivanju tzv. indeksa liranoj varijabli kao i veliCina razlika u zavisnoj varijabli. K
diskriminativne valjanosti, kojim st.: ustanovljujc koliko ncki zadatak u
testu uspjesno diferencira skupinu boljih od skupine slabijih ispitanika analiza tJ·cnda Statisticka analiza serijc podataka (dobivenih sukcc 1
po ukupnom rezultatu u testu odnosno koliko neki odgovor u upitniku nim opazanjcrn iii rnjcrenjern) kojoj je cilj utvrditi: (a) slijede li sukcc lv
diferencira dvije skupine koje se razlikuju po ispitivanorn svojstvu. Taj ne promjene prikupljenih podataka pravocrtni (linearni) iii zakrivlj
se indeks izraZava > koeficijentom kore/acije, koji pokazuje stupanj po- (nelinearni iii kurvilin.earni) tijek; ako slijede pravac, utvrduje se i nj
,. • vezanosti svake posebne cestice i ulrupnog rezultata u testu (iii upit- gov nagib odnosno strrnina, a ako su nelinearne, utvrduje se tip
niku). Mogu se odredivati i drugi statisticki pokazatelji kao sto su, prim- ljcnosti (primjcrice odgovara li krivulja kvadratnoj iii nekoj drugoj fu
jerice, interkorelacije medu svim eesticama rnjernog instrumenta, koje ciji); i (b) imaju li dvijc krivulje (iii vise njih) podjednak iii razlicit tijck
ukazuju na nutarnju strukturu mjernog instrumenta ili korelacije poje-

srnjer. Postoji vise razliCitih statistickih (matematickih) postupaka
dinih cestica s nekom drugom, izvan1skom varijablom. K se koriste u analizi trenda. Analiza trenda omogucuje > ekstrapo/11
• na temelju dobivenih podataka u nekom istrazivanju. K
analiza kovarijance Statisticki postupak koji predstavlja ekstenziju >
ana/ize varijance na slucajeve u kojima nije bilo moguce eksperimental- analiza varijancc (U literaturi na engl. jeziku ohicno se rabi akro
nim postupkom kontrolirati faktor (ili faktore) zbog kojih se sku pine is- ANOVA, od analysis of variance, a u hrvatskom mogla hi se
pitanika u eksperirnentu medusobn<_t razlikuju, a koji su u korclaciji sa kratica ANVA). Statisticki paramctrijski postupak kojim se
zavisnom varijablom. Takvi se slucajevi javljaju pretdno kad sc psihnlo- pbstoji 1i statisticki znacajna razlika izmedu vi~e skupina rezultat
14 ANALIZA VARIJANCE APSOLUTNA VRIJEDNOST
. ' 15
statisticki znacajno ), tocnijc, izmedu vetcg broja aritrncti~kih sredina. ljaju aproksimacijc. Pri tome "ne~to drugo" (skup matematickih iii dru-
Temelji se na procesu odluCivanja koliko od ukupnog (totalnog) varira- gih simhola) rcprczcntira "nc~to" (promjcne pojave koja se istraZt1je) uz
nja individualnih rczultata otpada na sistcrnatski uzrok (utjecaj razli6- ~~~ctpost~vku da to "ne~to drugo" predstavlja dovoljno dobru i upotreb-

tih vrijednosti nezavisne varijablc ), a koliko na slucajnc, akcidcntalne lJIVU zamJcnu. Aproksimacijom se, medutim, nikada ne reproduciraju
faktore koji se nazivaju faktorima "pogreske" i koji sene mogu pripisati sve osobitosti osnovnih podataka. Primjerice, srednjom vrijedno~cu ra-
poznatom sistematskom uzroku. Moze se razlikovati > jednostavna zreda rezultata grupiranih u razrede aproksimiramo rezultate koji se
'1' analizavarijance (JANV A) i >slozenaanalizavarijance (SANVA). K nalaze u nekom razredu. Time smo, dakako, zanemarili neke karakteri-
stike rezultata (npr. mcdusobnu razliku rezultata koji spadaju u isti
\ anketa Provodenje ankete (u engl. govornom podrucju koristi se termin razr:d), ~li, s druge strane, u nekim slucajevima to pojednostavlienje
. survey, sto znaci prcgled, izvjestaj, procjenjivanje, anketa, nacrt, plan olak~ava 1~brza~a daljnju statisticku obradu rezultata i, ~to je v<lZnije,
itd.) usko je povezano s koristenjem statistike ito dvojako: pri odabira- olaksava OJihovu mterpretaciju,jer se cesto aproksimacijom odstranjuju
nju uzorka i pri obradi dobivenih podataka. Anketa je, govoreCi opceni- ·akce.~orne znac~jke re~ltata. No, aproksimacija je valjana samo ako je
I to, postupak odredivanja odredenih znacajki i njihove vaznosti na jedi- poshgnuta zamJena koJa ne unosi bitne izmjene u strukturu i smisao ori-
I nicama neke cjeline. Primjena ankete (upitnika i/ili testova) omogucuje gin~inih r~z~!t~ta. Zbog toga se, kad god je to moguce, egzaktno, s po-
zakljucivanje o naravi ispitivanog prcdmcta i omogucujc kvantifikaciju m~cu s~ahst1c~th ~est~:'a provjerava, primjerice, pristaje li neka empirij-
rezultata u obliku procjcne (> procjena parametara) o ponasanju (od- s.kl U.Oi:IVCn~l diStrtbUCIJCI liZ distribuciju-model kojom ce se aproksimira-
govorima) svih statistickihjedinica (koje cine populaciju) ito uz poda- tt ongmalnt rezultati. K
tak o granicama nesigurnosti (ili sigurnosti) procjenc s odredenom
apscisa Horizontalna os (osx) u > koordinatnom sustavu. K
(odabranom) vjerojatnoscu. Te su gran icc ncsigurnosti uzrokovane ma-
lim, slucajnim (akcidentalnim) i mcdusobno nezavisnim varijacijama apsolutna nul a Potpuna stvarna odsutnost pojave koja je predmet mje-
svih vrsta: varijabilitetom medu jcdinicama (ispitanicima, skupinama rcnja (> omjerna skala). K
,_ ispitanika iii predmeta ili drugih statistickih jedinica), varijabilitetum u
primjeni upitnika ili testa, u kodiranju i dekodiranju odgovora ispitani- ~~so~~tn~. procje~a (engl. absolute rating) Procjena neke velicine (veli-
ka itd. Rezultati anketc mogu se podvrgnuti u nacelu svim univarija- cmc 111 vriJednosti podrazaja) ucinjena bez izravne usporcdbe s nekom
tnim, bivar~jatnim i multivarijatnim statistickim postupcima. K drugom vciicinom ili drugim podrazajima. K

. ap.solutna skala > omjema skala. P


ANOVA >analiza varijance

aps?lutna vrijednost (apsolutni rezultat) Numericka vrijednost bez


ANVA > analiza varijance
ob~1ra na ~redznak, pozitivan iii negativan. Npr. apsolutne vrijednosti
• -3 1+3 SUJednake, tj. 3. Obicno se s pomocu ravnih zagrada oznacuje da
aproksimacija Znaci pribliznost, priblizna vrijednost, odredivanje pri-
se u r~cun uzimaju apsolutne vrijednosti. Primjerice, ako je napisano
bliznih- jednostavnih iii slozenih- velicina. Doiazi od latinskih rijeci ad,
~ IX- M I, onda to znaCi da treba zbrojiti razlike izmedu X i M bez ob-
sto znaci kiproximus, sto znaCi najhlizi. Statistika (kau uostalum znanost zira n,t njihov smjer, tj. bcz obzira imaju Ii negativni iii pozitivni pred-
uopce) temeiji se na matematickim modelima koji u osnovi predstav- znak. K

'
- - ---
~
16=--
· ___
· · _ _._...::...A:::.R.:::B:..:.ITR
.=.c:..::.AR
:c..::::.c::::..c
NO_~QNDERIRA~~ ----· ____ . ___ ____ ATENUACIJA KOEFfCIJENATA KORELACIJE II
. -· · -- -
-
---~ -----

I arbitrarno ponderiranje > ponderiranje. asocijacija (u statistici) (lat. rijecassociatio znaci udruzivanje, spajanjl·,
savez, pridruzivanje) Upotrebljava se kada se opcenito govori o pow
area uzorak > klaster uzorak zanosti medu varijablama, a odnosi se na hilo koju statisticku vri"
koja pokazuje neku povezanost (ili pomanjkanje povezanosti) mcll11
aritmeticka sredina Jedna od > sredisnjih vrijednosti koje se koriste u
varijablarria, primjerice > koeficijent korelacije, > regresij"sku analiz.t'.
'
statistici, a koja se odreduje taka da se sve vrijednostiu nekom skupu re- v

Cesce se koristi kad se govori o kvalitativnim aspektima povezanosti th


zultata zbroje i taj zbroj podijeli ukupnim brojem rczultata:
. samo o pretpostavljenoj povezanosti medu varijablama. Neki statisti a
LX
M==-- ri termin asocijacija upotrebljavaju umjesto termina korelacija kad go
N vorc o povezanosti medu varijahlama koje nisu izrazenc kvantitativni111
(gdje jeM- od engl. rijeci mean- aritmeticka srcdina, oznaka za zhroj, (mjcr<::nim) vrijcdnostima, ncgo su izrazcne s pomocu kvalitativruh
X svaki pojedini rezultat, aN ukupan broj rczultata )~ Algeharski zhroj_ katt.:gorija. Postoji i > koejccijent asocijacije. K
dstu anja eojedinacnih rezultata od aritmeticke sredine jednakje nuli,
a zbroj kvadrata tih odstu an· a manji je od zbroja kvadrata od~tu an· a atenuacija koeficijenta korelacije (lat. attenuare znaci oslabiti) Smanjl'
r- -
od bilo koje druge vrijednosti u odredenom skilpu rezultata (bez obzira nje koeficijcnta korelacije zbog nepouzdanosti mjerenja (netocnosti od
na oblik njihove oistri ucije ). Aritmeticku sredinu koja ima smisao naj-
- v

nosno pogrcskc pri mjcrenju) pojcdinih varijabli. Sto je mjerenje uc.inj r


'
bolje reprezentativne vrijednosti nij~ opravdano racunati ako distrihu- nos vise pogrcsaka, to rczultati mjercnja sadrzc vcCi dio (vecu varijan
cija rezultata nije barem priblizno normalna (> normalna distribucija). cu) razlicitih slucajnih varijabli, pa je zbog toga i izracunati koeficijcnt
Aritmeticka se sredina koristi i u slozenijim statisticko-matematickim korelacije mcdu varijablama smanjen (koeficijent korelacije medu
postupcima abrade rezultata. Koristenje aritmetickc srcdinc u statistici
~
slucajnim varijablama jcdnak jc nuli). > Korekcijom zbog atenuuci;,•
9pravdano j.e .s.am su rezultati u skladu s modelom: svaki rczulta t mol.t.: st.: dohili kodicijt.:nl korelacijt.: koji pretlstavlja procjenu kon:lacije
1Pjere nj a r ezul.tan tnaj e vrij~d nos t_d.~jt::-
: k~w~a:::-n:~ja-;::-;;k-:
o;;ns~·t;::an tn::-:i::-:
h-;f<'=lk":'tt:o£n:::"1~(p~r....,a_­ izmcdu odrcdenih varijahli, kad hi mjcrenje tih varijabli bilo potpuno
77
ya vrijednostmjeren.@)l_nesistemat'iki vari_jaQ_ilf!.ih faktora (svih faktora pouzdano. K
-:--....:-...-:-~~---
koji pri mjerenju djeluiu po sluca,hk). Oznake (simboli) za antmeticku
sredinu nazalost su dosta razlicite u raznim udzbenicima: A.S., M, X, x
- -
i st. K

aritmeticka sredina, prava > "prava" aritmeticka sredina (i "prava"


I •• standardna devijacija)
I
asimetricna distribucija Svaka distribucija rezultata koja nije simetric-
na (> simetricna distribucija), tj. kod koje se glavnina rezultata grupira
vise prema lijevoj ili desnoj strani raspona dobivenih rezultata. Stupanj
asimetricnosti moze se odrediti s pomocu > indeksa asimetrije. > Mo-
ment (treceg reda) takoder pokazuje stupanj asimctrijc neke dislrihu-

cije . .P
'
'
'
'
,'
I
'
·----· BA YESO_Y._TRI NCII~@_!\YESOVA VJEROJ ATNOST) 19


kojim ih jc 10 s tamnom kosom. Kojajc vjcrojatnost da cemo po slucaju
izahrati iz sobc osohu koja cc biti muskarac? To je naravno lake rijesiti:
vjcrojatnost iznosi 0,5 Ucr ima jcdnako muskaraca i zena). No ako
• .. ' j •
doznamo da izabrana osoba, koju jos nismo vidjeli, ima tamnu kosu,
vjerojatnost da je ta osoba muskarac sada je veca od 0,5.

1/2 1/2

'"

Baycsov postulat Ncpoznatc vjcrojatnosti mcdusohno iskljucivih doga- 7/10 8/10 Vjerojatnost da ccmo izmedu 50 muska-
daja ne smiju sc smatrati jcdnakima, a ccsto u zivotu cinimo lu pogrd- raca (od kojih .15 imaju tamnu kosu) i 50
zcna (od kojih jc 10 s tamnom kosom)
ku. Primjcr: aka imamo 3 novcica, od kojih jc jcdan ispravan (daklc slucajnim izhorom "izvuci" tamnokosog
saddi "glavu" i "pismo"), drugi na obje strane ima samo "glavu", a trcCi 50 mu§karaca 50 tena mu~karca iznosi 0,60 ( > Bayesov princip ).
'" na obje stranc samo "pismo", pa iz scsira izvuccmo jed an novCic koji na
.
jcdnoj strani ima "glavu"i zclimo pogoditi sto mu jc na drugoj strani, Racunski sc tocna vjcrojatnost izracunava ovako: vjcrojatnost da iz-
skloni smo kazati da je 50% vjerojatno da je na drugoj strani "pismo". mcuu svih 100 osoba slucajno izaberemo tamnokosog muskarca iznosi
To zakljucujemo zato sto smo iskljuCili iz daljnjc kombinacijc novCic 0,5 X 0,3 = 0,15, dok vjcrojatnost da je to zena iznosi 0,5 X 0,2 = 0,10.
"pismo" -"pismo", pa znamo da.izvuceni novCic moze biti jcdino "gla- Dakle, vjerojatnost da je tamnokosa osoba, koju smo slucajno izabrali,
va" -"glava" iii "glava" -"pismo", i pogrcsno smatramo da za svaku od ovih ujcdn9 i muskarac, iznosi:
mogucnosti (jcr su samo dvijc!) postojijcdnaka vjerojatnost, daklc 50%
, -50%. Ustvari, vjcrojatnostjc oko 6G% dajc novcic "glava"-"glava", a 0,15 = o·oo
oko 34% da je novCic "glava"- "pismo". Baycsov postulat treba razliko- 0,15+ 0,10 '
vati od > Bayesova principa, koji se odnosi na promjenu vjerojatnosti u
vezi s novim informacijama. P 2. primjer: Pretpostavimo da zelimo odluCiti moze 1i jedan zatvorcnik
! biti pusten na uvjetnu slobodu. Dosadasnje iskustvo pokazuje da je
!
• Uayesov princip (Uaycsova vjcrojatnost) Takvo izracunavanjc vjerojat-

takva praksa bila u 40% slucajeva uspjesna, tj. zatvorenik se socijalizirao
nosti nekog slucajnog ishoda, koje sc mijenja pod utjccajcm novih iii do- i nijc upadao vise u kriminal. Mozemo li poboljsati prognozu ako dozna-
datnih informacija. mo da 80% uvjctno otpustenih uspijeva aka su ozenjeni, dok medu
1. primjer (vidi sliku ): Pretpostavimo da se u nekoj prostoriji nalazi 50 neozenjenima uspijeva samo 30%. Uz pomoc te nove informacije, aka je
muskaraca, nd kojih p<.:tnacstorica imaju lamnu kosu, i 50 zcna, mcclu nas kandidat ozcnjen, racun izgleda ovako:
'

...


22 BIMODALNJ\ DISTRIBUCIJA BINOMNI POUCAK 23
·-------------------=~~~~~~~~----------------~

graficki prikaz simctricne bimodalne distribucije (A) i asimctricnc hi- teorijsku osnovu za odredivanjevjerojatnosti ishoda nekih dogadaja, sto
modalne distribucijc (B). Bimodalna distribucija pokazujc da su pri u statistici slufi za usporedbu s dobivenim vrijednostima pri nekom

_!.lljerenju uklj,uccni ispjtanici ko.ii UQ udgUYara· u ·cdnoznacno i precizm1 mjcrcnju ili opazanju. Uzmimo da sup i q dva medusobno nezavisna i
definiranoj > statistickojj edinici (uzorci · ada· u 'stu isk1juCiva ishoda nekog dogadaja, da je vjerojatnost svakog oct njih 0,5
••
s iju) ilisva mje en·a ni b ~jena . ujedn: (p+q moraju iscrpljivati sve moguce ishode, tj. mora bitip+q=l) te da
EI.ieren·u · oso ednom ispita:niku _(primjerice, u drugom tih dogadaja ima n, onda binom i:z;gleda ovako: (p+q)n. Opec pravilo za
dj$ln od nekoliko_desdaka.mjerenja na w.yltat~_ mjerenja djelovao jc razvijanje binoma jest:
umor is ita · ·) (> vi.~emodalna distribucija). Medutim, postoje i sluca-
jcvi stvarne himodalnc distrihucijc, kao npr. promjcr srca. K

(A) (B)

'
Zamislimo si da bacamo kovani novCic, a ishod tog bacanja moze biti ili
"pismo" iii "glava" s vjcrojatnoscu oct 0,5 za "pismo" kao i 0,5 za "glavu".
L.:::::::_ _______\_._
L...::::----- - - - - - -· - - - - -- · - ... Ako istodobno bacimo dva novcica, onda sc vjerojatnost pojedinih is-
Primjcr simctricne (A) i asimetricnc (B) bimodalnc distribucije . hoda moze dobiti razvijanjem binoma (p+q)n, gdje je p vjerojatnost da

ce se pojaviti "pismo", q dace se pojaviti "glava", a n je broj dogadaja,


tj. broj novCica.

Dakle:
binomna distribucija Naziva sc-i Bcrnoullijcva, po njezinu autoru. Dis-
tribucija frekvencija koja pokazuje vjerojatnost dogadanja mcdusobno
iskljucivih dogadaja za svaki broj slucajeva posebno. Primjerice, ako je
novCic bacen 6 puta, binomna distribucija reCi ce nam kolikaje svaki put iii
vjerojatnost pojavljivanja "glavc" ("pismo" i "glava" su mcdusohno is-
kljucivi dogadaji, jcr se na jed nom novCicu kad jc haccn mozc pojaviti iii 2 2
(0,5+ 0,5/ = 0,5 + 2. 0,5. 0,5+ 0,5 = 0,25+ 0,5+ 0,25,
"pismo" iii "glava" (> binomni poucak). Ako postoji dovoljno vclik broj
takvih dogadaja (iii tocnije receno, sto je broj tih dogadaja veCi), binom- sto znaci dace se u dvadeset pet posto slucajeva pojaviti "pismo" na oba
na distribucija predstavlja prihvatljivu aproksimaciju > normalne distri- novcica, u pedeset posto slucajeva pojavit ce se "pismo" i "glava" istodo-
bucije. K bno i u dvadeset pet posto slucajeva pojavit ce se "glava" na oba novcica.
Ako sto put a bacimo dva kovana.novCica, teoretski "pismo" ce se na oba
binomni poucak Term in binom dolazi od Jatinskog e.x-binis nominibus, novCica pojaviti dvadesct pet puta, koliko i "glava" na oba novcica, ana
stu znaci iz dvije oznake, a upotrebljava se za matematicki izraz koji sc jed nom novCicu okrenut ce se "pismo", dok se istodobno na drug om
sastoji od dvije velicine koje su povezane znakom "+"iii znakom "-": okrcnula "glava" u pedeset slucajeva od sto bacanja ta dva novcica. Ako
p +q iii p-q iii 7 + 3 iii 7-3 it d. Binomni poucakje pravilo prema kojemu se vjerojatnost moguCih ishoda izrazimo s pomocu razlomka (a ne dcci-
potencija binoma, tj. (p+q)n, razvija. Razvijanje binomnog poucka daje malnim brojem), mozemo razvijanjem binoma dobiti minimalni broj ba-

'
~---- ·--------------------------------
'•

- '
BISERIJALNI KOEHCIJENT

KORELACIJE 25
=-24.:.___·__• '_· ---~B::!:IN~OM::.!NJ POUCAK ------~~~~~~~:...:...;_::===-=-==------

canja novcica da bi se baremjedanput teoretski ostvarili najmanjc vjcro- > dihotomizirane varijable (ali koja je stvarno, kad hi hila preciznije rnje-
jatni ishodi. Za gornji primjer to bi bilo ovako: rena kontinuirana i normalno distribuirana) i varijable koja je izrazena
' .
rezultatima na kontinuiranoj ljestvici. Primjerice r111 mogao bi se izracu-
nati izmcdu varijahle "uspjeh na ispitu", koja jc izrazena u samo dvije
) kategorij~.:·"prosli", "pali", i varijahle "intelektualni status" izrazene re-
To znaCi da moramo najmanje 4 puta baciti po dva novcica da bismo teo- zultatima u odgovarajucern testu (dakle, na intervalnoj skali). Za varija-
retski harem jedanput dobili "pismo" na oba novCica (25%) i jedanput
' ' hlu "uspjeh na ispitu" moze se opravdano pretpostaviti da je stvarno
"glavu" na oba novCica (25%) i dva puta najednom novcicu "pismo", a kontinuirana kad bi je hilo moguce precizno mjeriti (vee ljestvica skol-
na drug om "glavu" (50% od 4 bacanja ). Kad bismo bacali de set novcica skih ocjena daje veCi hroj vrijednosti) i da ima normalnu distrihuciju.
istodobno (kad bi, dakle, bilo n = 10), morali bismo, teoretski, novcicc Koeficijcnt ru 1 rnoze se izracunati po ovoj formuli:
baciti 1024 puta da bismo jedanput dohili na svih deset "pismo" i jcdan-
put na svih deset "glavu". U gornjojjednadzhi, kako se vidi, u brojniku se MYl -M
· Yt
nalazi hroj ostvarenih ishoda, au nazivniku broj potrebnih dogadaja da s y,
bi se ti ishodi ostvarili - u teoretskom slucaju. Brojevi koji se u gornjoj
jednadzbi pojavljuju na desnoj strani znaka jednakosti ito u brojniku (tj. Upotrijehljcni simboli imaju ovo-znacenjc: My 1 = aritmcticka sredina u
1,2,1) zovu se "hinomni koeficijcn.ti", a mogu se dobiti is pomocu > kontinuiranoj varijabli (Y) onih ispitanika koji se u dihotomiziranoj vari-
Pascalova trokuta. jabli nalaze u kategoriji kojoj je arbitrarno pridijeljena oznaka "1" (u
' U statistici se ovaj "binomni model" iii "model binomne distribu- gornjcm primjcru to bi hili oni koji su "pali"), a ta je kategorija bli:za is-
cije" vrlo cesto koristi za rezultate u dihotomnim varijahlama u kojima hodislu, kad hi hila prikazana u koordinatnom sustavu; My2 = aritmeti-
su podaci tipa tocno-nctocno, musko-zcnsko, zivi-umrli, postoji ncko cka srcJina u konlinuiranoj varijabli (Y) onih ispitanika koji se u dihoto-
ponasanje-ne postoji neko ponasanjc itd. Model sluzi za postavljanje miziranoj varijabli nalaze u kategoriji kojoj je arbitrarno pridijeljena ,
frekvencije ishoda sukladno njihovoj teoretskoj vjerojatnosti (teoretska oznaka "2" (u gornjem primjeru oni koji su "prosli"), a ta je kategorija
vjerojatnost binarnih ishoda moze biti 0,5:0,5, alii bilo kakav drugaCiji dalje od ishodista, kad hi hila prikazana u koordinatnom sustavu; Syu =
odnos) jer se zatim statistickim postupcima testira nul-hipoteza da .se
standardna devijacija ukupnih rezultata (svih ispitanika zajedno) u Y
dobivene frekvencije ne razlikuju od teorijskih (koje su dohivene po
varijabli; p 1= proporcija ispitanika u kategoriji "1" (n 1/N);p2 = propor-
slucaju, tj. nisu pod utjecajem nikakvog sustavnog faktora, npr. ncke
cija ispitanika u kategoriji "2" (niN); v = visina ordinate normalne kri-
nezavisne varijable ).
• vulje u tocki koja dijeli povrsinu normalne krivulje na segment PI i P2· ,
Kad je vjerojatnost binarnog ishoda 0,5 prema 0,5, povecavanjem ••

broja dogadaja dobivena distribucija ishoda priblizava se normalnoj dis- Logika rhi vrlo je jednostavna: ako jeMy2 vece odMy1, to znaci ua is-
tribuciji (> binomna distribucija, > stablo vjerojatnosti, > Pascalov pitanici u kategoriji "2" postizu u prosjeku vece rezultate u varijabli Yod
trokut). K ispitanika iz kategorije "1", i tada postoji pozitivna korelacija izmedu
varijabli izmedu kojih se odreduje stupanj povezanosti (npr. varijable
bisel"ijalni koeficijent korelacije (rb1iii rb 1.) > Koeflcijent serijalne ko- "uspjch na ispitu" i varijablc "intelektualni status"). Ako je My 1 vece od
relacije koji sc upotrebljava za odredivanje stupnja povezanosti izmcdu M y2>. to 6c ukazivati na ncgativnu povezanost medu varijablama, a ako
'
-26 BISERIJALNI KOEFICIJENT KORELACJ_J!!='=--·-----·-·· ------------~B~R~O~JC=AN~A~SKAL~=A~------------~2~7
medu ovim aritmctickim srcdinama nema nikakvc razlikc (iii jc ona varijablc, a maze se takoder vidjeti opCi tip povezanasti, tj. radi lise o li-
slucajna) anda nema ni povezanosti mcdu varijahlama. nearnoj iii nelineranoj korclaciji. K
Pagreska rh 1 je poznata, pa je mogucc provjcriti njczinu statisticku •

znacajnost, alije logicki razumljiv ijednostavniji naCin usporedbom arit- bivarijatna korelacija Korelacija izmedu dvije varijable. K

metickih sredina jedne i druge sku pine ispitanika (My1 iMy2): ako je razli-
biYarijatno Ono sto se odnosi na dvije varijable (istodobno). Taka se
ka medu njima statisticki znacajna, znacajan je i rh;·
govori o > bivarijatnoj distribuciji, > bivarijatnoj korelaciji i sl., za razli-
Za upotreburh1 u daljnjoj elaboraciji nema statistickog opravdanja; ku od > univarijatnog. K
taka primjeriee ovaj kocficijent ne moze se karistiti ni za odrcdivanjc >
lcoeficijenta detenninacije (tj. nc maze ga sc ni kvadrirati). b-koeficijenti > beta ponderi, > regresijski koeficijenti
Ako je patrcbno racunati stupanj pavezanasti izmcdu stvarna di-
hotamne varijable i kantinuirane varijable, onda trcba upatrijcbiti > bodovanje (a) Davanje adredene brojcane vrijednosti svakam pojedi-
point-biserijalni r. K •
nam uspjesno rijesenam zadatku, npr. u nekom testu. U psihologijskim
testovima sposobnosti ili znanja najeesce se svakom rijesenom zadatku
hit (izvedenica ad engl. "binary digit"= dvijc znamenkc) J edinica infor- daje 1 hod, ali hodovi za pajedini zadatak mogu biti i razliciti (sto se
macije kojom dobivamo rczultat izhora izmcdu dvije jcdnako vjcrojatne odrcduje hilo subjcktivnom procjcnam, bilo objektivnijim postupkam
alternative. Ako medu 32 elemcnta treba pogoditi jcdan odredcni cle- izracunavanja tdine pojedinih zadataka), a mogu biti i negativnog pred-

ment, za to namje patrebno 5 bita informacija: prvi bit daje odgavor na znaka (npr. kod takvih odgovora koji- pa misljenu konstruktora testa- ..
pitanje je li element u prvih iii drugih 16; drugi hit odgovarajc li u gornjoj prcdstavljaju "antiznanje", tj. potpuno nerazumijevanje podrucja na
iii donjoj polovici prcostalih 16, trcCi bit odgavaraje li u prvoj iii drugoj kojc se odnosi pitanje. Takvom postupku konstruktor obicna pristupa
palovici preostalih 8, cetvrti bit odgovara jc li u prvoj iii drugoj poloviei kada zeli bodovanje uCiniti slicnim svom nacinu ocjenjivanja na usme-
preostalih 4, i peti bit odgovara koji je element ad preostala 2. Matcma- nom ispitu, gdje je sklan kaznjavati besmislene odgovore.) Ukupni broj
ticki, bitje eksponent broja 2, kojim se dobiva ukupni broj mogucnosti: taka pastignutih bad ova naziva se > bruto rezultat. (b) Bodovanje moze
25 = 32. p znaciti i davanje ncke vrijednosti odrcdenom postignutom rezultatu u
nekoj disciplini: npr. u sportu odredeni rczultat u nekaj disciplini dobiva
bivarijatna distribuc~ja (U hrvatskom hi se mogao rabiti i izraz tahlica odrcdcni broj bodava, osnovan na > bazdarenju rezultata tc discipline
• korelacije) Distribucija frekvencija vezanih parova rezultata dabivenih (> skale bazdarenja, interpretacije i usporedivanja rezultata). P ·
pri opazanju ili mjerenju dviju varijabli. Najcesce se koristi pri racuna-
nju korelacije (npr. pavezanost izmedu tjelesne visine i tjelesne tdine, brojcana skala Slijed brojeva ureden prema nekom odnosu medu bra-
,.
vidi slike) odnosno u regresijskoj statistickaj analizi ( > regresija, > crta jevima. Tako npr. linearni niz brojeva (iii linearna skala) je svaki onaj
regresije, korelacija, > tablica korelacijc). U psihalogiji sc dobiva pri slijed brojeva u kojemu su brojevi na skali medusobno udaljeni za istu
apazanju ili mjerenju dvijc varijable na istim ispitanicima iii pri hrajcanu vrijednost. Najcesca takva linearna skala je prirodni niz bro-
-
ponovljenam mjercnju iste varijable na istim ispitanicima. Vizualnom jeva:, ali to moze biti, primjerice, i avakva skala: 5, 10, 15, 20, 25 itd.
inspekcijom bivarijatne distribucije magu se uociti eventualne razlike u VrijeJnosti na linearnoj skali, dakle, rastu (ili padaju) za neki konstan tni
stupnju pavczanasti na razlicitim rezultatskim razinama jedne i drugc faktor.
..
'

- ' •• 1'
' .

••

:~r. \'

'
- ~'-------~B~R~O~J~C~AN~A~S~KALA~~-~--- _ _ BRUTO REZULTAT 29

••
Brojcane vrijednosti na nelinearnim skalama ili nelinearnom nizu kvadrat test, koji se maze upotrijebiti kako za testiranje povezanosti
brojeva medusobno se razlikuju za razlicite brojcane vrijednosti na medu varijablama, taka i za testiranje statisticke znacajnosti razlika me-
razli.citim razinama ..skale. Taka npr. na tzv. geometrijskoj brojcanoj . c.1u frekvencijama.
skal~, k~ko rastu vrljednosti skale, rastu i razlike medu brojevima na
Katkad se brojeni podaci mogu odnositi ina kvantitativne klase, a
skah, ah odnos medu brojevima ostaje isti: 2, 4, 8, 16, 32, 64 itd. Razlike ne samo na kvalitativne kategorije. Takav je slucaj pri > grupiranju rezul-
medu susjednim brojevima na ovoj skali rastu (2, 4, 8, 16,32 itd.), ali oct- tata u razrede sa svrhom provjeravanja oblika distribucije dobivenih re-
nos medu susjednim brojevima ostaje jednak (4:2=2; 8:4=2; 16:8=2
zult.ata. K
it d.).
Brojcane skale treba razlikovati od > skala mjerenja. K '

bruto rezultat Broj bodova postignutih u nckom testu sposobnosti iii


znanja, u nekoj sportskoj disciplini, u razliCitim ohlicima glasovanja;
brojeni podaci Podaci dobiveni brojenjem pripadnih > statistickihjedi-
hrojcana vrijednost dohivena pri nekom mjerenju, procjenjivanju itd.
nica nekoj kategoriji, klasi, atributu > kvalitativne varijable. Primjerice,
Termin "bruto rczultat... maze imati. dvojako znacenje. U jednom
to je broj pripadnih statistickih jedinica u kategoriji "musko" varijable
znacenju koristi se kad se jednom numerickom vrijednoscu izrazava
spol; iii broj katolika u nekoj drzavi u varijabli "konfesionalna pripad-
zhroj rczultata u subtestovima nekc baterije testova iii, opcenito, rezcl-
nost". Brojenje se takoder smatra > mjerenjem na > nominalnoj skali.
tat dohiven zbrajanjcm iz vise razliCitih katcgorija iii disciplina; kad se
Brojenjem se dobije ccstina ili frckvencija statistickih klasa u sva- dakle radio slozenom rezultatu od vise aspekata ili pojedinacnih vrijed-

k~j kate~oriji kvalitativne varijable. Cestina moze biti izrazena apsolut- nosti nekog mjcrenja. U tom slucaju termin ima smisao ukupnog rezul-
mm broJem (tzv. bruto frekvencija) iii s pomocu nekog sustava relativ-
tata, hez odbitaka. U drugom znaccnju, term in "bruto rezultat" znaci da
n.i~ vrijednosti, oct kojih se najcesce koristi postotak odnosno prnpor-
., se radi o rczultatu mjercnja sa svim njcgovim komponentama od kojih
ClJa . .
se svaka mjercna vrijeunost nuzno sastuji, tj. rezultat mjerenja sastoji se
> Dihotomne varijable obicno su izrazcnc hrojenim podacima, kao
harem ou > konstantnih faktora i ou > nesistematski varijabilnih fak-
npr. broj muskih i zenskih ispitanika, broj ispitanika koji su odgovurili
tora. Razlicitim jcdnostavnijim ili slozenijim statistickim postupcima
DA iii NE na neko pitanje, broj ispitanika koji su pokazali neko odre-
~eno ponasanje i broj ispitanika kod kojih nije opazeno takvo ponasanje
mogu se, manje ili vise uspjesno, razluciti te pojedine komponente.
1td. Pretpostavlja se da su kategorije dihotomne varijable medm;obn~ Tako, primjerice, racunanjcm aritmeticke srcdine dobiva se rezultat
neza~i.~ne i iskljuCive, tj. ako neka statisticka jedinica pripada jednoj ka- koji pokazuje pravu vrijednost mjerenja, odnosno konstantne faktore i
I tegortJl, ne maze pripadati drugoj i njezina pripadnost jednoj kategoriji to vise, naravno, nije bruto rezultat. P,K
nije ni na koji nacin vezana uz drugu kategoriju. U veCini takvih sluca-
jeva mogu se upotrijebiti svi oni statisticki postupci koji se odnose na po-
stotk~ odnosno proporcije, ukljucivo procjenu parametra i testiranje
nul-h1poteze o proporcijama u razliCitim uzorcima (> t-test za propor-
cije). Za dihotomne brojene podatke postoje i poscbni > koeflcijenti ko-
I
relacije kao npr. > biserijalni r, > point-biserijalni r a i drugi.
I U slucajevima u kojima se brojeni podaci odnnse na vise od ctvijL:
kategorije kvalitativne varijablc (daklc tri iii vise) primjenjuje sc > hi-
I
" ''
......

- .
CIRKULARNE TRIJADE 31
'
ccntralnu vrijcdnost, onda prosjccna placa iznosi 40, i to se obrazlaze
ovako: ima jednako toliko placa kojc su vise, kao i onih koje su nize od te
place. Centralna vrijednost je korisna mjera u neki:n tehnicko-praktic-
nim situacijama: ako na nekom rasponu od 500 km gradnje autoputa po-
stoji 7 opskrbnih stanica, pa se zeli odrediti polozaj glavne opskrbne sta-
nice koja ce vozila opskrbljivati gorivom i servisima ada pri tome vozila
imajurelativno najmanje putovati, ondaje to centralna vrijednost, dakle
u nasem slucaju opskrbna stanica br. 4. P

centralna tendencija U veCini opazanja iii mjerenja u prirodi, kako na


ndivom taka ina zivom materijalu, ustanovljujemo da se rezultati poje-
. dinacnih opazanja ili mjerenja doduse razlikuju, ali da ipak ocito poka-
zuju tendenciju grupiranja oko neke vrijednosti koja se najcesee nalazi
po sredini svih rezultata: najvise rezultata nalazi se oko te "srednje"
C > centralna vrijednost vrijednosti, a sto su pojedinacni rezultati vise udaljeni od te vrijednosti,
to ih jc manjc. Pojava ccntralnc tcndcncijc u statistici se iskazuje razlici-
centil > skala centila tim mjcrama centra Inc tcndcncije, od kojihje najpoznatija i najkorisnija
\ > aritmeticka sredina, a "gustoca" grupiranja rezultata oko sredisnje
'
central limit theorem > poucak centra/nih granica vrijednosti oznacuje se mjerama "rasprsenja" rezultata, najcesce >
, ··~
... .
, "·
,. standardnom devijacijom. P
_ ___,_ :'Centralna vrijednost•tmedijan) (C) Vrijcdnost koja sc u nizu rezultata,
\Joredanih po velicini, nalazi tocno u srcdini. Polozaj ccntralnc vrijcdno- cirkularne trijade U metodi > usporedivanja u parovima moze se kod

sti odreduje se daklc u nizu rczultata poredanih po (numcrickoi) vclicini nesigurnih, ncpouzdanih ili nedovoljno diskriminativnih procjenitelja
formulom: polozaj C = (N +1)/2. 'tiedu 11 rezultata, porcdanih po vc- dogoditi da u razliCitim kombinacijama parova rezultata za clemente
licini, polozaj C ce biti (11 + 1)/2 == scsta vrijednost, a medu 12 rczultata procjene (!jude, predmete itd.) A, B i C ispadne da je A bolji od B, B bolji
c ce biti (12+1)/2 = 6,5, claklc vrijcdnost kojaje sredina izme~~ s_cstc j od C, a C bolji od A (vidi sliku), ~to je logicki nemoguce, a ta se pojava
sedme vrijcdnosti. Na ccntralnu vrijcdnosfn'eTltje~e\lrijedriost pojedl- naziva cirkularna trijada. Postoje tablice iz kojih mozemo ustanoviti ko-
·nog rezultafu (kao sto je to slucaj kod aritmetickc srcdine), vee samo liki se broj cirkularnih trijada moze tolerirati uz razlicito velik broj ele- •

broj rezultata: aka recimo prvi rezultat u nizu od 10 rezultata porcdanih menata koji se rangiraju metodom usporedivanja u parovima. DoN= 6
po vcliCini (od manjih prema veCima) iznosi bilo koju ckstremno malu nije dopustena ni jedna cirkularna trijada. P
vrijedno'st, a zadnji rezultat bilo koju ekstremno veliku vrijednost, tone
utjece na ccntralnu vrijcdnost. Centralna vrijednost ·stoga se najccscc A
upotrebljava u situacijama._kada trcba naCi "prosjek"nckoliko vrijetlno- / "-.
C B
sti, ajedna ili dvije su ekstremne: prosjecna placa petero ljudi koji imaju
place 10, 20, 40, 70,300 nekihjedinica, prema aritmetickoj sredini iznosi Primjer "cirkularne trijade":
88, sto je besmislica jer nijedne place nema u toj zoni. A ako izracunamo aka je A bolji od B, a 8 bolji od C, onda C ne mo~e biti bolji od A.


'
' • • --

- ••
~2'----------~C~L~U:._-:S~TE~R ANALIZA
'

C-SKALA 33
cluster analiza > klaster analiza crta regresije U koordinatnom sustavu crta (ili krivulja) koja spaja
to ekes koordinatama odredenim > parcijalnim srednjim vrijednostima u
cluster uzorak > klaster uzorak jcdnoj varijahli i > fiksnim vrijednostima u drugoj varijahli. Crta regre-
I sijt; zorno pokazuje tip odnosa izmcdu varijahli: ako je pravac (>jed-
correlation ratio > koeficijent zakrivljene korelacije (eta) nadiba pravca regresije ), onda jc povczanost mcdu varijablama linearna
I
(> linearna kurelacija), ako crta regresije nijc pravac, tada se radio >
C.R. > kriticki odnos, > t-odnos zakrivljenoj korelaciji. K

Cramerov <I> (Fie) Nova varijanta > Fi-koeficijenta korelacije. Kao i C-skala Jcdna od skala bazdarenja, a sluzi i za intcrpretaciju i usporedi-
f!i, takoder se racuna iz hi-kvadrata (s pomocu >tab/ice kontingencije), vanjt; rczultata. I ona sc, kao vcCina takvih skala, osniva na normalnoj ra-
Jednostavnom formulom: spodjdi, s aritnH~tickom sredinom 5 i standan1nom dcvijacijom 2. Saddi
2
11 razreda, od kojih svaki zauzima 0,5 standardne devijacije: razred
<I> = . __;_X:..___ vrijednosti 0 zauzima prostor od -2,75 do -2,25; razred 5 od -0,25 do
c N(s-1)
+0,25; razrcd 10 od +2,25 do + 2,75 standardne dcvijacije. Skalu je
• v •

pn cemu s1mbols oznacuje manji b:oj stupaca ili redova u tablici kontin- predlozio Guilford u svrhu hazdarenja vclikog hroja tcstova za vojsku


gencije (sto znaci da tablica ne mora biti kvadraticna ida moze imati vise tijekom 2. svjctskog rata, ali jc kasnijc predlozio modifikaciju te skale,
-.
od dva stupca ili reda). Za razliku od .Fi-koeficijenta, koji vrlo rijetko spajajuCi razrede 0 i 1, kao i razrede 9 i 10 u po jedanrazred tako da nova
moz~ poprimiti vrijednost 1, Cramerov Fi moze imati sve vrijcdnosti od 0 skala, nazvana "standardnih devet" ("standard-nine", skraceno "stani-
'
do 1;~to mu je pogotovo prednost prcd > koejlcijentom kolltint;encije, uc"), sadrz.i !) stupnjcva. Objc varijantc tc skalc u nas su manje u upo-
koji uopce ne moze postiCi vrijcdn"Jst 1. P trchi. P

critical ratio > kriticki odnos, > t-odnos

Cronbachov a U novije vrijeme jedan od najvise koriStcnih > koefi-


cijenata korelacije za odredivanje pouzdanosti psihologijskih mjernih in-
j strumenata. Temelji se na tzv. nutarnjoj konzistenciji mjernog instru-
menta, odnosno na prosjecnoj korelaciji medu cesticama mjernog in- I


strumenta. Jedan od nacina njegova izracunavanjaje s pomocu ave for-
!
mule:

krl'
a = -----'---·
1+(k-1)rl'
gdje je k broj cestica u instrumentu, a rl' prosj~cna kordacija m~clu cc-
sticama. K
I
I



' DIHOTOMNA V ARIJABLA 35 '

dcm,lgrnfi.ln Primjcna statistikc na proucavanje karakteristika ljudske


populacijc, poschno na pitanja brojnosti i gustocc, porasta stanovnistva,
raspodjele po kontinentima, seobe stanovnistva i pojava u vezi s roden-
jcm, smrti, bolcstima, kojc se ubrajaju u > vitalnu statistiku. Demo-
grafija sc uglavnom sluzi metodama > deskriptivne statistike. P
I
I, dcskriptivna statistika Onaj dio statistickih metoda koji se bavi opisiva-
njem cinjenica, dobivenih opazanjem ili mjerenjem neke pojave. Taka
nas npr. maze zanimati natalitet, morbiditet ili mortalitet u nekom gra-
I. du ili zemlji, prosjecna cijena nekih proizvoda ili usluga, povezanost iz-
I
I
'
mcdu zivotnc do hi i nekih fizioloskih funkcija, postotak muskaraca s!ije-
'
I pih za hoje mcdu kandidatima za strojovode, distribucija visine i tezine
I djece razlicitih godina, bazdarenje nekih mjernih instrumcnata (npr.
'

d Najce5ce znaci razliku izmcdu nckog rczultata i aritmctickc sredinc, a tcstova) itd. U deskriptivnu statistiku spada i proucavanje karakteristika
koristi sc prilikum racunanja standardnc dcvijacijc, ako sc nc koristi razlicitih > statistickih distribudja, a poscbno > nonnalne distribucije.
izraz (x- M). No neki statisticari koristc taj znak i za razlikc mcdu rango- Nos razvojcm matcmatickih statistickih metoda i razvojem teorije vje-
vima (umjesto D). Kao i D, d predstavlja kraticu ad "difcrcncija". P I
'
rojatnosti pojavila su se pitanja u vezi s > uzorkom i > populacijom, a to
I su na prvom mjestu pitanja o tome kakvoj se pogresci izlazemo aka iz
d' Ohicno sluzi za oznaeavanjc nckc provizornc razlikc iii razlikc oct
I ncke konkrctno ustanovljcnc Cinjcnicc, dobivenc mjerenjcm na uzorku,
donosimo zakljuckc o populaciji. Taj dio statistikc dobio je naziv > infe-
neke teorijskc vrijcdnosti. K
I rencijalna statistika. P
''
D Obicno oznacuje razliku iimedu dva ranga (npr. kod > rho koefi- devijacija (lat. de u slozenicama oznacuje odjeljivanjc, otklanjanje i sl., a
I,
c(ienta korelacije), iii pak neku razliku izmedu dviju brojcanih vrijcd- i rijcc via znaCi put) Tcrmin koji se upotrebljava u svim znanstvcnim
nosti (npr. dvijc aritmctickc srcdinc). Prcdstavlja kraticu od "difcrcn- I podrucjima, a oznacava odstupanje od utvrdenih normi, standarda,
cija". Moze znaciti i > dominantnu vrijednost. P •
I
prosjcka ili bilo koje druge referenicne pozicije (> standardna devija-
'
cija). K.
"daska" s cavlicima > Galtonova "daska" s cavlicima
-·a i ' (engl. kratica za degrees of freedom) "> "' stupnjev1 slobode ·· · ft
\

decil > skala decila dihotomizirana varijabla > dihotomna varijabla


I

I
dihotomna val'ijabla Varijabla koja jc izrazena s pomocu samo dvijc
delta Nacin izgovaranja za grcko slovo o, !!.., ili katkada za D ili d, au
i· kvalitativne ili kvantitativne klase (primjerice musko-zensko; zivi-umrli,
vecini slucajeva ti znakovi znaee razliku izmedu dvije vrijednosti (npr.
( ozenjcni-neozenjeni; ima djece-ncma djece; ima automobil-nema auto-
izmedu dva ranga, dvije aritmeticke sredine i sl.) P
t
'
I •

i
- ------------ . - ---- ---------
---------
- __,_ __
• - ------- - - - ---- ..

,_,, ' .
'' DISKRIMINATIVNOST MJERENJ A 37
36 DIHOTOMNA V:..:AR.=..:.:I:.:::JAB~L::::A~----- _ _

- ..
~

mobil itd.). Cesto se i varijable koje je moguce izraziti s pomocu veceg drat nije statisticki znacajan, moramo nasu dire~tivn~ hipot~~ odb.a-
broja kvantitativnih klasa, pa i tzv. > kontinuirane varijable, reduciraju citi. No, neki statisticari (npr. Fisher) upozoravaJU da 1 takvu d1rekt1v-
na samo dvije vrijednosti, zbog nepreciznosti mjerenja iii iz nekih drugih nu" hipotczu mozemo smatrati - nul-hipotezom. Treha ~e samo ~refor~
razloga. Tada se obicno govori o riihotomiziranoj varijabli, a naji::esce sc mulirati u drugi oblik: distribucija bod ova u tom testu nece se razbko~at1
kao tocka dihotomizacije uzima neka sredisnja vrijednost (centralna od teoretske distribucije, koju bismo ocekivali kada bi test bio pretezak.
vrijednost iii aritmeticka sredina), iako nije rijedak slucaj dihotomiza- Aka to ne ustanovimo, odbacujemo ovako formuliranu nul-hipotezu.
cije na osnovi neke arbitrarno odabrane vrijednosti. Neki smatraju da I

Valja upozoriti da neki statisticari direktivnu hipotezu ~ijele na jed-
nosmjemu i dvosmjemu: jednosmjerna bi bila onda ~ada btsmo p~etp?·

nema stvarno dihotomnih varijabli, nego da je u pitanju samo pojedno-
• i'
stavljenje iii teskoca u preciznosti m,ierenja, no ipak se u upotrehi razli- stavili da ccmo naCi razliku u nekom odrcdcnom smJCfU (npr. ~aJC ~~lt­
kuju dihotomne varijable (one kojc "stvarno" imaju samo dvijc kntcgo- I mcticka srcdina nckc populacijc statisticki znacajno vcca od antmetlckc
I

rijc) i dihotomizirane varijable (one koje su stvarno kontinuiranc, ali su \ sredine neke Jruge populacije ), a dvosmjerna je onda kada samo pret-
namjerno iii zbog nepreciznosti mjerenja izrazene u samo dvije katego- postavljamo da cemo naCi razliku, ito hilo kojeg si~lje-ra . Takoder. treba

I
I
rije iii dvije vrijednosti). K kazati da ncki statisticari dircktivnu hipotczu naz1vaJU 1 alternatlvnom

I dijagram rasprsenja Termin nastao izravnim prijevodom sintagmc u I


'
hipotczom. P

cngleskom jeziku scatter diagram. Smatramo da hi se u hrvatskom I dircktno mjerenje Izravno mjerenje s pomocu istovrsnih veliCina, tj.
mogao koristiti izraz > tab/ica raspdenja. K
• mjcrcnjc koje nc zahtijcva transformaciju vcliCinc mjcrcnja u ~eku dru-
g1.1 vrst pojavc (> irulirektno mjerenje). Primjcr dircktnog (1zravnog)
direktivna hipoteza Hipotcza o nckoj karaktcristiei jcdnc, dviju iii vise
mjcrcnja ·c mjcrcnjc prostornc protege mctarskom skalom. K
populacija.·Za razliku od > llul-hipoteze, koja najccscc glasi <.Ia ustvari
nema razlike izmedu rezultata koji smo dohili i nckog drugog rczultata I•

I > v; kod ko ·e izmedu o ·edinih vri ·edna· ·
(npr. da nema razlike medu aritmetickim sredinama dviju populacija), •

direktivna hipoteza pretpostavlja da postoji neka odrcl1cna karakteristi- I postoji skokovit, nckontinuiran rijclaz, t'. kad su vri' edno ·ti vari· .llll
I
ka u populaciji koja tu populaciju na odredcni dcfinirani nacin razlikuje jasno mcdusobno odijcljcnc._Upotrcbljava s~ i · . . . .. .
I
od drugih. Na primjer, na temelju inspekcije jednog testa znanja mozc rijabla ;Takvajc vcCina varijabli kQjf sc sastQ.JC od kvahtatlvn_t~ll~ ~an ~·
nam se uciniti da je taj test prete:Zak za populaciju kojoj je namijenjen. tativno/kvalitativnih kategorija: primjerice varijabla ~J?ol, skala skolsk1h
Nas .1direktivna hipoteza mogla bi stoga glasiti ovako: ako taj test primi- •ocjena itd.Mnogi, medutim, dde da manj~-vise sve_va~ija~l~a~~kon­
jenimo na veCi broj ispitanika, once dati izriCito asimetricnu distribuciju I
I
tin;-irane ( > kontinuirana varijabla) prijelaze medu poJe.dtm~Yr~Jedn~­
I

I bodova, ito asimetricnu "nadesnd', tj. dominirat ce bodovi u zoni sla-


I
I'
stima ali ih iz rakticnih razloga i tehnickih teskoca n m eren u
I .
bog uspjeha. Tu hipotezu mozemo provjeriti npr. hi-kvadrat testom, u izraiavamo diskontinuirano. Varijahlc, Ci ·c su vri ·edn
temelju hrojcp' a _hroj b · kv ·
bat roJ pogresa a I_§ . 1 stva o Sll. dis]}.o..nti.·
kojem bi ocekivane frekvencije bile distribuiranc po normalnoj raspo-
djeli (koju bi trebalo oeekivati ako je test primjcren po svojoj tdini). '
I -nuirane. K .
Ako se dobivena distribucija bodova swarm) toliko razlikuje iJd oct:kiva- -
.
ne da to racun potvrdi, potvrdili smo direktivnu hipotczu. Ako hi-kva-

diskdminalivnost mjcrcnja > o~jetljivost mjerenja

I
I
'
'
I
38 DISPERZIJA REZULTATA II
DI~IRIBUCIJE, 39

disperzija rezultata > rasprsenje rezultata I


I
distribucija U statistici znaCi raspodjelu rezultata, eestinu (frekvenciju) I
'
kojom se u nekom skupu rezultata poredanih po velicini pojavljuju poje-
a b c d
dini rezultati. Termin distribucija upotrebljava se i za frekvenciju osoba · .
Skice distribucija koje se najce§Ce susre61 u statistici: a- normalna distribucija;
(ili nekih drugih statistickihjedinica) koje pripadaju razlicitim (kvalita- I'
b - Poissonova distribucija; c - asimetricna distribucija; d - bimodalna distribucija.
tivnim ili/i kvantitativnim) kategorijama neke varijable, kao sto su npr. I .
distribucija po spolu, distribucija po socioekonomskom statusu i tome distribucija, bivarijatna > bivarijatna distribucija


slicno.
Statisticka analiza rezultata redovito zapocinje provjerom oblika distribucija, kumulativna > kumulativna distribucija
I distribucije i nastavlja se njezinom statistickom deskripcijom (odrediva- '
! distribucija kumulativnih frekvencija > kumulativna distribucija
njem osnovnih statistickih vrijednosti kao sto su sredisnja 'Vrijednost, in- I
''
deks rasprsenja i tome slicno). Oblik distribucije pokazuje uz koji model
distribucija, negativna binomna > negativna binomna distribucija
(npr. normalna distribucija, Poissonova distribucija) pristaju dobiveni
rezultati. Taj podatak ima bitan utjecaj na interpretaciju dobivenih re- distribucija, nonnalna > normalna distribucija
zultata. Osim toga, o podatku odstupa li dobivena distribucija od odre-
• denog modela ili ne ovisit ce odluka o daljnjoj statistickoj obradi rezulta- ~}str~~~~ij~_.!!~!~g st~tisti~kog_ i~;y;a (npr. arit-
ta (tj. o opravdanosti upotrebe osnovnih statistickih vrijednosti, npr. ari- meticke sredine, koeficijenta korelacije, hi-kVadi:aia :td.) kod dugo-
tmeticke sredine, standardne devijacije, te opravdanosti podvrgavanja
trajnog ponavljanja uzimanja slueajnih ~or~kajednake velici~~ (~idi ·o-
.
!
dobivenih rezultata slozenijoj statistickoj analizi) (> asimetricna.distri- I'
bucija, bimodalna distribucija). Ako postoje opravdani razlozi, dobiveni
."tome sliice iiiriaflikruee hi~kV~dr~t dirtribucija, F-distrlb~ija, standardna
I'\
pogreika koeficijenta korelacije r). Na primjer, aritmeticke sredine uzo-
rezultati mogu se odgovarajucom > transfonnacijom rezultata uskladiti I
I

s nekom odredenom distribucijom (> normalizacija distribucije). . I raka iz neke populacije dat ce normalnu rapodjelu (Cak i onda kada
I populacija nije normalno distribuirana) (> poucak centra/nih granica);
Postoji veCi broj matematicki opisanih distribucija. U statistici
bacajuCi mnogo puta 10 novciea i kod svakog bacanja zabiljditi ishod
koja se koristi u psihologiji, najcesCi i najpogodniji modeli za diskretne I -{broj "glava" i broj "pisama") i izracunavajuCi svaki put hi-kvadrat (iz
v.arijable su: > binomna distribucija, > Poissonova distribucija, > nega:.
ttvna binomna distribucija. Katkada se upotrebljava geometrijska dis- l razlike izmedu oeekivanih i opazenih frekvencija ishoda "glava" i "pi-
tribucija, hipergeometrijska distribucija, a moguce je upotrebljavati, I smo"), dobit eemo hi-kvadrat raspodjelu za 1 stupanj slobode, bacajuCi
ovisno o vrsti podataka kojima se raspolaze, i druge distribucije kao I igrace kocke dobit eemo distribuciju uzoraka hi-kvadrata za 5 stupnjeva
I
modele. Za kontinuirane va.."'"ijable najc~sce se koristi > normalna i slobode itd.
(Gaussova) distribucija, zatim > hi-kvadrat distribucija, > t-distribucija, I
> F-distribucija. Za bivarijatne i multivarijatne slt.Jeajeve takoder pos- I
toje razvijeni matematicki modeli distribucija. Na slici su prikazane nor- I cnih pojmova, nuZan za rarurnijevanje
I
~al~a di~~ribucija (A), Poissonova (B), asimetricna (C) i bimodalna (D) '
.
~ -·- ~ - ~-·--··. . . . .. --- -
, ., ~- ---~-.... · .. , . . -·-
~ - ;. ... . . '
__ __ __ ~------ ~--···: , ~- . ...... ,., .. ......... ,... __.. __, _-_ __ ..... .-.......
~

•'

dJstnbuciJa. K i distribucije, krivulja > graficki prikaz distribucije rezultata


I
r
40 DOMINAN1NA VRIJEDNOST I' DVOSMJERNO I JEDNOSMJERNO TESTIRANJE 41
' '
I
•uavrijednost, koja medu rezultatima do- ' aritmetickim sredinama, dobivenih iz opetovanog uzimanja uzoraka iz
koja je najeesee postignuta. Ako su vrijed- I
r dvije situacije, to> nul-hipoteza tvrdi da medu aritmetickim sredinama
i
nosti rasporedene u "razrede", onda je to sredina onog razreda s naj- '
mazda uopee nema razlike, dakle "prosjecna" razlika je nula (0). No
veeom ueestalosti (dakle, najvisi stupac u Dominantna I
'
standardna devijacija tihrazlika oko nule je velicina koju nazivamo stan-
'
~
••
....'· vrijednost koristi se najvise kod razlicitih iZVJ a o "prosjeenoj ciieni" dardna pogreska razlike. Aka neka, u istraZivanju dobivena, razlika
neke namirnice, o "prosjecnom" broju djece u obiteljima itd. Prosjecna '
I,
I
iznosi recimo 2, a njezina standardna pogreska iznosi 3, onda razlika 2
I
cijena koja bi se dobila izraeunavanjem aritmeticke sredine ne bi pred-
I
I vrlo dobro "pristaje" u takvu distribuciju razlika kojima je prosjek nula,
I sto znaci da bi se vrlo lako mogla islucajno dogoditi kada i medu popula-
stavljala nista realno, dok dominantna vrijednost predstavlja najeescu •
I
I' cijama nema razlike (tocka X na crteru). Dakle, razlika apsolutne ve-
cijenu neke namirnice. Jos bi besmislenije bilo izracunati da prosjeeni I
i licine 2 (plus ili minus dva, svejedno) mogla bi se i slueajno dogoditi. No
broj djece u obiteljima iznosi npr. 2,8 (sto bi pokazala aritmeticka
I aka dobivena razlika iznosi 7, onda ta razlika pada izvan 2 standardne
sredina), jer je znatno realnije reci da najvise obitelji ima npr. troje djece I
'
I
'
pogreske, pa je prema tomeslucajno pojavljivanje tako velike razlike ( +
(sto je
ili-7)mogueeumanjeod5%slueajeva(2,5% + 2,5%, vidisliku). Utom
.
I slueaju kaZemo da je takva razlika > statisticki znacajna
donja granica razreda > grupiranje rezultata u razrede I' •
I

I t= razlika = 7_ = 2, 3
dvosmjerni test > dvosmjemo i jednosmjemo testiranje I
pogre.Ska razlike 3 '
I
I
'
'
dvosmjerno i jednosmjerno testiranje Izraz ~e upotrebljava uglavnom ito na > razini znacajnosti manjoj od 5% (sto se biljeZi P < 0,05). K.ao
I sto se vidi, dvosmjernim testiranjem testira se statisticka znaeajnost
kod testiranja statisticke znacajnosti razlike izmedu dvije aritmeticke i

sredine, a njegovo znaeenje moguee je protumaciti graficki (vidi sliku). neke razlike s obzirom na njeZinu apsolutnu velicinu: za razliku veliCine
I
'
I
7 malo je vjerojatno da se slueajno pojavi aka medu obje populacije ust-
' .
vari nema razlike. No aka je istrazivaeeva hipoteza izricito jednosmjer-
·2,5% l,So/o I na (npr. "populacijaA ima statisticki znaeajno veeu aritmeticku sredinu
I

od populacije B"), onda ce istraZivac promatrati samo jednu stranu
'

X
(desnu) krivulje; ako je odlucio da i ovdjeradi uzrazinu znacajnosti 0,05,
.'
I' onda je dovoljno da razlika bude samo 1,64 puta veca od svoje pogreske
t
-3
.
0 3 9 (t = 1,64 iii vise), pa da mozemo kazati da se takva razlika slueajno maze
Razlik_a_vcli~ine 2 (to~ka x) izmedu dvije aritmcti~ke srcdinc mozc se doista i slu~jno pojaviti samo u 5% ili jos manje slueajeva (aka ona medu populacijama
dogod1ti, ako nam ra~un poka.Ze da Qi se mogle slucajno dogoditi ~ak i razlike ve!icine '
ne postoji). Mnoge tablice > granicnih (kriticnih) vrijednosti razlicitih
9 .. Ako istra.Ziva~ opravdano pretpostav!ja da razlika tpore postojati samo ujednom !
statistickih testova sadrze stoga oznake granicnih vrijednosti za jed-
smjeru, onda se i razlika, koja se u "dvosmjernom testiranju" jo~ ne bi smjela smatrati
' nosmjerne i za dvosmjerne testove. Medutim, mnogi statisticari protive
statisti~k:i zna~jnom (jer jet manji od 1,96) more proglasti statisti~k:i zna~jnom
(vidjeti tekst dvosmjemo i jednosmjemo testiranje). se jednosmjernom testiranju znaeajnosti tvrdeCi da gotovo nikada sa sig-
urnoscu ne moremo predvidati smjer neke razlike, ida bi uvijek razliku
BuduCi da > standardna pogreska razlik~ izmedu dviju aritmetickih trebalo testirati dvosmjernim testom. Prakticki se naime dogada (> ra-
sredina znaCi zapravo standardnu devijaciju velikog broja razlika medu zina znacajnosti) da zbog "fiksiranosti" na standardne razine znacajnosti
'

od 0,05 i 0,01, neki istrazivac, nesretan zbog toga sto mu u istrazivanJu t


iznosi recimo 1,90 (a ne 1,96, sto je kod velikih uzoraka dovoljno za nivo
znacajnosti od 0,05), u nastojanju da "spasi" rezultate odluCi razliku •

testirati jednosmjernim testom (u kojem slueaju t od 1,90 znaCi P <


'

.- , .

0,05). To je ujedno i razlog zasto statisticari, kao vamo istrazivacko


pravilo, propisuju da se razina znac:3.jnosti mora odrediti prije eksperi-
• V I •

menta, a ne nakon njega, jer ako to odreduJemo nakon sto vee tmamo
gotove rezultate, onda odluka u velikoj mjeri ovisi o tome kako smo ve-
•• -
, ..
-
lik t dobili. P

efikasnost (djelotvornost) prognoze Izrahva se s pomocu > indeksa efi-


kasnosti prognoze, a pokazuje, u postocima, koliko je djelotvornije pred-

vidanje rezultata u jednoj varijabli (na primjery varijabli) na osnovi po-
znavanja rezultata u drugoj varijabli (na primjer x varijabli) i stupnja
povezanosti (koeficijenta korelacije: r,;y) izmedu te dvije varijable, u od-

'
nosu na slucajno pogadanje rezultata u toj (Y) varijabli. K

"egzaktni test" > Fisherov "egzaktni test"

eksperimentalna pogreska Skupni i nespecificni naziv za djelovanje


svih onih varijabli koje pri opahnju ili mjerenju u eksperimentu utjecu
na numericku velicinu dobivenih rezultata, a nisu i ne mogu biti pod
•• kontrolom eksperimentatora. Izvori eksperimentalne pogreske mogu
I
biti nesistematske promjene u samom ispitaniku (fizioloske varijacije,
nestabilnost u paznji), u neposrednoj eksperimentalnoj okolini (rasvje-
ta, temperatura, buka i sl.), u procesu mjerenja (tocnost ocitavanja s
mjernog instrumenta i sl.),u nedovoljnoj pouzdanosti mjernog instru-
• •
I

•'
menta itd. Za sve te varijable pretpostavlja se da djeluju nesistematski,
tj. po slucaju, pa je zato kod velikog broja mjerenja aritmeticka sredina

njihova ukupnog djelovanjajednaka nuli. One uzrokuju varijabilitet re-
zultata te se zato velicina pogreske neizravno odreduje na temelju sla-

'
I
44 EKSPERIMENTALNA POGRESKA II
I
'
ganja odnosno neslaganja rezultata dobivenih ponovljenim mjerenjem. t
Pretpostavlja se, takoder, da varijable koje uzrokuju eksperimentalnu I
pogresku nisu u medusobnoj korelaciji niti su u korelaciji s predmetom l
I
,

mjerenja. K '
I
• • • • • I
ekstra olac.. a Zakl"ucivanje o neutvrdenim neispitamm, ne1zm ere- '

r
nim p.o_dacima ili odnosima medu odacima na osnovi ostojeCih oda- I'
I
l
taka.J ermin se najeesee upotrebljava Rri zakljy§ivanju o tijeku neke I.
I
krivulje (koj:'l poka_z,!lj~ odnos izmedu dvije varijable) na temeru dobi- II
. · oblika krivul ali izvan · .. · >· I

I
polacija ). Primjerice, pri ispitivanju broja reRroduciranih rijeci u ucen ·u I
i

ste rtjeci, na temer i re maze se redvid"eti koliko bi bilo I I


i
reproduciranih rijeCi u sljedeeem ponavljanju (vidi sliku). K '

- . '
II
i F > F-omjer, > F-test, > analiza varijance
'I'
-- ......... - -·
25
-! I

'

~
20 i
' F' > Scheffeov test
-~
z: I
Ekstrapolacija: produ~avanjem vjero- ''''
jatnog oblika krivulje dobivene na te- u- 15
!
'
'

faktorijalni eksperiment iii faktorijalni eksperimentalni nacrt Ekspe-


melju stvamo dobivenih rezultata mo-
gu se predvidjeti vrijednosti koje nisu
110
" 'I
I
rimentalni nacrt u kojemu se istodobno (simultano) ispituje (provjera-
bile uklju&me u mjerenje ill opdanje I 5 (
I
I
va, istrafuje) djelovanje dva ill vise faktora- zapravo nezavisnih varijabli
'
odnosa izmedu nekih pojava. I
I - na zavisnu varijablu. Na primjer, maze se istodobno proueavati moguCi
0 1 2 3 4 5 6 171 (81 (91 I '

'
'I utjecaj broja popusenih cigareta i starosti pusaca na pojavu karcinoma
PonavQanja I
I pluea. S pomocu ovog nacrta moguee je istodobno ispitati djelovanje
'
svakog faktora (svake nezavisne varijable) posebno- to su tzv. glavni
ekvidistantne jedinice Jednake jediniene vrijednosti. Skala mjerenja '
I
II efekti- te njihova interaktivno djelovanje na zavisnu varijablu- to je tzv.
koja ima ekvidistantne jedinice je ana skala kojoj su na svim njezinim interakcija. Statisticki postupak koji se primjenjuje za obradu taka do-

razinama jedinicne vrijednosti jednake. ~~e~~ ...,...... bivenih rezultata mjerenja iii opaZanja zavisne varijable naziva se >
~

. du susjednih brojcanih oznaka skale · razinama mora b · · · slozena analiza varijance. K


(> intervalna skala, > omjema skala). K · !
I
I faktorska analiza Skup statistickih postupaka namijenjenih odredi-
eta (7]) koeficijentkorelacije > koeficijentzakrivljenekorelacije7J (eta)
I vanju temeljnih dimenzija koje su odgovome za odnose izmedu veceg

· broja varijabli. Postoji veCi broj tehnika faktorske analize i materna-
• .. . -·· . tickih modela koji se upotrebljavaju ovisno o problemu istraZivanja,
' :. ..:

' I' vrsti varijabli te pretpostavkama o naravi njihova sklopa . .

. I
'
I
• •
'

46 FAKTORSKA ANALIZA F-DISTRIBUCIJA 47


Postupci faktorske analize primjenjuju se na > matricu interko- •
stva za konstrukciju modela za identificiranje tih varijabli. No, stvaran i
relacija. Sasvim opeenito govoreCi, kad bi korelacije medu varijablama u prepoznatljiv poeetak modeme faktorske analize predstavlja rad Char-
matrici interkorelacija bile nulte (iii vrlo blizu tome), tada se nikakav lesa Spearmana (1904), kojije trafio razloge korelacijama izmedu razli-
faktor ne bi mogao iznaCi faktorskom analizom. Ako, medutim, postoje citih sposobnosti i vjestina nadajuCi se pronaci mjere opee inteligencije.

ne-nulte korelacije izmedu svih iii samo nekih varijabli, tj. sto su korela- Prema njegovu misljenju, te korelacije nastaju kombinacijom djelova-
cije veee, povecava se vjerojatnost iznalazenja jednog ili vise faktora. ••
nja jedinstvenog faktora opee inteligencije i specificnih faktora koji su
Drugim rijecima, ako npr. nekoliko prividno razlicitih testova mjeri in- odraz jedinstvene kvalitete individualnih sposr.bnosti. K
teligenciju, onda se medu tim testovima moraju naCi visoke korelacije. •

Faktori dobiveni faktorskom analizom hipoteticke su varijable ili "kon-


strukti" koji opisuju medusobne odnose varijabli koje su bile podvrgnu- F-distribucija Kao sto postoji > distribucija uzoraka svake izraeunate
te analizi. statisticke vrijednosti (npr. aritmeticke sredine, standardne devijacije,
U sprkos velikoj raznolikosti i sarolikosti tehnika faktorske analize • koeficijenta korelacije, hi-kvadrata, t-testa itd.), taka postoji i distribu-
postoji nekoliko osnovnih pojmova faktorske analize. Faktorska struk- cija > F-omjera. Na primjer, kada bismo in1ali dvije identiene populacije
tura oznacuje skup faktora koji su iznadeni faktorskom analizom. Neki A i B, i kada bismo iz njih neprestano uzimali uzorke jednake veliCine
od tih faktora su zajednicki faktori, koji u manjem i1i yeeem stupnju (recimo 21 iz populacije A i 25 iz populacije B), pa svaki put iz tih uzo-
vrijede za sve varijable ili za skupine varijabli, aneki su specifiCni faktori, raka izracunavali odnose medu varijancama (npr. varijanca A/varijanca
koji su karakteristicni sanio za pojedinacne varijable. Tako se svaka vari- B), dobili bismo distribuciju tih odnosa (koji se zovu > F-omjen). Na
jabla maze prikazati linearnom kombinacijom zajednickih (ili opcih) prilozenoj slici prikazana je distribucija vrlo velikog broja F-omjera do-
faktora i specificnih faktora. Pri (statistickom) opisivanju rezultata fak- '
bivenih ovakvim postupkom. Na slici vidimo ubiljerene i vrijednosti
torske analize svaka varijabla u matrici interkorelacija numericki se
2,03, sto je granica iznad koje ima jos 5% F -omjera, a iznad 2,74 ima jos

izra.Zava u terminima njezina faktorskog optereeenja, koje pokazuje ko-
liko je u svakoj varijabli za rezuitat odgovoran neki faktor. Mnoge vari- 1% F-omjera. Za uzorke drugih velicina dobili bismo drugaciju distribu-
jable u matrici interkorelacija redovito imaju nesto zajednicko, sto se ciju. Te distribucije ponesto su asimetricne, i pokazuju koliki F ima
oznacava texminom komunalitet i pokazuje proporcijuzajednickog va- vjerojatnost da se slueajno dogodi, kao i graniCniF iznad kojeg se jo5 veci
riranja tih varijabli. Specificitet ili specificna varijancaje onaj dio varira- F moze slucajno dogoditi samo u 5% iii 1% (vidi sliku). To su ujedno
nja svake varijable koji je karakteristican samo za nju. , • vrijednosti navedene u F-tablicama kao granicne F-vrijednosti uz razli-
v • .., -
Faktori dobiveni faktorskom analizom sadrZaJnO se oznacuju pre- Cite veliCine ( stupnjeve slobode) jednog i drugog uzorka. Valja upozoriti
rna varijablama koje su njima najvise opterecene. Faktorska analiza ••
da kod testiranja statisticke znacajnosti razlike izmedu dviju varijanci
omogucuje istrafivacu provjeru hipoteze o bazicnim dimenzijama koje
se nalaze u temelju variranja skupa varijabli Ciji je medusobni odnos is-
pitivan. . ·
- Faktorska analiza nastala je na idejama Francis a Galtona (1888), 50% 1%
I
koji se bavio odnosom izmedu inteligencije i antropometrijskih poda- '
0 0,994 2,03 2,74
taka te Karla Pearsona (1901 ), koji je razvio matematicke postupke za
prikazivanje tocaka u prostoru s pomocu crta i ravnina. Rad Galtona Kad bi se iz iste iii iz identienih populacija uzimao velik broj uzorka (ciji stupnjevi slo-
ukazao je na pojam "latentnih faktora" koji su odgovorni za odnose •
bode bi iznosili 20 odnosno 24) odnosi medu varijancaw.a (F-omjeri) dali bi distribuciju
. medu varijablama, dokje Pearson priskrbio pocetna matematicka sred- kakva je prikazana na slici.

'
- . -
.
•• t
'. ' •

'
FISHEROVE Zr- VRIJEDNOSTI 49
48 F-DISTRIBUCIJA '

uvijek u brojnik F-odnosa stavljamo veeu varijancu (jer zelimo vidjeti PredznakFi-koeficijenta treba odrediti naknadno, na osnovi inspekcije
'
koliko je puta ona veea od manje varijance), dok kod stvaranjaF-distri- 2 x 2 tab lice. ZnacajnostFi-koeficijenta moze se odrediti prema znacaj-
bucije moramo F izraeunavati uvijek na jednakom odnosu, npr. uvijek •'
nosti hi-kvadrata (hi-kvadrat = ¢ 2N).Fi-koeficijent ne moze dosecijedi-
varijanca A/varijanca B (ier inaee nikad ne bismo dobili rezultat ispod I
nicnu vrijednost aka su distribucije varijabli razliCite. ·

vrijednosti 1!). Tablica F-distribucije nalazi se u Dodatku C. P BuduCi da je Fi-koeficijent zapravo Pearsonov koeficijent korela-{
'
cije r primijenjen na dihotomne varijable, moguee ga je izracunati is po-
Fergusonov test monotonije trenda Neparametrijski test kojim se te- mocu formule:

stira pokazuju li promjene koje se kod istih ispitanika zbivaju pod razli- •

citim eksperimentalnim uvjetima, neku pravilnost (npr. da li rezultati


sustavno padaju ili rastu ). Na primjer, ako smo nasli da veci broj kracih
odmora ima bolje restitucijsko djelovanje od samo jednog duzeg odmo- Primjena ave formule zahtijeva, dakako, da se dihotomne vrijednosti u
-
ra, maze nas zanimati hoee li (i do koje granice) sve veCi broj odmora svilkoj varijabli (i Xi Y) oznaee binarnim oznakama poput 0 i 1 ili 2 i 3 i
dovesti do sve uspjesnijeg oporavka. Medusobnim usporedivanjem ran- sl. U novije vrijeme neki autori umjesto Fi-koeficijenta preferiraju >
gova svih rezultata is tog ispitanika dobiva se izraz S, koji se dijeli svojom Cramerov Fi. K
vlastitom varijancom, i dob!va se izrazz, dak;e pozrtata vrijednost iz nor-
maine raspodjele prema kojoj se zakljueuje pokazuju li rezultati trend i1i fil{sne vrijednosti Polazisne vrijednosti, arbitrarno ili namjerno oda-
ne pokazuju. P brane u jednoj varijabli, za koje se promatraju sve vrijednosti uz njih ve-
zane u drugoj varijabli. Jedna od koordinata pri grafickom prikazivanju
koeficijent) > Koeficijent korelacije koji se > crte regresije. Taka se nazivaju zato sto se od njih polazi, one su fiksi-
'
upotrebljava za odredivanje stupnja povezanosti izmedu varijabli koje rane. K
su stvarno dihotomne (svaka ima samo dvije kvalitativne ili kvantita-

tivne kategorije) iii ih se maze opravdano dihotomizirati. Ako su rezul- "fiksiranost" za odredene razine maeajnosti > razina znacajnosti

tati prikazani u 2x2 tablici,Fi-koeficijent se maze odrediti uzpomochi- ' ·. - .
~Fisnerov . .
__...,.., ..... ,..,. . . test za testiranje razlike iz-
kvadrat testa: ....
- '

....inedu dviju brojeano malih skupina koje usporedujemo u dvije katego-


rije (a zbog premalih oeekivanih frekvencija ne smijemo koristiti hi-
<P=
kvadrat raeun). Radi se dakle o 2x 2 kontingencijskim tablicama. Racun
gdje je hi-kvadrat (X2) test odreden iz tablice 2 x 2, aN je ukupan broj is- je kompleksan i dugotrajan, jer valja izracunavati velik broj faktorijela
pitanika. Maze se odrediti i izravno iz tab lice 2 x 2; aka se polja u tablici, (faktorijel je umnozak niza cijelih brojeva, koji poCinju zadanim brojem
iduCi slijeva nadesno i odozgo prema dolj~, oznace s a, b, c, d, tada se i mnoze se sve manjim brojem; npr. faktorijel od 4, sto se pise 4!, iznosi
maze upotrijebiti ova formula: 4x3x2x1=24). P

<P= ad-be . Fisherove z,.- vrijednosti BuduCi da distribucija uzorakar koeficijenta


~( a+b)(a+c)(b+d)( c+d) korelacije nije normalna (vee je asimetricna), Fisher je predlozio naCin
50 •
FISHEROVE zr - VRIJEDNOSTI F-TEST 51
I

da sc ta di stribucija pretvori u priblizno normalnu distribuciju ito uz po- jedna grupa bolja ad druge .. Theta se maze racunati i kada su rezultati u
moc korc ktivnog faktoraz, koji je po njemu dobio naziv Fisherov z,. Uz grupama (npr. kada vise ispitanika ima istu ocjenu iii isti broj bodova).
pomo6 tahli cc F-vrijcdnosti (vidi tablieu u Dodatku F) pretvori sc svaki Theta ima nekih prednosti pred Tau koefieijentom: kod potpune
kocficijcnl korelacijc r u odgovarajuci Zn pa se nakon toga moze testi- ' povezanosti Theta poprima vrijednost 1 (a Tau, primijenjen na ovakve
'
rati jc li neka razlika izmedu dva koefieijenta r statisticki znacajna (> slucajeve, rijetko prelazi 0,70). Opeenito uzevsi, rezultati primjene Tau i
stwulardna pogrd ka razlike izmedu dva r koeflcijenta korelacije). P Theta na istom materijalu dosta sc razlikuju: katkada je rezultat visi u
jcdnom, a katkada u drugom postupku. P

F-omjer O mj er kojim zavrsava > analiza varijance i kojim se utvrduje


mozc li se ostati na prethodno utvrdenoj nul-hipotezi ili je treba odba- frekvencija U statistiei broj slucajeva (statistickih jediniea) koji pripa-
citi. U omjcr se stavlj aju varijance (sume kvadrata podijeljene s odgova- daju nekoj kvalitativnoj kategoriji iii cestina kojom se pojavljuje odre-
raj uCim stupnj evima slobode) dobivene parcijaliziranjem ukupne vari- dena numericka vrijednost (npr. broj zenskih iii broj muskih osoba; broj
I jancc (ukupnog rasprscnja, varijabilitcta rczultata). U najjcdnostav- !judi visokih 178 em, 179 em itd.). K
nijem oblikuF-omjera (kod > jednostavne analize varijance) u brojniku
frekvencija, poligon > poligon frekvencija
sc nalazi varij anca koja pokazuje variranje izmedu razlicitih eksperime-
ntalni h skupina ispitanika, au nazivniku varijanca koja pokazuje vari- t -~!i~_dmanov te~t Neparametrijski test analize varijance zavisnih rezul-
ra nja unutar skupina ispitanika i koja predstavlja zapravo pogrdku l tata~(npr. ista skupina ispitanika testirana pod razlicitim uvjetima neza-
uzurkovanj a i mjerenja. Iako je naceloF-omjera is to, ipak se u razliCitim visne varijable ). Rezultati svakog ispitanika rangiraju se za sve eksperi-
varijantama kod > slozene analize varijance F-omjer razlicito form ira, tj. mentalne situacije, i rangovi svih ispitanika za svaku ekspcrimentalnu
u hroj ni ku i nazivniku nalazc sc varijanee ciji odnos se hoce provjeriti. situaciju se zbroje. Pod hipotezom, da nezavisna varijabla nije imala ut-
F-omjcr je dobio naziv po Fischeru, koji ga je iznasao. K jecaja, ukupne sume rangova morale bi biti slicne, a aka se razlikuju,
primjenjuje se racunski postupak (nazvan hi-kvadrat,), kojim se uz po-
e
Frccmanov koeficijent (theta) Koeficijent asocijacije, koji (iedini uz moc hi-kvadrat tablica ocitava razlikuju lise eksperimentalne situacije
> Kendallov koeflcijent rang korelacije Tau) omogucava izracunavanje medusobno statisticki znacajno. Prema provjeravanjima nekih statisti-
kort:lacij e izmedujednc ordinalne i jedne nominalne varijable. Na prim- cara, snaga tog testa(> "snaga" testa) prakticki je jednaka snazi para-
jl!r, ako u jed nom mjesovitom razredu uceniei rjesavaju jedan test zna- metrijske analize varijance zavisnih rezultata P
nj a, mozcmo rezultate rangirati i uz svaki rang oznaCiti pripada li uceniei
iii ucc niku. J ednostavnim postupkom provjere za svakog ispitanika koli- F -test Parametrijski test kojim se testira razlikuju lise statisticki znacaj-
ko ispitanika druge skupine se po rezultatu nalazi iznad, a koliko ispod no varijance (kvadrirane standardne devijacije) dvaju uzoraka. Formula
njcga, moguce je izracunati koeficijent Theta: za F-test glasi:
ukupno ispod- ukupno iznad s2 ..
F= 1
e= ukupan broj usporedbi sl2
l
Interpretacija Thete nesto je drugacija nego interpretacija koeficijenta Kao sto kod t-testa ustanovljujemo koliko je puta neka razlika veca od
korelaeije: dobiveni broj pokazuje u kolikom je postotku svih usporedbi svoje pogreske, kod F-testa ustanovljujemo koliko je puta neka vari-

I
~· .

. .. . . ..
' .' - -. - •
~· -


I
' •
52 F-TEST

janca veea od druge varijance. Stoga se kod.testiranja znacajnosti razlike

rnedu varijancarna u brojnik uvijek stavlja veca varijanca. (No F -distri-

bucija, koja je osnovica F-tablicarna, dobivena je dijeljenjem velikog •
' •
broja F-omjera, kod kojih u brojnik uvijek stavljarno varijancu istog
uzorka, a ne obvezno vecu varijancu ). F -test dobio je ime u pocast statis-
ticaru Fisheru, koji je razvio tu metodu. F-test i F-omjer su istovrsni po-
jmovi, ali se katkada razlikuju taka sto se termin F-test koristi za uspo-
·,
redbu varijanci dva uzorka, a terrnin F-omjer koristi se u > analizi vari-
I.
jance. P

' •

G > geometrijska sredina

altonova "daska s cavlici " Uredaj sto ga jc Galton prcdlozio za


• demonstriranje nastanka > normabie distribucije, a koji se sastoji od
jedne nagnute povrsine, kojoi se u sredini na vrhu kroz prorez urnecu
kuglice koje na svorn putu prerna dolje nailaze na cavlice, koji irn puta-
'
nju po slucaju skrecu lijevo ili desno. Na donjern kraju nagnute povrsine
nalaze se pretinci, u koje kuglice upadaju i pri tome formiraju oblik nor-
,
maine raspodjele: najvise ih se nakupi u srednjern pretincu, a najmanje u
krajnjern lijcvorrt i krajnjem dcsnorn prctincu. BuduCi da sudar s ca-
• . . -' '

' •

Galton ova "daska s cavlici rna". A ko hismo



u nvakav urcdaj ubacivali odozgo kuglicc,
one hi sc u razlicitim smjcrovima odbijale
od cavlica (koji su prikazani kruzicima u -

· gornjem dijelu skice) i slagale se u donje
. pretincc u ohliku normalne distribucije .

. .

- - ....

'
GALTONOVA "DASKA S CAVLICIMA" GRAFICKI PRIKAZ DISTRIBUCIJE REZULTATA 55
vii!IIJI:t skri.!cc kuglicu po slucaju, to se na njezinu putu do dna najcesce populacija svake godine porasla 3 puta. To se dobiva odredivanjem geo-
11 1111 'l'nj i skrctanj a ponistavaju, pa najvise kuglica dospije u srednji pre- metrijske sredine, koja jeN-ti korijen iz umnozaka izmeduNbrojeva:
llll.tl', lJ krajnje pre tince dospiju samo or.e kuglice koje sukod svakog

11d 11 as rav li6em bivalc skrctanc na istu stranu. Galtonova daskajedan


11 w l nnjlloljih ured <:Jj a za demonstraciju kako nastanka, taka i smisla i
l11p.ll l' 1\ormn lnc d istrj_bucije, jer ukljucuje shvacanje obiju tendencii.?- pa u nasem slucaju dobivamo: G=.J4,5·2 = .J9 = 3.
lcqt p11 Jl:tH iankunormalne disttilnl.Q.i£al_'eluju: ndencijekjednoL(sre- Dakle, populacija je u prosjeku rasla 3 puta godisnje, sto dakako
I
dt 11)111) vJi1 ·d nosli Qij eva k u sredini) i tendencije djelovanja okolnih ? odgovara stvarnom stanju ukupnog porasta: od 1995. g. do 1997. stanov-
I nistvo je povecano 9 puta. [Da smo racunali aritmeticku sredinu, dobili
1.11· 1111" ( l'HV Ii ·i), pa oslucaju ovisi koliko ce oni djelovati na..pojedinacne I
'
' bismo (4,5+2)/2 = 3,25, sto bi bio netocan podatak.] Napomena: geo-
11 nillal ·. I'
~- metrijskq sredina ne maze se racunati ako je bilo koji broj 0 iii negativan.
c!ul tuuovn o~lv a (Galtonova oiiva) Naziv za > krivulju kumulativnih Geometrijska sredina katkada se naziva i "logaritamska" sredina. P
/t ,•/. ,,,.,, 'I'', koja i m a oblik r azvucenog slova S (vidi sliku ); ovaj se termin
11 IIIIV'II Vtl)('lll · rjedc upotrebljava. K glavni cfekti > slozena analiza varijance

1
goodness of fit > test stupnja podudaranja
I + 0,9
OB
0,1 gornja granica razreda > grupiranje rezultata u razrede
o.e
0,5
o. ~ graficki prikaz Prikaz rezultata dobivenih opazanjem ili mjerenjem s
0, '
I pomocu jednostavnih ili slozenih geometrijskih likova (krugova, kvad-
0,1 I
0,1 '. rata, kocaka i sl.), nekih drugih figura (figura covjeka, broda itd.) ili s
!--+-- I ·-1----1--1
0
10 12 14 18 18 20 22 24 26 2!1 3J 32
pomocu dvodimenzionalnog i1i visedimenzionalnog ( obicno) pravokut-
I nog kuon.Jinatnug sustava, da hi s~.: stu zornijc pokazali mlnosi unutar
'
pojedinih varijabli ili trendovi i odnosi izmedu dvije iii vise varijabli.
I I Vlllja kmnulativnih frekvencija ili Galtonova oziva. I
I
• Graficki prikaz omogucuje. zorni uvid u > interpolaciju i > ekstrapola-
ciju, as pomocu grafickog prikaza mogucc su i nckc solucijc prakticnih
u I 1 yui.Jn •• mmnulna distri/Jucija
I problema (primjerice, graficka solucija pri predvidanju najvjerojatnijeg
'',
rezultata u Yvarijabli na temelju poznavanja rezultata uXvarijabli). K
'"" 11 11 , n·rlln a (G) To je kao i > aritmeticka sredina takoder
,
'
1 11 till I d111 lt' IHI ' ncijc , a pre tezno se koristi kao mjera prosjecne graficki prikaz distribucije rezultata Prikaz u > koordlnatnom sustavu
1 l d 1 lllllllllt· n u. Na primjer, ako je neko mjesto 1995. god. imalo cestine kojom su dobiveni rezultati nekog mjerenja ili opazanja. Obicno
1 "" 111 ,,, l'l'lh. god. 9000, a 1997. god. 18000 stanovnika, ondaje l se na apscisu stavljaju vrijednosti rezultata, ana ordinatu koresponden-
1 1 1111 111! 111 l'l'llt.god inibio4,5putaveCiodbrojau1995.godini,a tna frekvencija rezultata. Na apscisu se mogu staviti bruto rezultati iii re-
'
1 1 II 1 , 11111/ pndl l ll' 2 puta vcca od one 1996. god. Prosjecno je I zultati grupirani u razrede (> grupiranje rezultata u razrede), a u tom
I.
I
I
I
"'• ' f I
.- w-• ·- --·

. -- -
.. . - - . . .
.. . . -. . ' -- -. •' ~

I
'
56 GRAFICKI PRIKAZ DISTRIBUCIJE REZULTATA GRUPIRANJE REZULTATA U RAZREDE 57
slucaju stavljaju se na apscisu ili srednje vrijednosti razreda ili granice • rdnu pogresku (pa dobijemo 68-postotne granice pouzdanosti), iii "do-
razreda. Ako su na apscisi bruto rezultati ili srednje vrijednosti razreda, damo" 2 (tocnije 1,96) standardne pogreske, pa dobivamo 95-postotne
onda se obicno dobivenc tocke spajaju crtama tako da se dobije > poli- granice pouzdanosti, a dodavanjem 2,58 standardne pogreske dobi-
gon frekvencija ili > laivulja distribucije frekvencija. Ako su na apscisi .varna 99-posto,,t~~" ~r~n.!c.~ pouzdanosti. ~~lJ>f~iko~Ltog"postupkll
granice razreda, onda se disuibucija rezultata prikazuje > histogramom. • . . . . .... zanvatj nutu ·(n.i cak prijede na negativne vrijednosti),
Katkada se- uglavnom samo zbog vizualnog efekta- distribucija prika- "'
::If;~.: . . . ''" . 'f~iki nije: stafisticki ~a:cajna~1P
zuje stavljanjem vrijednosti rezultata na ordinatu, a njihova cestina na I
'
apscisu. Glavni razing prikazivanja distrihucijc rczultata graficki jest

granicna (kriticna) vrijcdnost Broj, najccs6e u nekoj tablici, koji poka-
zorniji uvid u njezin oblik. K zujc koliko najmanje (iii najvise) mora iznositi neki rezultat (npr. > t-
odnos, > t-test, > hi-kvadrat test i dr.) kojim provjeravamo mozemo li
gran ice pouzdanosti Raspon u kojem mozemo uz manju ili vecu vjero- prihvatiti ili odbaciti nul-hipotezu. Svaki statisticki test ima svoje gra-
jatnost occkivati da sc nalazi prava vrijcdnost nekc karakteristike koju nicnc odnosno kriticnc vrijednosti, izrazene u jedinicama kojc taj test
smo izmjerit: na uzorku; npr. neka aritmcticka srcdina, dobivena na koristi: na primjcr, granicna vrijednost t za odbacivanjc nul-hipotcze I
uzorku, vise ili manje odstupa od prave aritmeticke sredine populacijc. kod testiranja statistickc znacajnosti razlika izmcc1u dvijc aritmctickc
I
Takodcr, razlika izmcdu dvijc aritmctickc srcdinc koju smo mjcrcnjcm srcdinc na razini znacajnosti 0,05 za vel ike uzorke iznosi 1,96, ana razini
dobili, najvjerojatnije nije "prava" razlika, tj. ona koju bismo dobili da
I
0,01 ona iznosi 2,58; granicna vrijednost hi-kvadrata za 1 stupanj slo-
smo mogli izmjeriti sve slucajevc u obje populacijc. Pogreska kojoj se hode na razini 0,05 iznosi 3,14, za 5 stupnjcva slohoclc 11 ,07 itd. p
izlazemo kad iz uzorka zaklju~uie,~o.~~~_r,o~ula~~ju, na~iva se _ > stan~ar-
dna Pogreska.. . cta J·e ~l<~cm
~ran'ii"!<"· ·"'··<esl("'
..,L.f..... ".P9&f: 7'iak'oae'f~W'fi~!
.......~a~ ---~L...~....J,_.!l
grupiranje rezultata u razrede Sazimanje rczultata dohivcnih mjcrcn-
jem ili opazanjem u manji broj statistickih (brojcanih) klasa odnosno
r

za nJu .-c;J!.·'·~ 1

razrcda. Koristi se u statistickim racunima koji se teinelje na tzv. >
• I ,. ,

~aa · akle izracunamo s_ki'acenzm pos!_upcima i za provjeravanje oblika > distribgcije rezyltata.
standardnu pogresku npr. neke aritmeticke sredine, onda mozemo naCi Skraceni postupci najcesce polaze od grupiranih rezultata jer vee
raspon ili interval u kojcm se uz vjerojatnost 68%, iii 95%, iii 99% (ili samo rupiran ·e rezultata u razrede skracu ·e racunski postupak. Grupi-
vise) nalazi prava vrijednost populacije. Najvise se u statistici upotre- ranje rezultata u razrede odvija se u nekoliko jednostavnih
' treha ·e vise rezul ta
bljavaju 95-postotne granice pouzdanosti i 99-postotne granice pouzda-
nosti. Ako neka aritmeticka sredina iznosi 50, a njezina standardna po- ·e rezultata bit ce i vise
. razreda. Ohicno se (arhitrarno) uzima broj izmedu 10 i 20 to je 'i
greska iznosi 2, onda su 68-postotne granice pouzdanosti te aritmeticke I
' hroj razreda, povecava se mogucnost iskrivljavanja stvarnih bruto
sredine 50 plus minus 2, dakle interval izmedu 48 i 52, 95-postotne gra-
tata, pa se zato preporucuje da se nikako, ili samo iznimno, uzima manje
nice pouzdanosti 50 plus minus 1,96 stand}rdne pogreske = 50±3,92,
.Jld-.7-r.azreda (osim u slucajevima kad rezultati ne omogucuju veci hroj
dakle 46,08 - 53,92, a 99-postotne granicc pouzdanosti dobivamo ako razrcda). VcCim hroj~_;m razreda nc postiz~_; s~_; cilj sazimanja r~_;zultata u
nadenoj razlici "dodamo" 2,58 standardnc pogreske. Ako testiramo sta- manji broj brojcanih klasa. Preporucuje se, takoder, uzeti neparan broj
tisticku znacajnost neke razlike izmedu dvije aritmeticke sredine, logika razreda, iako to nikako nije nuzno. Sljedeca odiuka odnosi se na
je potruno jednaka: nadenoj razlici "dodamo" lijevo i desno 1 standa- odrcdivanje velicinc > intervala razreda, za koji se ohi¢no koristi simhol

'
!'

'

~H. __ GRUPIRANJE REZULTATA U RAZREDE GRUPIRANJE REZULTATA U RAZREDE 59


, Pr i odrcdivanju brojcane vrijednosti intervala razreda mozemo postu- tit.i i na~nizi rez~ltat~. Ako pretpostavljamo da bi rezultati provedenog
1111 i t nko da > raspon dobivenih rezultata (razliku izmed~ najveceg i naj- mJerenJa trebah dati normalnu distribuciju, onda ce pri grupiranju re-
ru ,ruj cl' postignutog rczultata) podijelimo brojem razreda za koji smo se z~:t~~a u razrede. "s.to_ bolj.~ distribuciju" predstavljati ona koja je naj-
odhH~ ili. Primjer: pri nekom mjerenju imamo 150 rezultata (N=150) i shcmJa normalnoJ dttnbuctJI. Dakako, moze se pretpostaviti darezultati
" llruo ih grupirati u 11 razreda; najveCi postignuti rezultat iznosi (re- n:!erenja moraju biti u skladu is nekom drug om, nenormalnom distribu-
l lrrro) M, a najmanji 17. Provizornu velicinu intervala dobit cemo onda CtJom.
II VII ko:
. Va!ni~i razlog grupiranja rezultata u razrede (nego sto je koriste-
64-17 - nJe skracemh postupaka) jest kontrola iii uvid u oblik distribucije rezul-
- - = 4,3 (zaokruzeno).
11 ~ata <o iivem h ne"kim mjerenjem. VeCi broj bruto rezultata ne omo-

i gucuje uvid u oblik distribucije, pa ih je zato u veCini slucajeva potrebno
I
Ako sc brojcane vrij ednosti mjerenja razlikuju zajedinicnu vrijed- I

,gruplratt ~ manJi broJ .~l~sa, a to os obito vrijedi ka~e zeli distribucija re-
lllt NI (I), onda ccmo dobivenu vrijednost 4,3 zaokruziti nai = 4 ito ce biti
,zultata pnkaza tt graftcki. Zapravo bt svaka statisticka obrada rezultata
vr i jn lnost intcrvala razreda. Sljedeci korak jest odredivanje donjih i •
I re~~la zapoceti uvidom u oblik nj'ihove tstribucije, jer ce oDllk distri-
I'~'' njih granica razreda. Pocet cemo od najmanjih iii od najveCih vrijed-
b~ct e ru>kazat~ ~~sobito ~ko se upotrijebe i statisticki postupci za pro-
IIP:-I t i, a pucctna vrij ednost (aka polazimo od manjih pre rna veCima) I' VJeru ~dstupa h th ne dobtvena distribucija od ocekivane)~Ii mk ren' e
,
,,
lliO t.l' hili naj manji postignuti rezultat, pace najnizi razred hiti: 17-20.
ob~vl. e o ~ ad~In:'atan naci (iesu li svi rezultati dobiveni u jednakim
llrrnja granica sljedcccg razreda razlikovat cc sc za jednu jedinicu od UVJettma mJerenJa ttd.) i kakvi se statisticki ostu ci mogu i smi'u u 0 •
nwrlj l: granice prethodnog razreda pa cemo imati: 21-24; 25-28 itd. \
,
TI!j.eb.iti u dalj~joj statistickoj_pbradi rezultata (npr. smijemo Ii upotrije-
c lor nja granica najviseg razreda mora biti jednaka ili veca od najveceg ' ?ttt parJLmetnJske nostuRk~ ili samo neparametrijske). P,K
111 t 1gnutog rezultata, sto ce u nasem slucaju biti ovako: 61-64. Sta- -
1 Ii< ari razlikuju i tzv. prave donje i prave gornje granice razreda; to su
1:rnnic.:l' razreda umanfene odnosno uvecane za polovicu jedinicne vrije- •

dtHlSIi; tako ce prava donja granica najnizeg razreda biti 16,5, a prava
l'lllllja tog razred a bit ce 20,5. To razlikovanje potrebno je u nekim sta-
ll 11 k1lll racunima. Nakon sto smo odredili razrede, utvrdit cemo fre-
kvt•ol'iju rczul tata u svakom razredu tako da cemo prebrojiti sve rezul-
1,11<' koji spadaju u neki razred prema njihovoj numerickoj vcliCini. Pose
111p11 k j'rupiranj a rezultata u razrede u prilicnoj_je mj_eri arbitraran; cilj
..., • v• • • •v
11111 I'' dohiti "sto bolju distribuciju", pa se zato preporucuJe ucmttl vtse •

pok 11 aja da bi se postigao taj cilj. Osim toga, prvi pokusaj ne mora usp::
It 11npr. zhog toga sto uzimamo cjelobrojnu vrijednost intervala, pa nam • '
111 1110?: • uogoditi da dobijemo veCi ili manji broj razreda nego sto smo
, , lit h. 'l'ako bismo u gornjem slucaju s veliCinom intervala i = 4 dob.ili •
. ,. . .
I , , riL' 11 razred a. U ponovljenim pokusajima mozemo uzetl vect mter-
v tl , IIi mozcmo pomicati donju granicu najnizeg razreda (ona ne mora '
"dl\''v:r rati n~jnizem rezultatu, ali dakako najnizi razred mora obuhva-

• .'
.. ·- " .. . . . '
...- --
".•
_......
~
.
-
·-· ·-·-- · - ~~ ·-

. - ··- .
• -~- . .. ~ .

'

HI-KVADRAT DISTRIBUCIJA Ij
61 tr"•-.....
50, a drugi sat brzinom 100, onda je prosjecna brzina 75). No u gornjem
primjeru vozacje udaljenost od 200 km prosao za 4 sata, au povratku za
2 sata, pa je dakll: ukupno 400 km pro~ao za 6 sati, ~to znaCi 400/6 = 66,7
km/sat. P ·
. ~ ·r

hazarderska zabluda > "sazrijevanje sanse': > subjektivna vjerojatnost

hi-kvadrat distribucija Niz distribucija izraza hi-kvadrat uz razlicite


- '
stu n'eve slobode. Na primjer, kada bismo bacali 100 komada novCica i
gledali koliko puta smo dobili "pismo" a koliko puta "glava", pa svaki
put izracunali hi-kvadrat iz razlike izmedu opazenih i ocekivanih frek:
vencija ishoda "glava" i "pismo" (ocekivane su uvijek50%: 50%), i kada
bismo taj pokus ponovili nekoliko tisuca puta, dobili bismo hi-kvadrat
H > harmonicna sredina, > Kru.skal- Wallisov test distribuciju za 1 stupanj slobode. Aka bismo slican pokus ucinili s
••

igraCim kockama (gdje su ocekivane frekvencije svakog ishoda jedna


•---.
harmonicna sredina Rijetko upotrebljavana mjera "prosjeka", ali u ne- sestina oct ukupnog broja kocaka iii od ukupnog bacanja jedne kocke ),
kim situacijama onaje veoma korisna. Aka zelimo dobiti prosjeke nekih dobili bismo distribuciju hi-kvadrata za 5 stupnjeva slobode itd. Analizi-
odnosa (npr. prosjecnu brzinu nekog vozila na sat, prosjecni broj otip- rajuci povrsinu svake od tih distribucija, mozemo na.desnom kraju dis-
kanih slova u minuti itd.), onda nam harmonicna sredina daje tocan . -t
' tribucijc naCi 5% te.povrsine, tj. granicu iznad kojc se slucajno moze po-
odgovor. Pretpostavimo da udaljenost od 200 km neki vozac u jednom javiti taka veliki hi-kvadrat samo u 5% slucajeva. Ta vrijednost je stoga
smjeru prode brzinom od 50 km/sat, au povratku brzinom 100 km/sat; > granicna (kriticna) vrijednost hi-kvadrata u tablicama hi-kvadrata, na ·
kolika je prosjecna brzina tog vozaca na cijelom putu?
,..........
> razini znacajnosti od 5% (P < 0,05). Na slici su prikazane hi-kvadrat
.. . . . ('
Ona nije 75 km/sat, sto smo sklom IZJaVItl Jer 50+ 100 =
75) ,
, vee se ana S. s_ .. slupnjC\11 ~Job odc
2 so
racuna po formuli: '
• ·-
- ~ 40
~
t-- S. S.• I
N ~
H=--:- .::" )0

1 -~

L~
-~ 20
1.'1.• s
a. s.• 10
2 2 10
U nasem slucaju dobivamo: H == = = 66,7 km I sat.

100 50
-1 + 1 0,03 0
0 ~lc::2~J ~5~6~7:t8~9=1
f4 0 11 12 13
16171 819 20
:X:'
Do pogreske u rezoniranju dolazi zato sto u racun uzimamo samo
Hi-kvadrat distribucije (uz razlitite stupnjeve slobode ), koje bismo dobili u slul:ajevima
brzinu, a ne i vrijeme provedeno u nekoj brzini; aka je vrijeme jednako,
kada nema nikakvog razloga, osim listog slulaja, da se opazene frekvencije razlikuju od
onda je aritmeticka sredina to can odgovor (tj. aka 1 sat vozimo brzinom ol:e!Ovanih frekvcncija.

I
'

'
62 HI-KVAD RAT DISTRIBUCIJA
HIP01EZA 63

distribucije za 1,~;? i 10 stupnjeva slobode (s.s.). Iznad vrijednosti 11,1 da~ nz~rak (g_~r~ji·v ri~jer s rezultatima_testa), dva (grimjer
imajos 5% rezultata, ito je vrijednost koju mozemo odcitati u tablici hi- mu~ko-zen~ko) llt VI~~..nJth._,.U pone kim slucajevima racunanje se pro-
kvadrata (tablica je prilozena u Dodatku G). Analizom hi-kvadrat dis- vod)t na nesto drugaCIJI nacm od standardne formule ( > McNemarov
tribucije (vidi sliku) npr. za 5 stupnjeva slobode mozemo ustanoviti da se test .
najceSCi hi-kvadrat krece oko vrijednosti 3 - 4, pa da je stoga mali hi- Standardna formula ima ovaj oblik:

kvadrat jednako tako malo vjerojatan kao i veoma veliki - ako nema
sistematskog razloga da se opazene frekvencije razlikuju od ocekivanih. X 2 = ~ (!,, - [,) 2-
., LJ [, '
U slucaju suvise malog hi-kvadrata mozemo stoga zakljuCiti da je on
"predobar a da bude istinit", tj. da su vjerojatno rezultati falsificirani gdje !o ?znacuje opazene frekvencije, a fc teoretske fre!cvencije.
kako bi izgledali sto blize idealnim teoretskim frekvencijama. p . Najla~se se hi-kvadrat test izracunava aka rezultate unesemo u
• tabhcu s ovtm stupcima:

Ispitanici f,, (!,, - [, )2


!c f,,-fc (j,,-[,)2
[,
'

'
'
' '' '
'' '
'
'•••• •
'''
'•
• • •

'
••
•' •'
• ' •
•••

••' ''
'••
' •
'
'
' ••

Suma posljednjeg stupca ujedno je i zavrsni rezultaf,tj?lii'-kV~diit? p

hipo~eza (od grc. rijeci hypothesis, sto znaci podloga, osnova) Opcenito
znact.pr~t.postavku koju treba provjeravati i dokazivati. U znanosti to je
~d~a th pretpostavka kojom se nudi provizorno (privremeno) obja-
snJenJe _n:ko~ skupa opazenih podataka i odnosa medu njima ili provi-
zor~o rJesenJe znanstvenog problema. Kad je znanstvena hipoteza for-
muh~~~a .u operativnim terminima, tj. taka da ju je moguce provjeriti
empmJskim postupcima (opaZanjem iii mjerenjem), obicno se naziva
radna hipot~za, eksperimentaina hipoteza, altemativna hipoteza i sl. u
~sihologiji hipoteza je redovito tvrdnja o nekim osobinama pop~lacije,
t]. tvrdnja koja vrijedi opcenito, za cijelu populaciju, kao na primjer
"Frustracija izaziva agresiju", "Muskarci i zene su jednako inteligentni",
"Ponavljanje verbalne grade povecava kolicinu upamcenog materijala"
itd. Hipotezu je moguce formulirati i provjer:avati u vezi s razlicitim
o~~binam~ u populaciji koje se odnose na sredisnje vrijednosti, varija-
• '
,,. ostalc u etc istc· u samoj (ormuli_t ovisnost i- adrata b~htet, obhk distribucije itd. U empirijskim znanostima provjeravanje
_ o vclicini uzorka n,i je vidljiva ). Hi-kvadrat test om mozemo testirati je- htpoteze temelji se na logickom postupku odbacivanja posljedice, a to je
• .' . .. - -~ .. .. . .. •

64 IDPOTEZA HULLOVA SKALA 65

u formalnoj logici jedan od dva nacina na koja se ostvaruje mijesani hi- Hullova skala Jcdna od skala bazdarenja, a sluzi za interpretaciju i
poteticki silogizam, tj. postupak posrednog zakljuCivanja u kojemu je usporedivanje rezultata. Osniva se na pojmu > z-vrijednosti, dakle na
praemissa maior ili prva premisa (antecedent) hipoteticki sud, a prae- aritmetickoj sredini i standardnoj devijaciji, i obuhvaca 100 jedinica s
missa minor ili druga premisa kategoricki sud. Mijesani hipoteticki sud vrijednosti 0 na -3,5 standardne devijacije, vrijednosti 50 na aritmetickoj
ima dva nacina, modus ponens (postupak afirmiranja antecedenta) i sredini, i vrijednosti 100 na +3,5 standardne devijacije. Izracunava se po
modus toll ens (postupak odbacivanja konsekvencije ). U statistickom > formuli:
testiranju hipoteze > nul-hipoteza sluzi kao tvrdnja koju se odbacuje. K
Hullovi bodovi = 14,2Rz + 50
histogram > Graficki prikaz u kordinatnom sustavu odnosa izmedu
Npr. u testu s aritmetickom sredinom 50 i standard nom devijacijom 10,
veliCine rezultata i njihove cestine s pomocu stupaca. Na apscisi se nala-
rezultat 60 ima 14,28 (65-15)/10 +50= 71,42 Hullovih hodova. P
ze vrijednosti rezultata a sirinom svakog stu pea oznaccn je jedan rezul-
tat iii klasa (razn..:J) rczultata. Na oruinati sc nalazi ccstina rczultata i
vis ina svakog stu pea proporcionalna jc ccstini kojom sc pojavio ncki rc-
zultat ili klasa, tj. povrsina stupca odgovara broju rezultata u razredu ili
klasi. Na slici su prika-
zani rezultati mjerenja 80
• •
visine mlade2:i odredene
60
dobi grupirani u raz.redc.
K 40

30
.
20

Prikaz tcstinc rczultata mjcrc-


10
nja tje!esne visine s pomocu
histograma. Rezultati dobiveni
. . . .
mJerenJem grup1ram su u ra- 155-151 159- 162 ttJ -168 167 -170 171-11• 175-171 178-102

donje I gornJ• gr•nlct raued•


zredc. -
homoscedascitct Opcenito znaci homogenost u variranju, ali se ·
najcesce upotrebljava za oznaku podjednakog variranja vrijednosti u
jednoj varijabli, kada su te vrijednosti promatrane u zavisnosti od
razlicitih razina vrijednosti druge varijable. Drugim rijecima, homosce-
dascitet znaci da varijabla X ili Ypodjednako varira uz sve vrijednosti
varijable Y ili X. Upotreba > standardne pogreske prognoze teoretski

pretpostavlja postojanje homoscedasciteta. K


,

'

INDEKS EFIKASNOSTI PROGNOZE 67


I vece gomilanje rezultata u podrucju manjih vri'ednosti i tada je arit-
I .. -- -
meticka sredina veca od centralne .Y!ijed~sti (> ozitivna asimetricnost
I

'cr distribucik)J

indeks efikasnosti prognoze Vrijednost koja pokazuje djelotvornost


prognoze rezultata ujednoj varijabli na temelju poznavanja rezultata u
drugoj varijabli kad je korelacija medu tim varijablama razlicita od nul e.
Odreduje se s pomocu ove formule:

£=100 1- 1-rx/)
Kako je vidljivo iz formule, djelotvornost prognoze izrazava se u posto-
cima (jersc mnozi sa 100), tj. ako je recimo E = 35%, onda to znaci dace
prognoza biti 35% tocnija u odnosu na prognozu "naslijepo", odnosno
indeks (lat. index znaCi prokazivac, uhoda; kaziprst) Velicina (obic~o na prognozu koja se ne bi temeljila na poznavanju stupnja povezanosti
oznacena nekim simbolom, a najcesce latinskim ili grckim slovom) koJa izmedu dvije varijable. Maksimalna pogreska, tj. najmanje tocna prog-
pokazuje neku stalnu promjenu (u vremenu ili/i prostoru), ali koj~ nije nozajest ona koju mozemo napraviti kad imamo samo podatke o arit-
moguce izravno opaziti ili izmjeriti, vee je izvedena vrijednost koja po- metickoj sredini i standardnoj devijaciji u varijabli u kojoj prognoziramo
kazuje odnos medu nekim promjenljivim veliCinama. Nerijetko _s~. za- neki rezultat (u takvom eemo slucaju uvijek prognozirati aritmeticku
mjenjujc terminom > koeficijent. Primjcricc, takav je indeks koeftctJent sredinu, a pogreska kojoj se pri tome izlazemo jednaka je standardnoj
varijabilnosti, indeks nataliteta i sl. K devijaciji u toj varijabli). Djelotvornost prognoze je zapravo razlika
'
izmedu standardne devijacije u varijabli u kojoj se prognozira rezultat i
indeks asimetrije Indeks ko'i okazu·e u ko'em stu n·u neka distribu- > rezidualnog varijabiliteta, koja razlika je izrazena u postocima maksi-
cija frekvencija Q_dstupa o_E potpune simetrij~. Normalna di~~r~ucija je malnog varijabiliteta (maksimalne pogreske koja je jednaka standard-
- simetricna i u nje su > aritmeticka sredin.E:.J.. > centrqlnq_¥!JJednoscnu- noj devijaciji u varijabli u kojoj se prognozira rezultat). Na primjer, neka
. • me rigkfjednake, Qa se na toj Cinjenici termaji i ovaj inCleks: je Mx=84.2, sx= 12.36; My=57.1, sy=9.45 i rxy=0,54. Ako bismo u ovom
3 (1.1·..- C), gdje jeM aritmeticka sredina, C centralna vrijednost, as slucaju htjeli prognozirati rezultat u Yvarijabli na temelju rezultata uX
a=
s varijabli ina temelju korelacije izmeduX i Yvarijable, efikasnost prog-
standardna dcvi· acija nckc odrcdenc distribuci· c. i\ko jc distribucija noze iznosila bi E = 100 ( 1- ~1- 0,54 2
) = 16. lli:
simetricna, a ce tada iznositi nula (q); sto je asimetricn~st v~ca, bit.ce i ~
veci. Ako je a negativne vrijednosti, to znaci da posto 1 vece o tlan e Sy-sy(x) ·100= 9,45-7,95 ·100= 16%
rezu tata u ~podrucju veCih vrijednosti _ na desnoj strani aps~i~e u, gra- sy 9,45
- fickom p_rikazu distribucije ), je! ce tad a centralna vrij~dnost bttt ~ca o~ (syje standardnadevijacija u varijabli Y, a sy(•l > indeksrezidualnogvari-
aritmeticke sredine • t;kv_? o~tupanje naziva se > negativna a~zmetr~­ jabiliteta). Prema tome, prognoza ce biti 16% tocnija od prognoze "na-
-cnost distribucije. Pozitivna vriiednost ind~ksa asii!!_et.Die pokazu e da JC slijepo". K

'
. ..:'.. :.·;~ ·. .. - ~
. --.-------
...- .
.. --. '

--
·~· ~

. -- -
... ,•

' -
. -

68 INDEKS POLUINTERKVARTILNOG RASPRSENJA (Q) . IN'IERAKCIJA (U STATISTIC!) 69


1t
indeks poluinterkvartilnog raspdenja (Q) Polovica razlike izmedu nu-

drugom vrstom pojave, kao sto se primjerice temperatura lZrazava VlSl-


v 0 •

'
mericke ·· se nalazi na granici prve eetvrtine ( rvog..
•. ~
nom stu pea zivc iii clektricni napon otklonom kazaljke na voltmetru. K -
) i trece ~M1ill~;< (..U:~~g, kyartil<~; u nizu rezultata oredanih o
inferencijalna statistika Naziv za onaj stupanj statistickog nacina mi-
velicini: • • " • 0 •

~ljenja koji sc ne zadovoljava jednostavnim konstatJranJ~m c~~Jem~a,


Q= Q3 -QI dobivenim razliCitim ~jerenjima, v~c,Y:pQzorava nato da JC.yec;~na mJ,e-
2 reni,~ ~~~iyena na > uzorcima, a ne na > eeeulaciLi ..Bu~~ci. cta ce mn?~~
Q jc indckU]oluint£!ky_artilnog_ras rsenja a Ql_i QJ_granicne vrijed- ·1J1 jcrcnc karaktc.tistikc, nadcnc na uzorcima, pokazat1 tZVJvStan vcc1 til
nosti prvog, odnosno treceg kvartila. Granicne vrijednosti kvartila manji varijahilitct (npr. ako na 5 uzoraka od po 20 ispitanika ispitamo
odredu_iu .sc·, tako Q_a_se tvrdi vrijcdnost koja se u nizu rezultata pore- odnos izmedu intenziteta podrazaja i brzine reagirarija, dohit cemo
danih o vcliCini (od manjih prcma vcCima) nalazi u ravo na ranici doncklc razliCite rczultatc za svaki uzorak), postavlja sc pitan;c do koje
~ prw cciYctim: ..p.s.!Yt~.),.<.u.l.pQ;no t~"7:cc cetvrtinc....(75% ukupnqgbr,pj~ rc- gran icc smijcmo iz rezultata, dobivcnih na mjcrcnjuuzorka, zakljuciyati
zultata. I oluinterkvartilnog rasprsenja koristi..se_u .sluCaj.e¥ima ,na stanje u llQ_pulaciji..Na primjcr, ako smo izmjcrili visinu 50 dcsetogo·-
i > centralna vrijednQJt .. K diSnjih djecaka u gradu A i 50 dcsetogodisnjaka u gradu B, i pri tome us-
tanovili da su djcca iz grada A prosjccno 2 em visa od djccc iz grada B,
indeks rezidualnog varijabiliteta Varijabilitet u jednoj varijabli (reci-
smijemo Ii iz toga zakljuciti na "opcu" pojavu, tj. da su zaista desetogo-
mo Yvarijabli) koji ostaje i kad rasprsenje rezultata u toj varijabli pro-
disnji djecaci iz grada A (u slucaju da smo ih uspjeli sve izmjeriti) pro-
matramn povczano s rczultatima u drugoj varijahli (rccimoXvarijabli),
sjccno visi od djecc iz grad a B (takodcr izmjcrcnc u punorn l>n >ju )'! Dru-
a korelacija medu tim varijablama razlicitaje od nule. Indeks tog varija-
gim rijecima, !.n.fcr~~cijalna statistika pita sc kolikoj sc pogrcsci izlazc-
biliteta maze se odrediti izravno na taj nacin da se izracuna rasprsenje
mo kada iz rezultata dobivenih na uzqrku zakljucujcmo na R.Qpu).gciju,
(standardna devijacija) svih onihrezultata uy varijabli koji su povczani s
f .!vriie_di li i koliko vrijcdi ncka ciQ. cnica,_!]_adena na u o , i za.p.apula-
odabranom fiksnom vrijednoscu uXvarijabli. Buduci da se pretpostav-

ciju, ili jc dobiveni rezultat samo p_osljedica slucajn g yarirania medu
lja daje rasprsenje rezultata u Yvarijabli vezanih uzpojedine razlicite fi-
uz.orcima, Konkretno, inferencijalna statistika se ita jtDJ nad~na razli.=
ksne vrijednosti ux varijabli podjednako (to je tzv. > homoscedascitet),
_}(a medu visinom djece A i B ~ad ova > statistickLznaca · a,... · postoji li
onda taka dobivena vrijednost maze sluziti kao opca vrijednost.
on a i u opulaciji ili je mozda slucajna QOSljedica razlike~11J-edu.k:o.oktet-
Medutim, indeks rezidualnog varijabiliteta redovito se odreduje po ovoj - -
o cima.. Buduci da se provjeravanje taka postavljenih pitanja go-
formuli:
tovo bez iznimkc osni·va na logici i zakonima >; rwrmalne distrjhucije, a
normalna je distribucija vee u cijelosti opisana u > deskriptivnoj statis-
s y(x) = s y ~1- r.. y
2
tici, neki statisticari upozoravaju da je podjela na deskriptivnu i inferen-
gdje jc sy standardna devijacija u Yvarijabli, a rxy koeficijcnt korelacijc cijalnu statistiku clodusc korisna u praksi, ali da mozda nije potpuno
izmeduX i Yvarijable. K logicna. P

indirektno mjerenje Svako (neizravno) mjerenje u kojemu se veliCina interakcija (u statistici) Opcenito oznacuje posljedicu vezanog (zavi-
r
mjerenja ne izrazava istovrsnom (> direktno mjerenje), nego nekom sP.og) utjccaja dviju iii vise varijabli odnosno Cimbcnika. U > sloienoj
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ··h ' • )" ,._ •

' INIERPOLACIJA 71
70 INTERAKCIJA (U STATISTIC!)

analizi varijance govori se o interakcijskom efektu onda kad rezultat u (ili "krivulje") u grafikonu nisu paralelne (krizaju se ili zatvaraju neki
kut), postoji interakcija. Je li interakcija statisticki znacajna, pokazat ce
r zavisnoj varijabli, dobiven pod utjecajem jedne razine jedne nezavisne
varijable, ovisi o istovremenoj prisutnosti odredene razine druge neza-
racun analize varijance.
Maze postojati i interakcijski efekt drugog recta u faktorijalnom
visne varijable. Interakcijski efekt prvog recta moze postojati u > faktori-
eksperimentu s tri nezavisne varijable (ako su nezavisne varijable
jalnom eksperimentu s dvije nezavisne varijable (ako nezavisne varijable
oznacene sA, B i C, onda se biljezi Ax B x C) itd. Katkada se interak-
oznaCimo s A i B, onda interakcijski efekt biljezimo AxB). Na slici je cijski efekti dvije varijable nazivaju interakcijskim efektima nizeg red a a
graficki prikazan interakcijski efekt u najjednostavnijem slucaju slozene oni ~zr::e~u tr~ i .vi~e .varijabli..int.erakcijski efekti viseg recta. Postojadje
•• analize varijance s dvije nezavisne varijable, a svaka od njih ima samo statlsttcki znacaJmh mterakClJSkih efekata u > slozenoj analizi varijance
dvije vrijednosti ili dvije kategorije: A i B, te I iII. Na lijevom grafikonu utjece na formiranje > F-omjera i na interpretaciju glavnih efekata ( >
vidi se da ee rezultat u zavisnoj varijabli u kategoriji I jedne nezavisne slozena analiza varijance). K
varijable, vezan uz kategoriju A druge nezavisne varijable, biti znatno
nizi nego kad je katcgorija I vezana uz B. Naprotiv, u kategoriji II jedne interakcijski efekt > interakcija (u statistici)
nezavisne varijable postignuti su u zavisnoj varijabli podjednaki rezulta-
interkorelacije > Koeficijenti korelacije izmedu jedne varij able i manj eg
ti i u A i u B kategoriji (za Aje samo malo manja vrijednost nego za B).
ili veceg broja drugih varijabli; izraz se najce5ce koristi za koeficij ente
lnterakcija se graficki moze prikazati stavljajuCi jednu nezavisnu varija-
korelacije jedne varijable i niza drugih varijabli prikazanih u > matrici
hlu na apscisu, a druga se prikazuje zasebnim "krivuljama". Tako je na korelacija. Termin interkorelacija katkada se koristi umjcsto termina
slici u lijevom grafikonu nez.avisna varijabla "A,B" stavljena na apscisu, koeficijent korelacije ili termina > korelacija. K
a nezavisna varijabla "I,II" prikazana je zasebnim crtama. Na desnom
grafikonu prikazanaje ta ista interakcija, alije sada na apscisi nezavisna interkvartilno odstupanje > indeks poluinterkvartilnog rasprsenja (Q)
varijabla "I, II". I ovdje se vidi dace rezultat u zavisnoj varijabli pod utje-
cajem jedne vrijednosti jcdne nezavisne varijable ovisiti o prisutnosti . interpolacija Postupak kojim se na temelju dvije (ili vise) poznatih vrije-
dnosti o.dreuu· nepoznatavrijed.nost.k.Q_· e 1 z' 'z edu tih oznatih
odredene vrijednosti (A ili B) druge nezavisne varijable: ako je prisutno
vrijednosti (vidi sli!rn). Ako je odnos medu varijablama linearan, onda
A, rezultat ce biti manji, ako B, rezultat ce biti veCi. Opcenito, kad crte
'
' _se vrijednos.ti mogu int~r olirati s dovoljnom precizno.Scu. Ako, medu- -
70
70
--t.-A "" tim, odnos (krivulja kojom je p_ti-
e I e B
--6-11
65 • ""-..
.., ------·---···----·--··----, kazan odnos izmedu dvije varija-
...... ,
00 ·
60 l ,.
ble) mij.enja-S-mj.er, inter.pulrujj a
55
,
!' .na kriticoim.mj.estima m.o~.e f}ove-
50 ! _s_tLd0-bi·~a0--po.gresnib.zakljucaka.
"'
45
10 .
i' (> ekstrapolacija). K
''
~t---~·------~----- ''
40 .t---- -+-- --+------< I II 0~--------~~·~----~
A B 0 15 3) <45 00 105 120 135

Orafi~k a ski ca interakcije u slozenoj analizi varijance. Detaljan opis nalazi se u tekstu
81 Grafitki prikaz interpolacije.
( > ill ll!rakcija ).
• '

- .
'
72 IN'IERVALNA PROCJENA I1EM ANALIZA 73

intervalna procjena Oznaka za graniee ( > granice pouzdanosti) u koji- interval ra:~:reda Razlika izmedu gornjih graniea (iii donjih granica)
ma se s odabranom sigurnoscu (ili rizikom) nalazi statisticka vrijednost razreda rezultata grupiranih u razrede ( > grupiranje rezuttata u razrede ).
koju proejenjujemo (to je obicno parametar). K Ako postoji prakticna iii statisticka potreba sazimanja vrijednosti rezul-
tata u manji broj statistickih (brojcanih) razreda iii klasa iii ako ne posje-
intervalna skala Za ovujc skalu karaktcristicno odredivanje jcdnakosti
dujemo dzepno racunalo pa moramo sve sami izracunavati, kod izracu-
intervala iii razlika. Zbog ..toga se naziva
.... ............ ... - .. ,_ . i, sl_c?l.iot je.clnakih jeqiniea, tj.
·'
- ~ --- -. · · ~·~ ~

navanja aritmeticke sredine i standardne devijaeije velikog- broja rezul-


skala s ekvidistantnim jedinicama. Ona je kvantitativna u uobicajenom
smislu'ie~fijeti:·· si~h~li<iki, p~a~ilo koje tvori ovu skalu moze se izraziti tata sluzimo se tzv. "skracenim metodama", kod kojih rezultate grupi-
ovako: (a-b) + (b-e)= a- c. Npr. ako je a= 20, b = 15, a e = 10, onda ramo u razrede koji moraju po svom rasponu biti jednako veliki, pa
(20-15)+(15-10)= 5+5=10, a isti rezultat dobijemo kad od a=20 od- nakon toga sve rezultate toga razreda proglasimo kao da su jednaki, tj.
hijcmo e= I 0. Kod intcrvalnc skate (za razliku ocl > nominatne skate i > da imaju vrijcdnost sredi nc razrcda. Na pri rnjcr, a ko smo neke rczul tat l~
ordinatne skate). mo~a postoj ati kore.spondencij a izmedu r.az_lika u poj ayi. grupirali u razrede: 10 -14, 15- 19, 20-24, itd., ti su razredi jednako veli-
koja je predmet mjerenja i razlil.m u skalnim brojevima. Mogucnost ki i svaki od njih obuhvaca pet moguCih vrijednosti. Interval razreda u
r· · ·-. .. ... .. .. .. ..... ,.. . .. .
zbrajanja razlika na skali ne omogucuje aditivnost apsolutnih vrijed- ovom primjcru iznosi 5, jcr razrcdi rastu u intcrvalima od po 5. P
nosti na skali zbog toga stu ne postoji stvarna nulta tocka skalc, vee jc
samo arbitrarno postavljena. Transformaeije, koje su dopustive i mo- item analiza (item analysis) > analiza cestica
guce kod ave skale, tj. koje je ostavljaju invarijantnom (nepromijenje-
nom ), moraju biti ne samo monotone ncgo i line arne, a to znaci da sc
vrijednosti mogu samo zbrajati ili mnoziti konstantom.
lntervalna skala spada medu dobre skale i u psihologijskim mjere-
njima cesto se sluzimo tom skalom ili "gotovo takvom" skalom. Svoje
ime intervalna skala dobila je po tome sto ima jednake razlike medu ·
brojcanim vrijednostima i objektivno jednake na bilo kojem dijelu skale:
na primjer, u tluzinskoj skali razlika izmedu 3 i 10 em iznosi 7 em, a
izmedu 117 i124 em razlika takoder iznosi 7 em i tih 7 em objektivno su
jednake duzine u oba slucaja ( dakle intervali su jednaki). U psihologiji
rijetko raspolazemo takvim rezultatima mjerenja koje mozemo smjes-
titi na pravu intervalnu skalu: na primjer, objektivna razlika izmedu 90 i
'

100 bod ova u nekom testu ne mora biti jednaka razlici izmedu 40 i 50 bo- .
dova u tom istom testu. No, psihometricari, koji su se savjesno bavili tom ·
Cinjenicom (jer veCina statistickih postupaka zahtijeva rezultate mjere-
nja harem na intervalnoj skali), ustanovili su da standardnim statis-
tickim postupeima na nizu psihologijskih mjerenja, za koja samo djelo-
micno mozemo smatrati da nam daju vrijednosti na intervalnim skala-
ma, dobivamo dovoljno upotrebljive rezultate, zapravo takve kao da
nam se vrijcdnosti mjerenja nalazc na intervalnim skalama. P, K
'

JEDNOSTAVNA ANALIZA V ARIJANCE 75

se i predvidena vrijednost u y varijabli sve vise priblizava aritmetickoj


sredini u toj varijabli (odnosno z-vrijednosti jednakoj nuli). K

jcdnosmjerni test > dvosmjemo i jednosmjemv testiranje


II

jednostavna analiza varijance (JANVA) Statisticki postupak kojim se


provjcrava jc li varijabilitetu rezultata dobivenih mjerenjem (iii opaza-
njem) u Gednoj) zavisnoj varijabli u razlicitim eksperimentalnim prili-
kama (situacijama ili tretmanima) uzrok neki sistematski faktor iii se
njihov varijabilitet moze pripisati nesistematskim varijabilnim fakto-
rima (tzv. "pogresci"). Temeljni, paradigmatski slucaj primjene jed-
nostavne analize varijance izgleda ovako: izabrani > uzorak ispitanika
podijeli se po slucaju u skupine koje se po slucaju pridjeljuju razlicitim
eksperimentalnim situacijama, kojih ima vise od dvije. Na n :zlicitim
JANVA > jednostavna analiza varijance

. skupinama aplicirane su, dakle, razlicite vrijednosti nezavisne varijable .
J -distribucija > J-krivulja Ako statisticka analiza pokaze da se aritmeticke sredine razlicitih skupi-
na ispitanika medusobno razlikuju (statisticki znacajno ), to ce znaCiti da
'k ..
au koordi-
jednadzba pravca regresije Kad se > crta regresz;e, pn az~n . v • postoji diferencijalni utjecaj razliCitih eksperimentalnih situacija (ra-
natnom sustavu, moze opravdano opisati pravc.em, tad se 1~atemat~cki zliCitih vrijednosti nezavisne varijable ). Receno drugacije, to ce znaciti
- · ati ·ednadzbom pravca Y=aX +b, gdje je a koefiCIJcnt nag1ba, da je sistematski varijabilitet (uzrokovan zazlicitim vrijednostima/kate-
moze op1s 1 , . ·v •··
a b odrezak na osi Y. Ta jednadzba, izrazena s pomocu stat1st1cki11 vn]e- gorijama nezavisne varijable) veci od slucajnog varijabiliteta ( odnosno
l

dnosti, najcesce ima ovaj oblik: varijabiliteta pogreske). Polazi se od pretpostavkc da su svi ispitanici,
bez obzira kojoj skupini pripadali, iz iste populaci}e i da se prema tome
. s )
Y=r xy S
Y (X-Mx +My medusobno ne razlikuju po rezultatima u zavisnoj varijabli ( opcenito >
X
nul-hipoteza glasi da nema razlike medu skupinama), tj. da se aritme-
gdje je y najvjerojatniji bruto rezultat ~.Y vari!.abli za br~to ~~zul:a~~ ~x
tickc srcdinc pojcdinih skupina ispitanika nc razlikuju od njihovc zajc-
varijahli uz korclaciju rxy izmcdu tc dVIJC varlJ<\hlc ( o~dJC tdJ kocflcqc~t
dnicke aritmeticke sredine i da se ta zajednicka aritmeticka sredina ne
korelacije ima smisao koeficijenta nagiba pravca); sx 1Sy s~ kore.s?ondc-
I

razlik~je od aritmeticke sredine populacije.


ntne standardne devijacije te Mx i My korespondentne aritmetlcke sr~-
. • v -
0 ·, ·
• dvida pretvaranJe Polazi se od ovog model a: rezultat svakog ispitanika bio bi jednak
dine. Kako sc iz ovc Jednadzbc moze VI JCtl, on a pre . .. .
bruto rezultata uz-vrijednosti u x varijabli, i pretvaranJe z-~.IJed~o.stl ,u opcoj, zajednickoj vrijednosti, koja se moze prikazati s pomocu za-
jednicke aritmeticke sredine svih ispitanika, kad bi na rezultate djelovali
bruto rezultat U y varijabli. Q veliCini koeficijenta kore}aCl~C O~lSlt..ce
samo konstantni faktori. BuduCi da je struktura svakog rezultata
~ l. predvidcna vrijednost (u y varijabli) biti hlizc null u z-vrlJC~
h ()CC I .. bl'v • d k slozenija, jer na njih djeluju i sistematski i nesistematski varijabilni fak-
dnostima, tj. aritmetickoj sredini u bruto vrijednostima lh ~~e JC n~ OJ tori, onda se strukturna formula svakogrezultata moze prikazati ovako:
z-vrijednosti kakvaje u x varijabli: sto je koeficijent korelactJC man] I, to
I
' . .... ' •

'
76 JEDNOSTAVNA ANALIZA V ARIJANCE JEDNOSTAVNA ANALIZA V ARIJANCE 77
Ovdje se radi o varijancama pa zato ove razlike treba kvadrirati, a,
X=.u+a+£ naravno, razlika ima koliko i ispitanika pa ih treba sve zbrojiti i tako do-
gdje jc .u prava aritmeticka sredina ili aritmeticka srcdina populacije biti zbroj kvadriranih razlika. Kad se ti zbrojevi podijele s pripadnim
(koja predstavlja pravu vrijednost mjerenja), a je nezavisna varijabla stupnjevima slobode, dobiju se varijance. U stvarnoj provedbi jednosta-
(tocnije: vrijednosti nezavisne varijable ili razlicite eksperimentalne . vne analize varijance, varijance se odreduju na temelju tzv. suma kvad-
situacijc ili jednostavno sistematski faktor koji djeluje ili maze djelovati rata koje se dijele pripadnim brojem stupnjeva slobode. Te sume kvad-
na rezultate mjerenja ), a e je pogrdka cija je aritmeticka sredina pri rata dobiju se kvadriranjem bruto rezultata i uvrstavanjem u radne fo-
vecem broju mjerenja odnosno ispitanika jednaka nuli, njezina vari- rmule. Radna formula za odredivanje tzv. totalne sume kvadrata maze
janca predstavlja varijancu rezultata i nije u korelaciji (nezavisna je) s imati ovaj oblik:
ostalim fakorima u ovoj strukturnoj formuli. Dakle, ovdje .u predstavlja
konstantnu vrijcdnost, a a i £ uzrokuju varijabilitet rezultata. Analizom X1 + X2 +... + Xc - --'--------......::.:..:._____:_~
N
varijance utvrduje se kakav je omjer izmedu varijance a i varijance £ i
Sa X oznacen je svaki pojedini bruto rezultat, sa subskriptima 1,2... g
taj se omjer naziva F-omjer. Ako je varijanca a dovoljno puta veca od
oznacene su skupine (grupc) ispitanika koje su bile u razlicitom eksperi-
varijance e, to znaci daje sistematski varijabilitetveCi od slucajnog vari-
mentalnom tretmanu (aplicirane su razlicite vrijednosti nezavisne vari-
jabiliteta i tada se odbacuje nul-hipoteza. Zapravo, kod jednostavne
jable), aN oznacuje ukupan broj ispitanika (svih skupina). Kad seta
analize varijance smisao F-omjera je ovaj:
suma kvadrata podijeli pripadnim brojem stupnjeva slobode (u ovom
(procjena varijance pogreJke) +(n pula procjena efekata nezavisne varijable) slucaju to ce biti N-1 ), do bit ce se tzv. totalna varijanca, koja pokazuje
F= (procjena varijance pogreJke) ukupno variranje rezultata bez obzira kojoj skupini pripadaju. Lako se
Ovdje se radio procjenama zato sto baratamo uzorcima, a ne pravim, maze vidjeti da je ovaj postupak identican postupku koji se redovito rabi
populacijskim vrijednostima. za racunanje varijance ( odnosno standardne devijacije) iz bruto rezulta-
Prethodno navedena strukturna formula maze se pisati u termin- ta (tzv. skraceno racunanje, jer se polazi od bruto rczultata, a ne od
ima razlika, odnosno varijance zato sto se mjereni (dobivcni) rczultati razlika):
' .
manje ili vise razlikuju od prave vrijednosti; jedan od moguCih nacma
takvog prikaza zarezultate nekog stvarno obavljenogmjerenjaje ovaj:
s2 = N
N-1
Ovaj se identitet moze citati ovako: razlika svakog pojedinog rezultata Suma kvadrata za variranje izmedu grupa maze se izracunati ovako:
(X) od ukupne ili zaj~dnicke aritmeticke sredine svih ispitanika koji su
sudjelovali u nekom eksperimentu (Mu) maze se prikazati kao zbroj
razlikc izmedu svakog pojedinog rezultata (X) od aritmeticke sredine
skupine kojoj ispitanik u eksperimentu pripada a kojoj je aplicirana
'

neka od::-edena vrijednost nezavisne varijable (M~:) i razlike izmedu pri- Ovdje je s n 1, n 2, ... , ng oznacen broj ispitanika u svakoj skupini. Kad se
padne skupine u ekspcrimentu (Mg) i ukupne aritmeticke sredine (Mu)· ova !;Uma kvadrata podijeli pripadnim brojem stupnjeva slobode (to je u
'

78 JEDNOSTAVNA ANALIZA V ARIJANCE


J-KRIVUUA (J-DISTRIBUCIJA) 79
ovom slucaju broj grupa manje jed1n, ili g-1), dobije se varijanca koja
P_ogre.Ska .t~'a 1. Ako ostajemo na H0 iako nije tocna, cinimo pogresku
dt ~~1-a. J:dnostavnom racunicom (tako kafu statisticari)
pokazuje koliko je variranje medu grupama ispitanika koje su bile u
tJpa f3
razliCitim eksperimentalnim tretmanima. 1:(.1-a)",. gdJe Je n broJ parova aritmetickih sredina, dobijemo stvarni
Suma kvadrata za slucajni varijabilitet, tj. varijabilitet koji pred- rtztk koJemu se izlazemo pri odbacivanju H 0 iako je tocna; npr.
4
stavlja pogresku moze se izracunati po ovoj radnoj formuli: 1-(1-0,05) =0,185. To bi, dakle, znacilo da se, u slucaju kada imamo 4
~ara aritmetickih sredina, vise ne izlazemo riziku od 5%, nego riziku od
cak 18,5%. K

J-krivulja (J-distribucija) Veoma asimetricna distribucija rezultata


• "" v , • ,. • • '

ili ~aJcesce s naJvectm YriJednostima na lijevoj strani (pozitivno asimetri-


cna), tako da zapravo predstavlja "zrcalnu sliku" velikog slova "J". Na-
ziv J-krivulja ne oznacuje neku posebnu, matematicki definiranu
ras.podjelu (kao sto su npr. nmmalna raspodjela, binomna raspodjela:
P01ssonova :aspodjela), vee je samo opis oblika distribucije, a uz
Kad se ova suma kvadrata podijeli pripadajuCim brojem stupnjeva od:edene UVJ~te taj oblik mogu imati i neke poznate distribucije (npr.
sloboclc [(n r 1) + (nr 1) + ... + (n~-1)] iii N-g, gdjc jc g broj grupa, dohijc P01ssonova, bmomna, ncgativna binomna). Kao > asimetricna distri-
se varijanca koja pokazujc variranje unutar grupa, tj. variranje koje po- ~ucija J -krivulja katkada moze ukazivati na neke karakteristike mjernog
kazuje eksperimentalnu pogresku i pogre5ku uzorkovanja.
mstrumenta (npr. izrazito pretezak iii prelagan test dat ce asimetricne
Ako je dobiveni F-omjcr statisticki znacajan, sto se mozc odcitati rezultate slicne J-krivulji). p
iz tablica F-omjera (vidi tablicu u Dodatku C) ili racunalni program
izravno pokafe razinu znacajnosti, onda se moze posebnim postupkom f

utvrditi izmedu kojih skupina ispitanika postoji statisticki znacajna


razlika u aritmetickim sredinama. Postoji nekoliko postupaka koji sc u
tu svrhu mogu koristiti, a najvisc upotre1)ljavan je > Scheffeov test. Kad
F-test nije statisticki znacajan (kad ostajemo na nul-hipotezi), onda po- I
I
traga za znacajnim razlikama nije dopustcna.
l
Temeljni razlog zbog kojega se najprije mora F-omjerom utvrditi
postoji li uopce statisticki znacajna razlika medu aritmetickitn sredi-
nama, a tek onda provjeravati razlike medu parovima aritmetickih
sredinajest u tome sto se povecanjem broja parova aritmetickih sredina
izmedu kojih se testira znacajnost razlike mijenja razina znacajnosti. IIi,
drugacije reccno, povecava se sansa da se razlika proglasi znacajnom, tj.
da se odbaci H 0 iako je ona tocna. S a se obicno oznacava razina rizika
da cemo odbacitiH0 iako je toena; taj rizik redovito ne prelazi 5% (P <
0,05), a samo iznimno doseze 10%. Naziva se jos i pogreska tipa a ili >


'
KLASTER 81

stupanj povezanosti izmedu dva ranga. Na primjer, ako sedmero sport-


skih sudaca rangira 10 natjecatelja, katkada je zanimljivo znati kakvo je
• medusobno slaganje medu sucima: ako je, naime, s1aganje potpuno (tj .
svi su jednako rangirali svih de set natjecatelja), onda nam nije potreban
"prosjecan" rang; ako pak medu njima nema nikakvog slaganja, pro-
sjecni rang tada nema smisla, jer ce svi natjecatelji imati slican (ili isti)
rang. Dakako, postoji teoretska mogucnost da se izracunaju svy moguce
rang-korelacije za sve parove sudaca (ako je 7 sudaca, treba izracunati
21 rang korelaciju, > usporedivanje u parovima) pa iz toga izracunati
"prosjecnu" rang korelaciju (sto bas ne bi bilo sasvim opravdano). U
takvim situacijama koristan jc Kendallov koeficijent konkordancije W.
Taj koeficijent testira odnos izmedu stvarnog slaganja niza rangova i
kanonicka korelacija Korelacija izmedu vise > prediktorskih varijabli i maksimalno moguceg slaganja, te moze iznositi od 0 do 1. Logicki je
vise > kriterijskih varijabli (> multipla korelacija). K ·
lako shvatiti da taj koeficijent moze biti samo pozitivnog predznaka, jer
samo dva ranga mogu biti iii u pozitivnoj ili u negativnoj korelaciji, ali tri
kanonicka regresija Statisticki postupak (> regresijska analiza) kod ko-
ili vise rangova ne mogu, vee se mogu samo manje ili vise slagati. P
jega, za razliku od >multiple regresije, osim vise > prediktorskih varijabli
I postoji i vise > kriterijskih varijabli. K
Kcndallov kocfic~jcnt rang korclacijc r (Tau) Uz poznnti postupak >
kategorija Skupina osoba, stvari, fenomena (iii bilo kojih drugih enti- Rho koeficijenta korelacije medu rangovima, Kendalov Tau je noviji po-
teta) grupirana prema nekoj jasnoj i jednoznacnoj definiciji obicno te~ stupak. Njegovo je izracunavanje kompleksnije i sporije od izracuna-
meljenoj na kvalitativnim atributima (a rjede i na temelju kvalitativ- vanja Rho korelacije, ali Tau ima nekih prednosti: (1) uz Tau moze se
no/kvantitativnih atributa). Obicno sc unutar neke sire pojave (varija- racunati i > parcijalna kore/acija; (2) Tau kocficijcnt mozc sc koristiti i
ble) definira veCi broj kategorija (najmanje dvije) u koje se svrstavaju pri racunanju korelacije izmedu jedne ordinalne (rangirane) varijable i
osobe, stvari, fenomeni itd. Svrstavanje u kategorije omogucuje samo jedne > dihotomne varijab/e (kao sto je varijabla "ziv-mrtav", "muska-
brojenje pripadnika svake kategorije, pa se stoga i mogucnosti koriste- rac-zena" itd.); (3) u nekim slucajevima dodavanjc novih rczultata nc
nja statistike svode na tu vrst podataka (tzv. brojeni podaci, za razliku od zahtijeva ponavljanje cijelog postupka (kao sto jc to kod Rho-korela-
mjerenih pod a taka). K cije). UveCini slucajeva izracunati Tau nizije odRho-koeficijenta na is-
tim rezultatima. P
Kendallov koeticijent konkordancije W Ako raspolazemo s nekoliko
rang ova iste sku pine elemenata, pa nas zanima postoji 1i slaganje (kore-
klaster (engl. cluster) Skupina susjednih elemenata, kao npr. skupina
lacija) medu tim rangovima, a ako postoji, koliko je slaganje jako, onda
!judi koji zive u istoj zgradi (> klaster uzorak), iii skupina ("grozd")
ne mozemo koristiti osnovne racune rang-korelacije > Rho koeficijent
saCinjcna od slicnih profila nekih krivulja itd. U > faktorskoj analizi
korelacije i > Tau koeficijent korelacije, jer te nam korelacije pokazuju
• klasteri su varijable koje su u medusobno visokoj korelaciji. P
'
82 KLASTER ANALIZA KOEFICIJENT 83

klaster analiza Vrsta > multivarijatne analize koja maze graficki prika- klinicka metoda (klinicki pristup) (1) Pristup proucavanju psiholoskih
zati interkorelacije medu pojedinim varijablama: varijable koje su fenomena (i normalnih i patoloskih) koji se temelji na osobnoj, intuitiv-
mcdusohno u visokoj korclaciji, Cine slicnc >korelacijske profile. Na noj, subjektivnoj analizi. (2) Pristup proucavanju psiholoskih fenomena
primjer, aka na velikom broju ljudi izvrsimo mjerenja razlicitih tjelesnih na osobnoj, individualnoj razini; pristup koji uzima u oazir sve idiosin-
karakteristika (visina, tdina, duljina potkoljenice, duljina nadlaktice, krati<~ne karakteristike pojedinca - osobitosti prezentnog statusa po-

opseg natkoljenice, debljina potkoznog tkiva, opseg grudiju, duzina jedinca te njegov razvoj. Ovakav se pristup cesto konfrontira sa > stati-
vrata, debljina prsta, opseg kukova itd.) pa sve dobivene vrijednosti stickim pristupom, koji zanemaruje osobitosti pojedinaca, a usmjeruje se
medusobno koreliramo, dobit cemo velik broj interkorelacija. Aka u samo na ono sto je zajednicko nekoj, na odredeni nacin definiranoj,
koordinatnom sustavu, kome su na apscisi pojedine varijable, ana ordi- skupini pojedinaca. Stvarno, ta se dva pristupa n11Zno medusobno nado-
nati visina korelacije, izradimo > korelacijski profil svake pojedine vari- punjuju, odnosno predstavljaju samo polazisne tocke u prouea.v anju psi-
jable, dobit cemo dvije ocito odvojene skupine profila, dakle dva klas- holoskih fenomena. Primjerice, s pomocu psihologijskog testa kojim se
tera koji pokazuju da se sve tjelesne karakteristike mogu svrstati pod ispisuje funkcija pamcenja moze se utvrditi da je neka odredena osoba
postigla znatno ispodprosjecni rezultat; tu konstataciju mogli smo izve-
dva osnovna faktora, a logicka analiza sadrzaja pojedinih varijabli poka-
sti usporedujuCi rezultat te osobe sa zajednickim, opCim rezultatima
zuje da su to visina i tezina. P
(normama) skupine kojoj ana pripada (recimo da se radio mladoj zen-

skoj osobi sa srednjoskolskim obrazovanjem) i pri tome smo se posluzili
klastcr uzorak Sastavlja sc tako ua sc populacija (kojajc ograniccna, ali
statistickim podacima koje smo dobili na uzorku populacije kojoj ta
velika, npr. stanovnici nekog velegrada) podijeli u odredeni broj
osoba pripada. Kad budemo trazili uzroke ispodprosjecnog rezultata
skupina (npr. plan grada se podijeli na 50 sektora), nakon toga se po
ave osobe, posluzit cemo se klinickim pristupom pa mozemo, recimo,
slucaju odabere odredeni broj tih sektora, pa se nakon toga izvrsi mjere-
ustanoviti da je ta osoba pod stalnim stresom, ili je imala traumu s organ-
nje ili anketiranje svih osnovnih jedinica u izabranim sektorima ( dakle •
skim ostecenjem itd. K
svih stanovnika). Takvi uzorci najcdce se koriste u razlicitim socio-
loskim ili ekonomskim istrazivanjima; anketari imaju zadacu da u sva- klinicka predikcija Predikcija o ponasanju i dozivljavanju pojedinca
kom sektoru zaista obuhvate sve clanove (ida se vracaju na adrese onih koja se temelji na idiosinkraticnim podacima o pojedincu (> klinicka
koje nisu pronasli taka dugo dok ih ne nadu ). Klaster uzorak maze biti s . metoda), a po potrebi koriste se i podaci dobiveni > statistickim pristu-
jednim stupnjem iii s vise stupnjeva: npr. u nekom sveucilisnom gradu pom (npr. razlicite norme koje se koriste u evaluaciji rezultata koje poje-
od svih fakulteta izaberu se po slucaju neki fakulteti, u tim se fakulte- dinci postifu u psihologijskim testovima). K
tima na isti naCin izaberu odsjeci, u odsjecima grupa studenata i na njoj
se obavi ispitivanje. Klaster uzorakje losija varijanta > slucajnog uzorka, klinicki pristup > klinicka metoda
a ako se radio jednostupanjskom klaster uzorku, onda on donekle moze
sliCiti i > stratificiranom uzorku, jer je broj Ijudi u svakom sektoru nejed- koeficijent Termin koji se rabi u svim znanstvenim podrucjima, pa taka i
nak, pa on mozc (ali ne mora!) odrafavati i "stratume" stanovnistva. u statistici, a doslovno bi znacio "tvoriti zajcdno". U statistici obicno se
Klaster uzorak na geografskim podrucjima poznat je i pod nazivom koristi da bi se jednom simbolickom ili numerickom vrijednoscu izrazio
"area-uzorak". P • opCi stupanj odnosa medu nekim pojedinacnim vrijednostima ili neku
84 KOEFICIJENT ' KOEFICIJENT KONTINGENCIJE 85 '
!I
stalnu pramjenu, pa taka imama kaeficijent varijahiliteta, kaeficijent katkada i za svaki kaeficijent karelacije karisten kad varijabli koje nisu
korelacije itd. U matematici i tehnickim padrucjima, kao i u statistici izrazene u kvantitativnim (mjerenim) vrijednastima, nego u kvalitativ-
(npr. beta-ponder) upatrebljava se i za konstantnu vrijednast (kan- nim ili kvantitativnakvalitativnim kategorijama. K
stantu) kojom se npr. mnozi neka dahivena vrijednast iii vrijednast u ne-
koj jednadzbi. K koeficijent atenuacije > korekcija zbog atenuacije

koeficijcnt alUcnacije Vrijcdnost koja, kad se kvadrira, pokazujc koliki koefic~jent determinacije Kvadrirani kaeficijent korelacije (r ;Y) koji
dio varijance nije zajcdnicki dvjema varijablama izmedu kojih je pokazuje proporciju (iii postotak, aka je jos pomnozcn sa 100) za-
izracunat > koeficijent korelacije. Pakazuje, za razliku od koeficijenta jednicke > varijance dviju varijabli, adnasna praparciju faktora (jednog
kordacije, stupanj neslaganja medu varijablama. Odreduje se taka da se ili vise njih) kaji su adgavarni za dabiveni stupanj sukladnosti u vari-
iz > koeficijenta nedetenninacije (1 - r 2) izvadi drugi korijen, a obicno sc ranju rezultata dviju varijabli (varijablc x i varijahlc y). Tako npr. aka
2
oznacuje simbolam k: korelacija iznosi 0,50, anda koeficijent determinacije od 0,25 (0,50 =
0,25) znaci da postoji oko 25% zajednickih faktora koji uvjetuju kovari-
ranjc vrijcdnosti tih dviju varijahli. Jcdnak je smisao kocficijenta detcr-
minacije i kod > multiple korelacije. K
Upotrebljava se i kao pokazatelj slaganja nekog madela s konkretnim
podacima: manji k pokazuje vece slaganje i obrnuto. K koeficijent disperzije > rasprsenje rezultata.

koeficijent asocijacije (> asocijacija u statistici) Jedan ad rjede upo- koeficijcnt konkordancije > Kendallov koeficijent konkordancije W
trebljavanih > koeficijenata korelacije koji pokazuje koliko se dobivena
raspadjela frekvencija u 2x2 tablici kantingencije razlikuje ad slucajne kocficijent kontingcncije (K) Koeficijcnt koji pokazujc stupanj povcza-
raspodjele. Karisti se za dihotomne varijable, a odreduje se s pomacu nosti izmedu varijabli koje su izrazenc s pamacu kvalitativnih kategorija
formule: (ne mjerenih vrijednasti). Odreduje se na temelju > tab/ice kontingen-
ad-be cije i > hi-kvarlmt tr:sta:
Q=-- •

ad+bc
K= 2
gdje Q znaci koeficijent asocijacije, a slovima a, b, c i d oznacena su po- N+x
jedina polja (kvadratiCi) u tablici kontingencije iduCi slijeva nadesno i 2
gdje K znaci kaeficijent kontingencije, X = hi-kvadrat test, aN ukupan

odozga prema dolje. Predznak koeficijenta asocijacije ovisi o naCinu broj ispitanika. BuduCi da je paredak kvalitativnih kategorija u tablici
smjestanja podataka u tablicu kontingencije pa ga zato treba logicki kontingencije uglavnom proizvoljan, a formula omogucuje samo pozi-
odrediti naknadno. Kako nema tearijske statisticke padloge, koeficijent tivni predznak, stvaran predznak koeficijenta kontingcncije treba odre-
asocijacije serijetkaupotrebljava. Premaautoru G. U. Yuleu, naziva se i diti nakon inspekcije raspareda vezanih frekvencija u tablici. Kocfici-
Yuleov kaeficijent asocijacije. jent kontingencije ne maze doseCi vrijednost 1, a maksimalna vrijednost
Katkada se tcrmin koeficijent asacijacije upotrebljava za svaki kaja se racunom maze dobiti avisi o broju kategorija kajima je izrazena
kaeficijent namijenjen odredivanju stupnja korelacije u 2x2 tablicama, a svnka varijabla. Zbog toga se - da bi se koeficijenti kontingencije dobi-


••

'
86 KOEFICIJENT KONTINGENCIJE KOEFICIJENT MULTIPLE KORELACIJE 87

veni iz tablica kontingencije razliCitih velicina mogli medusobno uspo- njegovu statisticku znacajnost (> znacajnost koeficijenta korelacije, >
redivati- preporucuje da se izracunata vrijednost korigira tako da se po- standardna pogreska koeficijenta korelacije) i tek onda ga interpretirati.
dijeli maksimalno mogucom vrijednoscu. Maksimalna vrijednost koefi- Interpretacija koeficijenta korelacije na prvom mjestu ovisi o vrsti vari-
cijcnta kontingencijc mozc sc odrcditi s pomocu ove formule: jabli izmedu kojih se racuna korelacija. Ipak se, katkada, kao gruba ori-
jentacija navodi da koeficijent korelacije apsolutne vrijednosti izmedu
0,0 i 0,2 ukazuje na nikakvu ili vrlo slabu povezanost; izmedu 0,2 i 0,4 na
slabu povezariost; izmedu 0,4 i 0,7 na srednju povezanost, a vrijednosti
gdjc jc k broj katcgorija u jcdnoj odnosno drugoj varijabli. Tako, prim- preko 0,7 ukazuju na veliku povczanost medu varijablama. Koeficijent
jerice, za 3x3 tablicu kontingencije Kmw:= 0,816. Ovakvo odredivanje korelacije, bez obzira na numericku velicinu i statisticku znaeajnost, po-
maksimalnog koeficijenta kontingencije vrijedi samo za kvadraticne ta- kazuje samo stupanj sukladnosti u variranju dvije varijable, a ne ukazuje
blice kontingencije. Znacajnost koeficijenta kontingencije obicno se na uzrocno-posljedicnu vezu medu varijablama (na osnovi koeficijenta
odreduje na temelju znacajnosti hi-kvadrat testa: ako je hi-kvadrat korelacije ne moze se utvrditi uzrokuje li jedna varijabla promjene u
znacajan, znacajan je i koeficijent kontingencije. Za koristenje koefici- drugoj varijabli ili neka treca varijabla uzrokuje sukladne promjene u
jenta kontingencije ne postavljaju se zahtjevi o obliku distribucije (sime- promatranim varijablama ).
tricnost iii sl. ). Koeficijcnt kontingcncije, mcdutim, nije opravdano kori-
Postoji velik broj koeficijenata korelacije koji se razlikuju po tehni -
• stiti u slozenijoj statistickoj claboraciji (cak niti za odrcclivanjc > koeflci- ci iztacunavanja, a prilagodeni su specificnostima varijabli izmedu kojih
jenta determinacije). K se odreduje stupanj povezanosti pa je zbog toga uvijek nuzno najprij e
,, utvrditi prikladnost odredenog koeficijenta korelacije .~a primjenu na
koeficijent korelacije Vrijednost koja pokazuje stupanj > korelacije
rezultatima ispitivanih varijabli. Osobito je vazno prije izracunavanja
medu varijablama. Numericka velicina koeficijenta korelacije moze po-
koeficijenta korelacije odrediti postoji 1i medu promatranim varijabla-
primiti bilo koju vrijednosti od 0 (nul a) do + 1 odnosno -1. Vrijednost ma linearna ( > lineama zavisnost) ili > zakrivljena korelacija, jer primje-
+ 1 oznacuje potpunu pozitivnu korelaciju, a -1 potpunu negativnu ko- na nekih koeficijenata korelacije (Pearsonova koeficijenta r) u slucaju
rclaciju. Koeficijent korelacije od 0 pokazuje da nema povezanosti zakrivljene korelacije moze dati neadekvatan opis povczanosti iii cak
medu varijablama, odnosno da postoji samo slucajan konvarijabilitet sasvim netocan rezultat (kao primjerice u slucaju kad crta regresije ima
medu rezultatima za koje je izracunat koeficijent korelacije. Ili, dru- oblik obrnutog slova U, pa iako stvarno postoji povezanost medu varija-
gacije receno, promjene u jednoj varijabli odvijaju se nczavisno od blama r ce poprimiti vrijednost blizu nule ). K
promjena u drugoj varijabli. Vrijednost koeficijenta korelacije izmedu 0
i 1 ukazuju na manju ili vecu djelomicnu povezanost medu varijablama,
koeficijent multiple korelacije Koeficijent koji pokazuje stupanj pove-
tj. na manju ili vecu sukladnost u variranju rezultata dviju (iii vise) varija-
zanosti izmedu optimalne (linearne) kombinacije > prediktorskih vari-
bli. Pozitivni predznak koeficijenta korelacije pokazivat ce da su prom-
jabli (kojih moze biti dvije i1i vise) i > kriterijske varijable. Za slucaj s dvije
jene u promatranim varijablama manje-vise istosmjerne (povecanje
prediktorske varijable formula glasi:
vrijednosti u jednoj varijabli prati povecanje vrijednosti u drugoj varija-
bli); negativni predznak koeficijenta korelacije znaCi da je povecanje
vrijednosti jedne varijable praceno smanjivanjem vrijednosti u drugoj
varijabli. Za svaki izracunati koeficijent korelacije potrebno je utvrditi
I

-- . ·-- .. ' ' -

88 KOEF1CIJENT MULTIPLE KORELACIJE KOEF1CIJENT SERIJALNE KORELACIJE 89

gdje je Ry. 12 koeficijent multiple korelacije izmedu kriterijske varijable Y daje manje varijabiliteta u Yvarijabli objasnjivo varijabilitetom uXvari-
i dvije prediktorske varijable 1 i 2. Sarsu oznaceni koeficijenti korelacije jabli, a to ujedno znaci ida je manja povezanost (manji koeficijent kore-
(Pearsonovi) izmedu pojedinih varijabli. VelicinaR ovisi o veliCini kore- lacije) izmedu X i Y varijable. Maksimalna vrijednost koeficijenta
lacije izmedu svake pojedine prediktorske varijable i kriterijske varija- rezidualnog varijabiliteta maze doseci vrijednost ukupnog rasprsenja u
ble kao i izmedu samih prediktorskih varijabli. Iz gornje se formule Yvarijabli, a to se dogada kad povezanost Xi Yvarijable nije veca od
mozc vidjeti da sc u slucaju r12 = 0, R jednostavno dobije iz r2 + r2• slucajne. Kao sto je moguce u Yvarijabli tqko je koeficijent rezidualnog
Vclicina R maze se odrediti is pomocu :>beta pondera. K varijabiliteta moguce odrediti i uXvarijabli. Teorijski, koeficijent rezi-

dualnog varijabiliteta bilo bi opravdanije promatrati kao razliku ad ide-


koeflcijentnedeterminacije Kvadrirani > koeficijentalijenacije, tj.l-r2. alnih vrijednosti dobivenih na temelju jednadzbe regresijskog pravca.
Pokazuje kolild postotak faktora nije zajednicki u variranju dviju vari- Prakticno se, medutim, koeficijent rezidualnog varijabiliteta pro-
jahli. K • cjenjuje s pomocu standardnc devijacije u Yvarijabli i koeficijenta ko-
relacije izmedu Xi Yvarijable ovom formulom:
koeficijent rang korelacije > Rho koeficijent korelacije
i
koeflcijcnt rclativnog varijabiliteta > koeficijent varijabilnosti
gdje je sy standardna devijacija u Yvarijabli, a rxy koeficijent korelacije
koeficijcnt rezidualnog varijabiliteta Koeficijent kojim se izrafava izmeduXi Yvarijable. Koeficijent rezidualnog varijabiliteta najcesce se
velicina > rezidualnogvarijabiliteta. Maze se odrcditi izravno iz >tab/ice koristi za procjenu veliCine pogreske pri prognozi rezultata u Yvarijabli
rasprsenja, ali se to u praksi vrlo rijetko cini. Postupak se sastoji u tome na osnovi poznavanja rczultata u X varijabli (> standardna pogre.Ska
da se odredi rasprsenje (standardna devijacija) rezultata u Yvarijabli prognoze). K
koji se vefu za jednu odredenu (fiksnu) vrijednost u X varijabli. To je
rasprsenje rezultata u Yvarijabli oko > parcijalne srednje vrijednosti u Y koeticijent scrijalne korelacije > Koeficijent korelacije koji se koristi za
varijabli za neku odredenu (fiksnu) vrijednost u X varijabli. Uz odredivanje stupnja povezanosti izmedu dvije stvarno > kontinuirane
odredene uvjete maze se pretpostaviti dace rasprsenje vrijednosti u Y varijable od kojihje jedna izrazena u dvije ili vise kategorija (klasa). Za
varijabli za svaku odabranu vrijednost uXvarijabli biti jednako (podjed- varijablu koja je sazeta u dvije ili vise kategorija mora postojati
nako). Kad bi korelacija izmeduXi Yvarijable bila potpuna, tada bijed- opravdana pretpostavka da bi se njezinim mjerenjem na kontinuiranoj
noj odabranoj vrijednosti uXvarijabli pri svakom ponovljenom mjere- mjernoj Jjestvici dobila normalna distribucija rezultata. U osnovi, koefi-
nju odgovarala uvijek ista numericka vrijednost u Yvarijabli, pa bi tada cijent serijalne korelacije predstavlja > Pearsonov koeficijent kore/acije r
koeficijent rezidualnog varijabiliteta bio jednak nuli,, tj. rasprsenja izracunat izmedu prosjecnih z-vrijednosti svake kategorije varijable
vrijednosti u Yvarijabli, koje se vezu uz odabranu vrijednostX, ne bini izrazene u kategorijama i rezultata u varijabli izrazenoj na kontinuiranoj
bilo. Aka je u takvom slucajuX nezavisna varijabla, a Yzavisna varijabla, ljestvici, koji koeficijent je korigiran standardnom devijacijom z-vrije-
,
onda bi se moglo reci da se sve promjene u zavisnoj varijabli dadu obja- dnosti zbog smanjene varijabilnosti u varijabli s kategorijama. Najcesce
sniti promjenama u nezavisnoj varijabli. Sto je koeficijent rezidualnog se koristi > biserijalni koeficijent korelacije, nesto rjede > triserijalni, dok
varijabiliteta veci to znaci daje i vecerasprsenje vrijednosti u Yvarijabli i ' se > kvadriserijalni i > kvintiserijalni koeficijenti korelacije relativno


90 KOEFICIJENT SERIJALNE KORELACIJE KOLMOGOROV-SMIRNOVLJEV TEST 91

rijetko upotrebljavaju. Koeficijente serijalne korelacije nije opravdano koeficijent zakrivljene korelacije eta (7]) (u anglo-americkoj literaiuri
koristiti za odredivanje proporcije zajednickih faktora (tj. pretvoriti u > nalazi se pod nazivom correlation ratio) Koeficijent korelacije kod koje-
koeflcijent determinacije) kao ni za prognozu rczultata ujcdnoj varijahli ga linearnoj promjeni jcdne odgovara nelinearna (zakrivljena) promje-
na osnovi poznavanja rezultata u drugoj varijabli. K na druge varijable. Primjerice, takav odnos postoji izmedu trajanja rada
i srcanog ritma; izmedu stupnja osvjetljenja i radnog uCinka u vidnom
koeficijent theta > Freemanov koeficijent 8 (theta) zadatku itd. Temeljna formula za odredivanje koeficijenta zakrivljene
koreiacije izmedu varijable Xi varijable Y izgleda ovako:
kocficijent varijabilitcta > rasprJenje rezultata. s y•
7]=
koeficijent varijabilnosti (J-') (koristi se i termin koeficijent relativnog sY
varijabiliteta) Izraz koji nam pokazuje relativn! varijabilitet neke poja- gdje je s y· standardna devijaeija > parcijalnih srednjih vrijednosti u y
ve, ito taka sto standardnu devijaciju prikaze kao postotak aritmeticke varijabli za fiksne vrijednosti u X varijabli oko aritmeticke sredine u Y
sredine: aka je u nekom mjerenju aritmeticka sredina 100, a standardna varijabli (My), a s Y standardna devijacija u Yvarijabli. Maze se izracu-
devijacija 10, onda je stan dar dna devijacija 10% vrijednosti aritmeticke nati i koeficijent s vrijednostima u X varijabli; ta vrijednost moze biti
sredine. Koeficijcnt varijabilnosti racuna se vrlo jednostavno: V = razlicita ad one izracunate u Yvarijabli. Nije poznat nacin odredivanja
(s!M) • 100 (sa 100 sc mnozi da se izrazdobijc u postocima). Neke pojavc znacajnosti koeficijenta zakrivljene korelacije eta. Brojcana vrijednost
varirajujacc, a nekc manje; npr. tdina kod ljudi varira oko 15%, a visina ovog koeficijenta uvijekje pozitivna, jer eta koeficijent mjeri samo stu-
nest a preko 5% (sto se i vidi bez ikakvog mj erenj a: ljudi mnogo vise vari- panj povezanosti, a ne i smjer povezanosti, pa zato eta koeficijent za-
raju u debljini ncgo u visini); tjelesna temperatura (zdravih) ljudi varira pravo nema predznaka.
veoma malo (ispod 0,5% ), itd. Aka standardna devijacija prelazi 33% Uz pomoc eta-koeficijenta moguce je i izracunavanje stupnja
vrijednosti aritmeticke sredine, iz toga se maze zakljuCiti ne samo da povezanosti izmedu jedne > ordinalne skale iii > nominalne skale i jedne
mjerena pojavajako varira vee ida distribucija nije simetricna Uer M- 3s > intervalne skale (samo u navedenom smjeru, aline i obrnuto). K
zahvaca nulu i prelazi u negativne vrijednostf). No na mjernoj skali s
pozitivnim i ncgativnim vrijednostima (npr. skala atmosfcrske tempera- kohorta Skupina ljudi koji imaju (barem) jednu zajednicku, dobra de-
ture) koeficijent varijabilnosti dakako ne mora uopce ukazivati na rela- finiranu osobinu. Npr. skupina ljudi jednake dobi. K
tivni varijabilitet: prosjecna temperatura u jednom zimskom mjesecu
maze biti +2, a standardna devijacija 4. Iz toga proizlazi da se koefi- Kolmogorov-Smirnovljev test Neparametrijski test za testiranje pri-
cijent varijabilnosti maze upotrebljavati u pravilu samo kod > omjemih__ padaju li dva uzorka istoj populaciji, i to u razlicitim pogledima: u cen-
skala, a kod intervalnih skala veoma oprezno, tj. samo u situacijama tralnoj tendenciji, u varijabilitetu, u "uskosti" ili "sirokosti" distribucije,
usporedivanja istog svojstva izmedu dva ili vise uzoraka: mozemo npr. itd. Osniva se na usporedbi dviju kumulativnih frekvencija iz oba
na osnovi rezultata jednog testa znanja ustvrditi da u tom testu najviSe uzorka, a testira se ili uz pomoc hi-kvadrata (kod vec:h uzoraka) ili uz
variraju ispitanici grupe A, a najmanje ispitanici grupe B. Aline maze- pornoc posebnih tablica. Test se maze koristiti i za testiranje jednog
rna ustvrditi da ispitanici grupe A vise variraju npr. u inteligenciji nego u uzorka, aka nas zanima da lise maze smatrati da uzorak predstavlja
slucajan uzorak. P
introvertiranosti! P


KOORDINATNI SUSTAV 93
92 KOMBINACIJA DVAJU {ILl VISE) TESTOVA ZNACAJNOSTI
konstantni faktori U statistici oznacavaju > predmet mjerenja kojegaje
kombina~ija dvaju (iii vise) testova znacajnosti Ako ~ dva iii vise po- pokazatelj > prava vrijednost mjerenja. Nazivaj).l se konstantnim faktori-
kusa dobtjemo rezultate koji su is tog smjera (npr. aritmeticka sredina A ma zato sto se pretpostavlja da je ono sto se mjeri ili opaza relativno kon-
stalno je veca od aritmeticke sredine B), ali razlika ni u jednom ad
stantno (barem za vrijeme jednokratnog ili ponovljenog mjerenja ili ~. ,

pokusa nije > statisticki znacajna, neki statisticari preporucuju tehnike


opazanja)- a to je temeljni uvjet mjerenja; u suprotnom, mjerenje ne bi
z.~.i~racunavanje statisticke znacajnosti svih pokusa zajedno. Najpozna-
imalo smisla. K
tiJI Je Bakerov postupak, koji pomocu jednog nomograma (koji je prika-
zan na slici i u kojemu se na apscisi i ordinati nalaze korespondentne p kontingencija U statistici oznacava asocijaciju iii povezanost mcdu vari-
vrij~dnosti) omogucava odcitavanje zajednicke vrijednosti p iz dvije
jablama: vrijednosti (iii slucajevi) u klasama ili kategorijama jedne vari-
:azh~e (npr. P1= 0,08, P 2 = 0,10, a zajednicki P prema nomogramu
jable pojavljuju sc u kontingen:u s nekim klasama (ili kategorijama)
!ZOOS! p = 0, 05) (vidi sliku ). . druge varijable. Obicno se koristi za varijable izrazene s pomocu kvalita-
. Takoder je za hi-kvadrat test poznato da on posjeduje "aditivna" tivnih klasa ili kategorija. > Tablica kontingencije; > koeficijent kontin-
s~ojstva: ako u nekoliko hi-kvadrat racuna na is tom problemu dobijemo
h~-~adrate, ~d koji. su neki bili, a neki nisu bili statisticki znacajni (ali su
gencije. K
bllt .tstog smJ~ra, tj. o~azene frekvencije su se od ocekivanih uvijek
kontinuirana skala Skala mjerenja kojom se izrazavaju vrijcdnosti >
razhkovale u tstom smJeru), kombinirani iii "sveukupni" hi-kvadrat za
sve te racune dobiva se taka da zbrojimo sve dobivene vrijednosti hi- kontinuirane varijable. Prakticno, vrijednosti na kontinuiranoj skali iz-
kvadr~ta, a statistic~ z~acajnost dobivene sume testiramo na zbroju razavaju se u diskretnim vrijednostima, ali se pretpostavlja da mogu po-
stupnJ~va slobode. PnmJer: ako smo na 5 istrazivanja neke pojave (uz 1 ~onacrto malu) meduvrijednost. K
stupanJ slobode) dobili ave hi-kvadrat rezultate: 2 04· 1 83· 1 60· 5 90·
3,18 .
.. , samo Jedan ' ' ' (jcr
rezultat (5,90) statisticki je znacajan ' 'granicna
' ' ' <![ij~b~a kod koje izmedu pojedinih vrijednosti
vrtjednost za 1 stupanj slobode iznosi 3,84). No zbroj tih rezultata iznosi nt postoji skokovit .rijelaz ( > diskretna varijabla) ,,r-
14,55, a uz 5 stupnjeva slobode taj je rezultat statisticki znacajan (P< sve moguce (beskonacno male) meduvrijednosti. Tehnike mjerenja
0,05) (> metaanaliza). P . · ~omogucuju, medutif!h izrazavanj s _ake varijahle.samo u..manjim. ili
osoe
...
to 4D 60 10 10 100

... N
01 02 03 04 01 " )0

~f'1. "" vcCim skokovitim intervalnim vrijednostima. I zbog prakticnih potreba


.. .... 'j~Il.QSli_v.arij.£\hli. K
~'
110 koristi se redovito konac i j.Ak kovif

~~ ~
Ako u dva istovrsna istrazivanja oba
puta dobijemo neku razliku u istom 'J
20~ koordinatni sustav Svaki sustav koji sluzi odredivanju polozaja tocke
smjeru, ali koja ni u prvom ni u p
,.,_
"'
(iii sku pine tocaka) u prostoru odredenih dimenzija s pomocu brojeva ili
drugom istrazivanju nije statistitki
znacajna, uz pomoc ovog nomogra- ..
to
....
to \

koordinata. U najsiroj upotrebi je sustav sastavljen od dvije osi (dva


ma mozemo procijeniti znatajnost .. ~ .... pravca) koje se u ravnini sijeku pod pravim kutom i taka cine cetiri polja
razlike iz oba pokusa zajedno: u fK
koja se zovu kvadranti. Tocka u kojoj se osi sijeku (ishodistc) oznacava
"'. 03
tom se slucaju povecava vjerojat-
nost da razlika postane statisticki
'-1

'
f11tt 1 se nulom; horizontalna os naziva se apscisa, a obicno se oznacava sax;
znacajna. Of
ot aa 03 04 ~ 01 oe 10 20 ao 40
.ti:U
so eo 10 100
Of
vertikalna os naziva se ordinata i obicno se oznacava say. Ovaj sustav na-
I
I
ziva se jos i kartezijanskim, po latinskom imenu (Renus Cartesius) fran-
p '
'
I)(,

- - .... _ ·- --- .

ruskoo filozoia i mate.matieara Rena De~c;~rte~ ko)i ga je ra.zvi\.' i UYC"I.'


0
u upotrebu. U statistici pravokutni dvodirnen:rionalni koordinatni su- r rr = ~..--. r;-·
stav sluZi, izmedu ostalog, za zon: o prikazivanje odnosa dviju varijabli te 'l.u ·..J'n·
oblika distribucije Ce.stine rezultata dobivenih opazanjem ili mjerenjem. gdje je r11 koeficijent korelacije korigiran zbog atenuacije, rry stvarno do-
Svakaje tocka u tom sustavu odredena s dvije vrijednosti, koordinate (X biveni koeficijent korelacije, a rxx i rYY koeficijenti pouzdanosti varijahlc
i Y). Kad se prikazuje odnos dvije varijable, tada se obicno vrijednosti x odnosno y. Korigirani koeficijent korelacije pokazuje kakva hi hila ko-
nczavisne varijable smjdtaju na apscisu, a vrijednosti zavisne varijable relacija izmedu Xi Yvarijable kad bi mjerenje obje varijable bilo pot-
na ordinatu (lijeva slika). Pri prikazivanju distribucije cestina obicno se puna pouzdano. K
vrijednosti rezultata stavljaju na apscisu, a cestina njihova pojavljivanja
u nekom mjerenju na ordinatu (desna slika). Katkada se koriste i visedi- korekcija zbog smanjenog opsega Buduci da smanjenje opsega u kojem
variraju vrijednosti u varijablama izmedu kojih se raeu~a neki koefi-
menzionalni koordinatni sustavi (koji imaju vise od dvije osi), a ponekad
cijent korelacije smanjuje velicinu izracunatog koeficijenta korelacije, u
i koordinatni sustavi cije se osi ne sijeku pod pravim kutom (naziva ih se
nekim se slucajevima dobiveni koeficijent maze korigirati da bi se vidje-
. kosokutnim), koji se upotrebljavaju npr. u faktorskoj analizi za prikazi-
lo kolika bi vrijednost koeficijenta korelacijc hila s takvim povecanim
vanjL: fakturskog prustura veccg broja faktora koji nisu mcdusobno nc-
opsegom varijable (> Speatman-Brownova formula). K
zavisni. K
120 .
korckci.ia zhog vczanih rnngovn U mnogim statistickim tcstovima koji
'l ~
100
koriste rangove statisticari zahtijevaju da se u formule unesu neke pro-
20 80
·-·o"' mjene u slucajevima kada postoji veCi broj (neki kafu vise od 25%) > ve-
;>< 60
~
..0
15 =
.?;" zanih rangova. Tom korekcijom konacni rezultat postaje hlizi "stvarnom
I"'
~
10
J; 40
;><'
stanju", a to obi~no znal:i da je rezultat ndto nizi nego ~to je bez korek-
5
20 cije. Najpoznatiji slucaj korekcije odnosi se na >Rho koeficijent koreltt·
o~~-4--~-+--~~-4~
o~~~-+~--~~~~ 20 30 40 50 60 70 RO
cije, gdje je upotreba korekcije u ekstremnim slucajevima ocito
5 10 15 20 25 30 35
vArijnhla X
x - vrijcdnnAt rc7.ultnta opravdana: ako bez korckcije izracunamo Rho izmedu jednc varijable, u
Graficki prikaz, u koordinatnorn sustavu, odnosa izmedu dvije varijable (lijeva slika) i kojoj su rezultati dobra rangirani (tj. nema vezanih rangova), i druge
distribucije ~estina (frckvencija) (desna slika). varijable, u kojoj su svi rezultati jcdnaki (pa stoga svi imaju isti rang), do-
bit cemo rezultatRho = 0,5, ~to je ocita besmislica, jer je jasno da nema
korekcija za kontinuitet Matematicka prilagodba diskontinuirano dis-
korelacije izmedu tih varijabli. No, uz formulu za korekciju, korelacija
tribuiranih rezultata tako da aproksimiraju kontinuiranu distribuciju. ce biti 0 (nula). KodRho korelacije valja spomenuti daje to zapravo ko-
Takva korekcija omogucuje primjenu sireg opsega statistickih testova eficijent korelacije izraeunat na rangovima (ali je formula za r matema-
(> Yatesova korekcija). K ticki pretvorena u znatno jednostavniji racun), pa kod mnogo vezanih
!
rangova moze biti jednostavnije (naroCito aka se r-koeficijent maze
korekcija zbog atenuacije Korekcija izracunatog koeficijenta korelacije
izracunati uz pomoc dzepnog racunala) upotrijebiti r koeficijent korcla-
izmedu dvijc varijable (X i Y) s pomocu > kueficijenata pouzdanosti
cije nego korekturu, jer ce se dobiti jednaki rezultat kao i primjenom ko-
svake varijable:

..
'

'
KORELACIJSKA POVRSINA 97
96 KOREKCIJA ZBOG VEZANIH RANGOVA
nicke varijance kod promatranih varijabli (> koeficijent determinacije),
rekture. Za vezane rangove u Rho korelaciji, korekcije se ozbiljnije is-
zatim, objasnjavajuCi (u statistickom smislu) varijabilitet jedne varijable
plate samo kod niskih koeficijenata, kao i kod takvih rezultata koji su
s pomocu varijabiliteta druge varijable moze se preciznije predvidjeti
blizu > granicnoj vrijednosti. P
ponasanje rezultata u varijablama (> regresijska analiza, > jednadiba
~-
pravca regresije, > multipla korelacija) i, napokon, predstavlja polazisnu
korelacija U statistici oznacuje _sukladnost u variranjti vrijednosti dviju 1
osnovicu slozenije statisticke elaboracije (> faktorska analiza) s pomocu
(ili vise) varijabliyStupanj sukladnosti u variranju izrazava se > koeficije- koje se, na primjer, u psihologiji mogu empirijski klasificirati osobine i
ntom korelacije. Najveci stupanj sukladnosti u variranju, tzv. potpuna sposobnosti !judi. K
korelacija iii funkcionalna veza, postoji kad svakoj vrijednosti u jednoj

varijabli (recimo varijabliX) odgovara samo jedna vrijednost u drugoj


varijabli (recimovarijabli Y), tj. kad se pri mjerenju varijable Xi Yuvijek korelacija, rang > rang kore[acija
uz odredenu vrijednostX pojavljuje jedna odredena vrijednost varijable
Y, i obrnuto, kad se uz odredenu vrijednost Y pojavljuje samo jedna
korelacije, koeficijent > koeficijent korelacije
odredena vrijednostX. U statistickoj praksi, pri odredivanju stupnja ko-
relacije medu realnim varijablama, susrecemo se s _koeficijentima ko~
relacije kcji ukazuju na djelomicnu povezanost medu varijablama. D.Je- korelacijska matrica > matrica korelacija
-- '
lomicna povezanost znaci da postoji konvarijabilitet kod promatranih I

varijabli, ali da odredenoj vrijednosti varijableX odgovara vise razlicitih korelacijski omjer > koeficijent zakrivljene korelacije 1'J (eta)
vrijednosti varijable Y. Sto je korelacija manja, to je i varijabilnost y
vrijednosti koje se javljaju uz neku odredenu X vrijednost, veca i obr-
korelacijska povrsina "Povrsina" koju u koordinatnom sustavu zauzi-
nuto, sto je korelacija veca, manje je razlicitih Y-vrijednosti koje se vezu
maju individualni rezultati pojedinih elemenata ( statistickih jedinica; is-
uz odredenuX-vrijednost. Tako npr. postoji korelacija izmedu tjelesne
pitanika) u dvije varijable, izmedu kojih se racuna korelacija. Ako kore-
visine i tjelesne tezine u !judi; sukladnost u variranju ove dvije varijable
lacije nema, rezultati su rasprseni po cijeloj povrsini koordinatnog sus-
(visina i tezina) ocituje se u tome da su visi Ijudi i tezi (kako raste visina,
tava, i formiraju povrsinu, koja priblizno odgovara krugu. Ako postoji
raste i tezina ), ali samo u prosjeku, jer svi !judi iste visine nisu jednako
dosta visoka korelacija, rezultati formiraju elipsu (koja se kod pozitivne
teski.
korelacije penje slijeva nadesno, a kod negativne zdesna nalijevo ). Sto je
Pojam korelacije odnosi se na prvom mjestu na sukladnost u vari:?
koeficijent korelacije visi, elipsa je uza, a ako korelacija iznosi + 1 iii -1,
ranj~ v~rijabli ~oj_e, su izrazene na > intervalnoj skali ili na > omjemoj f.<' v • 0 .., • • • • •

povrsma VIse ne postOJI, JCI sc sv1 rezultat1 nalaze na pravcu. Na slici je


s~lt~ ah yse konsti 1 za oznacavanje asocijacije medu varijablama koje
prikazano nekoliko korelacijskih povrsina.
msu 1zrazene s pomocu Cisto kvantitativnih atributa (kvazikvantitativne •

ili k;.ralitativne kategorije ), kao sto su, primjerice, spol, boja oCiju i sl. Na Korelacijska povrsina korisna je kod dokazivanja da sc povcca-
r
osnovi same velicine korelacije ne mote se nista zakljucivati o uzrocno- njem > strogosti selekcije moze i test relativno niskc korclacijc s krite-
posljedicnom odnosu medu varijablama:' I rijem (npr. uspjehom u poslu) uspjesno koristiti. Povisimo li granicu u
i
Upotreba korelacije vrlo je rasirena ( osobito u nekim znanostima testu iznad koje cemo prilikom neke selekcije primati kandidate, pave-
kao sto je, primjerice, psihologija) jer omogucuje utvrdivanjc zajt:d- caw se proporcija uspj<.:Snih prcma neuspjcsnima u kasnijcm radu. P
-·-

98 KORELACIJSKA POVRSINA KRITICNI ODNOS 99


korelacijski profil Mnostvo korelacija izrnedu neke varijable i niza dru-
gih varijabli moze se graficki prikazati tako da u koordinatnom sustavu
varijable nanesemo na apscisu, a velicinu korelacije na ordinatu, pace-
mo

dobiti krivulju koja pokazuje variranje korelacije promatrane vari-
jable s ostalim varijablama. Na korelacijskom profilu osniva se > klaster
analiza. P

korigirani koeficijent korelacije > korekcija zbog vezanih rangova


(b)+ 0,6
(a)+ 0,9
kovarijanca Onaj dio ukupnog variranja dvije varijable (odnosno kom-
pozitnog rezultata dobivenog sumiranjem rezultata u jednoj i drugoj
varijabli) koji pokazuje tendenciju sukladnog variranja izmedu te dvije
varijable. Ako se varijanca sumiranih rezultata dvije varijable prikaze s
pomocu formule, s; + s ~ - 2r s "s Y, gdje s; i s ~ pokazuju varijancu
varijabli x, odnosno y, izraz 2rs "s Y pokazuje kovarijancu (r je koefi-
cijent korelacije izmedu varijable x i y). Kovarijanca sc moze prikazati i
ovako: (d,!ly)/N, gdje su dx i ely razlike svakog pojedinog rezultata od
pripadne aritmeticke sredine u varijabli x odnosno y. K
(d) • 0,3
(c)+O,l
KR20 i KIUl > Kuder-Richardsonove formule

kriterij > kriterijska varijabla

kriterijska varijabla lli kritcrij, kod >multiple korelacije ona varijabla


za koju se odreduje stupanj povezanosti s vise drugih, > prediktorskih
varijabli. K

f.!!.!R!!'l~~!.,.O!ff'rijeJnost koja oznacuje granicu izmcdu statistickc


znacajnosti th neznacajnosti, tj. granicu izmedu odbacivanja nul-
hipoteze i prihvacanja nul-hipoteze (> granicna vrijednost). K
(f) - 1,0
(e)- 0,8 kriticni odnos Stariji naziv za > t-odnos, tj. za razlomak koji pokazuje
odnos izmedu nekc razlike i njezine pogreske. U angloamerickoj stati-
stickoj literaturi uglavnomje oznacavan slovima C.R. (critical-ratio), a
Korelacijske povr~ine kod razlicitih koeficijenata korclacije.
"kriticnim" se smatra zato sto o njcmu ovisi odluka hoccmo li neku razli-
ku proglasiti statisticki znacajnom (> statisticka znacajnost) ili ne. Svo-


100 KRITICNI ODNOS ' KRUZNI DIJAGRAM 101
jedobno su statisticari postavljali zahtjev da kriticni odnos mora biti naj- njihove kumulirane (zbrajane) cestine pojavljivanja (ordinata) (> ku-
manje 3 (tj. da razlika bude 3 putaveca od svoje pogreske), no kasnijeje- mulativne frekvencije). Krivulja kumulativnih frekvencija rezultata, koji
zbog posve opravdanih razloga (vidi o tome npr. > pogreska tipa 1 i tipa se inace normalno distribuiraju (u skladu s normalnom iii Gaussovom
2) - taj kriterij ublazen, pa se najcesce zahtijeva da kriticni odnos (tj. t) distribucijom), ima sigmoidni oblik (oblik razvucenog velikog slova S)
bude (kod velikih uzoraka) harem 1,96 (za razinu znacajnosti od 5%). (vidi sliku). Na > papiru vjerojatnosti normalna distribucija daje pravac
Kao sto je pozna to, sto su uzorci manji, potreban je veCi t da bismo (vidi sliku). Katkada se..naziva Galtonova oziva iii samo oziva, ali su oba
razliku mogli smatrati statisticki znacajnom (> t-distribucija). p ova naziva, medutim, ponesto zastarjela, tj. u novijem statistickom na-
zivlju rjede se rabe. K
krivulja distribucije Graficki prikaz odnosa vrijednosti (rezultata) ne-
kog mjerenja i cestine kojom se te vrijednosti pojavljuju. Obicno se na
Kruskal-Wallisov test (H) Neparametrijski test analize varijancc koji
apscisu u koordinatnom sustavu nanose numericke vrijednosti mjere-
nja, a na ordinatu njihova frekvencija. Krivulja distribucije zorno poka- umjcsto hrojcanih mjcrnih podataka koristi rangovc. Ako su uzorci vcti
zuje o kakvoj vrsti mjerenja i kakvoj pojavi se radi, a sluzi i pri donosenju od 5, test ima hi-kvadrat distribuciju, pa se iz tablica hi-kvadrata
odlukc o odabiru i opravdanosti upotrebc odredenih statistickih postu- odCitava znacajnost. Aka su skupine manje (5 iii manje u svakom
pakana dobivenim podacima. Krivulje s kojima se najeesce u statistici uzorku), znacajnost se mozc odcitavati iz poschnih tahlica. U slucaju >
baratajesu krivulja > normalne distribucije, > Poissonove distribucije, > vezanih rangova, postupakje kompleksniji. P
binomne distribucije itd. K
kruzni dijagram Nacin grafickog prikazivanja relativne frekvencije iii
krivulja kumulativnih frekvencija Graficki prikaz u koordinatnom postotka, uz pomoc kruznih isjecaka razliCitc vclicinc. Kut koji u
(surednom) sustavu odnosa vrijednosti rezultata mjerenja (apscisa) i kruznom dijagramu zauzima pojedini postotak, racuna se prcma for-
.... muli:
•••
•••
••• kut = frekvencija · 360
.=....__ _..:..___ _
'
• I
. N
,_"'
u
c:
Q)
1CX)
Ill .•
. ~ Na primjer, ako na ukupno 500 ispitanika njih 75 imaju neku karaktcri-
~
., Ill
·u- 70 '
I• stiku, ta ce skupina u krugu zauzimati isjecak pod kutom od (75 x
·h
.~
-
~....
itl
.. . ... ....... ...... .. ....... .............. "
0
'til ..
~
..

."
I
'
360)/500 = 54 stupnja. Primjer kru-
.....ro
-E:::1
Ill
SJ .... .. ........... .... .... .............. . . znog dijagrama koji prikazuje rezul-
.() "• tatc diplomskih ispita na Filozof-
J:i :II I

"' skom fakultetu jedne skolske godine


.~
.....
-.o.:::,
Zl
..
•••'
prikazan je na slici. P
.,
"' 10 ~1
OCJENA5
0• l.-.o==: '--~-.......c..-...L_ __,__ _,_-+-......, 10'14 •
100.5 1151,5 16:;5 ~a~s 111.5 17~5 m,s 11!1<5 111<5 18115 1110,2 1M,I 111.1 tU,I 171,1 11J,I
OCJENA 3
1a.l ,.... t1f,l 110,1 11U 33%
!'rave j\nrnje ,llr;mirc razrcda .. !'rave gornjc gran icc razrcda OCJENA 4 "Kruzni dijagram" jc jed an od nacina grafickng
17%
Kunmlntivnc frckvcncijc nckc nnrmalnc distribucijc daj~igmoidnu krivulju (Iijevo), prikazivanja rezultata. Na ovom su kruznom
dijagramu prikazani rezultati diplomskih ispita
l
ana "papiru vjerojatnosti" daju pravac (d~a).
I na jednom zagrebackom fakultetu.
l

'
10.2 KUDER-RICHARDSONOVE FORMULE KVALITATIVNA VARIJABLA 103
Kudcr-RJchardsonove formule Formule s pomocu kojih se procjenjuje 4+7+6+9) itd. Graficki prikaz kumuliranih frekvencija, koje su inace
pouzdanost testa, a osnivaju se na tezini cestica koje saddava test i na normalno distribuirane, u linearnom koordinatnom sustavu (osX vrij e-
varijanci ukupnih rezultata u testu. Postoji veCi broj ovih formula, a dnosti rezultata, os Ykumulirane frekvencije) pokazuje karakteristican
najvi ~ c su u upotrehi one s oznakom 20 i 21. Ona s oznakom 20 ima ovaj oblik: razvuceno slovo S (vidi sliku pod > krivulja kumulativnih frekven-
oblik: • cija). Za odredivanje nekih statistickih vrijednosti (npr. > centralna
n s2-
r =--
LPq vrijednost, > indeks poluinterkvartilnog rasprsenja) nuzan je podatak o
kumulativnim frekvencijama pa njihova utvrdivanje predstavlja redo-
n n-1
vito etapu u takvim racunskim postupcima. Centralna vrijednost i polu-
gdje je r, koeficijent pouzdanosti, n broj cestica u testu, s2 varijanca uku- interkvartilno rasprsenje maze se odrediti i grafickom solucijom s po-
pnih rezultata u testu, p proporcija ispitanika koji su tacna rijesili neki mocu grafickog prikaza kumuliranih frekvencija. K
zadatak (cesticu) u testu, a q = 1- p.
Uz pretpostavku da su sve cestice u testu jednake tezine, formula kurticnost (engl. kurtosis, a dolazi od grcke rijeci koja znaci ispupeenje,
ima ovaj oblik (i oznaku 21 ): zakrivljenost, konveksnost) Termin kojim se opisuje opCi oblik zvonaste
krivulje (> nonnalna distribucija) u smislu njezine zakrivljenosti, a
n _ M(n-M)
r = 1 graficki pokazuje kolika je koncentracija rezultata oko aritmeticke sre-
n n-1 ns 2
dine. Normalna zvonasta krivulj a je > mezokurticna, a krivulj a koj a svo-
gdje je M aritmeticka srcdina rezultata u testu. K jim oblikom odstupa od mezokurticnosti maze biti > leptokurticna iii >
platikurticna. Kurticnost se u statistici opisuje s pomocu > momenta
kumulativna distribucija U statistici se cesto koristi kumulativna ra- (cetvrtog reda). U hrvatskom jeziku, na zalost, jos nemamo do barter-
spodjela frekvencija koje se inace distribuiraju normalno (Gaussova ra- ' min za kurticnost, pa predlazemo da se koristi sintagma zakri.vljenost
spodjela) jer graficki prikaz u linearnom koordinatnom sustavu raspod- nonna/ne kii.vulje. K
jele tih kumuliranih frekvencija ima karakteristican oblik razvucenog
slova S (vidi sliku pod > kri.vulja kumulativnihfrekvencija) (> kumula- kurtosis (engl.) > kurticnost
tivne frekvencije). K
kvadriserijalni kocficijcnt korelacijc (r~cvud) > Koeficijent serija/ne ko-
kumulativnc frekvencije Frekvencije dobivene postupnim redoslijed- re/acije koji se upotrebljava kad je jedna varijabla izrazeha u cetiri kate-
nim zbrajanjem (kumuliranjem) cestina kojima su se pojavile pojedine gorije, a druga je izrazena na kontinuiranoj skali. K
subklase (razredi) iii pojedinacni rezultati pri nekom mjerenju (ili
opazanju), odnosno ukupan zbroj frekvencija kojom se pojavio neki re- kvalitativna varijabla Pojam > varijablevezanje uzkvantitativne aspe-
zultat (iii klasa ili razred) i svi rezultati koji su mu po numerickom (ili ne- I kte pojava, stvari itd., pa je izraz "kvalitativna varijabla", aka se shvati
kom drug om) redoslijedu prethodili. Primjerice, ako je subklasa ili re- doslovno, zapravo contradictio in adjecto. Ali, buduCi da se (osobito u
zultat XI imao frekvenciju 4, subklasa ili rezultat x2 frekvenciju 7, x3

• psihologiji) koriste varijable koje imaju razliCite vrijednosti (iii tocnije
frekvenciju 6, x4 frekvenciju 9 itd., tada ce kumulativne frekvencije receno: razliCite razine ), koje nisu sasvim kvantitativne naravi, vee pred-
izgledati ovako: 11 (iz 4+7 ili 11+6), 17 (iz 4+7+6 ili 17+9), 26 (iz stavljaju neki kvalitativno-kvantitativni bastard, uobicajeno je koristiti i

'


- .•. - - -' .

104 KVALITA TIVNA V ARIJABLA

taj terrnin. Pojarn kv;;tlitativne varijable udovoljava terneljnoj definiciji


varijable da irna prornjenljive i opazljive vrijednosti, ali jc opravdanije '

govoriti o kategorijama, razinarna i sl. nego o vrijednostirna, veliCinarna


i tome slicno. Prirnjera takvih varijabli irna rnnogo: opisne skolske ocje-
ne, spol, profesija, socio.;!konornski status itd. K
I
'

kvartili Cetvrtine. Odreduju se taka da se skupina rezultata poredanih


po vclicini podijeli na cetiri jednaka dijela, tj. (1/4) N (gdjeN znaci uku- I
''
pan broj rezultata) pokazuje redno rnjesto granicne vrijednosti prvog
kvartila, (2/4) N redno rnjesto granicne vrijednosti drugog kvartila, a
(3/4) N redno rnjesto granicne vrijednosti treceg kvartila. Odredivanje
h."vartila, tocnije receno njihovih granicnih vrijednosti, predstavlja nuznu
etapu pri odredivanju > indeksa poluinterkvartilnog rasprsenja. K
latentni ponder (od lat. rijeci [at ere' sto znaci biti sakriven, i pondus' sto
znaCi uteg, tezina, teret) "Tezina" ili "vaznost" pojedinog testa u surni
kvartilno odstupanje > poluinterkvartilno odstupanje
bodova nekoliko testova, a tu rnu tezinu daje standardna devijacija. Test
sa 3 puta vecorn (u apsolutnirn brojevima) standardnorn devijacijom od
kvintiserijalni koeficijent korelacije (rkvmt) > Koeficijent serijalne kore- I'

nekog drugog testa, irna tri puta veCi ponder. Ako test A irna aritrneticku
lacije koji se upotrebljava kad je jedna varijabla izrazena u pet katego- I
sredinu 15, i standardnu devijaciju 3, a test B aritmeticku sredinu 40, i
rija, a druga na kontinuiranoj ljestvici. K I
'
I standardnu devijaciju 10, onda razlika od 3 bod au testu A znaci jednako
'I

I veliku razliku ' kao i razlika od 10 bod ova u testu B, jer obje razlike iznose
kvotni uzorak U izvedbi (a ne u nacelu) jedna od najlosijih varijanti > I .
'
' jednu standardnu devijaciju. Stoga kod jednostavnog zbrajanja bodova
stratificiranog uzorka: to je zapravo neslucajni stratificirani uzorak. Ako
I
'
oba testa mozemo i ozbiljno pogrijesiti: ispitanik sa 24 boda u testu A i
poznajemo npr. strukturu stanovnistva nekog grada, i zanima nas mi-
sljenje razlicito starih !judi i djece o nekom produktu; izracunamo ko-
I
I
35 bodova u testu B ima ukupno 59 bodova, a ispitanik sa 12 bodova u
; testu A i 55 bodova u testu B ima ukupno 67 bod ova, ali on je ustvari u
liko bi u uzorku velicine 1000 trebalo biti odraslih preko 50 godina, koli- ''
I ukupnom rezultatu znatno slabiji od prvog ispitanika; ako naime njiho-
ko ispod 50 god., koliko muskaraca, koliko zena, koliko djece itd., ian- '
I
' ve rezultate pretvorimo u > z-vrijednosti, onda prvi ispitanik ima ukup-
ketarima dademo uputu da po svom slobodnom izboru anketiraju iz no z = + 2,5, a drugiz = +0,5. Ukidanje latentnog ponder a od velikogje
I·.
svake od ciljanih skupina unaprijed definirani broj prolaznika. Uzorak znacenja prilikom selekcijskih postupaka kada se na velikom broju kan-
moze dati dosta problematicne rezultate jer biranje "po slobodnom didata primjenjuje nekoliko testova, pa je potrebno uciniti rang kandi-
I
izboru" cesto je rukovodeno subjektivnim faktorima anketara, koji i ne '
data (npr. pri klasifikacijskim ispitima na fakultetima). No buduci da-
prilazi osobama koje rnu se ne svidaju iii za koje smatra da bi odbile uz velik broj kandidata - pretvaranje individualnih rezultata u z-vrijcd-
'•
I
razgovor. Osim toga, tim nacinom biranja (u prolazu) iskljuceni su gra- I
nosti predstavlja opse:lan posao, mnogo je jednostavnije (uz nuznu pret-
dani koji se voze svojim vozilima i1i javnim prijevozom, oni koji u to vrije- postavku da ni jednom od testova ne zelimo dati vecu vaznost) to pro-
rne rade itd. P vesti na ovaj nacin: bruto rezultati svakog testa pomnoze se faktorom

... •
,

'

~ 106 lATEN1NI PONDER


I
koji odrazava odnos izmedu standardne devijacije testa s najvecom stan-
dardnom devijacijom i toga testa (npr. aka tests najvecom standardnom
oevijacijom ima 2,R puta vecu standardnu clevijaciju od nckog drugog
testa, onda svc rczultate toga drugog testa pomnozimo s_2,~)- ~a~on :o~
postupka rezultati svih testova mogu se zbrajati i iz zbroJa tzvrsttl defmt-
tivno rangiranje kandidata. P

Ieptokurticnost (od grcke rijcci leptos, koja zna~i t~na~, vit~~~ Karakt~­
ristika zvonaste krivulje distribucije koja se ocitUJC u IzrazitiJem grupi-
ranju rezultata oko sredisnje vrijednost_i, o_d~o~:n~ u sma~j~nom _r~s­
prsenju rezultata, zbog cega krivulja t~ dJstnbuctJe 1zgleda VIsoka 1VIt-
ka" (> kurticnost). Obrnuto: '> platikurticnost. K

linearna zavisnost Takva povezanost (korelacija) medu varijablama


v
kod koje su podjednake promjene vrijednosti u jednoj_ varijabli pracene M ( od engl. rijeci mean, koja znaci sredina) Cesta oznaka za aritmeticku
sredinu.
manjimili veCim promjcnama u drugoj vari~abli:_ali ~OJ~ su takoder po_~­
jednake na cijelom rasponu vrijednosti u toj vanJabh. Lme~r~a regresiJa
se oCituje u > crti regresije koja odgovara pravcu (> zaknvljena korela- mali uzorak Statisticari nisu potpuno slozni u misljenju kako malen
cija). K uzorak treba nazivati malim uzorkom: najeesce kafu da je to uzorak koji
je manji od N = 30, no neki smatraju od N = 50. Radi se naime o tome
logaritamska sredina > geometrijska sredina
da za male uzorke vrijede neka pones to modificirana pravila i statisticki
racuni (npr. izracunavanje standardne devijacije iz malog uzorka, ako se
ne provodi s N-1 u nazivniku, dovodi do sustavnogpodcjenjivanja stan-
dardne devijacije ); nadalje, izracunavanje > t-odnosa kod malih uzo-
raka poprima > t-distribuciju, kojaje sira od normalne raspodjele i neki
statisticari navode kao kriterij razlikovanja malih i velikih uzoraka nesto
vecu razliku u granicnim vrijednostima t-odnosa izmedu t-distribucija sa
i stupnjevima slobode manjim i vecim od 30. Ipak, postavljene granice od
I
'
I
'
I
N = 30 ili N = 50 samo su stvar dogovora jer pogreske koje u racunu
l -
'
cinimo, ako ne primjenjujemo formule za male uzorke, postaju kod tako
I\ malih uzoraka vee dosta velike. U principu, matematicki su posve is-
pravne samo formule za male uzorke, no one su obicno ne.Sto komplek-
snije, pa se od njih kod vecih uzoraka odustaje jer pogreska postaje
II•• IVII'II .. skala prakticki veoma mala. P, K
''''OHOO~

. .
- - -- . ~-- - -
.

-- - .

'
McNEMAROV 'JEST 109
108 MANN-WHI1NEYEV U-'IEST
na to mjesto stavlja jedinicna vrijednost, koja pokazuje da varijabla
Mann-Whitneyev U-test >test sume rangova
' sama sa sobom najvise korelira). Matrica korelacija sluzi kao polazisna
• •

osnovica slozenije statisticke elaboracije koja se temelji na koeficijenti-


matematicki model Ccsto se naziva i "statisticki model", a obicno se ma korelacije (primjerice > faktorska analiza). K
izrazava nekom distribucijom (npr. > normalna distribucija, > Poisso-
nova distribucija i sl.) ili formulom (kao npr. kod modela >.bruto rezulta- McNemarov test Varijanta hi-kvc.drat testa, a sluzi za e-
ta), u slucaju da je neka hipoteza o postanku tih rezultata tacna. Na ne iste sku
primjcr, ako pretpostavimo da su neki rijetki dogadaji potpuno slucajni, dyjje razliCite sjtuacije. se zapravo znacajnost razlike medu pro-
njihov matematicki model je > Poissonova distribucija; ako smatramo _Eorcijama neke karakteristikc u dvije .situacije. Na primjer, od 100
da se !judi razlikuju po nekom svojstvu koje bismo mogli nazvati "sklo- '•
ucenika na prvom testiranju neke vjestine njih 60 je zadovoljilo, a nakon
nost nesrecama", ida se to svojstvo distribuira medu ljudima po "nor- I odredenog treninga 70 ihje zadovoljilo, ali neki, koji su u prvom testira-
malnoj" raspodjeli, ali da i o slucaju ovisi hoce li netko imati manje ili I
nju zadovoljili, u drugom nisu:
'
vise nezgoda od onog broja koji bi odgovarao kolicini njegove "sklonosti •
POSLIJE
I
nesrecama", ondaje matematicki model tc hipoteze tzv. negativna bino- ''' - + •

mna raspodjela. Ako smatramo da se visina !judi distribuira "po PRIJE + S(A) 55~B) 60
slucaju", njezin matematicki model je normalna distribucija itd. Daka- t
- 251C) 15(J:?) 40
I
ko, matematicari mogu izraditi matematicki model bilo kakve hipoteze, I
I
30 70 100
pa se taj model moze (obicno uz pomoc > hi-kvadrat testa) usporediti s •

'

onim sto se ustvari dogodilo: ako nadena distribucija dogadaja nikako \ Razlike koje su se dogodile, nalaze se u celijama AiD, i McNemarov
I
ne odgovara modelu, hipoteza biva odbacena; obrnuto, ako nadena dis- • test ce nam pokazati je li promjena statisticki znacajna. Racuna se po
tribucija odgovara modelu, onda bi hipoteza mogla biti tacna (no u tom I
• formuli: '..1
('
'
slucaju treba pri zakljucivanju biti vrlo oprezan, jer bi mozda i neka I
( (A-D) 2
I 2
druga hipoteza mogla imati jednaki model). P '
I \ ' X = A+D
l -
matrica (u statistici) Svaka tablica kojom se u redovima i stupcima pri- ' ili s primjenom > Yatesove korekcije, ako je (A .f. D) manje od 20:
'
' 2
kazuju neki podaci s pomocu brojeva ili nekih drugih simbola (primje- I
I
I
(lA- D-1)
X2 = _::___ __:.._:.__
rice > matrica korelacija). K I
I A+D
Iako ovaj test spada u hi-kvadrat, valja uociti da bi racunanje teoretskih
matrica korelacija Moze se upotrijebiti i izrazkorelacijska matrica. Ta-
blicno prikazane sve korelacije izmedu tri ili vise varijabli ili, preciznije
I

i' frekvencija na standardan nacin dalo neu_potrebljive rezultate; npr. u


receno, tablica koeficijenata korelacije izmedu niza varijabli. U redo- I slucaju da su u prvom i drugom navratu polozili isti ucenici, ida oni koji
nisu polozili rvi ut nisu olozili niti dru i p1;1t, celije A i P. bile bi 0, pa
I
I'
vima tab lice nalazi se nizvarijabli, au stupcima te iste ili druge vuijable.
U presjecistima stupaca i redova nalaze se koeficijenti korelacije koji 'Qi i McNcmarov test dao hi~kvadrat = 0 (jer nije doslo ni do kakve prom-
pokazuju povezanost medu varijablama. Ako se radio is tim varijablama
i
jene ). Na rotiv racunan· e te skih fr~kYencija...J::)&Stanclartifle-m-J'}os-
u redovima i stupcima, u dijagonalnim kvadratiCima nalaze se vrijed- J!!Qku i rovedba hi-kvadrat racuna, dali bi visoki hi-kyadrat- S.tn uopGe
nosti koje pokazuju koreladju svake varijable same sa sobom (cesto se ne odgovara stvarnoj situaciji. P

-
• I

'
MEDIJAN
MJERENJE (U PSIHOLOGill) 111

metoda najmanjih kvadrata Opcenito, to je postupak kojim se trazi nu-


mericka vrijednost u nekoj skupini rezultata od koje je suma kvadrata
odstupanja najmanja- a to je aritmeticka sredina. U statistici se koristi u
medijan test Vrlo jednostavan neparametrijski test za testiranje pripa-
razlicitim slucajevima, a najcesce u > regresijskoj analizi pri odredivanju
daju li dva nezavisna uzorka populaciji sis tim medijanom. Test se svodi '
najbolje kri~lje koja pristaje uz dobivene rezultate odnosno najvjero-
zapravo nato da se nade centralna vrijednost (medijan) svih rezultata, i
jatnijeg rezultata koji se moze u nekoj varijabli prognozirati. K
u 2 x 2 tablici prika:lu frekvencije rezultata ispod i iznad medijana za
svaki uzorak, te se razlika testira hi-kvadrat testom (uz upotrebu Yate- metoda "slobodne ruke" > postupak "slobodne ruke"
sove korekture). P
-:=:=) mezokurticnost Oblik > kurticnosti normalne krivulje. Normalna (zvo-
meta-analiza lntegriranje svih objavljenih (dostupnih) rezultata is- nasta) krivulja (kojom je prikazana > normalna distribucija) je mezo-
trazivanja nekog problema i stvaranje zakljucaka iz ukupnih rezultata. kurticna, a to znaci daje proporcionalna, tj. ni preuska ni presiroka. Ako
u novije vrijeme meta-analiza sve se vise koristi u razliCitim znanostima nije mezokurticna, krivulja maze biti > leptokurticna iii > platikurticna.
kako bi se rezimirali ukupni rezultati proucavanja djelovanja nekog Kurticnost krivulje matematicki je opisana > momentom (cetvrtog
lijcka, nckog postupka i sl., jcr se mozc dogoditi da takva integrativna reda). K

a.naliza ukaze na neku zakonitost koja nije mogla biti ustanovljena u po-
-=~>finJere centr~inetendenci.iefu nas se koristi termin > sredisnje vrijed-
jcdinacnim istrazivanjima ( > kombinacija dvaju test ova znacajnosti). p
nosti. To su brojcanevrijednosti koje "reprezentiraju" skupinurezultata
u slucajevima kada rezultati imaju tendenciju grupiranja oko neke sre-

disnje ili neke druge vrijcdnosti, dakle kada postoji odredena "tcndcn-
kod provjerav,anja statistickc znacajnosti razlike izmcdu dvijc. aritmc- cija centriranja", tj. > centralna tendencija. Tako je npr. > aritmeticka
ticke sredine, ako uzorak nij£_ ve!_ili:, i ako su rezultati rvog I drugqg sredina uspjesna mjera grupiranja rezultata oko neke vrijednosti kojaje
mjerenja u korelaciji (npr. ako je ista skupina ispitanika tes~i.rana u dva uglavnom po sredini izmedu svih rezultata. > Dominantna vrijednost

navrata ). Metoda je vrlo jcdnostavna i "elegantna", a sastop se u tome ukazujc na grupiranje rczultata na vrijednosti koja moze, aline mora biti
x. ki k razlike izmcdu i rezultata po sredini svih vrijednosti. BuduCi da uz "centralnu tendenciju" rezul-
d a sc u ral,;uns
za svaki element ~vakog i~Qitanika), te se izracuna aritmeticka sredina tati vcCinc mjcrcnja pokazuju i tcndcnciju rasprsivanja, to se moze ka-
tih razlika, njihova stamlarJJna tlf_vijaciia i njihova standardna pogrdka. zati da je centralna tendencija skupine rezultata to izrazitija sto je ras-
A buduCi da radimo s razlikama, standardna pogre "ka r-redstavlja stan- prsenje rezultata oko neke rcprezentativne vrijednosti manje, i obrnuto.
ardnu ogrcsktUazlike_, uakle upr.av..u.oru ~ · azimQ. Tim postupkom I
I
Aje lito rasprsenje relativno veliko ili malo, pokazuju razlicite mjere >
_ izbjegavamo klasicni postupak testiranja statistick~ znac.~jno~ti r~zlike I rasprsenja rezultata, od kojih je jedna od najkorisnijih > koeficijent vari-
I' jabilnosti. P
medu aritmetickim sredinama zavisnih uzoraka, kOJI zahtlJCVa Izracuna-
vanja korclacijc medu rczultatima oba mjcrcnja, i uvrstava~jc koe~.i-
mjerenje (u psihologiji) Pridjeljivanje brojeva objektima, pojavama
cijwta korelacije u osnovnu formulu. Primjeno e.tod4Jiifer.en.cl.J.\;:-
itd. u skladu s pravilima (> skala mjerenja). Opcenito govoreCi, pravilo
k_or~ acija je automatski u.ra v ta. P
, -
\\
-· • . ..---
,.
.
-. . -
I
MON1E CARLO METODE 113
112 MJERENJE (U PSIHOLOGill)
'
pridjeljivanja brojeva pojavama maze biti hila koje konzistentno pravilo tata ad aritmeticke sredine u nekoj distribuciji rezultata podignuto na
I'
(osim pridjeljivanja po slucaju). Medutim, za mjerenje su posebno i-tu potenciju (potencija momenta prvog reda je 1, drugog 2 itd.), aN je
vazne cet:ri znacajke sustava brojeva, jer te znacajke determiniraju broj rezultata koji cine neku distribuciju.
pravila koja se pri mjerenju koriste, a time je ujedno odredena i razina
mjerenja odnosno skale mjerenja. 1. Svaki brojcani simbol ima svoj
:Lcx-M) ·
Moment prvog reda je m 1 = N = 0; moment drugog reda je
identitet, tj. onje sigurno razliCit od svakog drugog broja i reprezentira 3
uvijek isto (> nominalna skala). 2. Svi brojevi koji nisu identicni, manji :Lcx-M) 2
2
:Lcx-M)
m 2 =- N = s ; momenttreeegredaje m 3 = N ;
su ili veCi, pa se zato mogu redati po velicini (> ordinalna skala). 3. Za
razlike medu brojevima vrijedi isto sto i za same brojeve pa se moze ''
I
c d .
moment etvrtog re a Je m4 = L (X- M)
N
4 (X v •
oznacuJe sva
ki .
poJe-
utvrditi i red medu razlikama (> intervalna skala). 4. Sustav brojeva I •

sadrzi jedinstven broj -nul a- koji pokazuje odsutnost bilo kakve pojave dini rezultat, aM aritmeticku sredinu).
ili hilo kakvc kolicine (> omjema skala). K Moment prvog rcda zapravo je definicija aritmeticke sredine, mo-
ment drugog recta prcdstavlja varijancu, moment trceeg rcda pokazujc
dominantna vrijednost asimetricnost (engl. skewness) distribucije rezultata (> simetricna distri- I

hucija; > asimetricna distribucija), moment cctvrtog recta pokazuje >


moderator varijabla Varijabla koja rnijenja ("rnoderira") odnos kurticnost distribucije (engl. kurtosis). K
izmedu druge dvije varijable i stoga predstavlja varijablu interakcije. Na
primjer, ako bismo kod muskaraca nasli pozitivnu korelaciju izmedu moment prvog reda > moment
stupnja konzurniranog alkohola i stuphja agresivnosti, a kod zena ne bi
nasli nikakvu povezanost, onda spol prcdstavlja moderator varijablu: moment drugog reda > moment
vee prema tome uzmemo 1i u uzorak muskarcc ili zene, naCi ccmo ili I'
moment treceg reda > moment
'
neccmo nact'" povezanost. P I '
moment cetvrtog reda > moment
moment Fizikalni pojam koji je u statistiku uveo K. Pearson (Pearson je
Monte Carlo metode Metode za aproksimativno rjesavanje razlicitih
po svom temeljnom obrazovanju bio fizicar) - "moment sile je produkt
maternatickih i statistickih problema koji se ne rnogu analiticki rijditi,
iznosa sile i udaljenosti od sredista rotacije uzrokovane torn silom do
naroCito u ekonorniji, fizici i nekim drugim znanostima, koje se koriste
linije djelovanja sile"; "moment koliCine gibanja materijalne cestice sob-
"proizvodenjern" razlicitih brojnih uzoraka uz pomoc slucajnih brojeva,
zirom na neku tocku jc produkt kolicine gibanja cestice i udaljenosti od-
tj. generiranjem slucajnih brojeva na racunalima, au svrhu provjere ne-
abrane tocke do pravca definiranog smjerom brzine gibanja cestice". U
kih statistickih zakona ili najcesce nekih statistickih modela za testiranje
statistici postoji vise momenata, a definiraju se razlikom izmedu svakog
odredene hipoteze: provjeravanje realnih podataka trajalo hi suvise
pojedinog rezultata i aritmeticke sredine svih rezultata. Opcenito, mo- dugo, ili hi bilo prcskupo, pa se podaci po slucaju gcncriraju na racunalu.
. ·vki .
ment Je materna tic defimran ovako: m 1 =
,Lxi
N , gdje je m; moment
N aziv potjece iz razdoblja kada je Pearson u Monte Carlu koristio
rezultate razliCitih igara na ruletu u svrhu provjeravanja razlicitih zako-
i
prvog, drugog, treceg itd. reda; xi odstupanje svakog pojedinog rezul- I na vjerojatnosti. P
'
'
I
'

-~---===
r
I

i
'

' I
114 MULTIPLA KORELACIJA I MULTIVARIJA1NA ANALIZA 115
multi pia korelacija Multivarijatni postupak kojim se odreduje stupanj
I
I' lorn) (Y) i skup prediktorskih varijabli (koje se katkad ne sasvim oprav-
''
povezanosti izmedu jedne varijable (koja se obicno naziva kriterijskom ' dano nazivaju nezavisnim varijablama) (X) s pomocu linearne jedna-
varijablom ili samo kriterijem) i optimalno ponderiranc kombinacije dzbe: .
;
nekoliko drugih varijabli (koje se obicno nazivaju prediktorskim vari-
jablama ili samo prediktorima). Ponderi su odredeni na principu
najmanjih kvadrata tako da minimiziraju rezidualnu ili nepovezanu Regresijski ili b ponderi obicno su odredeni s pomocu metode najma-
varijancu. Formula za multiplu korelaciju (R) jedne varijable (Y) s k njih kvadrata taka da je minimizirana suma kvadrata odstupanja za-
ponderiranih varijabli (X), u terminima bivarijatne kordacijc i stan- visnih (pravih kriterijskih) vrijednosti od korespondentnih predvidenih
dardnih pondera parcijalne regresije ("beta") izgleda ovako: vrijcdnosti, tj. minimizirana je L (Y- Y') 2
• > Multipla korelacija stoga

RY.x, .x, ... x, = ~fJx,yrx,Y +fJx,yrx,Y + ...+fix,yrx.Y je R=ryy ..


U tzv. "korak po korak" postupku varijable se dodaju (iii oduzi-
Multipla korelacija proteze se od nule do 1 i interpretira se slicno maju) jedna po jedna izmedu nezavisnih varijabli sve dok se znacajnost
kao > bivarijatna korelacija (multipla korelacija maze se smatrati ek- R vise ne mijenja.
stenzijom bivarijatne korelacije), aka je ispunjena pretpostavka o ~ Regresijski ponderi naj ouzdanije se mogu odrediti kad su predik-
linearnoj povezanosti kao i druge pretpostavke koje vrijede za bivari- t~rske- varijable u medusobnoj relativno m oj korelaciji. K
•I
jatne interkorelacije iz kojih je multipla izracunata.
(u psihologiji kvadrat multiple korclacije (R 2 ) cesto sc koristi za multivarijatna analiza BuduCi da se istrazivanja u psihologiji, jednako
procjenu proporcije varijance u zavisnoj varijabli koja je povezana sa kao i donosenje prakticnih odluka psihologa, nuzno temelje na podaci-
skupom nezavisnih varijabl;J ma o veeem broju razlicitih varijabli prikupljenim na is tim individuumi-
Primjeri upotrebe multiple korelacije: (1) U profesionalnoj selek-
ma, u psihologiji se koriste matematicki i statisticki postupci s pomocu
ciji psiholog testira kandidate s nekoliko testova, pa zeli znati kakva je
kojih se takvi podaci simultano (istodobno) obraduju. Opcenito govo-
zajednicka korelacija izmedu rezultata u tim testovima (prediktorima) i
reCi, metode multivarijatne analize predstavljaju generalizaciju > uni-
uspjeha u zvanju (kriterija); taj podatak posluzit ce mu za boljupredik-
ciju uspjcha u zvanju. (2) Lijecnika zanima kakva je korelacija izmedu varijatne analize, sto znaci da se podaci za samo jednu varijablu mogu
rczultata nekoliko dijagnostickih nalaza (npr. broja lcukocita, sedi- obraditi multivarijatnim postupkom i dobit ce se identicni konacni rczu-
mcn tacij e, tjelesne temperature i sl.) i nastanka ili razvoj a neke bolesti. ltati kao da je primijenjen univarijatni postupak.
Kocficijent multiple korelacije dat ce najvecu vafnost onom prc- Iako se u psihologijskim istrazivanjima susrecemo i s nelinearnim
I
diktoru koji ima najvccu korelaciju s kriterijem, ali uzima u obzir i ko- ' odnosima varijabli, ipak linearni koncept opcenito zadovoljava veCinu
I
rclacijc medu prediktorima (u nacelu, sto je manja korelacija medu pre- . potreba pa se multivarijatni postupci temelje uglavnom na linearnim
' li ktorima, veCi je koeficijent multiple korelacije i obrnuto ). Staga koefi- modelima.
I Od mnostva multivarijatnih tehnika i postupaka u psihologiji se
d j ·nt multiple korelacije predstavlja najvecu mogucu korelaciju izmedu
pt •dik tora i kriterijaJ K, P najcesce koristi multi pia regresija (vise prediktorskih i jedna kriterijska
varijabla) i multivarijatna regresija (vise prediktorskih i vise kriterijskih
umll pia .-c~resija Metoda > multivarijatne analize koja stavlja u odnos varijabli) te multivarijatna analiza varijance (analiza varijance s vise za-
k rrlr tiJ ku varijablu (koj a se katkad netocno naziva zavisnom varijah- visnih varijabli). Zatim, diskriminacijska analiza, kanonicka korelacija
.. -
-· t~-" •
I c
'
'
I
I PQ -t C-' r '
\ • • ..
\
116 MULTIVARIJATNA ANAllZA

trf~
' •
I ' I
te analiza glavnih komponenata. Napokon, u sirokoj upotrebi su postu- ''
'
pci kojimaje cilj aritmeticke sredine, varijance i korelacije, dobivene na '
'
,
' f 1-1
opazanim varijablama, objasniti na temelju hipotetickih latentnih kon- • ' L
~

.._ , .._ ~
• •
strukata; najpoznatija takva tehnika je faktorska analiza (i eksplora-
torna i konfirmativna). K

multivarijatna distribucija Distribucija vezanih frekvencija rezultata )

dobivenih pri opazanju iii mjerenju dviju iii vise varijabli na istim ispi- I
'
'
tanicima. Kad se radio dvije varijable, onda se redovito koristi termin > '
'
bivarijatna distribucija. K

i
I •
''
negativna akceleracija Takav porast neke varijable, koji u vremenu (iii
I
'
paralclno s linearnim porastom druge varijablc).J2.ostaje svc SllQri·i. Na
primjcr, oporavak organizma u tijeku odmora odvija se najprije brzo, a
kasnije sve sporije. Alco je usporenje posve pravilno, negativna akcelera-
• cija prikazuje se izrazom:
''
'
Y=X"
' ,
I
pri cemu je a eksponent koji je manji od 1. P
I
'
'
negativna asimetricnost distribucije Takva distribucija koja nije sime-
'
' tricna, nego se veCina rezultata nalazi na njezinoj desnoj strani, dok je
lijeva strana manje iii vise produzena (vidi sliku). Naziva se "asime-
tricnost ulijevo". Negativna asimetricnost distribucije nastaje zbog ra-
zlicitih razloga, npr. stoga sto se neka pojava u prirodi iii drustvu doista
tako distribuira, ili zato sto je neki test prelagan za ispitanike na koje je
'
I primijenjen, pa stoga veCina ispitanika postize natprosjecne rezultate, a
II
')

''
' Negativno asimetri~na distribucija.
I

' '
I
'''
I
NESISTEMATSKI VARIJABILNI FAKTORI 119
I 118 NEGATIVNA ASIMETRICNOST DISTRIBUCIJE '

test je ogranicen brojem zadataka. Pri mjerenju neke varijable moze se testovima u statistici suj!FkV~flji})~~t 'i Rho . e.
• dobiti i zbog djelovanja nekih > sistematskihfaktora kao sto je, primjeri- , ¥.~9~i. ·~-t ~!i~ti~~~i.neparametrijske test~v~· riazivaju . . . · ·
I cc, vjczba. P
_}1i·~:<?.~-~~~~-i~~~ij~" (nez~visni od distribucije; distribution free tests),
pn cemu sc mislt da sc om mogu koristiti kod bilo kojeg oblika distribu-
• cije. Drugi se, pak, statisticari tome protive jer smatraju da se izraz "ne-
negativna binomna distribucija Distribucija koja nastaje superpozici-
~a~:~etrijski testovi" odi1?~i- sam<? na takve hipoteze koje .I1e zah~ijevaju
jom niza > binomnih distribucija ili > Poissonovih distribucija. U psiho-
Iznqt~ pret~os~avku ~?~~om> parametru populacijc. Ncparamctrijski
Jogiji najpoznatiji primjcr za takvu distrihuciju jc hipotcza o tome da sc
t.c ~tov1 .u vchkoJ ~u vec1m JCdnostavniji i lakse razurnljivi od parame~rij­
ljudi mcdusobno razlikuju po tzv. "sklonosti nesrccama". Pod prctpo-
skih, ~~~~_ci.<:l~~.a. 9~-~,tqm~ni~ :> .s:n(lg~ od_ ~jih, a nedostatak im je ito da su
stavkom da "sklonost nesrecama" doista postoji, najopravdanije je pret-
u komplel<smm el{spenmentima, u KoJima mampuliramo veC!m bro ·em
• postaviti da se ona medu ljudima raspodjeljuje po normalnoj distribu-
yarijablC znatno manje upotre J1VI. •
I ciji. U tom slucaju treba pretpostaviti da 6e mali broj ljudi s najmanjom
"sklonosti nesrccama" imati prosjccno i najmanje nesreca, ne5to veCi n~sistemats~.varija~ilni faktori Svi faktori koji pri OQa:lanju ili I!,ljerc-.
broj !judi s vecom "sklonosti" imat ce prosjccno vlse nesreca itd., i napo- nJu neke vchcme (poJave, fenomena, atributa) utjecu na velicinu dobi-
kon opet vrlo mali broj ljudi s vrlo vclikom "sklonosti" imat ce prosjecno vene vrijednosti, ~ njihova djelovanje je slucajno (kako se to obicu'o
vrlo mnogo nesrcca. No, kod svake od tih skupina ovisi i o slucaju koliko kaze: po zakonu slucaja). Svaki > rezultat · · · · rezulta-
ce tko odstupati od prosjeka skupinc. A buduCi da se radi o rijetkim • ,ntnaje vrijednost djelovanja >. konstantnih Wktpra i nesistematski vari-
'
dogadajima, svaka ce skupina tvoriti Poissonovu distribuciju, ali dakako I'
' jabilnih faktora. BuduCi da nesistematski vari'abi . i · · · -lu.·.u
svaka drugaCiju,jer ce se te distribucije razlikovati po aritmetickoj sredi- '
,slucaju,aritmeticka sreg!na njihova djelovanja jcdnakajq,nuJj, a o njiho-
ni i po povriini. Zhroj (superpozicija) svih tih Poissonovih krivulja dat ce .., . ..
vu. rasp~senJu ov1s~ > rasprJenje dobivenih rezultata; opcenito, sto je pri
negativnu binomnu distribuciju. P mJerenJU neke poJave vise nesistematski varijabilnih fakto:r.a (odnosno,
~to na ne~ pojavu djeluje vise nesistematski varijabilnih faktora), vece
negativna korelacija > koeficijent korelacije
JC rasprsenJe rezultata mjereoj.a, Nesistematski varij~hilni faktori odgQ-
ncograni~ena populacija > populacija vorni sui za normalni ili zvonasti oblik distribucijc rczultata ( > norma-
Ina distribucija). Nesistematski varijabilni faktori su faktori koji- iako se
neparametrijska statistika Onaj dio statistike koji se koristi > nepara- dobro zna da postoje i djeluju na rezultate- izmicu kontroli ili elimina-
v
metrijskim testovima jer karakteristike podataka koji se obraduju, ne I ciji. Sto jc pri nekom mjcrcnju moguce kontrolirati vise tih faktora, rc-
I'
odgovaraju propisima > parametrijske statistike (> neparametrijski tes- '

zultati mjerenja imaju manje rasprsenje, tj. mjerenje je tocnije jer je
\
tovi). P manja vjerojatnost odstupanja od prave vrijednosti (odnosno konstant-
nih faktora ). N ace no ovo su te~elj~i_ izvori dj,e.lpyauj.a ncsis!ema.tsk.i.h
nepristrani uzorak > pristrani uzorak I
varijabilnih faktora: nesistematske romjene u isgi aniku -~ispitani..ci•
.
I• ma),; faktori u neposrednoj okolini u kojgj~.e obaylja · · · o aza-
neparametrijski testovi _Statisticki postupci koji se koriste kada podaci '
nje, ukljucivo i neko.ntrolirane nesistcmatske faktore eks,p.c._rim.cntalnc
koji se obraduju i analiziraju, odstupaj.u od distribucije koja se moZe .
.analizirati > p.JLram~trijskim testovima, ili su izr:;tzei}i na fi/fii1Jtinqliiim.
ili istrazivacke cedme.;_sam postupak mjercnja il!_pg.aZ,an,j ·.~­
f pokon, djelovanje slucaja na slucaj,_pri. odabi:r:anju > uzorka. Nesiste-
iii> ordinalnim skalaina:Najpoznatiji medu brojnim neparame .. ;. ~.1111

J

-----. -· ..• - · ~ .. - ......
. -------

'

120 NESISTEMATSKI VARIJABILNI FAKTORI ------------------~N~O~M~O~G~R~AM~----------------~121


matski varijabilni faktori imaju smisao pogreskc mjercnja pri svakom brojevi
.
sluze samo kao. oznake
.. '
ili simboli.i mogu biti zamijenjeni slovi-
, '. '
\
rna, rijcCima ili bilo kojim drugim dogovorcnim znakovima, uz uvjct
mjerenju i obicno se zanemaruju u svim onim slucajevima kad se radi o
postivanja gornjeg pravila. Kod nominalne skale brojevi sluze za identi-
uzorkovanju i pogreskama izazvanim uzorkovanjem. K
fikaciju statistickih jedinica ili za oznacavanje klasa istovrsnih jedinica,
nczavisna varijabla Ona varijabla o kojoj na ncki naCin ovisi ono sto is- gdjc jc svakom clanu klasc pridijeljcn isti broj. Formiranje klasa ohjeka-
trazujemo, tj. ono sto nazivamo > zavisna varijabla. U eksperimentalnoj ta ili pojava ovdje se, dakle, temelji najednakosti s obzirom na neki atri-
situaciji nezavisna varijabla je ona varijabla koju istrazivac namjerno but (osobinu, aspekt) neke pojave. Kod nominalne skale brojevi ili dru-
mijcnja (varira), da hi ustanovio kako ce te promjcne djclovati na gc oznakc mogu sc zamijcniti bilo drugim oznakama iii medusohno, ada
I struktura skale ostane invarijantna. Na primjer, ako se u varijabli "spol''
zavisnu varijablu koju on istrazuje; npr. istrazivac mijenja temperaturu !

~ klasa "musko" oznaci sa 1 (sto se ohicno i Cini), a klasa "zensko" sa 2,


prostorije (nezavisna varijabla ), ispitujuCi djelujc Ji i kako na pamcenje I

brojcvi sc mogu zamijcniti, tj. sa 1 oznaCiti zensko, a sa 2 musko (pace i


ispitanika, sto je u ovom slucaju zavisna varijabla. P
tad a musko ostati musko, a zensko zensko ). lako se nominalnoj skali
nivo alfa > razina znacajnosti
'
!
cesto odricu bilo kakva svojstva metrijske skale, ana ipak udovoljava
!

I'
opceprihvacenoj definiciji mjerenja: pridjeljivanjc simbola odredenim ·-
nivo rizika > razina znacajnosti definiranim atributima stvari iii pojava u skladu s pravilima pridjdjiva-
!
I
nja. Takoder, u novije vrijeme sve je vise statistickih testova namijenje-
nivo znacajnosti > razina znacajnosti nih obradi podataka dobivenih na nominalnoj skali. P,K
, ,~,
-

nomina Ina skala Ova skala spada medu najnesavrsenije "skale", jer se I
u
-
I nomogram Graficko pomagalo za odcitavanjc nckc odrcdcnc zavisnc
zapravo ne radi ni o kakvoj skali: pomocu ~ominalne (iii kategorijalne) !
,-
I
vrijednosti iz jedne, dvije ili vise drugih poznatih nezavisnih vrijcdnosti.
skale rezultate opazanja i1i "mjerenja" svrstavamo u kvalitativne ili ap- '
•• C.

roksimativno kvantitativne klase. Na primjer, ispitanike svrstavamo u


muskarce i zene iii u mlade, srednje stare i stare; niske, srednje visoke j ~

!
visoke; u one bez motivacije, one sa srednjom motivacijom i jako motivi-
rane, it d. ~Q.~:f.l..L!.~f!l~~~ . p_()~!~P~!c. . !t ()V.Qj sk:l:lE ~l:lstoj~ se u brgjenju
I ' -
I'
S~_ll.~.a.j_~Y.a.. t1 ~.Y.a~~t~?t~gor.ijj. .
I

i
Brojevi, koji se cesto pridjeljuju kategorijama nominalne skale
. . ' I

nemaJu mkakve kvantitativne vrijednosti u uobicajenom smislu vee !


sluze jedino kao "etiketa" za identifikaciju u koju kategoriju pojedi~a > .
statisticka jedinica spada (npr. igrac broj 1 redovito u nogometu
- H, -· -
,.., L

.
v • • '

?znacuJe vrat~ra; broJ 1 moze oznacavati zdrave, a broj 2 bolesne !jude, I


I
I ,,
--!td.). Rezultati prikazani na nominalnoj slcitli obraduju se :::-: J:lepammr:t- I proporcija p u uz.orku proporci}a p u uzorlru ..-
l
f. t!fS.~!~ te~!ovim,a!
. priC,e.mu se najvise koristi .> ~i-kva(irqt te~t (i~nimka I
I
95%-tne (lijeva slika) i 99%-tne ( desna slika) gran ice pouzdanosti neke proporcije u funk- ,_
·· ~· · ···· ··· · · · · I
\ 1~ pri~Jena t-te.sta Z:l:l pfopm:~::u~ ). I
-.
··· · Pravilo koje definira nominalnu skalu jest utvrdivanje identiteta ili I
! ciji ve!icine uzorka. Na primjer, ako smo nauzorku ve!icine 100 nash da je neka karakteris-
tika zastupljena u 35% slucajeva (p = 0,35), onda iz gornjeg nomograma odcitavamo da je ·-
jednakosti. Simbolicki, to se pravilo moze izraziti ovako: ilije a= b ilije oko 95% vjerojatno da se u populaciji prava proporcija kreee izmedu 0,25 i 0,45, a oko
a :;t: b; ako je a= b, tadaje b =a; ako je a= b, b = c, tadaje a= c. Ovdje 99% vjerojatno da se prava proporcija krece po prilici izmedu 0,23 i 0,48. II
I
• '

! '1
/'·- ..
- . .1
·- -- -- --· - · - ~---
,
/
,. ' r'
.

~;~~~DISTRIBUCIJA
...- .• ~
'
122 NOMOGRAM \ .. ·.123 \[:/'
~

U statistici, na primjer, iz visine praporcije u uzorku odredene velicine tom" krivuljom distri-
mozemo na nomogramu odcitati 95%-tne ili 99%-tne granice pouzda- bucije rezultata, koJa je
nosti te proporcije (vidi slike: garnja slika 95%-tne granice, donja slika
IJIJ'Y,;-tnc gran icc); iii iz vcliCinc dvaju uzoraka i ukupnc proporcijc ncke
pojavc u ta dva uzorka mazemo nomogramom dobiti podatak kolika je
razlika u proporciji potrebna da bi bila statisticki znacajna na razini 5%
Obje tendencije
iii 1% itd. p
mogu se holje razum-
jeti uz pomoc razliCitih
normalitet distribucije Ovim se izrazom oznacava i proces i rezultat primjera. Jedanje ovaj:
provjere odstupa li neka konkretno dobivena > distribucija statisticki ako mnogo puta mjeri-
znacajno od normalne distribucije. Provjera se, u nacelu, provodi taka "-····· .. -··-·
- mo neku pojavu kojaje
·3• ·2• -h X +ls +2s +3s
da sc usporcdc ili (a) stvarno dabivene frekvcncije koje cine dobivenu "takva kakva jest" (sto
L' idealnoj "normalnoj distribuciji" oko 68% rezultata predstavlja tendenciju
distribuciju s frekvencijama koje bi bile u skladu s riormalnom distribu-
nalazi se u intervalu izmedu ·1 i + 1 standardne devija· postizanjajednakog re-
cijom, a koje se lako odrede na temelju tablica standardizirane norma- cije; preko 95% rezultata obuhvaceno je intervalom od zultata ), pri mjerenju
Inc distribucijc, ili (b) usporedbom odabranih povrsina normalne dis- -2 do +2 standardne devijacije, a preko 99,7% rezultata
radimo (nesvjesno i ne-
tribucije i stVarno dobivene distribucije; povrsine standardizirane nor- intervalom od ·3 do +3 standardne devijacije.
hotice) manje ili vece
maine distribucije takoder je moguce odrediti s pomocu tablica nor- pogreske, pa se zato re-
maine distrihucije (vidi tablicu u Dodatku A). K zultati pojedinacnih mjerenja manje ili vise razlikuju (a to predstavlja
tendenciju razlikovanja rezultata ). _Nesistematski varijabilni faktori po
normalizacija distribucije Takva > transforrnacija rezultata (abjasnje- · skrecu ili ereni rezultat cas na a cas na drugu
nje pod tackom c) kojom se postize da distribucija rezultata koja odstu- seta , i stoga
pa od normalne postane normalna ili priblizno normalria. K
-
i n~jvise rezultata koji adgovaraju pravoj vrijednosti mjerene pojavc,
koja adgovara kanstantnim faktorima (za avu lagiku nastanka nor-
-maine distribucije do6ar je piiinjer > altonova "daska s cavliCima").
normalna distribucija Opce je iskustvo gotovo svih nas da kod opazanj a
Za neke druge situacije u kojima je nesta teze zamisliti neku silu kaja
i mjerenja razliCitih predmeta, pojava, procesa i osoba nalazimo najvise
tendira tome da rezultati budu jednaki, balji su primjeri nastanka nor-
"srcdnjih", "prosjecnih" rezultata, a sve manjc onih koji od tog "prosje- maine distribucije s bacanjem novCica i djelovanja "cis tog" slucaja na re-
ka" sve vise odstupaju. qo te pojave dolazi zbog razlicitih razloga, koji se zultat.e. U strogom smislu kad bacanja novcica se zapravo radi o jednoj
svi daju syesti.nadvije "sile" ko'e dj~_luju n3: rezultate: jedna_je sila ona drugaj distribuciji, tj. o > binomnoj distribuciji, ali kad je N vrlo velik, ta
-koja utjece na_to darezultati mjerenja budu uvijekjednaki (a uvjetovana distribucija gotavo potpuno odgovara normalnoj distribuciji. Slicno
je > konstantnim.J_aktorima, tj. anima koji su uvijekjednaki, a to Je ve- nam i > stablo vjerojatnosti zorna maze pakazati postanak narmalne dis-
- liCina pojavc iii prc~mct~jcrenja ili opaza9j,!!)z ~ druga.~ila utjccc na tribucije.
razlikovanje rezultata (i uvjetavana je razliCitim > nesiste~atskim vari-- rNarmalna j~ dis!ti~u~ij~ po_!P~IJ,? ,de~~n!~.~~.~~~•.dv~_p_!E~~~}E~: >
jabilnim faktJ rima . Te dvije tenpencije rezulti!aju tipi ~,nom "zvonas- ~ritn:z~!-~.~'2.!J1:..~£I.tf:i..'!22!.. i..?:..~!9JJ.if-!1!.4r.~t?...'!!.~~yfi£!.cji.e.'!};. Drugim rij e Cim a,
111m;m1'1::' '!
~ --- ~-~ ~--

- - -

'

124 NORMALNA DISTRIBUCIJA NORMALNA DISTRIBUCIJA 125


ako su nam te dvije vrijednosti poznate, mozemo tocno nacrtati krivulju smjeruQer npr. vrijednosti ne mogu biti manjend imle), takoder nece
normalne distribucije jer sve krivulje normalne distribucije imaju jed- dati normalnu raspodjelu: ako npr. registriramo zakasnjenja vlakova,
nake karakteristike, kao npr. to da se mjesto na kojemu se krivulja iz ona ne mogu biti manja od nula minuta, ali mogu biti vrlovelika, s domi-
konkavne pretvara u konveksnu ("tocka infleksije") nalazi u svim krivu- nantnom vrijednoscu koja je na lijevoj strani distribucije ).
ljama tocno iznad. (2) Moramo imati velik broj mjerenja.
Ako aritmetickoj sredini dodamo lijevo i desno po jednu stan- (3) Sva mjerenja treba provesti jednakom metodom i u jednakim
dardnu devijaciju, obuhvatili smo povrsinu koja cini oko 68% cijele vanjskim uvjetima.
povrsinc krivulje, daklc oko 68% svih rczultata (vidi sliku). S dvijc stan- (4) Skupina koju mjerimo mora biti hetcrogena (neselekcioni-
dardne devijacije lijevo i desno od aritmeticke sredine obuhvacamo oko rana) po svojstvu koje mjerimo (npr. ako mjerimo visinu mladica, ne
95% svih rezultata, a s tri standardne devijacije lijevo i desno od arit- smijemo je mjeriti samo na kosarkasima ), ali ujedno mora biti homoge-
meticke srcdine obuhvatili smo gotovo svc rezultate, tj. oko 99,7% rc- na po svim ostalim svojstvima koja mogu djelovati na ono sto mjerimo
zultata. oslovno sve rezultate ne mozemo · · niti (npr. ako mjerimo tjelesnu snagu, mjerena skupina ne smije se sastojati
standardm eke sredine, jer norma ina distribuci ·a od muskaraca i zena ). .
je a se asimptoticki riblizava apscisi, pa je teoretski tek u Mnogo je autora proucavalo i definiralo normalnu distribuciju. Ci-
-
ni se dasu (ne znajucijedanza drugoga) prvi hili De Moivre (1667-1754)
u Engleskoj i Bernoulli (1654-1705) u Svicarskoj, a gotovo jedno stoljece
kasnije Laplace (1794-1827) i Gauss (1777-1858), nezavisno jedan od
~ vrlo bliska nuli . drugoga, definirali su tu distribuciju i izrazili je formulom. Belgijanac
Postoji, dakako, neizmjerno~~~n~o~r!!m!!a~Jn2.i~h~~~~~~~;~·~ Quetelet (1796-1874) prvi je upozorio na njezinu siroku primjenu.
bilo- BuduCi da se u pocetku smatralo da je normalnu krivulju matematicki
--·- . .
~ nJima -~ _o svo'im standardnim devi'aci·~Il1!:1.: nek.~. S\l.Sil:Q-
'ke (> plat! Urlltnost), a neke USke-(> l~ptokurtfcnost), sto oyisi 0 tome
l definirao jedino Gauss, ona je danas poznata i pod nazivom Gaussova
krjvulja (nekije nazivaju i "zvonastom krivuljom", sto nije posve tocno,
-s to mjerimo; neka svojstv:;t varira·u man·e a neka vise, pa tako npr. jeri > t-distribucija ima zvonasti i simetricni oblik, ali to nije normalna
te2ina odraslih ljudi varira vise a visina varira man·e dok co e ova 1Jy· distribucija sve dok broj stupnjeva slobode ne dosegne vrlo velik broj
esna temperatura s ada medu svoj§tva koja u normall!Llllgrilikama ek- (oko 1000).
stremno malo variraju (> koeficijent varijabilnosti). V ariranje rezultata . ' Normalna .. · temelj za razumijevanje vjero-
ovisit ce o broju nesistematski varijabilnih faktora koji na mjereno svo- ~
-
js o i 1 na 2roces mjerenja mogu djelovati: sto ihje vise, bit ce veCi vari-
-
.a normalne tli
. 100%), _I~a prema tom£_ neki re~ltat koji se na!azi bil~ ,gdje unu~ar no-
a I It t. ~

rmalne distrfuuci~.._predst_avljaJ.Q.Cku od koje lako mozemo izraeunati


Da bi se pri nekom mjerenju dobila normalna distribucija, moraju Clo<4 C!nu.p.ovrsine_krivulje do bilo kojegjjrugog dijela krOO!}j ~ ako jere-
biti ispunjeni neki uvjeti: zultat tocno na + 1s, to znacida postoji oko 16% rezultata koji su bolji od
(1) Ono sto mjerimo, mora se i u prirodi distribuirati po normalnoj njega, iii oko 34% rezultata do aritmeticke sredine, iii oko 84% rezultata
distribuciji. Neke se pojave, naime, ne distribuiraju po normalnoj dis- koji su slabiji od njega, itd. ( > z-vrijednosti)._Uz pomoc t~~lice normalne
tribuciji: promjer ljudskog srca daje, primjerice, bimodalnu distribuciju; distribucije mozemo odcitati sve mo~ce · ;·7Tr
bilirubin u krvi daje asimetricnu raspodjelu. Osim toga, sve pojave koje · ~og rezult; ta i bilo kojeg_2_rugog reZ\.lltata uJQj..distribuciji i na taj nacin
variraju, ali im je omoguceno neograniceno variranje samo u jednom domati i za vjero ·atnost poj._a_yljivanja.hiluJro.j.eg.taspona .rezultata,

, I
126 NORMALNA DISTRIBUCIJA '
' NVL-IDPO'IEZA 127
I
U izravnoj vczi s time, normalna distribucija prcdstavlja i osnovicu I da prihvacanje nul-hipoteze ne znaci da je posve sigurno da npr. neka
I
za razumijevanje nekih bitnih pojmova > inferencijalne statistike, a u I' razlika ne postoji, vee to znaci dane mozemo tvrditi da razlika postoji jer
I
prvom redu pojma "standardne pogreske". Formulirano malo dru- razlik:u nismo uspjeli potvrditi. Takoder valja reCi da odbacivanje nul-
l
gaCijc, mogli bismo kazati ovako: osoba koja ne razumije logik:u i zakone ''
hipoteze nikako ne znaci da je zbog toga automatski prihvacena >alter-
normalne distribucijc nc mofc razumjeti niti statistiku (a potpuno "me-
nativna hipoteza. Na primjer, kada u nekom eksperimentu iz ekstrasen-
hanicka" primjena statistickih pravila maze cesto zavrsiti besmislenim
zorne percepcije ustanovimo da ispitanik pogada poledine karata sta-
rezultatom!). P
tisticki znacajno vise nego sto bi to mogao po slucaju, tada odbacujemo
nul-hipotczu kojajc mogla glasiti "nema ekstrascnzorne pcrccpcije", ali
normiranje > baidarenje
t~ dakako ne znaci da prihvacamo alternativnu ili direktivnu hipotezu,
'
tj. da ekstrasenzorna percepcija postoji Qer je dobra pogadanje "medi-
nul-hipoteza Najcesce se koristi pri testiranju statisticke znacajnosti ra-
' ja" moglo imati i razliCite druge uzroke). Novalja primijetiti darecenica
zlike medu aritmetickim sredinama, meQ.u koeficijentima korelacije itd.
.(> statisticki znacajno), a g!asi, na .pr.imjcr: cm.p.i.t:~js.ki-cl.OOw~-a:tli*a=
"nema ekstrasenzorne percepcije" ne bi hila dobra formulirana nul-
hipoteza, jer bi ona zapravo morala glasiti ''nema razlike izmedu do-
medu aritmetickim sredinamaje slucajna,jer medu aritmetickim sredi-
bivenih rezultata i rezultata koje ocekujemo po slucaju". P
- nama obiju populacija nema razlike; iii: dobivena korelacija je slucajna, .

jer u populaciji korelacija izmedu tih varijabli ne postoji. Logika nul-
J tipots-ce e-sniva sc na > normalnoj distribuciji: aka izmcdu dvij.~popula ~
>'-..!'. razlike u aritme · · ·
velik hroj uzoraka_iz ob'e opulacije i registrirajuci dobiyene xazlike
m1:du aritmetickim srcdinama uzoraka, dobili normalnu distrihuciju ra-.
-;lika kojima je aritmeticka ~redina 0 (nula) 1 a st~ndardna geyjj,acija
__yrij.GeMs-t-kojtl-ffil.zivamo > standardnapogrdka razlik: izme~u ~viju ~tj-
tmetiC:kib sredina, j koj.ujako izr.acunam.o. Ako ncka nasa razhka 1znosJ 5,
A kn mcdu dvjcma pnpulacijarna nmw ra1.likc 11 aritmcti~kim srclli nanm, 117.astPpnim u;o:i -
· a njezina standardna pogrcska iznosi 1, onda jc ta razlika statis~icki
manjem uzoraka iz obje populacije dobili bismo (zbog djelovanja slu~aja) normal11u dis-
_znacajna,jer- pod pretpostavkom da medu nopulacijama mana razhk~ ~ tribuciju razlika mcdu aritmcti~kim srcdinama parova uzoraka. Ta bi normalna raspod-
slucajno dobivene razlike mogle bi se kretati.pQprilici od -3 do + 3 (v1d1 ' jela irnala aritmcticku sredinu 0 (nula) (jer su populacije identicne), a standardnu devija-
.lijcvu sliku). Naprutiv, ako standardna pogrcska tc ra~lik~ izm~si ~ (vic~i ciju te raspodjclc nazivamo "standardna pogre~ka ra1.likc medu aritmcti~kim srcdinama" .
1\ku ncka tlubivcna razlika izmedu dva uzurka iznosi 5, a standardna pogrc~ka te razlike
desnu sliku), onda nadena razlika od 5 posve dobra pnstaJe .u ~~~tnbuct-
iznosi 1, onda je iz lijeve slike jasno da je prakticki nemoguce dobiti razliku vecu od 5, ako
ju razlika kojima je aritmeticka sredina nula- pa stoga z~klJUCUJe~~ da medu populacijama zapravo nema razlike. Dakle, razliku smatramo "statisticki znacaj-
I
razlika nije statisticki znacajna, nego je vjerojatno dobJVena slucaJn?: '
nom". Naprotiv, razlika velicine 5 mogla bi se Iako i slucajno dogoditi, ako bi njezina stan-
Nije nuzno da nul-hipoteza glasi "nema razlike':, jer ona. moze gl~stt~ dardna pogreska iznosila 4 (desnaslika), pastoga takvUrazlikunebismomoglismatrati
' statisticki znacajnom.
npr. i: "razlika u populaciji nije veca od 10", pa se 1stom logtkom te~ttra I
ova hipoteza: ustanovljuje se koliko nadena razlika odstup~ od antm~~
ti cke sredine razlika, kojima je aritmeticka sredina 10. ValJa upozontJ

1
• •

~ .

• • ·- ..

'
OMJERNA SKALA 129
l
iznosi 1/4 = 0,25, onda sansa da necemo izvuCi tu kartu iznosi 3/4 = 0,75.
Prema tome, odnos sansi iznosi 0,25/0,75 = 0,3333.
Aka u razlicitim popularnim prikazima nademo npr. podatak da
vjerojatnost neke covjekove karakteristike iznosi 1 prema 7 (dakle od
ukupno 8ljudi, u prosjcku eemo kod jednog naCi to svojstvo, a kod 7 ga
necemo naCi), to znaci daje vjerojatnost takvog nalaza zapravo 1/8 (na 8
Ijudi kod jednog eemo naCi tu karakteristiku). Do odredene konfuzije
maze doCi u razumijevanju stoga sto racun 117 iznosi 0,143, a prava
vjerojatnost da cemo medu 8 Ijudi naCi jednoga s tom karakteristikom
iznosi 1/8 = 0,125.
"Odnos sansi" je izraz za koji u hrvatskom nemamo za sada pravu
rijec iii sintagmu. Bitno je to da taj izraz ujedno oznacuje i neku mjeru
• povezanosti: ali za razliku od ostalih mjera povezanosti (ili korelacije),
oceklvane (teoretske) frekvenclje Frckvencijc kojc u pojedinim katego- odnos sansi u visini 1,0 znaci da nema povczanosti medu varijablama
rijama oeekujemo pod nekom odredenom hipotezom. Na primjer, ako (0,5 je vjerojatnost daCe se nesto dogoditi, a takod~r 0,5 je vj~~ojatno.s~
ispitujemo frekvencije pojedinih ocjena na diplomskom ispitu stude- da se to nece dogoditi). Velicina veze mjeri se razhkom (pozltlvnom 1h
nata i studentica, pa nas zanima razlikuju li se te dvije skupine po dis- • negativnom, vee prema tome u kojem smjeru gledamo podatke) pre rna
tribuciji ocjena, > nu/-hipoteza ce glasiti da nema razlike mcdu njima, i vrijednosti 1,0: O<.lnos sansi is pod 1,0 upucuje na negativnu povezanoBt, a
pa da ee dakle proporcija svake ocjene biti jednaka kod djcvojaka i mla- I iznad l,O na izravnu, tj. pozitivnu povezanost. Ako bismo npr. nasli (iz-
dica. Oeekivane frekvencije najpoznatije su u primjeni > hi-kvadrat misljeni primjer) medu 100 muskaraca da su njih 5 manje ili vise slijcpi
za boje, a medu 100 zena samo jednu, onda odnos izmedu sansi iznosi
testa, kod kojeg se one uvijek moraju izracunavati, i usporedivati s >
5/95:1/99 = 0,053:0,001 = 53, sto ukazuje na jaku povezanost izmedu
opazenim frekvencijama. Izracunavanje ocekivanih frekvencija nije
spola i sljepoce za boje: kod zena sljepoca za boje vrlo je rijetka, a kod
uvijek potpuno jednostavno, i ne moze se provoditi potpuno automat-
muskaraca ona iznosi nekoliko postotaka. P
ski, vee treba savjesno voditi racuna o tome kakve frekvencije odgova-
raju postavljenoj hipotezi. P
ogranicena populacija > populacija

odds ratio > odnos "sansi" I t;~fu.i;@~Jllla~~"Ratio" skala) Najbolja skala mjerenja: ne samo da
posjeduje - kao i > intervalna skala-E.~~is.tantn~ jeP,inice, tj. dana bilo
odnos "sansi" (odds ratio) U nas rjede koristen izraz, ali u razlicitim kojem dijelu skale jednaki intervali odgovaraju i jednakim fizikalnim
statistick,;m tekstovima na engleskom jeziku crsto nailazimo na izraz razlikama, vee ..ta skala posjeduje apsolutnu nultu vrijednost. To znaci da
,.- ......... . .. " ... . ...
'~ ·-·-· _,
"odds ratio" ili skraceno "odds", stoga je uputno upozoriti na razliku " '

se jedino u tim skalama moze kazati da je nesto npr. "tri puta veee" od
izmedu pojma "odnos sansi" i "vjerojatnost" (iii "sansa") Odnos "sansi" necega drugoga: stol duzine 150 em tri je puta duzi od stola dliZine 50 em
je odnos izmedu "sanse" dace se nesto dogoditi i sanse da se to nece do- (pa makar to mjerimo bilo kojim duzinskimjedinicama), kamen od 300
goditi. Na primjcr, ako sansa za izvlacenje karte "as srce" izmedu 4 asa kg trije puta tezi od kamcna teskog 100 kg (u bilo kojim tdinskimjcdini-
\.


I
'
OMJERNASKALA~~----------------
ORDINALNA SKALA 131
130 I . .
earn a), vrijeme od 45 minuta tri je puta duze od 15 min uta. To je zaista Zbog toga, naravno, nije opravdano (iako se to eesto cini!) iz-
I

tako jer 0 (nula) em, 0 kg i 0 vremena znaCi da je duzina "nikakva", da



racunavati prosjek (aritmeticku sredinu) onih skala koje su zapravo
skale rang ova (a ne > intervalne skale). Najpoznatiji primjer takvog (ne-
nesto nema tezine ili da se nesto dogodilo prakticki u "nul a" vremena.
dopustenog) postupka je izracunavanje "prosjecne ocjene" iz nekoliko
Izraz "apsolutna nuia" u omjernim skalama valja razlikovati od
skolskih predmeta, a koja "prosjecna ocjena" cesto predstavlja glavni
pozna tog iriaza "apsoiut_11enule" u s~ali temperature (kojaje intervalna
kriterij prilikom prijama kandidata u neke skole i1i fakultete. Skolske
skala), jer minus 273,16 stupnjeva c je arbitrarno dogovorena nul a, ~j. t~
'
'
I

jc temperatura kod koje prestaje kretanje atoma, a ne takva nul a koja b1


ocjene (makar se navodno radio "pravilnom slijedu ocjena") zapravo su
znaCi ia c.Ja jc m:sto potpuno "bez temperature" - sto cak nijc niti zami- skale rangova, iz cega proizlazi da stvarne razlike izmedu susjednih
ocjena nisu jednake. Dokaz je vrlo jednostavan: stvarna razlika izmedu
slivo.
Dakako da su svi statisticki postupci dopusteni s podacima koji su ocjen~ 1 (nedovoljno) i 2 (dovoljno)je golema: socjenom 1 sene prolazi,

prikazani u omjernim skalama, a >.;.,koeficijentvari{abilnosti tetykod om- as OCJenom 2 se prolazi na ispitu. Unutar kategorije "prolazi se" ocjene
jt:rnih Hlutla ima svojt: potpuno Iog1cko op~avdanJe. P >
2, 3, 4 i 5 samo ukazuju na razlike u prolaznom znanju, tj. od "jedva" pa
sve do "izvrsno''. Iz toga proizlazi da su stvarne i smislcne razlike izmedu
opazene frekvencijc Frekvencije stvarno dobivene pri opafanju (broje-
>
susjednih ocjena iznad ocjene 2 znatno manje od r.azlike izmedu 1 i 2.
nju) pripac.Jnih dcmcnata (statistickih jcdinica) odrcdenim, unaprijed >
Vee prema kriteriju pojedinih nastavnika, za neke nastavnike postoji
ddiniranim, kategorijama ili kvantitativnim klasama. Ako, na primjcr, veca razlika izmcdu ocjcne 3 i 4 nego izmedu 4 i 5, iii jc pak obrnuto.
priiikom ispitivanja misljenja ginekologa o tome treba li ili ne treba zeni Uz ordinainc jc skale dopustena, d~k:ako, primjena svih stati-
pri porodu dati ancstt:ziju, ud 100 Iijccnika njih 50 misli c.Ja trcha, 35 da stickih postupaka koje primjenjujemo uz > nominalnu skalu, a uz to i
. izracunavanje ccntraine vrijcdnosti, kocficijcnata rangkorelacijc kao i
nc treba, a 15 nema o tome definitivno misljenje, onda su 50, 35 i 15
drugi neparametrijski postupci.
opazene frekvencije u kategorijama "da" ,"ne" i "ne znam". Njih u >hi-
No, ipak valja reci da u nekim slucajevima ima opravdanja za iz-
kvadrat testu usporedujcmo s > ocekivanim frekvencijama, tj. onima .., • 0 ....

racunavanJC prosjecnog ranga. To su naimc one situacije u kojima je


koje bi se ocekivalc pod odredenom hipotezom, ate hipoteze mogu biti
~eki element rangiran od nekoliko ocjenitelja (npr. isti sportas rangiran
razlicitc, pa prcma tome razlicite sui ocekivane frekvencije. p
Je od nekoliko sudaca). Ispitivanja takvih "prosjecnih rangova" poka-
zuju da su tako dobiveni prosjccni rangovi obicno ndito biizi "pravoj"
ordinalna skala Tom skalom oznacujemo redoslijcd, oc.Jnosno rang cle- situaciji jer vece razlike u prosjecnom rangu ukazuju i na stvarno vece
menata koje opazamo ili mj(!~imo: to su npr. kUcni brojevi neke ulice, re- razlike medu realnim objektima. Drugim rijecima, takve skale "pro-
doslijed trka6a ~~ cilj~, rang-lista svjetskih tenisaca itd. Te nam skale po- sjecnih rangova" po svojoj se vrijednosti nalaze negdje po sredini iz-
kazuju jc li ndto prijc iii posiijt:, je Ii nesto vece iii manje od neceg medu ordinalne i intervaine skaie.
drugog, a samo katkada (ito samo donekle) je li ta razlika veca ili manja. N a kraju, vise formalno recimo ovako: specificnost ordinalne skale
Rangovi se naime pravilno redaju od 1 pa nadalje, ~.!.~-~~-~~!:'!~. ~~zlike iz- jest odredivanje "vece od" ili "manje od" unutar neke klase pojava iii ob-
medu pojec.Jinih elemenata su nam nepoznatc: na primjer, u sportskim jekata. To odredivanje maze biti na temelju kvantitativnih razlika ili
iiat]ecanjima trkac koji prvi stigne na cilj maratonske utrke, dobiva rang promjena unutar neke kvalitativno dcfinirane klase iii na temelju cesti-
1, drugi trkac, koji je mozda nekoliko me tara iza njega, dobiva rang 2, a ne (frekvencije) kojom se nesto pojavljuje. Maze se reCi daje operacija
treCi trkac stize mo:lda 200 metara iza drugoga i dobiva rang 3.JRazlikc redanja koja se ovdje primjenjuje, klasifikacija u kvantitativne katego-
I rije. Kod redanja po veiiCini moguca je potpuna diskriminacija i tada
medu rangovima su dakle jednake (1,2,3, ... ), ali stvarne razlike nisu.
- -.
'"~-. --- . -
- -·


132 ORDINALNA SKALA '

svaka kategorija (klasa) ima samo jedan clan. Sasvim formatno pravila II
I ove skate mogu se formulirati ovako:

' •

ako a > b tada b > a; ako a > b, a b > c, tada


'
a>c

Kako se vidi ovdje je,za razliku od nominalne skate, relacija medu cla-
novima skate asimetricna. )

Na ovoj ljestvici moguce su sve transformacije (tj. skala ostaje inva- •

rijantna) kojc nc mijenjaju poredak, jer velicina razlike izmedu susjed-


nih vrijednosti se zanemaruje. To znaci da su moguee sve monotone
transformacije (sve operacije s konstantom) kao i netinearne transfo-
rmacije (kvadriranje, logaritmiranje i sl.). P,K

osjetljivost mjerenja U statistici znaci razlikovanje predmeta mjerenja P (iii p) U statistici znaci: (a)vjcrojatnost (od lat.probabilitas). Najcdcc
na temelju rezultata dobivenih mjerenjem neke osobine (pojave, feno- ., se u statistickim postupcima "Vida kod testiranja razlike izmedu stati-
mena) na razlicitim individuumima. Sto mjerni instrument bolje razli- stickih vrijednosti (> t-odnos, analiza varijance), gdje oznacuje razinu
kujc razlicitc ispitanike, za koje se pretpostavlja da se stvarno razlikuju u rizika (> razina znacajnosti) koju netko zeli prihvatiti kao npr. P< 0,05;
pogledu razvijenosti osobine kojaje predmet mjerenja, to je on osjetlji- J
(b) moze znaCiti i proporciju u kojoj se neko svojstvo pojavljuje: npr.
viji, a ta ee se njegova znacajka ocitovati u rasprsenju dobivenih rezulta- p = 0,3, znaCi 30%; (c) u statistickim tablicama obicno znaci povrsinu
'
ta (> rasprsenje rezultata). K \ neke krivulje iii dio njezine povrsine, jer se ustvari takoder radi o vjero-
'•'
I
jatnosti rezultata. Npr. u tablici normalne raspodjelePpokazuje povrsi-
osnovni ~kup > populacija I' nu krivulje od aritmeticke sredine do tog rezultata, iii povrsinu od tog re-

I zultata pa do blizeg kraja krivulje: uzz-vrijednost 1 (sto znaci da je neki
''
I
J rezultat tacna na + 1 standardne devijacije) citamo dap iznosi 0,3410 ili
I 0,1587 (vee prema tome koji dio krivulje tablica pokazuje: oba broja za-
'
''
• jedno daju zbroj 0,5, dakle 50%). A taj broj ujedno pokazuje i vjerojat-
nost dace neki slucajno izvadeni rezultat iz populacije pasti izmedu arit-
meticke sredine i te z-vrijednosti (iii te vrijednosti i kraja krivulje ). P

p Ima isto znaccnje kao i > P, ali se vise upotrebljava kod oznacavanja
'' proporcija u dihotomnih (iii dihotomiziranih) varijabli: p = proporcija
' u kojoj se neko svojstvo pojavilo, a q = proporcija u kojoj se to svojstvo
'

nije pojavilo pa iz toga slijedi da je p + q uvijek = 1. Sa p se oznacava i
• vjerojatnost (ili razina rizika) pri jednosmjernom testiranju razlika

medu statistickim vrijednostima (> dvosmjemo i jednosmjemo testi-
ranje). P

••


' ' I I I ' ,
'
. _ , _
-- -- - -
- -~-~
. .. . -~ -- - ... -- -

' .
134 PAPIR (NORMALNE) VJEROJA'INOSTI PARCIJALNA KORELACIJA 135

papir (normalne) vjerojatnosti Papir, po izgledu slican milimetarskom statistika sluzi se > parametrijskim testovima i iz dobivenih vrijednosti iz-
papiru, kojemu je apscisa linearna skala na kojoj se bilje:le rezultati vode se zakljucci o > parametrima populacije. P,K
""
I
mj ercnja u ckvidistantnim jedinicama, ana ordinati se biljeze relativne
~af~!D~'irlj;~r~I;'f~"Statisticki postupci koji se upotrebljavaju kada
kumulativne frekvencije, ali je ordinata tako podesena (suzena u sredi-
podaci koji se obraduju udovoljavajn odredenim uyjetima, naiQesce
ni, a prosirena prema krajevima) da relativne kumulativne frekvencije
tomu da im kao ida su
normalne distribucije daju pravac. Stoga razliCita odstupanja od pravca
na papiru vjerojatnosti ukazuju na razliCite vrste odstupanja distribucije
od normalne distribucije (npr. asimetricna distribucija, bimodalna dis- ,.. . ~

(npr. standardne
tribucija itd.) (vidi sliku). P p
..... -----·+
:~ +·------~ / --- T ~:----:~ parcijalna korelacija Katkada mozeino izmedu dvije varijable dobiti
eo
70+-
t==)l:====:;t/-'~==~~~==~j~'---
.L-
visoku korelaciju zato sto ina jednu ina drugu varijablu istodobno na isti
~~~-----f~---~t-~~~- nacin djeluje neka treca varijabla. Medu starijim statisticarima bila jc
~ H----~f/+--:;/.-{-_/' @ asimclr ija udcsn o poznata sala da je glavni dokaz tvrdnji da "rode donose djecu" to sto
:lO W----1-/+/~/?L----@ 1u;inw tri ja uli jevo postoji relativno vclika korclacija izmcdu broja roda i broja novorodene
20 W----([-1)-/--/-tf/,l./-._/11------ © koni~nnst
djece u selima velikog broja zemalja (u kojima :live rode). No, tu poveza-
10 '----)-
/ / @ :l (ll j o ~ I C IIO~I
6 / / :. /._., -- - - -- - - - ---- - --- · ® bim odal nost nost (ipak) je uzrokovao "treCi faktor", a to je vclicina naselja: stu je nc-
ko naselje vcce, to ima vise kuca s dimnjacima, pa stoga i vise roda, a uje-
Na "papiru vjerojatnosti" jedino idealna normalna distribucija dala bi pr~:ac dno - zbog veceg broja stanovnika- i vise rodene djece. Ili, kad bismo u
(vidi dcSnU sJikU UZ pojam krivu/ja kumu/atiVIlih frekvencija), dok CC raz!JcltC • jednoj osnovnoj skoli izmjerili duzinu stopala sve skolskc djecc i ujcdno
drugacijc distribucije dati krivulje razlicitih (nelinearnih) oblika. procijenili sposobnost pisanja svakog djeteta, takoder bismo dobili viso-
ku korelaciju, jer sto su djeca starija, to imaju vcce stopalo, a ujedno i sve
para~e~~ fJ statistici oznac · · eku bro'canu vrijedn?~t (n~r. ~it~~­ bolje pisu; a ocito je vrlo mala vjerojatnost da postoji ikakva korelacija
hc sredinu ili standardnu devijaciju),! oja karakterlZ!ra d1stnbuc1JU izmedu duzine stopala i vjestine pisanja. U svim takvim slucajevima
·· se vrijednost obicno oznacuje grckim slovima, dok se ko- treba iskljuciti djelovanje tog treceg faktora (ili vise njih, ako ih ima), tj .
.pg-ndentnc vrijednosti uzorka nazivaju "statistici"( nom. jed.: > sta- dr:h ti ga konstantnim. Tada se stvarna korelacija izmedu dvije varijable
tistik), i oznacuju se latinskim slovima. P (izmcdu kojih nas korelacija zanima) moze izracunati uz pomoc for-
mule za parcijalnu korelaciju- koja se u slucaju kada postoji samo jed an
parametrijska statistika Onaj dio statistike koji ustanovljuje "Cinj~­ "treCi faktor" naziva parcija/na kore/acija prvog reda - glasi ovako:
nicno stanje", tj. izracunava glavne karakteristikc nekog. uzorka (ant~ )

,.- meticku sredinu, standardnu devijaciju itd.) ili stupanJ povezanostl 't3r
'12 -
23
' r = --;:::;===~~==~
medu varijablama mjerenih na uzorku (korelaciju). Glavn~ zadaca p~­ 12. 3 ~(1-rn2)(1-r2/)
'
rametrijske statistikc jest procjcna populacijskih vrijednostJ na temelJU
gdje je r 12_3 , korelacija izmedu varijable 1 i 2 kad se iskljuCi utjecaj ( od-
rezultata dohivenih na uzorku. Pri tome se polazi od pretpostavke ~-no­
nosno korelacija) trece varijable na jednu i drugu varijablu. Sa r12 itd.
rmalnoj distribuciji u populaciji iz koje se uzorci uzimaju. Parametnjska


. - .

'

136 PARCIJALNA KORELACIJA PEARSONOV KOEFICIJENT KORELACIJE 137

oznaceni su koeficijenti korelacije izmedu pojedinih parova varijabli, a '


'
'' I I I
2 I 2 I
brojkom 3 oznacena je ta "treca varijabla" iii "treci faktor". Tako, re- I 3 3 I
' 3
cimo, neka koeficijent korelacije izmedu varijable "duzina stopala" '' 4 I 4 6 4 I
' 5 I 5 10 10 5 I
(varijabla 1) i varijable "vjestina pisanja" (varijabla 2) iznosi r12 = 0,36 i '' 6 I 6 15 20 15 6 I
7 I 7 21 35 35 21 7 I
neka korelacija ovih varijabli s dobi djece na kojoj su prikupljeni podaci 8 I 8 28 56 70 56 28 8 I
iznosi r13 = 0,38 i r23 = 0,49; parcijalna korelacija prvog reda iznosit ce I
• 9 I 9 36 84 126 126 84 36 9 I
10 I 10 45 120 210 252 210 120 45 10 I
rJ2.3 = 0,22, sto znaci da bi u ovom potpuno izmisljenom primjeru korela-
cija izmedu "duzine stopala" i "vjestine pisanja", kad bi se iskljucio utje- '
' Pascalov trokut je jednostavna metoda za izra~unavanje nekih distribucija, nejre~ce bi·
caj varijable "dob", iznosila r = 0,22. Parcijalna korelacija p1Vog reda bit nornne distribucije. Ako 2 nov~ica bacimo rnnogo puta, dobit cemo moguee ishode (pi-
ce to veea sto je veca korelacija izmedu varijable 1 i 2, a to manja izmedu smo-pismo, pismo-glava, glava-glava) u omjeru 1:2:1. Kod 10 nov~ica od ukupno 1024
bacanja teoretski idealni ishodi bi bili: jedanput 10 glava, 10 puta 9 glava- 1 pismo, 45
varijable 1 i 3 i varijable 2 i 3. Postoji parcijalna korelacija "drugog red a",
puta 8 gl. - 2 pis., itd. lshod 5 gl. - 5 pis. trebao bi se pojaviti naj~esce i to 252 puta.
"treceg red a" itd., ovisno o broju varijabli koje treba "iskljuciti", ali, da- •

kako, tada i racunski postupak postaje sve slozeniji. Mnogi statisticari koder, lakSe uocavanje i nekih pogresaka pri rezoniranju o vjerojatnosti
isticu da parcijalna korelacija pokazuje "sto bi bilo kad bi bilo", pa da za- nekih ishoda. Na primjer, na pitanje "Kolika je vjerojatnost da kod ba-
pravo nem.1 realno znacenje ako se mjerenjem ili opazanjem ne mogu canja 8 novciea dobijemo rezultat4 G- 4 P", velik ce broj Ijudi odgovoriti
dobiti podaci koji nisu pod utjecajem neke "treee" varijable. P,K ' da je vjerojatnost 50%. No uvidom u Pascalov trokut vidimo da je sansa

parcijalna srednja vrijednost Aritmeticka sredina rezultata u jednoj


za 4 G- 4 P doduse najveca, ali manja od 50%, tj. sansa iznosi 70/256 = .
27,3%. p
varijabli vezanih za odredenu vrijednost (koja se naziva > fiksna vrijed- ,.

nost) u drugoj varijabli. Parcijalna srednja vrijednost je jedna od koordi- '


'
Pearsonovkoeficijent za ovaj koeficijent korelacije u L.

nata za odredivanje > crte regresije (druga koordinata je fiksna vrijedno- anglo-americkoj literaturi obicno e product-moment correlation; i u nas
st) (> kor:dacija, > crta regresije, > regresijska analiza). K se katkada rabi termin koeficijent korelacije umnoiaka i1i samo koefi- ·- or

Pascalov trokut J ednostavna metoda (bez upotrebe form uta) za iz- cijent umnoiaka) Odreduje se na temelju umnoza~~. p;u:ova!ezultata u ~ .. ,..,, .-- ...,........,.:,~~-..\ . ... • t _,
L

racunavanje > binomne distribucije i nekih drugih racuna. Sastoji se od varijablama •W•izmedu kojih se racuna korelaciJa~ Koeficijenf korelacije r
<::J~i::t' :1,.; ,,flo,l<j.IJ"'ocl.:'~<-i7~ •·,,
• ·-\ ' ,,· , ....-,~, ·~- ~

citanja ubiljezenih brojevajednog "trokuta", sto ga Cine redovi brojeva opravdano je racunati samo (1) ako su rezultati u obje varijable prave
koji u vrhu poCinju brojem 1, a svaki daljnji red nastaje zbrajanjem lije- ,numericke vrijednostj, tj. ako su barem na > intervalnoj skali; (2) ako je
vog i desnog broja u redu iznad njega, te poprima oblik, prikazan na slici. broj rezultata veci od 30 (N > 30) ~(3) ako su distribucije u varijablama
Taj sistem bio je poznat vee u 14. stoljeeu u Kini, ali je dobio ime po ' simetricne (jer asimetricnost distribucije utjece na oblik povezanosti
matematicaru Pascalu, koji je nasao mnoge njegove korisne primjene. - medu varijablama; > lineama zavisnost; > zakrivljena korelacija); i (4) r-"-'

Primjer za primjenu: Ako npr. bacamo 8 komada novciea 256 puta, onda ako je povezanost~edu varijablama ravnocrtna (linearna). J esu li zado-
I
teoretske frekvencije "glave" (G) i "pisma" (P) mozemo citati iz osmog voljena prva dva zahtjcva, nijc tt:Sko utvrditi; provjcra druga dva zahtjc-
reda: 1 putaO G- 8 P, 8 puta 1 G-7P, 28 puta2 G- 6 P, 56 puta3 G- 5 P, va cini se kontrolom oblika > distribucije rezultata u svakoj od varijabli
70 puta 4 G- 4 P, 50 puta 5 G- 3 P, 28 puta 6 G- 2 P, 8 puta 7 G -1 P, i 1 ' .. te kontrolom oblika > crte regresije. Postoji jos i zahtjev o > homosce-
puta 8 G- 0 P. Pomocu Pascalova trokuta mozemo izracunati i razlicite dascitetu, ali ga je prakticki tesko kontrolirati, pa se obicno i ne kontro-
'
druge probleme racuna vjerojatnosti. Pascalov trokut omogucuje, ta- lira vee se samo pretpostavlja da nije u znatnijoj mjeri narusen .

.,
'

PEARSONOV KOEFICIJENT KORELACIJE POGRESKA 139


138
Temeljna formulazar, koja pokazuje logiku njegovaracuna,jest: kurticne distribucije frekvencija. Stupanj platikurticnosti maze se izra-
.. ,
zttl s pomocu > momenta. P
I
podatak U statistici, svaka brojcana vrijednost koja se maze podvrgnuti
gdje je sazxizy izrazen svaki rezultat uX odnosno Yvarijabli s pomocu > statistickoj obradi. Podaci se dobivaju opazanjem i mjerenjem, pa stoga
z-vrijednosti, aN je broj rezultata. No, radna formula koja najcesce sluzi znace zapravo is to sto i > rezultat. Podatak je strukturirana vrijednost,
za racunanje r, izgleda ovako (to je zapravo "skraceni" naCin racunanja iako je izrazena jednim jedinstvenim brojem. Primjerice, podatak (re-
zultat) dobiven mjerenjem (ili opa2:anjem) sastoji se barem od tzv. >
r):
prave vrijednosti mjerenja i [pogreske] koja se vde uz dobivanje svakog
empirijskog podataka, a izvoriste pogreske moze biti sam proces mjere-
nja, postupak odabiranja uzorka, nesustavne promjene u ispitaniku i sl.

Simbolicki to se maze ovako izraziti: X = X' + P, gdje X oznacuje
gdje suX i Ybruto rezultati uXi Yvarijabli. Raclln zahtijeva odredivanje opazeni iii izmjereni rezultat (podatak),. X' pravu vrijednost mjerenja i
zbroja umnozaka korespondentnih bruto rezultata jedne i druge vari- P pogresku mjerenja.
jable, zbroja kvadriranih bruto rezultata u svakoj varijabli te kvadrira- Termin . "podatak" moze imati i siri smisao i znaciti cinjenicu
v

nag zbroja bruto rezultata u svakoj varijabli. Prema tome, sam racun se uopce, iii izvedenu statisticku vrijednost (taka se za aritmeticku sredinu
najjednostavnijc provodi standardiziranorn tablicorn s ovim stupcima: takoder maze reCi da je podatak). U svakom slucaju podatak uvijek ima
empirijsku podlogu. K
Ispitanici X y XY
0

•• •• •• • 0
0

• • • ••
0
• 0
· pogreska Pojam pogreske u statistici (osobito u inferencijalnoj statis-
tici) vrlo je vazan pa zato mnogi statisticari, napola u sali, kazu kako sta-
~,> Znacaj1lost koeficijenta korelacije r maze sc odrediti s pomocu -~ tistika zapravo i pociva na ~·pogresci". Opci koncept parametrijske sta-
t-testa Koeficijent korelacije r jedini se od svih koeficijenata korelactJe tistike polazi od pretpostavke postojanja tzv. > prave vrijednosti mjere-
moze upotrijebiti u daljnjoj, slozenijoj statistickoj elaboraciji (npr. > nja. Prava vrijednostje idealna vrijednost predmeta mjerenja koja pos-
multipla korelacija, > faktorska a1Jaliza) (> pogreJka koefi.cijenta korela- toji u populaciji (koncept jednako vrijedi za mjerenje jedne velicine na
cije). K razlicitim statistickim jedinicama kao i za ponovljena mjerenja jedne
velii:ine na jednoj statistickoj jedinici) i tu bi se vrijednost moglo dobiti
percentil > skala centila mjerenjem cijele populacije (aka je populacija konacna odnosno neiz-
rnjcrno velikim brojern rnjcrenja, ako se radio beskonacnoj populaciji),
platikurticnost (od grckc rijcci plate, sto znaCi. ra~an, _rl~sna~: sirok)
ali takoder uz uvjet da je moguce ostvariti idealno mjerenje (mjerenje
Vrst > kurticnosti, tj. karakteristika zvonaste krlVUlJe dtstnbuclJe frek-
koje ne trpi ni od kakvih pogresaka). BuduCi da je svako mjerenje ·
vencija, koja se ocituje u slabije izrazenom grupiranju rezultata oko sre-
podlozno utjecaju mnostva razlicitih cirnbenika (koji su medusobno
disnje vrijednosti, dakle u povecanorn varijabilitet_u ~azultata, pa stoga
nezavisni i koji djeluju po slucaju), to sui dobiveni rezultati izlozeni po-
I
krivulja izgleda "spljostena" i "siroka" u usporedbt s tdealnom normal-
gresci. No, povecavanjem broja mjerenja i racunanjem aritmeticke sre-
nom distribucijom, a pogotovo se razlikuje od "uske" i "vitke" > lepta-
,t
I '
140 POGRESKA POGRESKA TIPA 1 I TIPA 2 (ALFA I BETA POGRESKA) 141

dine iz dobivenih rezultata mozemo dobiti vrijednost koja je to bliza pra- · tocna, tj. stvarno nema razlike medu populacijama. Pogreska tipa 2
voj vrijednosti mjerenja sto je veCi broj mjerenja; tocnije receno, razlika (beta pogreska) je obrnuta: prihvacamo nul-hipotezu, koja stvarno nije
od prave vrijednosti mjerenja povecavanjem broja mjerenja smanjuje se istinita. Ta je situacija prikazana na tablici:
na razumno (iii prakticno) prihvatljivu vcliCinu. Pogreska kojoj je
izlozen svaki pojedini rezultat izra.Zava se njegovom razlikom od aritme- Stvarno stanje u populaciji
ticke sredine skupa rezultata kojemu i taj rezultat pripada. , I
~
Odluka Nema razlike ilcii"postoji
~

Cimbenici (faktori) koji djeluju na svako mjerenje (tj. svaki je re- ' • $1-
Odb~CUJ~mo
zultat dobiven pod njihovim utjecajem) imaju nekoliko izvorista: nesus- ~ Pogreska tipa 1 (alfa) Ispravno
tavne trcnutacnc fizioloskc i psihickc promjene u ispitaniku; nesustavne nul-hipotezu
.

varijacije u neposrednoj okolini mjerenja; sam postupak mjerenja (ni je- fPfifi'l~~-,
·- - ..
· .,. -;rer~- 1 -"1' ·'\'":· y Ispravno Pogreska tipa 2 (beta)
dan postt:pak mjerenja nije savrsen); nesustavni utjecaji sredstava mjer- 9
~""riUI~lir ote:Zu
... "· P.....
enja (instrumenata koji sluze pri mjerenju); nesustavne trenutacnc
promjene u mjeritelju i u njegovu ponasanju vezanom uz mjerenje.
Drugo izvoristc pogreske je proces ili operacija uzorkovanja, pa se Uz "strozi" kriterij testiranja znacajnosti razlike (npr. P< 0,01) izla:le-
zato pogreska nastala tim procesom naziva > pogreska uzorkovanja mo se riziku da cemo nepravedno odbaciti neku razliku koja zapravo
(engl. sampling error). Ovdje nas vise ne zanima gore spomenuta po- postoji (pogreska 2), a uz "blazi" kriterij odluke (P< 0,05) postoji izvjes-
greska mjerenja. Odabiranje uzorka iz populacije po slucaju izvrgnuto tan rizik da cemo prihvatiti neku razliku kao realnu (tj. odbacit cemo
je djelovanju slucaja na slueaj, pa zbog toga aritmcticka sredina svakog nul-hipotezu) a razlika zapravo ne postoji (pogreska 1). U svakodnev-
uzorka, iako je veca vjerojatnost dace biti jednaka, moze odstupati od nom zivotu nase su odluke zapravo izlozene pogrcskama ovog tipa: ako
prave vrijednosti mjerenja (tj. od populacijske vrijednosti). U ovom trazimo vrlo veliku sigurnost u odluci je li neki optuzenik kriv ili nije,
slucaju velicina pogreske moze se izraziti s pomocu > standardne po-
proglasit cemo mnoge krivce neduznima (pogreska 2), a ako nam je za
greske aritmeticke sredine. Jednako vrijedi i za druge statisticke vrijed-
odluku potrebno samo nekoliko dokaza, proglasit eemo mnoge ne-
nosti, a ne samo za aritmeticku sredinu (> standardna pogreska propor-
duzne krivima (pogreska 1). Nemoguce je izbjeci te pogreske: sto vise
cije, > pogrdka koeficijenta korelacije). Aka se radio neslucajnim po-
grdkama (tj. Cimbenicima koji ne djeluju po slucaju), onda se govori o nastojimo izbjeCi pogresku 1 (povecavajuCi razinu znacajnosti), to se vi-
pristranom uzorku ili pristranom uzorkovanju (> uzorak, > slucajni se izlazemo pogresci 2, i obrnuto. Odluku o prihvatljivoj razini znacajno-
uzorak). K sti valja donijeti u skladu sa situacijom: zelimo li biti gotovo potpuno si-
gurni da neki postupak ima ucinka (jer je on veoma skup, pane dolazi u
pogreska koeficijenta korelacije > standardna pogreska koeficijenta ko- obzir ako je neefikasan), treba uzeti strozi kriterij, tj. osigurati se razi-
relacije nom znacajnosti od 0,01 ili 0,001 (ili jos nizom!) da je postupak zaista
djelotvoran. Naprotiv, radi lise o nekom postupku koji nije ni komple-
pogreska mjerenja > standardna pogreska ksan niti skup, niti opasan, amogao bi imati spasonosan utjecaj na situa-
ciju (neka operacija novom tehnikom), odlucit cemo se za blazi kriterij
pogreska tipa 1 i tipa 2 (alfa i beta pogreska)i£ogreska tipa 1 ~alfa po- u
(0,05, pa cak i vise, dakle 0,10 ili 0,20). privatnom zivotu odlueujemo
greska) sastoji se u tome da odbacimo > nul-hipotezu, a ona je zapravo I
se za neke postupke kojihje uspjeh samo malo vjerojatniji od nekog dru- I

142 POGRESKA TIPA 1 I TIPA 2 (ALFA I BETAPOGRESKA)


POISSONOVA DISTRIBUCIJA
143
gog, dakle kod kojeg bi razina znacajnosti razlike iznosila P < 0,30 ili
P < 0,40! No buduCi da se u znanosti posebno izbjegava pogreska tipa 1,
to se najeesce susrecemo s tendencijom strogog kriterija (niskog rizika
pogreske 1). Kod testiranja uspjesnosti nekih lijekova pojedini
t strucnjaci i statisticari traze stoga da nivo znacajnosti bude cak znatno Znacenje si.m~ola: y i }'2 = svaki pojedini bmto rezultat i njegov kva-
nizi od P < 0,001, iii jos mnogo nizi. P ~ra~ ~ k~ntJ~urranoj varijabli; ~ = bruto rezultati u kontinuiranoj vari-
Jabh !Spltamka kategorije 1 u dihotomnoi variJ. abli· N = uku b ..
' 'k
pltanJ a·N 1'N b .. · · J ' pan TQI IS-
J
pogreska uzorkovanja Isto sto i > standardna pogreska. U procesu oda- • 1 .. 2 = rDJ !Spttamka u kategoriji 1 odnosno kategoriji 2 di-

biranja uzorka po slucaju (> slucajni uzorak) zbog slucajnih razloga hotomne vanJable.
( obicno se kaze zbog djelovanja slucaja na slucaj) aritmeticka sredina Bu~uCi _da j~ rph zapravo Pearsonov r, pogreska mu je poznata, pa se
I uzorka maze se razlikovati od aritmeticke sredine populacije (odnosno za odr~dt:an!e nJegove tnacajnosti maze koristiti > tablica znacajnosti r
v
od prave vrijednosti mjerenja). Sto je uzorak veCi, to je i vjerojatnost (s ~o~t~aJemh N-2 st~pnj~ slobode). Koeficijent rpb nije opravdano
takvog odstupanja manja. Aritmeticka sredina aritmetickih sredina ve- kons~th. ako se n~. radJ o dthotomnoj nego o dihotomiziranoj varijabli
likog broja uzoraka istc vdiCine i iz istc populacijc jest velicina koja sc
(ak~ Je Je_d~a. vanJabla dihotomizirana, a druga kontinuirana tada ,
maze konshti > biserijalni r). K ' sc
prihvaca kao vrijcdnost populacijc odnosno kao prava vrijcdnost mjerc-
nja. Standardna devijacija distribucije (koja ce sigurno biti normalna)
tih aritmctickih srcdina pokazatelj jc vcliCinc pogreske koja maze nas-
tati zbog uzorkovanja ( > standardna pogreska aritmeticke sredine ). P,K

pogreske, varijanca > varijanca pogreske

point-biserijalni r (rpb) Koeficijent korelacije koji se koristi za od-


redivanje stupnja povezanosti izmcdu stvarno > dihotomne varijable 50
(npr. "zivi-mrtvi", "ozenjeni-neozenjeni", "ima automobil-nema auto- 40
mobil" i sl.) i kontinuirane varijable (npr. rezultat u nekom testu ili upit-
niku ). To jc zapravo > Pearsonov koeficijent korelacije r izracunat na di- 30

hotomnoj i kontinuiranoj varijabli. Postupak zahtijeva da se jedna kate- Rijetki slu~ajni dogadaji distri-
20 buiraju se po tzv. Poissonovoj dis-
gorija u dihotomnoj varijabli oznaCi jednim brojem (svi ispitanici u toj
trihuciji, koja ja"'ve~nom·j;tiitl'
kategoriji imaju tada taj "rezultat''), a druga drugim brojem (to jc "rc-
~o,ilsimetrl~tia~a slici jc prika~
zultat" svih ispitanika u toj kategoriji); to mogu biti bilo koja dva zano' koliko dana u 100 dana
razlicita broja, ali je uobicajeno koristiti brojeve 1 i 2 ili 0 i 1, i zatim se opliZanja u nekoj robnoj kl!Ci nije
izracuna Pcarsonov r po njcgovoj formuli. Mozc sc, mcdutim, upotrijc- u nalazni urcd kucc primljcn niti
jedan izgubljeni predmet, koliko
biti i ova formula:
dana je predan 1 predmct itd .
. '
. -
'

'
144 POISSONOVA DISTRIBUCIJA POLUINTERKVARTILNO ODSTUPANJE
--------~~=~~~~~~~~~~~~=----------
145 '

Za razliku od normalne distrihucije, koja je definirana aritme- Poligon frekvencija manje je precizan nacin grafickog prikazivanja
tickom sredinom i standardnom devijacijom, Poissonova
-
od > histograma, jer kod histogram a (koji se sastoji od stupaca nad sva-
(nazvana po matematicaru Poissonu) - ' ... ~
potpuno-
.- ,.. ..
~
kim razredom, pa se zato moze koristiti samo ako su rezultati grupirani
r tiCJro.m sre~nom,jer je _ ~~· ·~ · _ . . . .u razrede, ili svaki cijeli hroj._ujedno znaci i "razred") povrsina svakog
. To'znaci da je Poissonova raspodjela to sira sto joj je aritmeticka sredina stu ca tacna odgovara i ek.Yenciji rezultata u tom razredu, dok kod po-
veca. U odredenim uvjetima (kad je N vrlo velik, a P hlizu 0), Poissono- ligona samo cjeloku Jna Jovrsina krivulje odgovara ukupnoj frekvenciji,
va raspadjela prihlizava se > binomnoj distribuciji, no "smislena" razlika ua e uku_pnom hroju rezultata N). _No, da h1 to zaista hila taka, va,Ja
izmedu nJih je u tome sto kod hinomne raspodjele znama ne samo koli- kod crtanja poligana "uzemljiti" krivulju, tj.lijevo i desno spustiti je po-
ko se puta neki dogadaj pojavio, vee i koliko se puta nije pojavio (npr. SVC } la
-. -
!!I,?~CISU.
- -
kod sto hacanja navCica znamo koliko je puta palo "pismo", a koliko pu-
·: ·I""'C·...,;-1.--- --
~ .~ Usprkos manjoj preciznosti poligana frekvencija u usparedhi s hi-
ta nije palo), dak kod Poissonave raspodjele!znamo samo koliko se·putf ·~ stogramom, aligon se eesee koristi u grafickom prikazivanju rezultata i
neki dogadaj
··-.~,r,.
-l:.,._ --&.~~ T
pojavio ~pr. aka za
,:;',•.,;. . .l:'
vrijeme oluje hiljezimo koliko je puta
_to zato sto (a) krivulj~se vise prihlizava realnQj distr.ihuciji rezu tata ad
hljesnwo, m1 ne znamo koliko puta nije hljesnulo!). P -
.histograma,j_ h kod Jrikaza dvije iii vise distribucija na jednoj slici pri-
kltzivan·e histograma dala hi pasve nepreglednu sliku, za razliku ad do-
poligon frekvencij~Jedan od nacina grafickog prikazivanja > distribu- ~- -
hre pre le nosti iju ili ise krivul" ana istoj_IDici (is tom koordinatnom
cije rezultata n~kog mjerenja ito u > @£!dinatnom sustavu. Sastoji se u sustavu). P
- tome da se na apscisu unesu vrijednosti rezultata (ako su rezultati grupi-
rani u razrede, onda su to_sreOrije vriJednosti razreda), ana ordinatu
poliranc vrijcdnosti Vrijednosti (tackc u koordinatnom sustavu) kojc
frek:vencije, pa se spajanjem tocaka (bilo crtama od tocke do tocke, hilo
sluze za izvlacenje krivulje pri grafickam prikazivanju odnosa izmedu
> metodom ''slobodne rnke") u koordinatnom sustavu dohije crtez koji
dvije varijahle, a koje su dobivene nekim postupkom izgladivanja krivu-
je ohicno vise iii manje slican > nonnalnoj distribuciji (vidi sliku).
lje, kaa sto je primjerice > postupak "pomicnih srednjih vrijednosti ". Ta-
v eo
ka dohivene vrijednosti ne koriste se za daljnju statisticku ohradu, vee
70 samo za zorno (graficko) prikazivanje odnosa medu varijablama. K

"poliranje" krivulje "Izgladivanje" krivulje u grafickom prikazivanju


odnosa izmedu dvije varijahle (u koordinatnom sustavu). Poliranjem se
40
uklanjaju slucajne, akccsorne nepravilnosti krivuljc. Postoji nckoliko
postupaka poliranja: > postupak "slobodne rnke", > postupak "pomicnih
srednjih vrijednosti". K

1:~~~~----~~~--~-=========~~~
125 145 1as 185 225 245 265 285 305 325 345 3115 x
:ns
polozaj pojedinog rezultata u grupi > z-vrijednosti, > decili.
I
vrijome rellkcUe u me
poluinterkvartilno odstupanje > indeks poluinterkvartilnog rasprsenja >,
Poligon frekvencija dobiven iz velikog .broja mjerenja vremena reakcije. (Q)
'
PONDER :...:::..J.)_ _ _ _-~
POPUIACIJA (OSNOVNI .§_K_UP 14~
7
146
ponder "Te:l.ina" ili vaznost sto je neki rezultat ima medu drugim re- .. Aritmeticka sredina maze biti ponderirana i nekorn arbitrarnorn
VTIJedno~?u ili vr~jed?.os~u koja je dobivena slozenijom statistickom
zultatima. U sumi brojeva 1, 2 i 1000daleko najvecu tdinu ima najveCi
ela~.oraCIJO~, konstect pn tome rasprsenje rezultata, korelacije s nekim
broj, dakle 1000, jer ako druga dva broja izostavimo, zbroj se bitno nece
va~IJabl~vma I sl. !ed~n od nacina odredivanja zajednicke ponderirane
promijeniti. U nekim statistickim racunskim postupcima ponder se ja- ant~et1cke sredme Jest koristenje > standardne pogreske aritmeticke
vlja "sam od sebe": npr. u sumi bodova nekoliko testova najvecu tezinu sredzne za svaku vrijednost, prerna formuli:
u znaeenju ukupnog zbroja ima rezultat testa s najvecom standardnom
devijacijom (> latentni ponder). U drugim situacijama namjerno daje- M1 M2 M
2 + 2 +... + 2n
mo nekim rezultatima vecu tezinu (npr. u > ponderiranoj aritmetickoj -
M= SM SM S
. 1
I
1
2 M.
1 --
sredini, tj. u aritmetickoj sredini dobivenoj iz nekoliko aritmetickih sre- 2 + 2 +... + 2
dina, veCi ponder imaju aritmeticke sredine s veCim brojem rezultata ); u sM, sM. sM.
nekim je pak statistickim racunima (> multipla korelacija) ukljuceno
gdje sM oznacuje standardnu pogresku aritmeticke sredine. Kako se iz
optimalno ponderiranje, tj. takvo davanje tezine rezultatima pojedinih
. for~ule vidi, vecu tezinu dobit ce ana aritmeticka sredina koja ima
testova koje ukupno daje najvisu korelaciju s kriterijem (> beta pon-
manJU standardnu pogresku. P,K
dni). r
' pond.e~iranj~ Davanje "tezine" (pondera) pojedinim rezultatima u
ponderirana aritmeticka sredina Pri odrcdivanju aritmetickc sredinc
skuptm.drugth rezultata (> ponder). Pod ovim nazivom obicno se misli
dviju ili vise aritmetickih sredina svakoj aritmetickoj sredini ne daje se na namJ~rno ponderiranje, a ne na ono koje dolazi "samo od sebe", npr.
jednaka vaznost (tj. zajednicka aritmeticka sredina nije jednostavna zbog vece standardne devijacije jednog testa medu drugim testovima ili
aritmeticka sredina svih aritmetickih sredina) nego svaka od aritrne- zbog veceg broja u sumi nekoliko brojeva. Kod prirnjene razliCitih tes~o­
tickih sredina dobiva razliCitu "tezinu" ili ponder. Najce~ce se uzima u va znanja k~nstr~ktori testa cesto se odluce na ponderiranje pojedinih
obzir N (broj rezultata) na temelju kojega je svaka aritrneticka sredina zadataka koJe om smatraju vaznijima od drugih: ako su npr. neki zadaci
izracunata. Takva formula izgleda ovako: po konstruktorovu misljenju, mnogo tezi od ostalih, pa bi kandidata tre~
balo posebno nagraditi aka ih je uspio rijesiti, konstruktor katkada
odluci da te zadatke ponderira, tj. da npr. umjesto 1 bod kandidat za
.. .., .
nJesem zadatak ~obije 2 iii vise bodova. Ovarno se moze ubrojiti i povre-
~ena praksa nekih konstruktora testova znanja da uspjesno rjesenje ne-
gdje je M ponde.rirana aritrneticka sredina, M 1, M 2 itd. pojedinacne
kih zadataka smatraju "conditio sine qua non", tj. aka kandidat ne rijesi
aritrneticke sredine, NI> N 2 itd. pripadni broj rezultata (ili ispitanika). ~ev za~atke o:e :x:ste (a oni predstavljaju bitne clemente gradiva),
Na taj naCin dobivena aritmeticka sredina potpuno odgovara rezultatu rJesenJa se dalJe mti ne provjeravaju, nego se smatra da kandidat nije za-
koji bismo dobili da smo sve rezultate zbrojili i podijelili njihovirn bro- dovoljio. P
jern, dakle odgovara osnovnoj formuli za . aritmeticku sredinu:
~o~u~acija (osnovni skup) Izraz znaci (a) sve slucajeve (sve statisticke
Jedtmce) u nekom konacnom skupu elemenata (npr. sve stanovnike ne-

-
.. -
-- -~ -
--- .

• •
148 POPULACIJA (OSNOVNI SKUP) HGRANICA 149

I
kog grad a) i u tom se slucaju govori o ogranicenoj populaciji, iii (b) potpuna korelacija Ako koeficijent korelacije iznosi ± 1, onda se govori
neizmjerni broj slucajeva u nekom beskonacnom skupu elemena ta ( npr. 0 potpunoj korelaciji, sto znaci da svakoj vrijednosti jedne varijable

ako mjerimo brzinu reagiranja u funkciji intenziteta podrazaja, popula- odgovara samo jedna vrijednost druge varijable (nema nikakvog > rezi-

ciju predstavlja neizmjerni broj mjerenja) i u tom se slucaju govori o dualnogvarijabiliteta, odnosno > indeks rezidualnogvarijabiliteta jednak
neizmjernoj iii neogranieenoj populaciji. P je nuli). U takvom je slucaju > pravac regresije koji povezuje Y s obzirom I

. na X identican s pravcem regresije koji povezuje X s obzirom naY (tj. I


postotak Broj > statistickih jedinica (elemenata) koje imaju neko oba se pravca regresije poklapaju). Potpuna korelacija u naravi nepos-
odredcno svojstvo izrazen na skali od 0 do 100, gdjc ukupan hroj (uku- toji (izmcdu ostalog i zato sto jc svako mjcrenjc ncsavrscno, tj. nuzno --,
panN dobiva vrijednost 100. Zbroj broja statistickihjedinica koje imaju sadr:lava neku pogresku; > nesistematski varijabilni faktori, > stan-
neko odredeno svojstvo i onih koje nemaju to svojstvo mora dati 100 ( >
dardna pogreska mjerenja), vee samo u tvorevinama kao sto je, prim-
proporc{ia). K ·
jcricc, gcometrija, pa se zhog toga primjeri potpune korclacije uzimaju
I
postupak "pomicnih srednjih vrijednosti" Postupak uredivanja ("iz- upravo iz tog podrucja: postoji potpuna korelacija izmedu opsega kruga
gladivanja") krivulje koja pokazuje odnos izmedu dvije varijable u koor- i polumjera kruga. Svakom polumjeru kruga odgovara samo jedan
dinatnom sustavu. Ako krivulja povucena kroz dobivenc tocke nijc do- npscg i ohrnuto, a sa svakom promjenom opsega (polumjera) nuzno se
voljno pravilna, zbog djelovanja akcesornih faktora, mozemo je izgladiti mijenja i polumjer (opseg). K
tako da se, koristeci brojcane vrijednosti u zavisnoj varijabli (odnosno
one vrijcdnosti kojc su prikazane na ordinati koordinatnog sustava),
zbroje tri susjedne vrijednosti i podijele s tri, a tako dobivena vrijednost poucak ccntralnih granica (central limit theorem) Aritmeticke sredine
je nova vrijednost za srednju od njih tri. Krajnje vrijednosti uzimaju se velikog broja uzoraka iste veliCine, uzetih iz neke populactJC, ihstrtbut-
dvostruko i pribroji im se prethodna vrijednost, osim u slucajevima kad Jaju se po normalnoj ras- 1\<nm<li(k• mdin• pnpulacljo - 7l ..< ,

se opravdano moze pretpostaviti koja bi vrijednost mogla doci iza za- . podjeli Cak i onda kada po- 1: 1\rllmCii~kil uedina ltlllmc.lilkih ue.duu. uwraka - 15,)f)

dnje (kao npr. pri poliranju krivulje koja prikazuje distribuciju frekven- pulacija i znacaJno odstupa :
A
cija, gdje jc vrijcdnost iza krajnje, nula). Ako prvo izgladivanjc nije do-
voljno, moze se provesti jos jedanput. K
od normalnosti (vidi sliku ).
Poucak centralnih granica
..
:
,.,
od velike jc vaznosti u stati-
postupak razlika > metoda diferencije
stickim postupcima > infe-
postupak "slobodne ruke" Postupak izvlacenja krivulje koja najbolje 220
ll
200
pristaje dobivenim vrijednostima (koordinatama) u koordinatnom sus- 110 Atitmctitk.a srcdin~ populacijc • 6,8

tavu, pri cemu se nastoji da krivulja prode kroz sto vise dobivenih "Poucak centralnih granica" govo- 110
Aritmctit!lc.ii sredina ar itmctit:kih srcdina uzoralu '"" 6,9
140
tocaka, a zbroj odstupanja od tocaka kroz koje krivulja ne prolazi treba ri nam da sc aritmeticke sredine 1:10

biti podjednak na vise i na nize od krivulje. Izvlacenje krivulje slobo- (dovoljno vclikih) uzoraka distri-
....
100

dnom rukom zahtijeva odredeno iskustvo, a rukovoditi se moze zna-


buiraju po normalnoj distribuciji
bez obzira na to jesu li uzorci uzi- ..
njem o tipicnom odnosu koji postoji izmedu varijabli unesenih u koordi- mani iz norma Inc iii posvc asime-
20

natni sustav (varijabli izmedu kojih se trazi odnos). K tricne distribucije.


150 POUCAK CENTRALNIH GRANICA '
"PRAVA" ARI1METICKA SREDINA 151
rencijalne statistike, ion opravdava koristenje zakona normalne distribu-
cije ius ucaJevtma aoa rad1mo s rezuitatima koji se uopee ne raspodjei: Y=Xa
juju po normalnoj . kod > ·· · tes- pri eemu je a eksponent, koji je veCi od 1. P
tova ckih Sredina U?:Of
iz jedn~ normalne i iz jedne asimetricn~ popuiacije. p · pozitivna asimetricnost distribucije Takva distribucija koja nije sime-
-
tricna, vee se veCina rezultata nalazi (grupira) na njezinoj lijevoj strani,
pouzdanost U statistici pouzdanost ima smisao stabiinosti: pouzdana je dok je desna strana manje iii vise produzena (vidi sliku). Naziva se i
a na statisticka vrijednost (recimo aritmeticka sredina iii koeficijent ko- "asimetricnost udesno". Do pozitivne asimetricnosti · e
relacije) koja se pri ponovljenim mjerenjima ili pridodavanjem novih re- doCi zbog vise razloga, npr. zbog toga se ava u i)i
zultata neee znacajno mijenjati (mijenjat ce se samo u okvirima siucaj- u drustvu zaista taka raspodjeijuje iii zbog toga sto ·e ariranje rezultata
nog varijabiliteta). Sto je veCi broj rezultata (sto je veCi N) iz kojih je na li"evo· strani ograniceno rezultatom 0 (nula) (npr. broj izostanaka s
ncka statisticka vrijednost izracunata, to je ana stabiinija, pouzdanija. posla skupine radnika ne maze biti manji od nula izostanaka), iii zbog
Drugacije receno, pouzdanija iii stabilnija je ana statisticka vrijednost toga sto je neki test pretezakza skupinu isp!tanika na koju je primijenjen
koja je bliza > pravoj vrijednosti mjerenja odnosno na koju je djelovalo pa vecina ispitanika postize ispodprosjecne rezultate. Pozitivno asime-

manje > nesistematski varijabilnih faktora. • ·v a distribucija maze biti.i.llQ§l"edica <!jelovanja nekog sistemats
u statistici se koristi termin > granice pouzdanosti, sto znaci da faktora
-pri mjerenju ili
se u odredenim granicama s odredenom sigurnoscu nalazi neka vrijed- _opazanju neke pojave, kao
nost (> procjena parametra), a upotrebljava se kod intervalnih pro- _sto je, primjerice djeloxanje
cjena vrijednosti populacije. Tu, dakle, pouzdanost ima znacenje sigur- umora. P
nosti. K
Pozitivno asimetricna distribucija
frekvencija.
povezanost u statistici tcrmin povezanost znaci zapravo > sukladnost ll f

variranju, tj. ne impiicira nikakvu uzrocno-posijedicnu vezu medu vari-


jablama medu kojima se odreduje povezanost. Stupanj povezanosti pozitivna korelacija > koeficijent kore/acije
izrazava se s pomocu > koefi.cijenta kore/acije. Povezanost znaci is to sto i
> korelacija i taj je termin (korelacija) u statistici terminus technicus za "prava" aritmeticka 's redina (i "prava" standardna devijacija) Vrijed-
povezanost mcdu varijablama. K nost koju bismo dobili kada bismo uspjeli izmjeriti sve clanove neke
populacije. Aka je populacija definicijom ogranicena (npr. "svi ucenici
pozitivna akceleracija Takav po!'ast neke varijable koji u vremenu (iii 5.a razreda skole N"), onda su dakako i aritmeticka sredina i standardna
paralelno s linearnim porastom druge varijabie) postaje sve brzi. N a pri- devijacija prave vrijednosti populacije. No u najvecem broju slueajeva
mjer, umor raste svc brze u funkciji trajanja rada; to sc dokazuje time rni mjerirno > uzorak neke populacije, pa stoga dobivamo samo
sto je nakon dvostruko dugog prethodnog rada potreban nerazmjemo "procjenu" aritmeticke sredine i standardne devijacije. Bez mjerenja
puta duiji odmor da bi se organizam oporavio. Aka je ubrzanje porasta citave populacije uopce nije moguce doznati koje su prave vrijednosti
pravilno, pozitivna akceleracija prikazuje se izrazom: tih parametara, ali nam statisticke metode omogueavaju (> standardna

.. I

. .. ~
.. ...

I

152 "PRAVA" ARITMETICKA SREDINA ' PRIGODNI UZORAK 153
prediktorske varijable Ili prediktori, kod > multiple korelacije sve one
pogreika aritmeticke sredine) da s dosta velikom sigurnosti ocijenimo u
varijable za koje se odreduje zajednicki stupanj povezanosti s > kriterij-
kojem se intervalu nalazi prava vrijednost. Na tim se postupcima osni-
vaju logika i metode > parametrijske statistike i > neparametrijske sta- skom varijablom. K
tistike. P
predmet mjerenja U psihologiji, pretpostavljena (hipoteticka) veliCina,
psiholoski entitet za koji se pretpostavlja da je moguee odredenim psi-
pravac regresije > jednadiba pravca regresije
hologijskim mjernim instrumentom mjeriti ili opazati njegove kvantita-
tivn<.: karakt<.:ristike. No, predm<.:t mj<.:rcnja je uvijek izved<.:na vrij<.:dnost
"prava" varijanca > "prava" aritmeticka sredina (i "prava" standardna zbog toga sto na opazeni ili mjereni rezultat nuzno djeluju i drugi fak-
devijacija) tori, a ne samo predmet mjerenja. Ti "drugi faktori" djeluju kao slucajna
varijahla, pa je zato na temelju ponovljcnih istovrsnih mjcrenja moguec
prava vrijcdnost mjcrcnja Pret ostavl· en a vri ·cdn ) "'+ (osohinc, derivirati pravu velicinu mjerenja. Svaki rezultat mjerenja (iii opazanja)
atn uta) kojaje predmet ...,... din if!!funi~Q.te ima ovu strukturu X= ~,+X,, gdjcXznaci izmjerenu iii opaz<.:nu vrije-
dnost (rezultat mjercnja), XP pravu velicinu mjerenja (prcdmct mjcrc-
nja ), a X, sve > nesistematske varijabilne faktore koji su utjecali na ko-
_velikog broja mjere~ja odnosno iz populacij~ Ako se radi o mjerenju nacni rezultat mjerenja. Ako se pretpostavi da ee pri vecem broju pono-
jedne vel' · o ·ave osobine na ·ednom individuumu, onda o ula~ vljenih mjerenja biti M x, = 0 Uer nesistematski varijabilni faktori djc-
ciju redstavlja neizmjerno velik broj rojerenj~. a ,ako se radi o mjerenj~ luju po slucaju), onda cc hiti i X= Xr K
jedne yelicine (pojave, osobine) na razlicitim individuumima (razlicitim
- ~ statis.tickimjedinicama), ondSLllUpulacij.utine sye statisticke jedinicc_ prigodni uzorak Uzorak koji se sastoji iz elemenata (predmeta, situa-
(koje udovoljavaju nekoj definiciji); u oba slucaja pravu vrijednost mje- cija ili ljudi), koji su nam "pri ruci". U strucnim publikacijama moze se
renja cini rosjecna vrijednost (~ritmeticka sredina) populacije (> "pra- procitati dosta kritika na prigodni uzorak, jer on zaista moze biti veoma
va" aritmeticka sredina). Tu vrijednost (osim u rijetkim slucajevima po > pristran uzorak; najcesce se kao primjer spominju uzorci bolesnika:
~u
-
lo granicenih o ulaci'a}_procjenj.uj.e se na temelju vrijed~ neka nova metoda lijecenja gotovo bez iznimke provjerava se na prigod-
nosti > uzorka. K I
nom uzorku, tj. na prisutnim pacijentima. To dakako u nekim situacija-
ma moze imati i veoma negativnu stranu Uer se u takvim prilikama rije-

' Takva distribucija rezultata u kojoj je svaki re- tko koristi kontrolna grupa ili grupa s "placebom"), no opcenito o prigo-
'· .
zultat (iii grupa rezultata, ako su oni rasporedeni u "razrede") za- dnom uzorku valja reCi ovo: pristranost prigodnog uzorka ovisi o tome
stupljen u jednakoj ili slicnoj frekvenciji. To moze biti zato sto svaki re- sto se ispituje: ako bismo na studentima fakulteta tjelesnog odgoja is-
zultat ima jednaku vjerojatnost pojavljivanja; npr. kada bismo 600 puta trazivali prosjecnu izdrzljivost mladih ljudi u nekim naporima, onda bi

bacili jednu ispravnu igracu kocku, morali bismo svaki od sest moguCih takav uzorak bio izriCito pristran; zakljucivanje na postotak frigidnosti
ishoda dobiti priblizno 100 puta, dakle uglavnom jednako cesto. p kod zemi, ana osnovi takvih slucajeva koji su registrirani u psihijatrij-
skim ordinacijama bilo bi pogresno iz istih razloga pristranosti uzorka;
prediktor > prediktorske varijable zakljucivanje na zastupljenost neuroticnosti na osnovi uzorka studenata


• •

'
154 PRIGODNI UZORAK PROGNOZAREZULTATA 155
psihologije takoder bi predstavljalo upotrebu pristranog uzorka. Pozna-
to je da su svojedobna Kinseyeva istrazivanja razlicitih oblika seksual-
nog ponasanja bila kritizirana upravo stoga sto je istrazivanjc radeno na
studentima, dakle na uzorku koji u pogledu seksualnog ponasanja moze
biti veoma pristran. No ako se prigodni uzorak koristi za istraZivanje
problema za koji ne mqzemo ustanoviti da ima ikakve direktne veze s
4 '" .. 1 • "' -· ·-

karakteristikama naseg uzorka, onda je upotreba ptigodnog~uzorka


--·- - ......
mnogo manje'"opasna". Na primjer, ako se na raspolozivim studentima
psihologije ili medicine istrazuje problem vidne paslike, nema nikakvog "pr~duc~-moment correlation" U engleskom jezicnom podrucju cesto
prihvatljivog argumenta koji bi govorio da studenti ovih struka imaju vi- konsten tzraz za > Pearsonov koeficijent korelacije r, a naziva se tako zato
dne paslike drugacijih karakteristika od drugih mladih ljudi. Prema sto s: k~eficijent korelacije r u svojoj logici osniva na "umnosku marne-
tome, kod rada s prigodnim uzorkom treba prethodno kriticki razmo- nata , tj. na ~edu~obnom mnozenju odstupanja svakog pojedinog re-
triti bi 1i > nezavisna varijabla, koju u pokusima manipuliramo, iii > za- zultata od antmettcke sredine u varijabli X s odstupanjem korespon-
visna varijabla (uz pomoc koje mjerimo uCinak nezavisne varijable), dentnog rezultata od aritmeticke sredine u varijabli Y. U racunu korela-
mogle biti u bilo kakvoj vezi sa socijalnim, intelektualnim, starosnim iii cije izraz "mom~nt': ne znaci dakle nista drugo nego > z-vrijednost, pa
hilo kojim tlrugim karaktcristikama nascg prigodnog uzorka. Ako takvu prema t~me logtka tzracunavanja koeficijenta korelacije r osniva sc na
vezu ne mozemo pronaCi, opasnost od pristranosti prigodnog uzorka umnosctma korespondentnih z-vrijednosti.
sveli smo na minimum; zapravo se veCi prigovor moze staviti cinjenici da Kad imamovdv~ i~enticna niza brojeva (npr. dva puta niz 1, 3, 4, 6),
u prigodnom uzorku "slucajnost" izbora kandidata nije dovoljno posto- medu~obno mnozenJe tzmedu ta dva niza dat ce najvecu mogucu sumu
vana. P
~mnozaka sa~o onda ako neki broj iz jednog niza mnozimo is tim bro-
Jem drugog mza ( dakle 1 x 1, 3 x 3, 4 x 4, 6 x 6). To znaci dace sum a um-
noz~kaz-vrijednosti biti najveea samo u slucaju ako medusobno mnozi-
pristrani uzorak Onaj uzorak koji nije potpuno slucajan, nego su na m~ tdenticne z-~i~~dnosti, a to nas navodi na neizbjezivi zakljucak da _
njega djelovali jedan iii vise sistematskih faktora; npr. uzorak !judi sto ih ostm u matematJct 1 nekim nevarijabilnim pojavama - ne mozemo niti
anketar intervjuira na ulici ("po slobodnom izboru"), cesto je pristran ?ceki:Vati d~ ce odstupanje svakog pojedinca u obje varijable biti
ne samo zato sto na nekc vrste pitanja ncki !judi ne zelc odgovarati, vee i tdentJcno, 1J. da ce pojedincevo odstupanje od aritmeticke srerline u
zato sto anketar i ne prilazi ljudima za koje muse cini da ga ne bi ljuba- varijabli X biti identicno njegovu odstupanju od aritmeticke sredine u
zno docekali; takoder, uzorak uzet iz telefonskog imenika najcesce je varijabli Y. Stoga je prakticki nemoguce dobiti koeficijent korelacije r
koji bi bio "najveCi moguCi", tj. koji bi iznosio tocno 1 {> korelacija >
barcm djelomicno pristrani uzorak,jer tclcfon nc posjcduju ujcdnakom potpuna korelacija). P '
postotku svi slojevi stanovnistva; uzorak 1V-gledatelja koji odgovara na
neku anketu, cesto je pristrani uzorak, jer na ankete obicno odgovaraju p.rog~oza ~e~lt~ta .~ajcesce se tim izrazom oznacava postupak pred-
samo neke kategorije pretplatnika (jedan je autor duhovito rekao da vtd~DJa naJVJeroJatmJeg rezultata u jednoj varijabli na temelju pozna-
nam na pitanje u upitniku "Volite li odgovarati na upitnik?", oni koji ne vanJa rezultata u drugoj varijabli i poznavanja velicine povezanosti
vole, uopce ne bi odgovorili). P medu tim varijablama (> jednadiba pravca regresije). K



--.

'
I
156 PROPORCIJA
-
proporcija Broj > statistickihjedinica koje imaju neko odredeno svoj-
stvo, izrafen na skali od 0 do 1, a oznacava se slovomp. Ostale statisticke
jedinice koje nemaju to svojstvo, oznacavaju se sq. Zbroj p+q uvijek
mora biti jednak 1. Proporcija pomnozena sa 100 daje > postotak. K '
L...

prosjek OpCi izraz za > srediJnju vrijednost ili > centralnu tendenciju,
koji se rabi ne samo u statistici. Katkad se tim terminom oznacuje sarno
> aritmeticka sredina. K

prosjecni rang > ''vezani" rangovi

prosireni medijan test Neparametrijski test kojim se testira da li vise


nezav1snih uzoraka pripadaju istoj populaciji. Predstavlja dakle jednu
q Najcesee u statistici oznacuje proporciju u kojoj se neko svojstvo nije
od nepararnetrijskih varijanata parametrijske > analize varijance, aline
pojavilo, dakle q = 1 - p. Ako medu 80 ispitanika nademo njih 20 s
I

provjerava razlike rnedu aritrnetickirn sredinarna, vee razlike rnedu rne-


odredenorn karakteristikorn, onda ta karakteristik a ima p = 0 25 a
dijanima. Jednako kao i > medijan test, provodi se tako da se nade me- ) )

q = 0,75. p
dijan iz svih rezultata svih uzoraka uzetih zajedno, pa se uz pornoc hi-
kvadrat testa provjerava ima li razlika medu uzorcima u pogledu frek-
vencije rezultata ispod iii iznad medijana. P

provizorna sredina ili provizorna vrijednost Pri racunanju skracenim


postupkom nekih statistickih vrijednosti (npr. aritmeticke sredine i sta-
I

ndardne devijacije) potrebno je najprije arbitrarno odrediti neku


(provizornu) vrijednost koja se na kraju racuna korigira da bi se dobila I
'

stvarna, prava vrijednost. Tako, na primjer, pri racunanju standardne


I

devijacije s pomocu formule: s= N polazi se od


N-1
vrijednosti bruto rczultata (X), srnatrajuCi ih razlikorn od 0 ( nulte vrijed-
nosti), pa je tako ovdje nul a posluZila kao provizorna vrijednost ili provi- randomization (engl. randomize znaci urediti, izabrati ili rasportditi
zorna sredina. U ovoj forrnuli korektivna vrijednost koja ornogucuje do- slucajnim nacinorn, tj. po slucaju; hrvatski izraz koji bi najbolje
odgo:arao ovorn terrninu jest sintagma odabiranje po slucaju; neurnje-
.
bivanje stvarne konacne vrijednosti jest izraz
(:Lxr . K sno b1, dakako, u ovorn slucaju bilo engleski izraz pohrvatiti pa govoriti
N
'
158 RANDOMIZATION
RASPRSENJE REZULTATA
"rendomizacija" .) Odabiranje ili izbor jedinica (statistickih jedinica:
159
ako je distribucija rezultata izrazito asimetricna mozemo koristiti
predmeta, dogadaja, ispitanika itd.) iz osnovnog skupa (tj. populacije)
jedin~ rang _k?relaciju. Postoje dva postupka za izr~cunavanje rang ko-
na takav nacin koji ne omogueuje nikakav pristran ili sustavan rezultat
relac_I!e: prvi,Jednostavniji (i ne~to lo~iji) postupak >Rho koeficijent ko-
(posljedicu ). Temeljni uvjet takvog odabiranja jest da svaka jedinica iz
relaci.Je (Spearman, 1904. ), i drugi, ne~to kompleksniji, ali noviji is dosta
skupa iz kojeg se izabire ima jednaku vjerojatnost da bude odabrana te
moguCih primjena u drugim racunima, > Tau koeficijent rang korelacije
da odabir bilo koje jedinice nina koji nacin ne utjece na odabir bilo koje
druge jedinice. K
(~en~~ll, 193~). Ob~ ~oeficijenta omogucavaju izracunavanje korigira-
mh VTIJednosh u slucaJu > "vezanih" rangova. p

rang Redno mjesto, polozaj sto ga neki rezultat zauzima medu ostalim rangova, skala > ska/a rangova
rezultatima, kada su svi rezultati pored ani redom ( od najveceg pre rna
najmanjem, od najboljeg prema najslabijem, iii obrnuto ). Ako se rezul- raspodjela > distribucija
tatX nalazi na 9. mjestu po redu, on zauzima 9. rang. U slucaju da neko-
liko rezultata ima istu vrijednost (ili, primjerice, nekoliko trkaca isto- raspodjela kumulativnih frekvencija > kumulativna distribucija
dobno stigne na cilj), oni zauzimaju isti rang ( > "vezani" rangovi). > Or-
r~spon Razlika izmedu najveceg i najmanjeg rezultata u nekom mjere-
dinalna skala koristi rangove. P
nJu. Raspon nam donekle moze posluziti kao grubi pokazatelj varijabil-
nosti rezultata mjerenja. No, raspon rezultata je nesiguran pokazatelj
rangiranje Redanje rezultata od najveceg pre rna najmanjem, od najbo-
rasprsenja nzultata, jer ovisi o samo dva rezultata, najmanjem i naj-
ljega pre rna sve slabijima (ili obrnuto ). Rezultate redamo n~jces~e o~da
kada treba od ukupnog brojarezultata uzeti samo odredem broJ naJbo- vecem, pa aka su pri mjerenju slucajno dobiveni ekstremni rezultati ra-
ljih, pa se iz ranga rezultata uzmu samo oni koji se nalaze ~ okviru broj~
sp~n ce biti povecan, iako se mozda svi ostali rezultati homogeno grupi-
rezultata koji ulaze u daljnji postupak: medu 100 kand1data za nek1 ~a.Ju oko nek~ vrijednosti. Osim toga, sto je uzorak mjerenja veci, raspon
Ima te_ndenciJu porasta Qer se povecava vjerojatnost pojavljivanja eks-
natjecaj uzima se u daljnji postupak npr. p.~hdvades.et po. ran~u. ~?ze
tremmh rezultata). Stogaje > standardna devijacija neusporedivo bolji
se, dakako, koristiti i kad se hoce odbaciti odredem broJ omh koJI su
· najslabiji po rangu. P
P?k~z~telj variranja rezultata oko nekog prosjeka. Osim mnogih drugih
fljezimh prednosti, valja istaknuti i to da se ona ne mijenja sistematski
povecavanjem ili smanjivanjem uzorka. p
rang korelacija Stupanj povezanosti medu rangovima. Za razl~ku od ~
Pearsonova koeficijenta korelacije r, koji vodi racuna o tome kohko svaki
-=~ raspdenje rezultata Svakom je eovjeku pozna to da pri ponavljanom
pojedini rezultat odstupa od ostalih rezultata, rang ~ore~acija, ~uduc~ da • • • •
IDJerenJu tste pojave (npr. pri uzastopnom mjerenju vremena reakcije
se sluzi rangovima, ne moze te stvarne razlike uztmatl u obztr, vee su
· kod is tog covjeka), kao i pri jednokratnom mjerenju neke karakteristike
razlike izmedu susjednih rangova uvijekjednake, tj. 1 rang, sto dakako
na velikom broju slucajeva (> statistickihjedinica) (npr. mjerenje tezine
' dovodi do toga da rang korelacija predstavlja neprecizniji indeks pove-
dvogodisnje djece ), gotovo bez iznimke dobivamo rezultate koji su
zanosti od koeficijenta korelacije r. No ako ne posjedujemo mjerene re-
razliciti, ali ujedno i slicni jer se grupiraju oko neke > sredisnje vrijedno-
zultate, nego samo rang rezultata (npr. neki nastavnik mo~ev15 s~oj~~ sti, a to je najcesce aritmeticka sredina (> nesistematski varijabilni fakto-
ucenika poredati po rangu marljivosti i po rangu skolske uspjcsnostJ ), 1h
ri). 0 velicini rasprscnja rezultata oko nckc sredisnjc vrijednosti ovisi i


- -· ·-
--~
~
• •
-- ~ .-

I 161
160 RASPRSENJE REZULTATA I RAZREDI
'

vrijednost odnosno "reprezentativnost" te sredisnje vrijednosti: sto su va na normalnoj raspodjeli, kod testiranja statisticke znacajnosti neke
rezultati "gusce" grupirani oko sredisnje vrijednosti, to je ana bolji
razlika . . k
razlike mi uz pomoc formule: t == . ustanov1JUJemo o-
pogreska razltke
"reprezentant" tih rezultata; a ako grupiranja uopce nema, sredisnja se
vrijednost dakako moze izracunati, ali ana nema statisticki smisao (npr. liko puta je neka razlika veca od svoje vlastite pogreske. Aka je (kod ve-
prosjecni kucni broj desne strane neke ulice ). likih uzoraka) ana 1,96 putaveca, znacajnaje nanivou P < 0,05, a ako je
2,58 puta veca, na nivouP < 0,01. Razlika koja nije harem 1,96 puta veca
Postoje razlicitc mjere kojc vise iii manje uspjesno ukazuju na
od svoje pogreske, nijc statisticki znacajna, jer je rizik da smo pogrijcsili
velicinu rasprsenja rezultata oko neke sredisnje vrijcdnosti (a koje nazi-
va'llo indeksima raspdenja). Najjednostavnija (ali i najmanje tacna) u zakljucku veci od 5%. To se onda biljezi ovako: P > 0,05. Za male
mjera je > raspon, tj. razlika izmedu najveceg i najmanjeg rezultata uzorke (uglavnom ispod N = 30) te se vrijednosti mijenjaju, tj. t mora
medu svim rezultatima mjerenja, a jedna od najboljih i najpoznatijih biti to veci sto je uzorak manji (> t-distribucija). Razina znacajnosti jed-
mjera rasprsenja rezultataje > standardna devijacija. Uz standardnu de- naka je pogresci alfa (a) ili pogresci tipa 1 ( > pogre.Ska tipal i tipa 2). -
vijaciju cesto je potrebno usta!loviti radi lise o relativno malom ili rela- U vezi sa standardiziranim i uobicajenim razinama znacajnosti
tivno velikom rasprsenju, jer npr. neka standardna devijacija velicine 10 (5% i 1%) upozoravaju neki moderni statisticari kako je kod mnogih is-
prcdstavlja dosta veliko rasprsenje rezultata kojima aritmcticka sredina trazivaca doslo do "fiksiranosti" za tc standardiziranc razinc. U jcdnom
iznosi 50, ali vrlo malo rasprscnje neke normalne distribucij~ kojoj je svom radu o "nepovredivosti" nivoa 0,05 Skipper kaze ova: "Nc bi bilo
aritmeticka sredina 500. Stoga se koristi i mjera koja pokazujerelativnu tesko naCi dokaze koliko se neki istrazivac raduje kada ( ... ) ustanovi
velicinu rasprsenja, a to je > koeficijent varijabilnosti (V). P
znacajnost na nivou od 0,05, a koliki je njegov uzas ako iz tahlice procita
znacajnost ad 'samo' 0,10, ili 0,06. Gotovo kao da razlika izmedu 0,05 i
ratio skala > omjema ska/a 0,06 znaCi razliku izmedu 'dobra' i 'zla', 'casnog' i 'nccasnog', 'uspjeha' i
'neuspjeha' ". Stoga neki statisticari sugeriraju da hi istrazivac morao u
razina znacajnosti Rizik koji preuzimamo kad tvrdimo da je nesto ·> . svom radu samo izvijestiti koju razinu statisticke znacajnosti je dobio u
statisticki znacajno, tj. da nijc slucajno. Na primjcr, aka tcstiramo sta- , ' svom istrazivanju, a prcpustiti citaocu da odluci mozc li tu razinu prihva-
tisticku znacajnost razlike izmedu dvije aritmeticke sredine pa kazemo \, titi iii nc. P ~
'
I
da je ta razlika statisticki znacajna "na razini rizika od 5%", onda to t
0
I l/ .-_

znaci da postoji samo 5% sanse dane postoji razlika medu aritmetickim


sredinama obiju populacija. U statistici su uobicajene (i donekle dogo-
-- razredi Statisticke iii kvantitativne klase u koje se svrstavaju rezultati
dobivcni opazanjcm ili mjercnjcm. Svrstavahje rezultata u razredc (>
vorene) razine znacajnosti od 5% i 1 %, sto znaci da postoji 5 ili 1 posto grupiranje rezultata u razrede) omogucuje uvid u njihovu distribuciju, a
sanse pogresnog zakljucka. > Standardna pogre.Ska neke vrijednosti podatak o obliku distribucije (npr. je li normalna ili harem simetricna)
I
sluzi nam za procjenu intervala u kojem sc ta vrijednost u populaciji -na- predstavlja temelj odluke o daljnjoj statistickoj obradi podataka.
lazi; npr. ako neka razlika iznosi 5, a njezma standardna pogeska 1, and a Razred uvijek obuhvaca vise ad jednog vrijednosnog intervala koristene
vjerojatnost iznosi 95% da se prava razlika krece po prilici izmedu 3 i 7, skale mjerenja, sto znaci da se svrstavanjem rezultata u razrede brojcana
tj. izmedu 5±2. (> granice pouzdanosti). Takva razlika visoko je sta- 0

' skala pogrubljuje i pojedinacni rezultati mjerenja (bruto rezultati) gube


tisticki znacajna, i oznacava se s P < 0,01, sto znaci da je rizik pogresnog svoju izmjerenu vrijednost i poprimaju vrijednost > srednje vrijednosti

zakljucka manji od 1%. Buduci da se logika statisticke znacajnosti osni- I razreda kojemu po svojoj numerickoj veliCini pripadaju. K

'
'
'

162 REGRESIJA REGRESIJSKI KOEFICIJENf 163


.
regresija Doslovno (lat. regressio) znaci povrat, vracanje, odstup i sl. varijablama manja, predvideni rezultat je blizi aritmetickoj sredini, a
Izraz je povezan sa statistickom tendencijom "vracanja" vrijednosti jednak je aritmetickoj sredini kad se povezanost medu varijablama ne
jedne varijable, koje se promatraju povezano (tj. vrijednosti koje se razlikuje od slucajne povezanosti, tj. kad je > korelacija medu varijab-
predvidaju u toj varijabli) s vrijednostima druge varijable prema aritme- lama jednaka nuli. ·
tickoj sredini, kako se smanjuje korelacija izmedu te dvije varijable. Re- Regresijska analiza oznacuje upotrebu regresije i regresijske jed- ..,
gresija je zapravo skraceni naziv od regresija prema aritmetickoj sredini ) n,a dzbe za analizu povezanih podataka u dvije iii vise varijabli. R~ceno
koja dolazi od opcenite statisticke pojave da je rezultat u jednoj varija- vise formalno, regresijska analiza koristi se u slucajevima kad se pretpo-
bli, predviden na temelju rezultata u drugoj varijabli, blizi aritmetickoj stavlja da su opazene vrijednosti u jednoj varijabli funkcija druge varija-
ble. Teoretski, kod regresijske analize radi se o jednoj > slucajnoj varija-
sredini nego sto je rezultat u varijabli kojaje sluzila za predvidanje. Po-
bli i o drugoj (ili drugim) u kojoj su vrijednosti namjerno odabrane ili
znat je primjer nasljedivanje inteligencije: sinovi vrlo inteligentnih oce-
fiksirane;. §.~~~aj.~a ~arijabla naziva se kriterijska, a katkad i zavisna vari- ...
va obicno su blize prosjeku, a sinovi ispodprosjecno inteligentnih oceva,
J~bla, a neslucajna varijabla (iii varijable) n&ziva se prediktorska ili neza-
takoder su blizi prosjeku. U suvremenoj statistici tim se pojmom, visna varijabla. 0vi nazivi varijabli pokazuju da se ovdje radio jednosm-
medutim, oznacuje svaki statisticki postupak s pomocu kojega se pred- jernom odnosJ.l: na temelju odabrane vrijednosti ujednoj (iii vise) vari-
vidaju vrijednosti u jednoj (ili vise) varijabli na temelju poznavanja jabli trazimo najvjerojatniju vrijednost u drugoj varijabli. Po tome sere-
vrijednosti u drugoj varijabli (ili drugim varijablama) i na temelju gresijska analiza razlikuje od > korelacije koja pokazuje povezanost iz-
poznavanja koeficijenta korelacije medu varijablama. Racunski temelj medu dvije iii vise slucajnih varijabli i moze se opisati u terminima ve-
predvidanja rezultata jest > jednadzba pravca regresije. Citav statisticki liCine varijabiliteta jedne varijable povezanog s varijabilitetom druge ili
postupak- koji moze biti vrlo jednostavan kad se radio samo dvije vari- drugih varijabli. K
jable, ali i mnogo slozeniji kad se koristi vise > prediktorskih varijabli i
vise > kriterijskih varijabli (> multipla korelacija; > kanonicka korela- ednadzba (pravca) koja izrazava odnos izmedu
clviju iii vise varijabli. Obicno se prikazuje o ovom obliku:
cija) - naziva se obicno regresijska analiza. K,P

I
Y = i)o + !) 1x + e
regresije, crta > crta regresije
gdje je Y > kriterijska varijabla,X > prediktorska varijabla, 1) 0 i 1) 1 su >
)
••
regresije, pravac > pravac regresLJe regresijski koeficijenti, a e pokazuje pogresku prognoze (> standardna
I pogrdka) koja ima teoretsku vrijednost nula. To je jednadzba linearne
regresijska analiza~ (termin regresija dolazi od latinskog regressio, sto regresije. Nelinearna regresija moze biti kvadratna, kubna itd. i opisa-
znaCi povrat, vracanje, odstup, uzmak, nazadovanje) U statistici regre- ' na je odgovarajuCim jednadzbama. K
sija znaCi odnos izmedu odabranih vrijednosti jedne varijable (v~rijabl~*
X) is njima povezanih vrijednosti druge varijable (var~ble ~; taJ odnos f!i!~1J.!'19~~!!£ijenf Broj koji pokazuje koliko su vrijednosti u >
opisuje > jednadzba pravca regresije kao i > regresijsk~jednadzba. Rel~­ kriterijskoj varijabli vezane za vrijednosti u > prediktorskoj varijabli, ili
tivni polozaj (izrazen s pomocu z-vrijednosti) povezamhrezultata u obJe za koliko se jedinica povecala vrijednost u kriterijskoj varijabli ako se
varijable bit ce jednak Qednako udaljen od aritmeticke sredine) samo wijednost prediktorske varijable povecala za 1. Regr~sijski koeficijent
kad je povezanost medu varijablama potpuna; sto je povezanost medu je dio > regresijskejednadzbe. U standardiziranom obliku (izra:len kao
. . -- ·-
. - -

164 REGRESIJSKI KOEFICIJENT RHO KOEFIOJENT KORELACIJE 165

z-vrijednost, tj. u jedinicarna standardne devijacije) naziva se beta koefi- bli). Rezidualni varijabilitet maze se prornatrati u Yvarijabli polazeCi od
cijcnt iii > heta ponder, au nestandardiziranorn obliku naziva se b koefi- (odahranog) rezultata u X varijahli, iii uX varijahli polazeci od rezultata
cijent. K u Yvarijabli. VeliCina rezidualnog varijabiliteta izrazava sc s pomocu >
koeficijenta rezidualnogvarijabiliteta. U prognozi rezultata u jednoj vari-
rektangularna distribucija > pravokutna distribucija jabli na temelju poznavanja rezultata u drugoj varijabli (ili u vise drugih
varijabli) i poznavanja stupnja povezanosti medu tim varijablarna sluzi
rcJatlvnc frckvcncijc > Frekvencije rczultata izrazcne kao postotak iii
kao indcks > standardna pogrdka prognvze. K
proporcija od ukupnog N (ukupnog broja rezultata ). K

rcprezcntativna vrijcdnost Brojcana vrijednost koja "reprezentira", rezultat Opcenito, ishod ili posljedica nekog opazanja ili mjerenja
"zastupa" iii "prcdstavlja" skupinu od vi~c vrijcdnosti; u na~cmjcziku za izrazena nckim simholom. U tom smislu rezultatom sc naziva i deskrip-
takvu vrijcdnost rahi sc tcrmin > sredLfnja vrijednost ili > prosjek. U sta- tivni ili kvalitativni ishod opazanja. U statistici sc rezultatom naziva sa-
tistici k:riterij reprezentativnosti skupa bruto rezultata jest: (1) da je rno onaj ishod opazanja ili rnjcrcnja koji se mozc izraziti brojkom, ali
zhroj odstupanja manjih vrijednosti jcdnak zhroju n.dstupanja vecih moze znaciti i neku izvedenu brojcanu vrijednost, kao sto je > arit-
vrijednosti od te reprezentativne vrijednosti; torn k:riteriju udovoljava > metitka sredina, > kvejicijent kore/acije i sl. U najopccnitijcm smi!llu, u
'' svakodnevnorn govoru rijec rezultat koristi se za. ishod bilo koje vrste
aritmeticka sredina, (Lei-)= (Ld+) m '
aktivnosti. K
(Ld- )+(Ld+) = O,gdje d oznacujerazlikuizrnedusvakogpojedi-
nog rezultata i aritrneticke sredine (d =X- M) ; (2) da se vrijednost na- . Rho koeftcijent korelacijc (naj~c~ec se ozna~ava grckim slovom p ==rho)
lazi po sredini skupine rezultata poredanih po velicini; torn k:riteriju Koeficijent koji pokazuje stupanj povezanosti medu ordinalnirn varijab-
odgovara > centralna vrijednost, iii (3) da se vrijednost u skupini rezul- larna (varijablarna izrazenirn na ordinalnoj skali). Najjednostavniji po-
tata najcesce pojavljuje, tj. da irna najvecu frekvenciju; torn kriteriju stupak za izracunavanje >rangkorelacije (autorSpearman, 1904). Sa-
odgovara > dominantna vrijednost. Postoje jos i druge vrijednosti, koje- stoji se u tome da se kvadriraju razlike (D) rnedu korespondentnirn ran-
vee pre rna situaciji - najbolje reprezentiraju neku skupinu rezultata kao govirna obje varijable, i sum a tih kvadriranih razlika uvrsti se u formulu:
sto su > geometrijska sredina te > harmonicna sredina. P,K I
'

rezidualni varijabilitet (od lat. residuum, stoznaCiostataknakonspa- •

ljivanja, isparivanja; rezidualan znaci koji je zaostao, koji preostaje, pre- • Postoje razliCite forrnule za korigirani Rho kod > vezanih rangova, no u
'''
ostali) Varijabilitet rezultata koji je preostao u jednoj varijabli (npr. va- praksi se njihova upotreba gotovo ne isplati,jer se upotrebom tih formu-
rijabli Y) i kad se prornatra povezanost s rezultatima u drugoj varijabli I'
v
' la znatno poveca posao izracunavanja, a rczultat jc samo malo drugaciji
(npr. v~rijabli X). Sto je povezanost (> korelacija, > koeficijent korela- od rezultata bez prirnjene korekcije: Rho se smanji, i to posve neznatno
cije) izrnedu Xi Yvarijable veca, rezidualni varijabilitet ce biti rnanji i, ,
kod visokih korelacija, a nesto vise kod niskih korelacija. Rho koefi-
naravno, obrnuto. Pri korelaciji od 1 on iznosi 0 (nula ), a pri korelaciji cijent korelacije ustvari predstavlja r-koeficijent korelacije primijenjen
od 0 (nul a) jednakje varijabilitetu (izrazenom > standardnom devijaci- na rangove.


'

166 RHO KOEFIOJENT KORELAOJE


Buduci da rangovi ne vode raeuna o velicini medusobne razlike
(razlika izmedu ranga 1 i 2 iznosi 1 rang, kao i razlika izmedu ra~_gova 5 i •

6, iako stvarne razlike mogu biti posve razlicite ), to rang korelaclJa pred-
stavlja samo aproksimaciju stvarne visine povezanosti, ako se primijeni
na mjerene rezultate koji se rangiraju.
Granicne vrijednosti rho koeficijenata korelacije za razliciti broj
parova (N) nalaze se u tablici u Dodatku E. P

run-test > test homogenog niza

s U statistici najcesce oznacuje standardnu devijaciju uzorka. P


.--...

'

sampling error > pogreJka uzorkovanja, > standardna pogreska

SANVA > sloiena analiza varijance

"sazrijevanje sanse" Jedna od predrasuda, poznata narocito kod hazar-


dera (pa se zato katkada naziva "hazarderska zabluda") a koja se sastoji
'
'I' u tome da aka se dugo vremena ne pojavi neki ocekivani rezultat (npr.
brojka 3 kod uzastopnog bacanja kocke ), igrac ima uvjerenje da se sad a
konacno mora taj rezultat pojaviti. Obrnuta predrasuda sastoji se u
tome da se smatra, nakon sto se pojavio jedan rezultat (npr. broj 12 na
ruletu), daje kod iduee igre manje vjerojatno da se taj rezultat ponovno
I pojavi, jer da sada drugi rezultati "imaju vecu vjerojatnost pojavljiva-
;
nja". "Sazrijevanje sanse" spada u pojave > subjektivne vjerojatnosti. P
I

scatter dijagram > tablica rasprsenja

SchetTeov test kda!l. o~ postupaka predlozen za testiranje statisticke..;


..,znacajnosti razlika medu parovima aritffietickili sredina, nakon sto srrio~
. . . . .. ·• . . . '.. .... ..
~ -- .

'
168 SHEFFEOV 1EST I SIMETRICNA DISTRIBUCIJA 169

> analizom varijance ustanovili da uzorci ne pripadaju istoj populaciji. s kategorijama. > biserijalni koeficijent korelacije, > triserijalni koefi-
I
I cijent korelacije, > kvadriserij2lni koeficijent korelacije, > kvintiserijalni
Scheffeov test moze se izracunati po ovoj formuli: i

I koeficijent korelacije. K
I
-
Siegel-Tukeyev test Neparametrijski test za testiranje znacajnosti razli-
ka u varijabilitetu izmedu dvije skupine rezultata. Nacin racunanja

'
• slican je > testu sume rangova, ali je nacin rangiranja drugaciji: medu
pocetne rangove idu rezultati koji su ekstremni u bilo kojem smjeru. U
gdje je FM - M F-omjer za razliku izmedu aritmeticke sredine skupine '
I
• • parametrijskoj statistici taj test donekle odgovaraF-testu, iako je njego-
a i aritmcticke sredine skupine b (dvije odabrane skupine izmedu vise
I va snaga sigurno manja od snage F-testa. P
skupina ispitanika za cije je rezultate provedena analiza varijance ); Mu i I
I
Mt> pripadne aritmeticke sredine skupine a i skupine b; Vmc varijanca I
! sigma U statistici cesto sinonim za standardnu devijaciju (malo grcko
medu grupama u provedenoj analizi varijance; n" i nb broj ispitanika u slovo sigma cr). Velikim grckim slovom sigma (E) u statistici se uvijck
skupini a i skupini b. Tako dobivenaF-vrijednost mora se usporediti sF' oznacava zbrajanje. P
koji se dobije mnozenjcm granicnc vrijednosti (iz tahlica za odcitavanje I
I
znacajnostiF omjera u analizi varijance) za izracunati F-omjer u pretho- sigma skala Jedna od skala bafdarenja, a sluzi za interpretaciju i
'
dnoj analizi varijance s (g-1), tj. s brojem skupina (za koje je obavljena i usporedivanje rezultata. Kao i > z-vrijednosti, sigma skala temelji se na
I
analiza varijance) manje 1. FM. - M. usporeduje se sF' da bi se mogla • standardnoj devijaciji i podijeljenaje na 100 jedinica, s vrijednosti 0 na -3
donijeti odluka treba li ostati na nul-hipotezi (H0) ili je treba odbaciti I standardne devijacije, 50 na aritmetickoj sredini i vrijednosti 100 na +3
(ako je FM. - M• manji odF' ostajemo na nul-hipotezi, ako je jednak iii standardne devijacije. Izracunava se po formuli:
veci odF' odbacujemo nul-hipotezu). P •
I sigma bodovi = 16,66 z · 50
I
selekcionirani uzorak > uzorak
I Npr. u testu s aritmetickom sredinom 80 i standardnom devijacijom 10,
I
, I rezultat 90 ima 16,66(90-80)/10 + 50 = 83,3 sigma bodova. P
serijalna korelacija Oznacuje korelaciju izmedu dvije stvarno > konti-
nuirane varijable, od kojih je jedna izrazena samo s pomocu dvije katego- I
sign test > test predznaka
rije ili klase (biserijalna korelacija ), iii tri (triserijalna korelacija), iii ceti- I
i

ri itd. Za varijablu koja je izrazena reduciranim brojem klasa mora po- I


--_; simetricna distribucija Distribucija rezultata cije su dvije polovice je- L
stojati opravdana pretpostavka da bi se dobila normalna distribucija kad dnake (preklapaju se ). Tako, primjerice, ako se > normalna distribucija
bi tu varijablu bilo moguce izmjeriti na kontinuiranoj numerickoj ljestvi- '1 raspodijeli na mjestu arimeticke sredine, ona ce pokazivati potpunu
ci. Koeficijenti serijalne korelacije su zapravo > Pearsonovi koefi.cijenti simetricnost jer ce dio distribucije lijevo od aritmeticke sredine biti je-
korelacije r izracunati izmedu prosjecnih z-vrijednosti svake kategorije dnak onom desno od aritmeticke sredine (jedna strana bit ee zrcalna
varijable izrazene u kategorijama ( dvije iii tri itd.) i rezultata u varijabli slika druge strane). Jednakost jedne i druge strane distribucije moze biti
mjerenoj na kontinuiranoj ljestvici, koji koeficijent je korigiran standar- izrazena povrsinom distribucije iii "tezinom" jedne i druge strane, pa se
dnom devijacijomz-vrijednosti zbog smanjenog varijabiliteta u varijabli zato aritmeticka sredina naziva i "te:Zistem rezultata". Simetricne mogu

\
I

l


' ~

I 170 SIMETRICNA DISTRIBUCIJA ' J

SKAlA CENTIIA (PERCEN'IIIA) 171


biti i distribucije drugih oblika, kao sto je npr. rektanguralna (pravo-
kutna) distribucija, bimodalna distribucija itd. K
!<:~je se osn~vaju na standardnoj devijaciji), vee se moze primjenjiyati na
'• bdo kakvoJ....distdb.ucif . . ·

"sirovi" rezultat > bruto rezultat t?.me sto centili ne predstavljaju "ekv.jdistantae" j.edinice ako je distribu-
a 1 - --
• "" -=-

sistematski uzorak Takav uzorak u koji uzimamo svaki n-ti clan neke .J_e na mnogQvzemrasponu nego 1% tezultata
populacije. Npr. zelimo li iz populacije velicine 1000 dobiti uzorak od _nek~ d~~tribuc~je (vi.~i sliku gdje su centili usporedeni sa standardnim
100, uzimamo u uzorak svaki deseti element populacije. Sistematski deVIJac1~a~a, tJ .. ~-VI1Jednostima). Slican se problem javlja i za bilo koju
uzorak najcesce po svojim karakteristikama dobro zamjenjuje > slucaj- -drugu ~~stnbuc~Ju.kod koj.e postoji tendencija gruP,iranja rezultata oko
ni uzorak, koji je najbolji reprezentant populacije (> uzorak). P nek~ ':1Jednosti, tJ. ko~ SV1h ~~stribuci' a rezultata koje nisu pravokutne.
Ekv1d1stantne su gramcne VflJednosti centila jedino kad je distribucija
prayokutna. · Stoga se k d ti'J .. •
skala Svaki uredeni niz brojcanih vrijednosti koji omogucuje smjestanje . . o cen a ne Sm1Je 1Zracunavati "pros:iek" '1'
" ku ., 'I' ~ 11
neke pojave na odgovarajuce mjesto na tom nizu prema stvarnoj iii pro- u pm centi 1Znekolikotestovazanekogispitanika Racv ki
·1 k · uns se cen-
cijenjenoj velicini iii promjeni u velicini pojave. Niz ne mora uvijek biti tt ne og rezultata racuna po formuli:

cksplicitno izrazcn brojevima, vee se moze prikazati graficki, npr. duzi-


centil = (rang rezultata/N) . 100
nom na kojoj su oznaceni podjeljci iii sl., pa se tada govori o grafickoj
skali. Obicno se u takvim slucajevima naknadno (ne pri samoj primjeni N~r .. ~ko je medu 50 rezultata neki rezultat 43. po redu (racunajuci od
skale) pridjeljuju odgovarajuce brojcane vrijednosti. Postoje i kombini- ~aJmzeg rezul~ata), on zauzima (43/50)100 = 86. centil. U praksi se
rani slucajevi: graficke skale s oznacenim brojevima. Katkada se u psi- ce~to u~otre~lJava 10 ~uta grublja skala, nazvana > skala decila, kod
hologiji skalama nazivaju svi psihologijski mjerni instrumenti, ali se koJe prv1 deed obuhvaca 10% najlosijih, a 10. decil10% najboljih rezul-
tata. P
eesce termin upotreblj ava za posebno konstruirane instrumente kojima
se obicno ispituju stavovi.
,
Skalama se nazivaju i oni dijelovi razliCitih I
'
uredaja, strojeva i instrumenata s pomocu kojih se prati njihov rad, tijck '
'
'

tehnoloskog procesa iii promjene u pojavi koje registrira instrument ( > i


I

skala mjerenja ). K
t
I
' f
skala centila (percentila) Spada medu skale baZdarenja, a sluZi za inter-
pretaciju i usporedivanje rezultata. Pokazuje u kojem se postotku medu Centili obuhva~aju redom po
\
I 1% rezultata neke skupine mje-
svim rezultatima neki konkretni rczultat nalazi: 1. ccntil obuhvaca 1% .'
' renja, pa stoga ni u kojoj ne-
najslabijih rezultata, 2. centil 1% iduCih najslabijih rezultata, itd; 100. I .kvadratifnoj distribuciji, dakle
centil obuhvaca 1% najboljih rezultata. Prednost skale centila pred os- niti u normalnoj distribuciji, ne
talim skalama,.kaje sluze za iste svrhe (npr. > z-vrijednosti, > T- skala, > I predstavljaju "e.kvidistantne"
'
jedinice te stoga nije dopu~teno
Hullova skala itd.) nor-
~
izra~unavanje npr. "prosje~­
maln T b em riblizno normalnu raspodjelu (sto zahtijevaju sve skale nog" ccntila.
'

I'
J,
I
-- ----~--,....... ----....... -
. . -. - . -

'
I
I SKALE BAZDARENJA, IN'IERPRETACIJE I ... 173
172 SKALA DECIIA
I
skala decila Spada medu skate bazdarenja, a sluzi za interpretaciju i I rang ova, kao i razlika izmedu 1. i 6. ranga ), ali stvame razlike medu re-
usporedivanje rezultata. To je zapravo 10 puta "grublja" skala od > ska- 'I• zultatima mogu biti potpuno drugacije: drugi trkac na cilju jedne trke

~- '
/e centila, tj. ona dijeli rezultate u sk:upine od po 10% (umjesto 1% ). Ako maze biti nekoliko centimetara iza prvoga, a treCi maze biti nekoliko de-
neki rezultat padne u prvidecil, znaci da spada medu 10% najslabijih re- setaka metara iza drugoga, no razlika u rangu izmedu prvog i drugog i
zultata, a najbolji rezultati padaju u 10. decil. U prakticne svrhe (npr. drugog i treceg jednaka je: iznosi 1 rang. .-
kod kategorizacije kandidata na nekom selekcijskom postupku) cesto je
Neprikladnost skate rangova maze se prilicno ublaziti ako uzme-
dovoljno rezultate dobivene na nekim testovima podijeliti u 10 katego-
• mo nekoliko skala rangova, pa izracunavamo njihov prosjek (iii zbroj):
rija, a to se postize skalom decila. No zbog istih nedostataka koje ima i •
'•
na primjer, ako je skupina ispitanika testirana uz pomoc 3 testa, pa ako ••
skala centila (tj. zbog toga sto se decilni rezultati ne smiju zbrajati niti od ispitanike rangiramo u svakom testu, i uk:upni rezultat svakog ispitanika

1
njih traziti neki prosjek), u selektivnim postupcima mnogo se cesce izrazimo sumom njegovih rangova, taj ee nam zbroj dati znatno realniji
upotrebljavaju skale, osnovane na standardnoj devijaciji, kao npr. > z- ukupni rang ispitanika nego da smo jednostavno zbrojili > bruto rezu/-
vrijednosti i druge skale (> skale bazdarenja, interpretacije i usporediva- tate svakog ispitanika, pa da smo prema tome zbroju rangirali ispitanike.
nja rezultata) (vidi sliku uz > skala centila ). P VeCi broj provedenih (vlastitih) provjera pokazao je da je slaganje
izmedu ranga dobivenog zbrajanjem rangova i ranga dobivenog najis-
skala, intervalna > intervalna skala pravnijim postupkom (tj. pretvaranjem bru.to rezultata u z-vrijednosti)
'l'
vrlo visoko, tj. rang-korelacija rho je preko 0,95, cak i do 0,99. P
skala mjerenja Skala mjerenja determinirana je svojstvima brojcanog
sustava koja odreduju pravila pridjeljivanja brojeva pojavama (> mjere-
I skala standarda (standardna skala) > z-vrijednosti
nje u psihologiji). Ta pravila jesu: utvrdivanje identiteta (> nominalna
skala), utvrdivanje reda (> ordinalna skala), utvrdivanje razlika (> in-
telvalna skala) i utvrdivanje omjera (> omjema skala). Ovimje pravili- skale bazdarenja, interpretacije i usporedivanja rezultata Vrlo cesto
ma ujedno odredena i razina mjerenja koja je definirana dopustivim I
moramo interpretirati rezultat nekog ispitanika (tj. ocijeniti koliko taj

> transformacijama koje skalu ostavljaju invarijantnom. DrugaCije '' rezultat u usporedbi s drugim rezultatima "vrijedi"), iii usporedivati re-
!
reeeno, skalu definira mogucnost manipuliranja brojcanim vrijednosti- zultate istog ispitanika u razlicitim testovima, ili pak izracunati ukupni
ma koje nece promijeniti empirijske informacije dobivene transponira- uspjeh razliCitih ispitanika u nekoliko > prediktorskih varijabli. Za tu
njem mjerenih pojava u vrijednost skate. K svrhu upotrebljavaju se razlicite skale bazdarenja nekog testa, sportske
\
• discipline ili sl. Tako se npr. svaki pojedinacni rezultat maze izraziti >
skala, nominalna > nominalna ska/a centilom (ili > deci/om ), u koji on spada, ali se najbolje metode sastoje u
I
I tome da se svaki rezultat izrazi u terminima odstupanja od prosjeka, da-
I
skala, omjerna > omjema skala I
I kle u terminima standardne devijacije. U tom podrucju najpoznatije su
I > z-vrijednosti (standardne vrijednosti), kao i drugc skale koje se osniva-
skala rangova Skala dobivena na temelju rangiranja rezultata. Ako re- I
zultate odredcnog broja predmeta, osoba i sl. rangiramo, dobivamo do- l' ju na standardnoj devijaciji (> C-ska/a, > T-skala, > sigma-skala, > Hu-
sta "primitivnu" skalu u kojoj su razlike medu jedinicama skate samo I /lova skala). Ove skate ne treba brkati sa> skalama mjerenja, iako obje
\ skupine skala cesto nose isti naziv. P
formalno ekvidistantne (npr. razlika izmedu 5. i 10. ranga iznosi 5 I

\
I
' SLUCAJNA V ARIJABLA 175
SKEWNESS '
174
skup rezultata Svaka skupina rezultata nekog opazanja ili mjerenja (sto
skewness (engl.) Stupanj u kojemu krivulja _distribuc~je o~~tup~ o~ podrazumijeva da su svi rezultati te skupine dobiveni u istim ili Larem
(potpune) simetricnosti. U nas se ~p~tre~ljava tzraz > s1metncna d!stn-
prihvatljivo jednakim uvjetima mjerenja i1i opazanja). Skupinu rezulta-
bucija, odnosno > asimetricna d1stnbucqa. K ta nazvat cemo skupom rezultata u svim onim slucajevima u kojima ne
skraceni postupci U statistici to su postupci koji obicno u vecoj mj~ri mozemo dokazati i pokazati da su dobiveni r.a uzorku. Mozemo to reCi i
skracuju tacunanje, koje bi inace, s obicnom radnom f~r~ulom, btlo ovako: svaki uzorak je skup, ali svaki skup nije uzorak. K
'
'
I

duze i zamornije. Takvo skraCivanje obicno ne dovodt m do kakve I

'ke od "normalnog" postupka ili je razlika prihvatljivo mala. Jcdan ! slozena analiza varijance (SANVA) Statisticki postupak koji pred-
razl I . . · vk
I

od najpoznatijih skraeenih postupaka je izracunavan~.e ar~:metlc e_ sr~- I stavlja ekstenziju > jednostavne analize varijance, koji se upotrebljava
dine i standardne devijacije "po skracenom postupku , pn cemu se md~­ I •
kad se u istrazivanju koristi vise od jedne nezavisne varijable. Glavni do-
vidualni rezultati skupljaju u manji ili veCi broj "razreda", pa se vonda ~z bitak takve statisticke analize je tzv. > interakcija. Postoje vrlo razliciti
tako grupiranih rezultata po posebnoj form~~i ~~ skrac~n-~ r~cu~anJ~ '
•'
modeli primjene ovog statistickog postupka pa se stoga za svaki poje-
''
izracuna aritmeticka sredina i standardna devtJaCtJa. Statts~tcan su ~~~~ '' dinacni slucaj treba konzultirati specifiena literatura, kao sto je primje-
sljali ~kracene postupke raeuna uglavno~ zbog t~ga da d~tsta olakSa~u ~ rice knjiga B.J.Winer, Statistical principles in experimental1.esign, New
ubrzaju statisticka izracunavanja, a time 1 smanJe mogucnost pogreske York, McGraw-Hill book comp, 1962. K
Cija jc vjcrojatnust to vcca sto racun duzc trajc. Danas kad s~ ra~una ug-
'
\

lavnom racunalima, takvi se postupci vrlo rijetko upotreblpvaJU. slucaj Ishod u nekom sustavu koji ovisi vjerojatno o brojnim, nama
Logika skracenog postupka sastoji se u tom~ ~a se o?rc_di ncka '
ncpoznatim uzrocima, koji su obicno izvan tog sustava. Najjednostavniji
provizorna vrijednost, pa se ond~ ta vrije_dnost kon~~~a nekim tzrazom ;'
primjer djelovanja slucaja je > binomna distribucija, npr. rezultat baca-
koji zahtijeva manje racuna da bt se dobtla prava vrtJedno~t.. v • nja novcica, kod kojegje vjerojatnost da padne "glava" jednaka vjerojat-
No i danas se upotrebljavaju skraceni postupc~ u v_eC!m slucaJeva nosti da padne "pismo". Svakako postoje razlozi da je novcic pao na
kada racun zahtijeva odredivanje razlika (npr. razhka ~zme~u svakog ( "glavu" ili "pismo", ali oni su nam nepoznati, ajednaka "sansa" za "gla-
pojedinog rezultata i aritmeticke sredine )._ T~ko se za :acunanJe >stan- '
'
I vu" i "pismo" pokazuje dati faktori nisu sistematski, tj. da ne djeluju u
I
dardne devijacije s pomocu racunala konstl formula. jednom smjeru, vee "po slucaju" u razlicitim smjerovima. Tako slucaj
- npr. djeluje na rasprsenje pogodaka puske oko samog centra cilja. P
I

~ slucajna varijabla Takva varijabla kod koje se konkretan rezultat ne


s= , i
N-1 I moze predvidjeti sa sigurnoscu, ali sve moguee vrijednosti (vrijednosti
I
u kojoj se umjesto razlika izmedu svakog poje~inog v~:zultata ~ arit- ! koje postoje u nekoj varijabli) mogu biti specificirane unaprijed, a pri
meticke sredine koriste kvadrirani bruto rezultatl.XZ, ClJI se zbroJ onda \ razlicitim i1i ponovljenim opazanjima iii mjerenjima varijable moguce je
dobiti razlicite ishode. Vjerojatnost pojavljivanja nekog odredenog re-
zultata pokazuje vjerojatnost opazanja tog rezultata. Tako, primjerice,
kongua s pomocu tzraza N '
• • • v
'
I kod varijable "bacanje kovanog novcica" svi moguCi ishodi su "glava" i
tata podijeljen brojem rezultata. Slican postupak konstl se 1 u racunu I "pismo". Kod nekog konkrctnog bacanja novcica ("mjerenja" ili
I

koeficijenta korelacije r. P,K


I.
'
,~

'
176 SLUCAJNA V ARIJABLA "SNAGA" TESTA 177
"opazanja" te varijable) ne maze se znati tocan ishod (s potpunom sigu- preostalih elemenata da budu izvuceni postaje postupno sve veca (ier u
rnoscu) nego samo njegova vjerojatnost, koja u ovom slucaju iznosi 0,5 bubnju preostaje sve manje elemenata ). Tab lie~ slucajnih brojeva
(iii 50%) za svaki od ishoda. No, pri velikom broju "opazanja" ili "mje- najvise sc koriste kod biranja slucajnog uzorka iz brojcano relativno
renja" broj ishoda svake od vrijednosti varijable (u ovom slucaju "pi- ogranicenih populacija (npr. izvlaeenje slucajnog uzorka ucenika neke
smo" i "glava") priblizava se svojoj vjerojatnosti iii, tocnije receno, skole, radnika neke tvornice), a radi se taka da se iz tablice citaju sku-
vjerojatnost je odredena na osnovi relativnog broja ishoda svake vrijed- pines onoliko znamenaka od koliko se sastoji i populacija (npr. ako je
nosti varijable pri dugotrajnom ili beskonacnom ponavljanju opazanja veliCina populacije N = 3800, onda se iz tab lice citaju po eetiri broja, pa
ili mjerenja varijable. Ukupan zbroj vjerojatnosti ishoda svih vrijednosti se izaberu oni clanovi populacije koji na listi populacije nose te brojeve;
kod slucajne varijable mora iznositi 1. K brojevi koji ne postoje, preskacu se, a takoder se preskace rezultat kojije
vee izvucen). Kod veoma velikih, a pogotovo kod "neizmjernih" popula-
slucajni uzorak Uzorak u kojem svaki clan populacije ima jednaku cija upotreba tablice slucajnih brojeva prakticki ne dolazi u obzir pa se
sansu da bude izabran u uzorak i izbor jednog clana ne smije utjecati ni onda sluzimo drugim vrstama uzoraka, koje posve uspjesno zamjenjuju
na koji nacin na izbor bilo kojeg drugog clana. Slucajni uzorak najbolje · slucajni uzorak. Jedan od njihje > sistematski uzorak, kod kojeg se u uzo-
reprezentira populaciju, uz uvjet daje dovoljno velikjer, ako se popula- rak uzima svaki n-ti clan populacije. P
cija sastoji od nekoliko "slojeva" ("stratmna"), veliki slueajni uzorci po-
I
sve ce dobro reproducirati i postotne odnose medu tim slojevima. (Aka •

~'.S.nl!:Ja,~~~'ta Vjerojatnost odbacivanja .~ul~hipoteze, ako je ta hipoteza
slucajni uzorak zbog nekih razloga ne maze biti dovoljno velik, onda se \ "zaiS.:! :;P.~~~~s~a. Dakle, to j~_:¥P~sob~o~~.~e_~g &tatistickog testa da ot-'
upotrebljava > stratificirani uzorak, kod kojeg namjerno stavljamo po- t krije~ilekU bwiku izm'edu.dvije populacije;' ako ta razlika doista
treban postotak u svaki "sloj", no unutar "sloja" izbor pojedinaca opet je Receno statistickim rjecnikom, snaga testa ocituje se u vjerojatnosti
slucajan.) Normalna raspodjela dobiveila je na slucajnim uzorcima, a izbjegavanja pogreske tipa 2 (> pogreika tipa 1 i tipa 2). U cjelini gleda-
. ,.. ,... .

buduci da se logika statistickog zakljucivanja gotovo u cijelosti osniva na no, {~~~g~; neparametrijskih testJva manja je od snage parametrijskih,Jl
karakteristikama normalne raspodjele, slucaj'ni uzorakje jedan od "ka- iako kod nekih testova (npr. > Friedmarwv test) gotovo da i nema razli-
mena temeljaca" kako > deskriptivne, taka i > inferencija/ne statistike. ke, a u nekim posebnim situacijama snaga neparametrijskih testova
Dakako, pojam "slucajni" ne znaci "bilo kako" izabran uzorak, nego maze biti i veca nego kod parametrijskih: buduCi da parametrijski testa- •

uzorak biran po strogim principima, tj. sukladno njegovoj definiciji. vi uzimaju u obzir i velicinu odstupanja pojedinog rezultata od prosjeka,
Prakticno, postoje dva nacina dobrog izbora slucajnog uzorka, ito: (a) maze se dogoditi da nekoliko ekstremno aberantnih rezultata toliko
upotreba > tab/ice s/ucajnih brojeva ili slucajni brojevi generirani s po- povecaju standardnu pogresku aritmeticke sredine da npr. t-test pokaze '
mocu racunala i (b) izvlaeenje iz "bubnja" (ili slii~an postupak koji da razlika izmedu dvije aritmeticke sredine nije statisticki znacajna. No
mozemo vidjeti prilikom izvlacenja brojeva tombole, Iota itd.) i u tom ako su ti aberantni rezultati u istom smjeru (tj. oni povecavaju razliku
slucaju svaki zeton ili kuglica u bubnju mora predstavljati jednu osobu tj. izmedu obje skupine ), onda ce se neki neparametrijski test (koji ne vodi
jednog clana populacije. No tablica slucajnih brojeva svakako je najbolji racuna o velicini odstupanja) mazda pokazati korisnijim jer ee on hiti
postupak,jer on u cijelosti oponasa "idealno" izvlacenje slucajnog uzor- sposobniji da odbaci nul-hipotczu, ako je ona ustvari pogrcsna. Na
ka, tj. izvlacenje > uzorka "uz povrat" (gdje se svaki izvuceni rezultat primjer, kada bi neka terapijska metoda gotovo kod svih bolesnika do-
vraca natrag u populaciju), dok kod izvlacenja "iz bubnja" sansa vodila do neke pozeljne posljedice, a kod nekih bi ta reakcija bila veoma
• I
. ;•

'
'
!
178 SNAGATESTA SREDNJA VRIJEDNOST RAZREDA 179
jako._ izra.Zena, bilo bi logicno zakljuCiti da je terapija u c}.eli~i uspjesna - centralna vrijednost) i1i cestine pojavljivanja (kao sto je to > dominantna
iako ·bi zbog tih veoma aberantnih rezultata parametrt)Ski test mogao vrijednost). K
"zakazati", tj. ne odbaciti nul-hipotezu. P
sredisnjn vrijednost poloznjn > Sredi.~nja vrijednost koja se odrcduje na
Snedecorove F-tablice Analogno > t-tablicama, Snedecorove tablice temelju polozaja rezultata u skupu rezultata, a ne na temelju brojcane
pokazuju > granicne vrijednosti > F-omjera, kako bismo mogli zakljuCiti vrijednosti rezultata. Tipicna takva sredisnja vrijednost je > centralna
razlikuju li sc dvijc varijance statisticki znacajno. P vrijednost. K
' . .
Spearman-Brownova formula Formula koja omogucuje p~ocje~~. > .:::=~ srednja vrijednost razreda Aritmeticka sredina i~medu gornje i donj ~
pouzdanosti testa koji je produzen ili skracen, a poznata mu J:~eh~ma granice > razred__a . •Rezultati grupirani u razrede gube svoju "individu-

pouzdanosti samo poeetnog oblika; npr. test odredene duzme 1m~~

alnu" vriier:JnQ§t i p_Q rima· u vrij,~dnost..sre,dnj,e yrij_ednosti razreda. N a


pouzdanost '" == 0,8, a nakon produzenja test je, recimo, dva puta du.zi primjer, pri izracunavanju aritmeticke sredine za rezultate koji spadaju
(tj. produzenje zajos toliko koliko dugje bio test p~zna~e.pouzdanosti). urazred 10-14 (dakle razred s intervalom5), smatramo da sada svi imaju
Prcma Spcarman-Brownovoj formuli u ovom hi s.l~ca.Ju pouzd~nost
vriJC · nost 12, tJ. - Ako se provodi statisticki racun na grupira-
ukupnog testa hila 0,89. Dodani dio testa mora hit~ ko~p~~~bila~ s 2
pocetnim dijelom po aritmetickoj sredini, standardnoJ .deVIJaCIJI, .obl~~ nim rezultatima, onda se u racun uzima ta vrijednost (srednja vrijcdnost
distribucij<.: i, sto j<.: samo po scbi razumljivo, po sadrZaJU: A_ko OVI U~JCh razreda) onoliko puta kolika je frekvencija rezultata u tom razredu.
nisu ispunjeni, procjena pouzdanosti ukupnog testa bit ce pogresna. Ovd'e se olazi od ret ostavke da se unutar svak9g razreda rezultati
Opcenito, formula ima ovaj oblik: normalno distribuiraju Lda je sr_e_dnja~vrijedno~ I).jLhov na'bori re re-
••
nr11 , zentant, pa je zato i QQgreska ko'o' se ri tome izl a l
r ---~'-:--
sB - 1 +(n-1)ru, veCinom zane · sim_$1-ko osto 'i velika ne ravilnost u op.coj _dis-

trib ciji rezultaJ.<t.~npr. ako je distribucija izrazito asimetricna ). Ako je


gdjc n znaci bilo koji faktor produzenja testa, a r,, znaCi pouzdanost
distribucija normalna, onda ce doista rezultati u svakom razredu
pocetnog dijela testa. K takoder imati distribuciju s laganom asimetrijom, tj. nesto malo veCim
Spearmanov test rang korelacije > rho koeficijent korelacije gomilanjem rezultata unutar svakog razreda prema veCim rezultatima
kod razreda koji su is pod aritmeticke sredine i nesto malo ve¢.im gomila-
sredisnja vrijednost Isto sto i > mjera centralne tend.~ncije. Sre~isnja ,.
njem rezultata prema manjim vrijednostima unutar razreda kod razreda
vrijednost pogodan je izraz zato sto je to up~a~O. ~na VTljednost ~~Ja po- I
'

koji su iznad aritmeticke sredine.
kazuje > pravu vrijednost mjerenja, a po defmtCIJI.~e mora n~lazttl u. sre-


I u nekim statistickim postupcima, kao sto je nn1"

d1ni distribucije rezultata koji su rezultantna VTIJednost djelovan~~ ~ lZ


. t 'h fiaktora i > nesistematski varijabilnih faktora. Sredisnp unutar svakog raz;e~.a rek_tangularn{l (prayokut~a ), da.
k onstan m · ·h
vrijednost moze biti izracunata na temelju brojcanih vrijednostl ~ re- I ulv 5 laprove . · interpolac~~ojaje potrebna u ·
zultata (kao sto je to > aritmeticka sredina) ili odre.~~~a na t:me~JU sre- -- emo sve UT~redu- _!.!il~lO~V~O~mg-~~}!·~o~m~~~-..
I nosti razreda.
disnjeg polozaja u nizu rezultata poredanih po vehcmt (kao sto Je to > i'

I

'

180 SREDNJA VRIJEDNOST RAZREDA STABLO VJEROJATNOSTI 181

Srednje vrijednosti razreda najcesce se koriste pri grafickom pri- vanje podataka koji su izrazeni u kvalitativnim klasama, tzv. brojenih
kazivanju distribucije frekvencija rezultata dobivenih mjerenjem iii podataka, zahtijeva uglavnom samo njihova jasno smje8tanje i prebroja-
opazanjem i predstavljaju uporisne tocke (obicno) na apscisi. P,K vanje u odgovarajucim kvalitativnim kategorijama. K
v
srednje kvadratno raspdenje Naziv za > standardnu devijaciju, jer se stabilnost statistickih vrijednosti Terminom stabilnost u statistiCi se
odreduje kvadriranjem razlika izmedu svakog pojedinog rezultata i oznacuje svojstvo nepromjenljivosti iii neosjetljivosti izracunatih sta-
aritmeticke sredine. K tistickih vrijednosti povecavanjem i1i smanjivanjem broja rezultata (N).
Sto je N veCi, veca je i stabilnost statistickih vrijednosti. Stabilnost sta-
======> srednje odstupanje Jedna od mjera varijabilnosti rezultata: prosjecna I tistickih vrijednosti ovisna je i o djelovanju > nesistematski varijabilnih
apsolutna veiicina odstupanja pojedinih rezultata od neke > srediJnje faktora: sto vise takvih faktora djeluje, potreban je i veci N i obrnuto, jc;r
vrijednosti, a najeesce od aritmeticke sredine. Buduci da zbroj svih pozi- nesistematski varijabilni faktori povecavaju rasprsenje rezultata. Mjera
tivnih i negativnih odstupanja od aritmeticke sredine daje kao rezultat stabilnosti je pogreska koja se veze uz svaku statisticku vrijednost: >
nulu, to se srednje odstupanje racuna tako da se zbroje sve apsolutne standardna pogreJka aritmeticke sredine, > standardna pogreJka koefi-
velicine odstupanja, i podijele brojem odstupanja: cijenta korelacije itd. K

. ds . IX-MI
srednJe o tupanJe = '---N--'
--...::....,.. stablo vjerojatnosti Jedan od jednostavnih i razumljivih grafickih pri-
kaza razlicitih ishoda pri prikazivanju > binomne distribucije (pa i nor-
gdje je saX oznacen svaki pojedini rezultat, saM aritmeticka sredina, a ~ maine distribucije). Najce-
:=-
saN broj rezultata.
'
I ~
g Moguti
sec sc; koristi kad jc; sansa
I
Srednje odstupanje bolja je mjera rasprsenja od > raspona, ali ~
ishodi 50%:50%, npr. pri bacanju
s 1
novcica. Na donjoj slici pri-
znatno slabija od > standardne devijacije, te se rijetko u statistickim
K 2
racunima koristi. P kazano je "stablo vjerojat-
s 3
nosti" za situaciju u kojoj
K 0 nas zanima vjerojatnost da
sredivanje podataka BuduCi da proces prikupljanja podataka (mjer- II s s s
enje iii opazanje) ne mora uvijek biti po redu koji pogoduje statistickoj cenekaobitelj, koja zeli Ce-
l obradi rezultata, sredivanje podataka u statistici znaci zapravo pri-
I K
K
s
®
(J) tvero djccc, dohiti 4 sina
premu pod ataka za daljnju statisticku obradu, njihova sredivanje prema K 8 (S = sin, K = kCi).
nekom redu: redanje po velicini, > grupiranje rezultata u razrede i tome s 9

I slicno. Sredivanje pcdataka omogucuje istrazivacu (koji ujedno obavlja l


K
K
s
@
@ "Stahlo vjerojatnosti" jedan je od
i statisticku ohradu pod ataka) dobar uvid u "ponasanje" rezultata, sto je
K 12 jednostavnih i razumljivih naCina
vrlo vazno za kasniju njihovu interpretaciju, alii za samu obradu. Suvre- s s @ prikazivanja vjerojatnosti pojcdi-
mena obrada rezultata suzila je sredivanje pod a taka na njihovu pripre- K 14 nih ishoda, naroCito u binomnim
distrihucijama, kada vjerojatnost
mu za unos u racunalo (pa se moze dogoditi da istrazivac uopce i ne vidi K s IS
I
svakog od 2 moguca ishoda iznosi
izmjerene podatke, vee samo statisticki dobivene vrijednosti). Sredi- i K 16
50% (0,5).

I
I
I
' I

I
'
I
II
r 182 STABLO VJEROJA1NOSTI
STANDARDNA DEVIJACIJA 183
Kao sto iz slike vidimo, vjerojatnost za sina iznosi 0,5 (kao i za
je aritmeticka sredina. _S, ... <lfdJ?.a devi'acija koristi se jedino uz aritme-
kcer). Ako je prvo dijete S, kod drugog djeteta opet postoji jednaka ''
I' !icku sredinu i ima jedino svoj smisao ako je distribucija rezultata barerp
vjerojatnost za S i K. Ako jc drugo dijete S, za trece dijete opet vrijcdi
priblizno noq nalna. U idealnom slucaju ( dakle, kod normalne distrib~­
isto pravilo, itd. Na slici se vidi da za cetvero djece postoji 16 moguCih is-
hoda, a samo jedan od svih 16 ishoda je S,S,S,S, dakle vjerojatnost je 1/16 cije), ako od aritmeticke sredine "zagrabimo" Iijevo i desno za jednu
iii P - 0,06, a to znaci dace se to u prosjeku dogoditi oko 6 puta na 100 standardnu devijaciju (M ± ls), obuhvatili smo oko 68% svih rezultata,
obitelji s cetvero djece. s M ± 2s obuhvacamo oko 95% svih rezultata, as M ± 3s obuhvatili
Iz stabla vjerojatnosti mozemo odcitati i svaku drugu zeljenu kom- smo gotovo sve rezultate, tj. 99,73% svih rezultata (vidi sliku uz na-
binaciju: na primjcr, kombinacijc 2S i 2K (ako rcdoslijcd nije vazan!) tuknicu > nonnalna distribucija). Doslovno sve rezultate ne mozemo
mogu se dogoditi prosjecno 6 puta od 16 slucajeva, dakle vjerojatnostje obuhvatiti niti s desetak iii vise standardnih devijacija Iijevo i desno od
p = 0,375, sto znaci gotovo 4 takva slucaja na 10 obitelji s cetvero djece. aritmeticke sredine, jer krivulja normalne distribucije dodiruje apscisu
No, ako nam je vazan redoslijed, onda iz stahl a vjerojatnosti vidimo da je tek u beskonacnosti (neizmjernosti), tj. krakovi krivulje asimptotski se
I za svaki od 6 moguCih redoslijeda vjerojatnost 1/16, dakle jednaka kao i priblizavaju apscisi. Drugim rijecima, i rezultat koji je udaljen od arit-
I vjerojatnost za sva 4 djeteta S ili sva 4 K (> zakoni vjerojatnosti). P meticke sredine za, recimo, 15 standardnih devijacija, maze se slucajno
dogoditi, ali vjerojatnost takvog ishoda je ekstremno malena. Ako dis-
standard Kritt1-ij ili uvjet kojemu mora biti udovoljeno, a koji se tribucija rezultata nije normalna, negp npr. izricito asimetricna .. stan-
propisujc za razlicitc situacije (npr. za prijam na neko radno mjesto, za dardna devijacija gubi svoj smisao ·er na jedno · stt ani krivulje vee sa, re-
uvrstavanje sportasa u reprezentaciju itd.). p cimo, 1s dolazimo do kraja, dok na drugoj strani rezultati se otefu i
znatno reko 3 iii 4 standardne devijacije.
} standardizacija Odredivanje i definiranje svih relevantnih situacijskih
Normalna distribucija (a onaje potpuno definirana aritmetickom
karakteristika (kriterija) nekog postupka ili mjerenja. Na primjer, test je
sredinom i standardnom devijacijom) predstavlja osnovnu Iogiku
standardiziran ako su propisani svi bitni uvjeti njegove primjene, kao sto
racuna vjerojatnosti, tj. povrsina normalne distribucije znaCi ujedno i
su upute ispitanicima, vremensko trajanje pojedinih zadataka, nacin ko- vjerojatnost. Primjer: vjerojatnost da cemo iz skupine rezultata koji
rigiranja rezultata, broj bodova za pojedina rjesenja, osnovne,norme do- daju normalnu distribuciju slucajno izvuci rezultat koji se nalazi u inter-
bivcnc > baidarenjem testa (aritmeticka sredina, standardna dcvijaci- valuM ± 1s iznosi 68%, vjerojatnost dace izvueeni rezultat biti veCi od
ja ), eventualno podjela bodova u decile iii centile, a u nekim testovima M ± 1s iznosi oko 16% itd.
(npr. nekim testovima licnosti) dane sui interpretacije pojedinih rezul- Izracunavanje standardne devijacije vrlo je jednostavno: po svom
tata u testu. Kad se kaze da je test primijenjcn u "standardnim uvjcti- smislu, standardna devijacija je drugi korijen iz prosjecnog kvadriranog
' ma", to znaci da su svi rezultati dobiveni ujednakim, tj. unaprijed propi- odstupanja rezultata od aritmeticke sredine (dakle, drugi korijen iz >
sanim uvjetima. ·P varijance), pa njezina formula glasi:

_ _:-~~~standardna devijacija (s) Statisticka mjcra koja pokazujc kako se s=


- ~ "gusto" rezultati nekog mjerenja gruplraJU oko aritmeticke sredine. To
'
je mtJ olJa mjera > rasprsenja rezultata, to jest pokazatelj koliko se re- gdje X oznacuje svaki pojedini rezultat u nekoj distribuciji rezultata, M
- ____
zultati u nckoj_,._,._
distribuciji rczulta! a razlikyju od rcfcrcnicnc t,i.)ckc, a to . aritmeticku srcdinu, a N broj rezultata. Zbog poscbnih razloga kod

I

'

----

'

184 STANDARDNA DEVIJACIJA STANDARDNA POGRESKA ARITMETICKE SREDINE 185

mnogih racuna, a narocito u > inferencijalnoj statistici, u nazivniku se ~~aJ!~a!dna .pogrdka ~ribri~tilb,.reiline Standardna devijacija distri-
N mijenja u > stupnjeve slobode, pa formula za s glasi: bucije aritmetickih sredina uzoraka iste velicine oko prave aritmeticke
_sredine, tj. oko aritmeticke sredine populaQij~Uzimamo li iz neke po-
ulaci ·e velik bro · slucajnih uzoraka iste veliCine, i izracunamo li aritme-
ticku sredinu sv~kog uzorka, 9obit temo velik broj aritmetickih sredin~
N-1 I
I - koje ce se distribuirati po . . s aritmetickom sredi-
~

No, redovito se pri izracunavanju standardne devijacije koristi formula •


i
koja polazi od bruto rezultata i ne zahtijeva odredivanje razlika izmedu I• aritmeticke sredine i koja se
svakog pojedinog rezultata i aritmeticke sredine (to je tzv. > skraceni ~
postupak za racunanje standardne devijacije): I
-~
I
I ~ S;'JI = .JN
'

L
gdje je sM standardna pogreska aritmeticke sredine, s standardna de-
s= vijacija uzorka i N broj rezultata u uzorku (velicina uzorka ).-Xa normal-
N-1 p.a_distribucija_yeliko_g !?~·a £1!itmetickih sredina bit ce, dakako, to sira
i
.Sto · zorakmanji a k uzorkavelicin~N ~1 ta distribucija bit ce jed~ .
gdje je X svaki pojedini rezultat, aN je broj rezultata. naka distribuciji opulacije (vidi sliku: simbol a oznaeuje standardnu
''•
Osim citavog niza prednosti sto ih standardna devijacija ima pred '
'
I devijaciju populacije, a aM znaCi standardnu pogresku aritmetickih sre-
nekim drugim mjerama raspdenja rezultata (npr. pred > rasponom, > ''
dina uzoraka razlicite velicine ).
poluinterkvartilnim rasprsenjem i dr.), njezina je prednost ito sto smanji- \
vanje ili povecavanje velicine uzorka ne djeluj~ sistematski na standar- I Oistn"bucija mdtvldualruh
'I vrijtdraost1 u pvpulaciji
dnu devijaciju,vec nna -uzmanja iii ~ca slncajna kolebaJ?:ia- ostaj.e pri- · I 0 ~ 10

bliZno j.e dnaka. P ~ I


'
Distribucr;u untm~titk ih trtdina
Ot.t = 10 u.zoraka vc/1Cine N ~ J

'
standardna pogreska Pogreska kojoj se izlaZemo kada iz neke vrijed- I· OM= 7,07
Di.stribu.cija arilmttitkih Jrtdina
uzoraktz vdilint N :::a 2
nosti dobivene mjerenjem na > uzorku, zakljucujemo o toj istoj vrijed- I
I
)

nosti (parametru) u > populaciji (npr. o pravoj aritmetickoj sredini, o a,., = S, 78 Dirtribucija aritmttit kih sredina
t uzorako vdil inr: N :c J
pravoj korelaciji ·.. ·p,_Q- ''
\


tzracuna-
v I •
O'M z:; S Distribucija aritmelilkih Jrtdin. a
uwraka vclitint N = 4

1j<
vanja standardnih pogresaka za razlicite statisticke vrijednosti uvijekje
aM 2,5 Di.stribucija aritmetitk.ih Jrcdin.a
jednaka, tj. zanima nas kako izgleda distribucija tih vrijednosti, ako I
:;::r
uzoraka vtUtint N = 16
I sredina oko prave
bismo iz populacije uzimali neizmjerno velik broj uzoraka iste velicine.
ticke sredine
Standardna pogreska naziva se i > pogreska uzorkovanja (> distribucija je uza §to je DiJtrib':'clja aritmttil kih sredino
O~o~ = 2
uzoraka vtl1lint N ::~:~: 25
uzoraka) P cano veci.

I
I
I
186 STANDARDNA POGRESKA ARITMETICKE SREDINE '
STANDARDNA POGRESKA KOEFICIJENTA KORELACIJE 187
. ..
. ' . . .. . . . ·~
I
I
BuduCi da dobivena vrijednost predstavlja po svom _smtslu sta,rt· . ' tata, i (b) za situaciju kada korelacija u populaciji iznosi +0 80 a·uzorci
dardnu devijacij~, to za nju wijede isti zakoni koji vrijede za standardnir su ta~oder vclicinc R parova. Kako viuimo, ako u populac:ji 1;ema ko-
,• devijadji.i: dko 68% svih aritmetickih sredina nalazi se u intervalu plus i
r~laCIJe, po slucaju bi se cak mogle dobiti i korelacije od -1 iii + 1. A kada
· minusjedna standardna pogreska oko aritmeticke sredine populacije,
b1 stv~r~a k~relacija u populaciji iznosila +0,80, uzorci velicine 8 parova
oko 95% aritmetickih sredina u intervalu plus i minus dvije standardne
mogh b1 dati korelacije od -0,20 pa do + 1,0.
pogreske itd. Iz toga dak!e zakljucujemo da neka, na uzorku dobivena,
aritmeticka sredina, uz 68%-tnu vjerojatnost ne odstupa od aritmeticke
srcuinc populacijc za vise ou jcunc stanuardnc pogrdkc, uz 95%-tnu
vjerojatnost za vise od dvije standardne pogreske itd. Dak!e, ako neka
aritmeticka sredina, dobivena na uzorku velicine 100, iznosi 80, a njezi- r = o.so........._,
na standardna devijacija 10, onda njezina standardna pogreska iznosi
101 ..JlOo = 1, pa iz toga zakljucujemo ovo: postoji oko 6H% vjerojat-
nosti da nasa aritmeticka sredina (veliCine 80) ne odstupa od arit-
meticke sredine populacije za vise od 1, dakle aritmcticka sredina popu-
lacijc mogla bi biti negdjc izmcdu 79 i Hl; postoji oko 9YY,J vjcrojatnosti

tla nal1cna vrijcdnost nc odstupa od prave aritmeticke srcdine za vise od 'f
dvije (tocnije: 1 ,96) standardne pogreske.' da~e aritmeticka sredi~a •

populacije mogla bi ?iti n~~dje iz~cdu 7X 182, 1td. To su tzv. ? f}mce


~ I

' · 1.0 ·O,H ·11,6 ·0,4 -0,2 11,11 +0,2 ·I 0,4 111,6 •·O,H • 1,0
JF()UZ4anosti nek~ antmehcke sredme. P ~ . . r;;
Distrib~.~ija kaeficij~.~ata ~arelacij.c r, dabivcna na vclikom broju uzoraka, ovisi 0 stvarnoj
standardna pogreska koeficijenta korelacije r Kao i svaka druga vn - l k~rclac•J• u papula~IJI kaa 1 o velicmi uzorka (tj. o broju parova). Na primjcr, ako korela-
CIJC ~e~u ~opui~CIJama ncma, a broj parova je 8, slucajna distribucija kr1eficijcnata ko-
nost dobivena mjerenjem na > uzorku, taka je i koeficijent korelacije I relaciJC Jc stmetncna, a u ostalim slucajevima on a je manje iii vise asiml' tricna. Kako iz
podlozan odredenoj pogresci ( > standardna pogreska ), kojoj se izla~~-­ slike vidimo, kada medu papulacijama ne bi pastajala nikakva karelacija, na taka mal am
mo kada iz dobivenih koeficijenata zakljucujemo na stanje u populacqi, uzorku mogli bismoslucajno dobiti cak i korelacije velicinc plus iii minus 1! Kod korelacijc
u populaciji od 0,80, na uzorcima vclicinc 8 mogla hi ~c slucajno naci cak i malanegativna
dak!e na pravi kocficijcnt korelacijc (> prava vrijednost mjerenja). No, korelacija, ali jednako taka i korclacija + 1.
kod standardne pogreske aritmeticke srcdine relativno jednostav~o
zakljucujcmo u kojim se granicama najvjerojatnije nalazi > _P_~ava anl-
meticka sredina populacije ( > granice pouzdanosti), kod koefiCIJenta k~­
Stoga veCinom koristimo tablice koje nam pokazuju koliko naj-
relacije taj je problem slozeniji jer se koeficijenti korelacijc velikog brop
manje mora iznositi visina neke korelacije, pa da bismo je- uz zadanu
uzoraka ne distribuiraju po normalnoj raspodjeli, vee je njihova raspod- velicinu uzorka - mogli smatrati > statisticki znacajnom na odredenoj
jela asimetricna ito razliCito asimetricna za svaku velicin~ koeficij~nta razini znacajnosti. Iz tablice granicnih vrijednosti koeficijenta korelacije
korelacije. Distribucija koeficijenata korelacije normalna!e. ~ samo ~ed­ r taka npr. mozemo odcitati da bi kod 6 stupnjeva slobode (broj parova,
nom slucaju: kad je korelacija u populaciji 0 (nula). ~-a shciJC to pn~a­ tj. broj ispitanika minus 2) koeficijent korelacije morao iznositi naj-
zano za dvije situacije: (a) za situaciju kada u populaciJl nema korelaCIJC, rnanje 0,707 (plus iii minus~ svejedno), da bi bio statisticki znacajan na
a uzorci na kojima je obavljeno mjerenje su velicine po 8 parova rezul- razini od 5% (tablica se nalazi u Dodatku D). P


'
I
188 STANDARDNAPOGRESKAPROGNOZE \ __________::.
STAND_~R!?.~_A POG_!{ESKA RA~~!ffi IZMED~:::.:..
·· _ __ l.B.~
I
standardna pogreska prognoze Pri > prognozi rezultata u jednoj vari- I da postoji 95% vjerojatnosti da se pravi postotak djece s jakim stupnjem

jabli na temelju poznavanja rezultata u drugoj varijabli i poznavanja I karijesa krece negdje izmedu 50 i 70% (0,6 plus i minus 2 x 0,049). Stan-
stupnja povczanosti medu varijahlama, pogreska kojoj jc takva progno- I dardna pogrdka proporcije moze biti vrlo korisna u prakticnom radu.
za izlozena izrazava se s pomocu > koeficijenta rezidualnog varijabili- Na primjer, pretpostavimo da se u nekom kraju u kojem zivi milijun sta-
teta, koji tada ima smisao pogreske i naziva se standardnom pogreskom novnika, pojavi opasna zarazna bolest koju valja odmah suzbiti protu-
prognoze. Ako se prognozira rezultat u Yvarijabli na temelju rezultata u mjerama. Zdravstvena ekipa poslana na teren, uzme uzorak (npr. >
X varijahli (koristcci > jednadzhu pravca regresije), onda sc pogrcska sistematski uzorak) od 500 !judi, i ustanovi daje 25% njih zarazeno. Pod
'
moze izracunati ovom formulom:
pretpostavkom da ekipa od troje !judi moze na dan poduzeti sve potre-
bne mjere za 1000 zarazcnih, koliko ekipa od po troje Ijudi treha smjesta
poslati na teren, ako zelimo zarazu zaustaviti? BuduCi da nadeni posto-
gdje je sy standardna devijacija u Yvarijabli, a rxy koeficijent korelacije. tak oboljelih nije pravi postotak cijele populacije, izracunamo i standar-
Pogre~ka prognoze omogucuje procjenu intervala u kojemu sc progno- dnu pogrcsku proporcije i dobijemo prakti~ki 0,02, dakle 2 posto. Ako
zirani rezultat nalazi s odredenom (odabranom) sigurnoscu ili rizikom zclimo prcdvidjcti najgorn mogucnost, uzct ccmo 99,7%-tnc granicc
(> intervalna procjena). K pouzdanosti, tj. dodamo nadenoj vrijednosti 3 standardne pogreske, pa
dobijemo da je mazda zarazeno cak 31% !judi (25% + 3 X 2% ), dakle
.standardna pogreska
.
proporcije Pogreska kojoj se izlazemo kada iz
oko 310.000 njih. To hi znacilo da bi oko 310 ckipa od po trojc ljudi mo-
neke proporcije, dobivene na uzorku, zaklju~ujemo na proporciju u
glo u jednom danu izvrsiti sanaciju svih oboljelih.

populaciji. K.ao i sve vrste standardnih pogresaka, i standardna pogreska l
poporcije nije nista drugo nego standardna devijacij_a v~likog broja pro- I Kada su uzorci relativno mali, ili jep vrlo nizak ili vrlo visok, dis-
porcija dobivenih iz uzoraka, oko rave propo.rc~~p.o.pulac!ie. Ako.je I tribucija uzoraka populacije nije vise simetricna, pa se u tom slucaju .
- uzorak dosta velik i ako proporci'a "e izricito niska n r. is od 0 10) I
• • ' t

koriste > nomogrami, iz ~-ih od~itavamo 95 ili 22%-tn~ granic~


- iii visoka (iznad 0,90), distribucija proporcija priblizpo je n.o.n_n.aln~
I
I
-
p.ouzdanostt neke ro orci ·e· npr. ako proporcija neke karakteristike u
'
distribucija pa standardnu pogresku proporcije mozemo izracunati I uzorku veliCine 20 iznosi 0,2, 95%-tne granice pouzdanosti su od oko
- -
formulom: 0,05 do oko 0,45 (dakle raspon nije simetrican oko dobivene proporcije)
(nomograme za granice pouzdanosti proporcija vidi uz natuknicu >no-
p·q mogram). P
sp =
N
pri eemu p = proporcija u kojoj se svojstvo javilo, q = 1- p,
,. dakle pro- standardna pogreska razlike izmedu dva r koeficijenta korelacije Lo-
porcija u kojoj se svojstvo ni'e o ·avila a N _uku an broj_slu&ait<Ya
gika testiranja statisticke znacajnosti razlike izmedu dva koeficijenta
(veliCina uzorka . Npr. ako u slucajnom uzorku od 100 djece nademo da
r-korelacije (Pearsonov r) jednaka je logici ostalih testova provjeravanja
ih 60 ima jace izrazeni karijes (p = 0,60), onda je standardna pogreska
statistickih znacajnosti razlike, tj. svodi se na > t-test, a to je razlomak
0 60 0 40
proporcije = • ' • = .Jo,0024 = 0,049 (dakle gotovo 5%). Pri- koji pokazuje koliko je puta neka razlika veca od svoje vlastite pogreske.
100 .
No prethodno valja koeficijente r pretvoriti u > Fisherove z, vrijednosti.
mijenimo li poznate zakone > granica pouzdanosti, mozemo zakljuciti

I

I / )

l STANDARDNA POGRESKA RAZI IKE IZMEDU ... 191


I 190 ST ANDARDNA POGRESKA RAZLIKE IZMEDU ...
' i >vgrani~e pouzda~osti), pa zakljucujemo ovo:_oko 68% je vjerojatno da
Uz pomoc formule 1 nade se standardna pogreska svake z, vrijed- nasa dobtven~ razhka ne odstupa odprave razlike za vise od jedne stan-
N-3 _9ardne o reske oko~% je vjerojatno dane odstupa vise od dvije stan-
nosti, pa se to uvrsti u poznatu formulu za standardne pogreske razlike,
dar~~e pogre~ke,. itd. Pakle, alro u neK:om tsrrazivanju (na uzorcima)
u kojoj sc.; pod drugim korijcnom sumiraju kvadriranc standardnc po-
d?biJemo razhku Izmedu dvije aritmeticke sredine koja iznosi 10, a nje-
greske obiju z, vrijednosti (> standardna pogrdka razlike izmedu dvije
• zm~ standardna pog~es~a iznosi l;'onda to znaci ovo: oko 68% smo sig-
aritmeticke sredine). Taka dobivena standardna pogreska uvrsti se u t- ''
urm da se prava razhka Jzmeduobje aritmeticke sredine krece u inter-
tcst, tj. razlika izmedu obje z, vrijednosti podijcli se tom standardnom vatu 9 -. 11, 95% smo sigurni da se ana krece u intervalu 8- 12, itd. No
pogreskom. Rezultat se interpretira u skladu s poznatim pravilom: ako k~d~. ~~ standardna pogreska te razlike bila 5, onda bismo morali za-
'- je dobiveni t veCi od 1,96, mozemo smatrati da se oba koeficijenta ko- klJU~tti da se ~z 9~% vjerojatnosti prava razlika izmedu obje aritmeticke
relacije medusobno statistick.i znacajno razlikuju (u ovom slucaju na ra- sredme nalazt u mtervalu od minus 5 do plus 20 (10 . . 10 1
1 965) t v· minUS, I p US
zini znacajnosti od 5% ili manjoj). P :. 'a o znact da mo.zda razlika uopce ne postoji. (Vidi daljnju disku-
st~u o ~om~ pod.> ?'amce pouzdanosti i statisticki znacajno ). Ovaj nacin
standardna pogreska razlike izmedu dviju aritmetickih sredina Stan- rc:~mranJa.kor~stt se pojmom > granice pouzdanosti, a postoji i drugi
dardna devijacija distribuci'e razlika medu aritmetickim sredinama nacm.rezomranJa, mnogo poznatiji u statistici, a taj se koristi pojmom >
_y_wraka, oko prave razlike medu populacijama. Uztmamo 1 tz vije nul-hzpoteze.
I
populacije velik broj uzoraka iz svake o ulacijc uzorke iste veliCine , . .-:ko .su uz~r~i zavisni, kao sto je to npr. cest slucaj kada istu skupi-
uvijck ccmo uobiti ncku razliku mcdu aritmctickim sredinama tih uzo- I nu tspttamka mJenmo u d~a navr~ta (prije i nakon primjene nekog pos-
I
raka, ate ce se razlike distribuirati o normalnoj raspodjeli · ·e ari t- I tup~a), standa~?na pogres~.a razhke se smanjuje, dakle u formuli se pod
meticka sredina prava razlika medu o ulaci' e. \ konJeno~ odbt~a odredem 1zraz, tj. dvostruka korelacija izmedu prvog i
Standardna devijacija te raspodjele razlika naziva se standardna pogrc- drug~g mJerenJa, pomnozena s obje standardne pogreske, te formula

~ka razlikc, ~ajlli~ ~~~~~~~~i2~9£1il£W!Yk~------ I


4
tada tzgleda ovako:
I•
'

gdjc je s M,-M, standardna pogrcska razlikc, a s M, i s M, su pripadnc > I g~je sus M isM, standardne pogreske proporcija, a rkoeficijentkorela-
1
standardne pogrdke aritmetickih sredina. Standardna pogrcska arit- I
CIJe. Ako su zavisni uzorci mali, mnogo jednostavnije je upotrijebiti >
s
JN' pa sc zato gore navedena
meticke sredine racuna se po formuli metodu diferencije. P

formula moze pisati i ovako: ~ta~dardna pogreska razlike izmedu dviju proporcija Pogreska kojoj se
Izlazemo ~ada iz neke razlike medu prQ.l!Orcijama zakljuCujema. na
s M 1 -M 1 = ''
pra"v'U raz~tku medu ro orci'ama o ulacija. Racuna se po istom prin-
\ ct.pu k~o 1 > standardna pogreska razlike izmedu dviju aritmetickih sre-
BuduCi da dobivena vrijednost po svom smislu predstavlja stan- dma, t]. pogreska je drugi korijen iz sume kvadriranih standardnih po-
dardnu devijaciju, to za nju vrijede isti zakoni kao i za standardnu devija- gresaka proporcija:
I
ciju (vidi o tome diskusiju pod > standardna pogreska aritmeticke sredine


STANDARDNA POGRESKA RAZUKE IZMEBU ...
' STATISTICKA JEDINICA 193
192
vijaciji (iii varijanci) populacije i standardnom devijacijom koja se na-
-
S p,-p, -
2
S plq, +
2
S plqz
ziva. standardna pogreska standardne devijacije, i racuna se po formuli:
'

s
gdje su Sptq pripadne standardne pogreske proporcije.
s • = .fiN

t-odnosa ustanovtmo
• •
gdje je s standardna devijacija uzorka, aN veliCina uzorka.
voje su uzorc1 a u uzorctma . . Medutim, ako su uzorci relativno mali, distribucija standardne de-
zak ili visok (> standardna pogreska proporcije), mozemo sma!~att, d.a JC vijacije i varijance hila bi asimetricna, pa standardnu pogresku nema
razlika > statisticki znacajna na > razini znacajnosti P < 0,05, ako JC do- smisla racunati (jer standardna pogreska- kao i standardna devijacija-
I
biveni t yeCi ool.9"6.' 0 ne . . . ari.., buduci da distribucija p to vise '
'
I
I
pretpostavlja normalnu raspodjelu). Stoga se ovdje racunaju samo >
od normalne raspodjele sto je uzorak ·· i sto granice pouzdanosti, a one se odreduju nesto kompleksnijim postup-
_ nrPr ll,1 =.k~.w.
kom. Taj se postupak osniva na hi-kvadrat distribuciji. P
_ bud~! bart!m 3 (umjcsto 1,96). Nazalost, medu statis~icarima .nema P?t-
punog slaganja u tome kako velik mora biti uzorak, 1 kakav mora bttt p, L
standardne vrijednosti > z-vrijednosti
pa da bi se mogla pretpostaviti normalna raspodjela (npr. neki kafu ~~ I

Np ili Nq moraju biti veci od 10, a neki da ukupni izraz Npq mora bttl stanine > C-skala
barem 9).
Ako su uzorci zavisni (npr. ista skupina ispitanika u dva navrata), statisticka jedinica Pri mjerenju iii opazanju jcdne :¥elicine (osobine,
postupakje metodoloski identican testiranju znacajnosti razlike izmed_u svojstva, pojave, atributa) .na razlicitim elementima; (indiyidl.!.umima)=
zavisnih aritmetickih sredina; standardna pogreska time postaje manJa potrebnaje jasna ijednoznacna definicija tih elemenata koji se onda na-
jer se pod korijenom odbija dvostruka korelacija, pomnozena jednom i ziVaju statistickim jedinicama. Primjerice, ako predmet mjerenj ~pre -
drugom standardnom pogreSkom: stavlja tjelesna visina djecaka starih 14 godina u Hr:vatsl<Ql, onda svaki
cetrnaestogodisnjak nrcdstavlja tatisticku jediniQ.l;l. a svc statisticke j_c-
dinice cine > populaciju (tzv. ogranicenu populaciju). Pri ponavljariju
mjerenja jedne veliCine na jednom elementu, statisticku jedinicu pred-
gdje sus p lq pripadne pogreske proporcije, a r koeficijent korelacije. P stavlja svako pojedino mjerenje definirano na odredeni (iasan, jedno-
znacan i precizan) nacin, a populaciju predstavlja neizmjerno velik broj
standardna pogreska standardne devijacije Standardna devijacija niza _p
mjerenja (tzv. neogranicenu populaciju). psihologijskim mje~enjim q i,
standardnih devijacija (i varijanci), dobivenih iz mnostva uzoraka iste ~pazanjima najcesce statisticke jedinice su osobe (individuumi, koji se
velicine, uzetih iz iste populacije, a koje se rasprsuju oko prave standar- tada nazivaju ispitanicima), ali to mogu biti, primjerice, citave skole ili
dne devijacije (ili varijance). Ako bismo izjedne populacije opetovano §.licne ins.tituci' e n~ke dobra definirane sku pine !judi itd. Primjer stati-
vadili velik broj velikih uzoraka (neki statisticari tvrde barem velicine sticke jedinicc pri mjerenju jedne osobine na jednom individuumu mozc
N = 100), i iz svakoga od njih racunali njihovu varijancu odnosno stan- biti mjerenje vremena jednostavne senzomotoricke rea:kcije: statisticka
dardnu devijaciju, dobili bismo priblizno normalnu distribuciju tih vrije- jedinica je operativna definicija mjerenja, au ovom slucaju to je vrijeme
dnosti, s aritmetickom sredinom koja odgovara pravoj standardnoj de- koje protekne od trenutka zadavanja podraiaja (treba navesti kakvog



i
194 STATISTICKA JEDINICA I
STATISTICKI 1ESTOVI 195
podrazaja: svjetlosnog, zvucnog i sl. kao i njegove fizikalne karakteristi- njihovih granica, solidno iskustvo u znanstvenom istrazivanju i oprez
ke, poput duljine elektromagnetskih valova upotrijebljenog svjetla, ras- prilikom interpretacije dobivenih rezultata.
pona intenziteta upotrijebljenih podrazaja, frekvencije zvucnih titraja i
I U psihologiji, za razliku od > klinicke metode, statisticki pristup je
sl.) do pocetka reakcijc ispitanika (treba navesti vrst reakcije: je 1i to po- ' takav pristup kojim se uz pomoe odgovarajuCih psihologijskih metoda i
dizanje kaziprsta s tipke strujnog prekidaca, je li to pomicanje cijele prikladnih statistickih postupaka utvrduju zajednicke i opee znacajke
ruke i sl.). K uze ili sire skupine individuuma. Ovaj pristup zanemaruje pojedinacne,
idiosinkraticne osobitosti pojedinaca ispitivane sku pine ljudi jer je orije-
statisticke distriblicije Postoji mnogo razliCitih distribucija rezultata. ntiran na otkrivanje same pojave (fenomena) koja je predmet istraziva-
Medu njima svakako su najpoznatije i najkorisnije > normalna distribu- nja. Statistickim pristupom otkrivaju se znacajke, recimo, apsolutne os-
!'
cija i > binomna distribucija. Ako se,_na primjer, radio vrlo rijetkim, a jetljivosti nekog osjetnog sustava i njezine ovisnosti o razlicitim faktori-
slucajnim pojavama, takve se pojave distribuiraju po tzv. > Poissonovoj ma; otkrivaju se karakteristike pameenja i cimbenika koji utjecu na pa-
distribuciji, nekc sc pojave distribuiraju po > negativno binomnoj distri- meenje. Istrazivaca pri tome ne zanima apsolutna osjetljivost neke
buciji, neke po > pravokutnoj distribuciji; vrijednosti malih uzoraka dis- odredene osobe i1i pameenje neke odredene osobe, vee samo njezin re-
tribuiraju se po > t-distribuciji. Nadalje, postoji > hi-kvadrat distribuci- zultat u mjerenju te osobine koji zajedno s ostalim rezultatima osoba u
ja, > F-distribucija, > distribucija r-koeficijenta korelacije, itd. P ispitivanoj skupini omogueuje otkrivanje karakteristika ispitivanog fe-
nomena. P,K

statisticki model > matematicki model P


statisticki simboli Znakovi koji se u statistici upotrebljavaju za razlicite
statisticki pristup Jedan od oblika znanstvenog pristupa mjerenim ili statisticke pojmove, ili za razlicite racunske operacije. Tako npr. znako-
-
opazenim podacima. Glavna muje znacajka postivanje pravila prilikom vi X, M, A.S. i dr. oznacavaju aritmeticku sredinu, znakovi s, cr, SD.
prikupljanja podataka i odabir onog statistickog postupka za obradu oznacavaju standardnu devijaciju, znak ,L znaCi zbroj, itd. Nazalost,
podataka koji je adckvatan problcmu koji nas zanima. Takav odgova- usprkos nastojanju pojedinih statisticara da se ujednace statisticki sim-
rajuCi pristup mazda se najcesee ocituje kod primjene jednog od inace boli, to se jos uvijek nije uspjelo provesti ne samo u radovima koji koriste
vrlo jcdnostavnih statistickih testova, tj. kod hi-kvadrat testa: vee prema statisticku obradu nego ni u udzbenicima statistike. A to predstavlja (na-
postavljenoj hipotezi koju zelimo provjeriti, ocekivane (teoretske) rocito za pocetnika!) znatnu barijeru u svladavanju statistickih postu-
frekvencije izracunavaju se na razlicite naCine, a ne posve mehanicki. U paka, jer se korisnik statistickih metoda "demoralizira" pred cinjenicom
"statisticki pristup" mozemo ukljuciti i takvo planiranje nekog istrazi- dane razumije sto mu neka formula "saopeava". No, kao sto je to slucaj s
. vanja ili nekog eksperimenta koje vee unaprijed vodi racuna o varijabil- razlicitim stranim jezicima, taka i razliciti statisticki simboli pred-

nosti nckc pojavc, pa pre rna tome plan ira i uzorak (iii uzorkc) i to kako stavljaju samo formalnu barijcru, jcr kada ih naucimo citati i razumjeti,
samu vrst uzorka (slucajni, stratificirani itd.), taka i pribliznu veliCinu teskoee nestaju. P
uzorka. Statisticki pristup ocituje se i u razumnom razlikovanju "stati-
sticke znacajnosti" nekog rezultata od stvarne, realne i prakticne znacaj- ~-~atisticki
"''•... .
.,_ .testovi
..
Uobicajeni naziv za one postupke u > inferencijalnoj
nosti toga istog rezultata. Ukratko, statisticki pristup zahtijeva ne samo statistici koji provjeravaju vjerojatnost da se neki dobiveni rezultat
formalno poznavanje glavnih statistickih postupaka vee i poznavanje dogodioslucajno, tj. da nije odraz stanja u populaciji. Tako npr. t-testom


STATISTICKI TESTOVI STATISTICKO TESTIRANJE HIPOTEZE 197
196
provjeravamo mozemo 1i neku razliku izmedu dvije aritmeticke sredine (b) Izraz "znacajno" dovodi do konfuzije zbog drugacijeg znacenja te
'
smatrati > statisticki znacajnom, hi-kvadrat testom provjeravamo I rijeci u svakodnevnom govom: kada npr. ka2;emo da je student A
I
odstupaju li nckc opazcnc frekvencije toliko od pod nekom hipotezom znacajno bolji od studenta B, onda to znaci da razlika medu njima nije
ocekivanih ferekvencija dane mozemo smatrati da se to slucajno dogo- 1,

mala, vee velika. I zato mnogi ljudi kada cuju da je npr. neka razlika
I
dilo, F-testom provjeravamo razlikuju 1i se dvije > varijance toliko da izmedu dvije aritmeticke sredine "statisticki znacajna" (a pogotovo
se ta razlika uglavnom ne moze pripisati slucaju, testom znacajnosti II kada cuju samo term in "znacajna") ili da je neka korelacija "statisticki
kodicijcnta korclacije prnvjcravamo hi 1i se takva korelacija mogla znacajna", to shvatc kao dajc razlika mcdu aritmctickim srcdinama vc-
slucajno pojaviti i onda aka medu populacijama nema nikakve pove-
lika, ili da je korelacija visoka. No, dakako, uopee se ne radi o tome ko-
zanosti itd. P
lika je neka razlika ili kolika je visina korelacije, vee kada se kaze da je
I ndto "statisticki znacajno", to znaci da ono sto smo mjerenjem na
I
"statisticki znacajno" u > inferencijalnoj statistici znaci 9.~ ~(;*l;l cinje- uzorku dobili, nijc slucajno, te da bismo slican rczultat do hili i kod pono-
I
nica, ustanovljena na uzorku ili uzorcima,
.
nije. . slucajna, vee da ~na (uz I
I
vnih mjerenja na drugim uzorcima, pa prcma tome ta nal1cna cinjcnica
........
~~-·

odrcl1eni rizik pogrcsnog zakljucka) postoji i u > populaciji; npr. _ako vrijedi i za populaciju. I veoma mala razlika medu dvije aritmeticke sre-
smo na dva uzorka (istih iii razlicitih veliCina) ustanovili da posi.ojc dim: ffiOZC biti Statistit:ki znacajna (?itO !lC ffiOZC dogoditi k.ada SU UZOTCi
razlike u njihovim aritmetickim sredinama, mozemo 1i smatrati da takve veliki), a to znaci da i u populaciji post~ji neka mala razlika izmedu tih
ili slicne razlike postojc i u populacijama, tj. nije li razlika koju smo do- dviju aritmetickih srcdina. Iz toga proizlazi da nesto sto je statisticki
hili na nasa dva uzorka mazda slucajan rezultat, a zapravo medu dvjema I znacajno uopce ne mora biti od hila kakvog prakti<::nog znacenja: na
populacijama iz kojih potjecu nasi uzorci, uopce nema razlike (tj. oba primjer, svi !judi navccer su 1-3 mm nizi ncgo ujutro (ito jc dakako viso-
uzorka potjecu iz iste populacije). Ili, u uzorku od 50 ispitanika ustano- ko statisticki znacajno, jer sc radi o populaciji !), a ipak ta razlika nema
vili smo da korelacija izmedu broja ponavljanja neke vjestine i stupnja I nikakvog prakticnog znacenja. U znanostima u kojima postoji dosta ve-
uspjcsnosti u toj vje8tini iznosi +0,70; mozemo li smatrati da bismo pozi-
likvarijahilitet pojava koje mjcrimo (npr. u psihologiji, sociologiji, peda-
tivnu korelaciju (ne nuzno iste visine!) nasli i mjercnjem drugih uzoraka
gogiji, medicini - jer se sve one have covjekom, a pojave u vezi s eovjc-
ispitanika? Drugim rijecima, bismo li korelaciju, nadenu na uzorku,
kom obicno variraju mnogo vise od pojava u vezi s nekim fizikalnim ili
nasli i u populaciji? Sam izraz "statisticki znacajno" (koji se osim toga
kemijskim zakonom) oct velike je vaznosti prilikom nekog istraiivanja
cesto upotrebljava samo u obliku "znacajno"), uzrokuje mnoge nespo-
ustanoviti mozemo li ndto sto smo istrazivanjcm konstatirali smatrati
razume kod laika pa i kod pocetnika u statistici, za sto postoje dva glavna
razloga: "opeom pojavom" ("opCim zakonom") iii je nas nalaz mozda samo
(a) logika i nacin misljenja kod primjene statistickih metoda i tehnika za slucajan ishod, posljedica varijabiliteta uzorka. Stoga je provjeravanje
provjeravanje "statisticke znacajnosti" ponesto su neuobicajeni, i dosta "s~atisticke znacajnosti" dobivenog rezultata (sto se provodi razlicitim
komplek:sni, pa - kako kafu neki nastavnici statistike - odredeni broj slu- ~ statistickim testovima) jedan od neophodnih uvjeta za postizanje

salaca "mentalno otpada" na toj temi. Nuzan preduvjet za razumijeva- '


znanstvene
. .
vrijednosti
. . .. . .
dobivenih rezultata. P
nje toga pojma je naime stvarno razumijevanje logike > normalne distri-
bucije. · statisticko testiranje hipoteze > testiranje hipoteze


• '

~ 198 STATISTIK
I
'
STATISTIKA 199
I
statistik Malo poznat izraz, koji koriste neki statisticari anglo-amc- analiziranju i interpretiranju brojcanih podataka dobivenih savjesnim
rickog jezicnog podrucja, a oznacuje one karakteristike uzorka koje u opazanjem i/ili mjerenjem razlicitih objekata iii procesa.
populaciji nazivamo > parametrima. Tako npr. aritmeticka sredina po- Prvi poticaji matematicarima (koji su stvaraoci matematickih me-
pulacije je parametar, a aritmeticka srcdina uzorka je statistik. Uo- toda statistickih analiza), potjecu od kockara, koji su matemati:::arima

bicajeno je kod nekih autora da se parametri oznacuju grckim, a statisti- postavljali razliCita pitanja u vezi .s vjerojatnoseu razlicitih ishoda kod
ci latinskim slovima. P hazardnih igara (npr. kod igara kockom). ProucavajuCi zakone "sluca-
ja", matematicari su otkrili razlicite oblike "slucajnih distribudja", a
medu njima i tzv. > nonnalnu distribuciju (Gaussovu), koja predstavlja
statistika Za statistiku mozda u pojacanoj mjeri vrijedi opaska jednog
kamen temeljac u statistickom naCinu razmisljanja i zakljucivanja.
statisticara (Mainland), koji kaze da nijedna definicija ne znaci mnogo
"Averzija" prema statistici, na koju nailazimo kod mnogih !judi,
tako dugo dok nismo proucili ono sto radimo- a tadaje svaka definicija potjece iz cinjenice sto se (zato sto su matematicari stvaraoci statistike)
gotovo nepotrebna. Postoji preko 100 definicija statistike, i one se uglav- bavljenje statistikom poistovjecuje s bavljenjem matematikom, tj. statis-
nom razlikuju po tome koliko sc "dalcko" protde analiza mjercnjem iii tika se poistovjecuje s matematikom. No, cinjenica da su matematicari
brojenjem dobivenih podataka: ako se zadovoljavamo samo tablicnim razradili statisticke metode nikako ne znaci da covjek koji se koristi sta-
prikazima izmjerenih podataka, i smatramo da je to "statistika", onda tistickim metodama, mora dobro znati matematiku: mnogi odlicni
statistika doista znaCi samo urcdenc brojcanc ili postotnc podatkc one- vozaci automobila veoma malo znadu o automobilskom motoru i o me-
koj pojavi. Ako nas zanimaju nckc prcciznijc karaktcristikc izvjcsnog hanici.
procesa ili pojave (npr. postoji li povezanost izmedu visine i tezine Ijudi, Za covjeka danasnjice statistika zapravo znaci "statisticki nacin
'
misljenja", a za to zaista nije potrebno znanje matematike. Ustvari, nije
i kako je ta povezanost visoka, ili odgovor na pitanje distribuira li se
potrebno vise od poznavanja cetiri osnovna racuna! (Vee i malo kom-
covjekova tezina po normalnoj raspodjeli jednako kao i covjekova visi-
pleksnije postupke, kao npr. vadenje drugog korijena, podizanje nekog
na), onda "statistika" znaci sredeni i sustavni opis mjerenih pojava, i broja na trecu potenciju, rjesavaju postojece tablice, koje saddi veCina
konstataciju 0 nekim cinjenicama do kojih dolazimo tek primjenom ne- statistickih udzbenika, iii jeftina dzepna elektronska racunala ). "Sta-
kih racunskih postupaka (> deskriptivna statistika). A ako prilikom ne- tisticki nacin misljenja" znaci prilaziti istrazivanju pojedinih problema
kog istrazivanja ustanovimo neku zanimljivu cinjenicu, pa nas u prvom na nacin koji osigurava dobivanje sto pouzdanijih podataka: pocevsi od
redu zanima da 1i ta Cinjenica zaista postoji iii je nas rezultat mazda definiranja problema i izrade nacrta i metode istrazivanja iii eksperi-
slucajan (npr. aka smo nasli povezanost izmedu koli~ine alkohola u krvi menta, preko biranja uzorka (iii uzoraka) na kojem (ili kojima) cemo
obavljati mjerenje, pa sve do odabiranja metode abrade podataka (jer
i brzine reagiranja, iii smo nasli da su zene uspjesnije u detektiranju
upotrijebljena metoda abrade ovisi u velikoj mjeri o tome sto nas u is-
"neverbalnih signala" od muskaraca), pa primjenom razliCitih sta-
trazivanom problemu zanima). A za sve to naravno nije potrebno biti
tistickih postupaka pokusavamo odgovoriti nato pitanje, onda "statisti- matematicar (jer vjerujemo matematicarima da su formule koje su nam
- ka" znaci zakljucivanje iz konkretnog slucaja na "opCi zakon" ( > infere- dali, ispravne ), ali je potrebno razumjeti logiku statistickog misljenja i
ncijalna statistika). Aka iskljucimo prvi, najnizi nivo kao nesto sto je da- zakljucivanja, a to naucimo poznavajuci statistiku (narocito "normalnu
nas vee prefivljeno unutar pojma "statistika", tj. brojcane podatke "sa- raspodjelu").
me za sebe" ne smatramo statistikom, onda nam preostaju druge dvije Definitivna interpretacija dobivenih rerultata ovisnaje, dakako, i o
razine pa bismo najkraee mogli reCi da je statistika znanost o skupljanju, primijenjenim statistickim postupcima (ier ako su oni bili neadekvatni,

I
200 STATISTIKA
I STRATIFIKACIJA 201
zakljucci mogu biti temeljito pogresni), ali je najvecim dijelom ovisna o procese ciji ishod se predvida s nekom vjerojatnoscu, a ne s potpunom
I

znanju, iskustvu i znanstvenom postenju istrazivaca: i potpuno izmislje- I


sigurnoscu. BuduCi da se statistika temelji na teoriji vjerojatnosti, kat-
ni podaci mogu se "statisticki" obraditi, ali oni nemaju nikakve znan- I
I kada se koristi i umjesto termina "statisticko", sto nije sasvim opravda-
stvene vrijednosti.
I no, jer termin statisticko ima sire znaeenje. K
I jos nesto za utjchu anima, koji se boje "egzaktnog" matema-
tickog pristupa: i u podrucju statistike, koju su stvarali matematicari,
I
ima nekih dijelova gdje se niti matematicari-statisticari bas potpuno ne
I stratificirani uzorak Vrsta > slucajnog uzorka koji unutar uzorka tocno
I odrazava postotak pojedinih "slojeva" ("stratuma") populacije. Na pri-
slaru, i gdje upotrebljavaju razlicite argumente kojima opravdavaju svoj
vlastiti pristup nekoj metodi. mjer, ako se namjestenici nekog poduzeea, kojih ima preko 1000, sastoje
Statisticka teorija pociva na teoriji vjerojatnosti, ali stvarno statis- od 50% nekvalificiranih radnika, 25% kvalificiranih radnika, 20%
tika se ne bavi samom vjerojatnoscu nego rezultatima teorije vjerojat- sluzbenika sa srednjom strucnom spremom, i 5% ljudi s visokom
nosti. Za svrhe statistike dovoljno je uzeti jednu od konvencionalnih de- strucnom spremom, pa nekom anketom zelimo dobiti niz podataka o
finicija vjerojatnosti: to je broj koji je povezan s konacnom relativnom stavu namjestenika prema placama, radnom vremenu itd., te odlucimo
frekvencijom dogadanja (ostvarivanja) nekog dogadaja. Taka kad se
uzeti uzorak veliCine N = 100, onda taj uzorak mora odrazavati propor-
kaze da dogadaj A ima vjerojatnost P, znaci dace dogadaj A- gledajuci
cije tih razlicitih "slojeva" u populaciji, dakle mora se sastojati od 50
na dugi rok iii na velik iii neizrnjeran broj opaZanja ili mjerenja- imati
nekvalificiranih radnika, 25 kvalificiranih radnika, 20 cinovnika srednje
proporciju P u onim slucajevima u kojima se taj dogadaj mogao dogo-
diti. strucne spreme, i 5 sluzbenika "fakultetskom naobrazbom. To je potre-
Obicno se (u matematici) vjerojatnost i slucaj objasnjavaju ovako: bno uciniti zato sto bi se kod relativno malog uzorka od N = 100, kada
pretpostavimo da zelimo obaviti "eksperiment" (u ovom slucaju to je bismo ga sastavljali po cistom slucaju, lako moglo dogoditi da neka
termin koji koriste matematicari) u kojemu je, kao i u svakom eksperi- skupina koja je malo zastupljena u populaciji (npr. namjestenici s fakul-
mentu, neizvjesno kakav ee biti ishod. Medutim, moguce je specificirati I tetskom naobrazbom) uopce - posve slucajno - ne dospije u uzorak.
sve ishode koji bi se mogli zbiti. Tako u "eksperimentu" s bacanjem (Ako je slucajni uzorakvelik, on se obicno stratificira sam od sebe, i nije
novcica mozemo predvidjeti sve moguee ishode- u ovom jednostavnom ga potrebno namjerno stratificirati.) Nakon sto se odredi apsolutni broj
slucaju samo su dva: "glava" i "pismo"- ali ni jedan ne mozemo predvid- pojedinaca u svakom "sloju", daljnji izbor obavlja se po principu >
jeti s potpunom sigurnoscu. Bitno svojstvo ovog "eksperimenta" jest da slucajnog uzorka, tj. potreban broj ljudi u svakom "stratumu" dobiva se
se maze ponoviti toliko puta koliko se cini potrebnim iii koliko puta
npr. primjenom > tablica slucajnih brojeva. Stratificirani uzorak maze
netko hoce. Takav "eksperiment" matematicari nazivaju "slucajuim
medutim predstavljati i izvor odredenih teskoca: buduci da je sad a svaka
eksperimentom", a njegov rezultat > slucajnom varijablom. P,K
I skupina u uzorku zastupljena u drugoj velicini, pojedine statisticke
statistika zakljucivaoja > inferencijalna statistika vrijednosti (npr. aritmeticka sredina) imaju vecu "tdinu" (>ponder)
kod vecih grupa, pa o tome moramo voditi racuna, ako nas, recimo, za-
stohasticno (prema grckoj rijeci koja ima otprilike znacenje "vjest u nima neka > ponderirana aritmeticka sredina, ali bez obzira na velicinu
pogadanju") Karakteristika svakog procesa ili niza dogadaja koji se mo- podskupina. P
gu opisati s pomocu teorije vjerojatnosti. U opcenitijem znacenju upo-
I trebljava se i kao sinonim zanedetenninisticko iprobabilisticko, tj. za one str~tifikacija > stratificirani uzorak

'

' STUPNJEVI SLOBODE 203


I 202 STROGOST SELEKCIJE
imamo situaciju prikazanu na povrsinama B 1 i Dl> au tom slucaju pos-
strogost selekcije Odabrani relativni broj (postotak ili propordja) I
' totak uspjesnih znatno je veci od postotka neuspjesnih. lako tim postup-
primljenih prema ukupnom broju prijavljenih kandidata pri selekciji za I'·
I korn Cinimo nepravdu onima koji bi uspjeli, ali nisu primljeni, tom
obavljanje neke aktivnosti (posla ili sl. ), a cilj odabira jest po~ecati rela- ' '

mjerom uspjeli smo relativno slabi test uciniti upotrebljivim za praksu.


tivni broj uspjclih i smanjiti broj neuspjelih u toj aktivnosti. Sto je rela- Kako je receno, ako je "ponuda" radne snage obilna (kao sto je npr. u
tivni broj primljenih manji, strogost selekdje je veca i obrnuto. vojsci, pri usmjeravanju rocnika u razliCite vi dove), taj postupak moze-
Prilikom selekcije kandidata za neki posao upotrijebljeni test ili > mo smatrati racionalnim i opravdanim. Upotrebom tzv. Taylor-Russe-
hataija t~stova ccsto ncmaju visoku korclaciju s uspjehom u t~m posl~. I llovih tablica moZc sc za svaku situaciju, u kojoj namje poznat (1.) posto-
No i takvi testovi mugu se- ako je broj kandidata za to raunu rnJcsto vehk I tak uspjesnih u kriteriju bez selekcije i (2.) korelacija izmedu uspjeha u
_ uspjesno upotrijebiti, a to se postize povecanje~ stro~os.ti s~lekcije.
I
testu i uspjeha u poslu (tzv. "koeficijent valjanosti"), odrediti gdje valja
Pretpostavimo da je korelacija izmedu nekog pred1ktora 1~n~e~11a dosta postaviti strogost selekcije da bi proporcija uspjesnih prema neuspje-
'
I niska (npr. +0.40). > Korelacijska povdina u takvom slucaJU Jzglcdala snima u kriteriju mcdu primljenim kandidatima bila uglavnom ona koju
bi otprilike kao elipsa na donjoj slid. zelimo. p
y J

Stud~ntov test > t-te.~t

stupnjevi slobode Opcenito, to je broj dogadaja koji pri izracunavanju


Uspjevaju
B Bl
nekc statistickc vrijcdnosti mogu slobodno (nczavisno) varirati. Najpo-
C D
znatiji primjer za logiku stupnjeva slobode je ovaj: ako zbrajanjem 5 bro-
Ne uspjevaju jeva moramo dobiti npr. rezultat 150, onda cetiri broja mozemo od-
abrati po volji (npr. 5, 300, -200, 10), ali peti broj mora biti +35, jcr
jedino u tom slucaju zbroj svih pet brojeva iznosi 150. Ovdje dakle
rczullati testa imamo N-1 = 4 stupnja slobode. IIi, aka je zadatak da s pet brojeva dobi-
jemo zbroj 50, ali da zbroj prva dva broja bude 11, onda gubimo dva
Povecavanjem "strogosti sclekcije" moze se i kod testova ~iskc kor~~acij~ s ~r::erije~
postici koristan rezultat: ~to vi~e povecavamo strogost sclekclJC, ~dnos uspJe§mh ~~em stupnja slobode (zbog ogranicenja kod prva dva broja i ogranicenja kod
''neuspjclinima" sc povccava u korist "uspjclinih" (vidi tumacenJc > strogost selekcrJe). zadnjeg broja), pa imamo 5-2 = 3 stupnja slobode.
U hi-kvadrat tablicama tipa 2 x 2, ako su zadane sume redova i stupa-
Ako pretpostavimo da bez ikakve selekcije u kriterijskoj :ar~ja~li ca, samo jedan broj ( od 4) mo:Zemo postaviti proizvoljno, pa stoga 2 x 2
(u ovom slucaju to bi bio uspjeh na poslu) uspijeva oko 50~ pnm:Jemh tab lice imaju 1 stupanj slobode. U. drugim .
slucajevima stupnjevi slobode
na posao (horizontalna crta na slid), onda _ce~o uz pomoc pred1~tora ovise o tome sto je sve zajednicko u dvije skupine rezultata, koje uspo-
(rezultat u testu ili bateriji testova), ako pnmm~o samo one kand1~a~e reduje~o:. .. .
npr. aka testiranioje
. . . ..
11 neka distribucija ''normalna", onda
koji su postigli harem prosjecan rezultat, (v_ertlkalna ~~ta X na .shc1 ),
'

opazene......
distribucije
..... ···-·· ..
i idealne (ocekivane) distribucije imaju isti N, istu
stanje neznatno poboljsati: povrsina B veca JC ?d .povrs~~e ~ (B 1 D su
" " ' ' ' ' ' '

aritmeticku sredinu i istu standardnu devijaciju, pa zbog toga stupnjevi


primljeni kandidati), pa ee dakle medu pri~lJemma b!.tl VlSe .o~ ~0% slobode iznose broj kategorija minus 3. u nekim statistickim testovima
uspjesnih. Ali ako povecamo strogost selekcqe, pa odluc1mo p:1~mh, re- pojam stupnjeva slobode znatno je kompleksniji za razumijevanje. P
cimo, samo 10% najboljih u testu (vertikalna crta Y na shc1), onda

- 1 r~jli1Jq
' '
II''' ,
-
' '·
~ - - -- •

SUBJEK11VNA VJEROJATNOST '


204 SUPERPONIRANA KRIVUUA 205
subjektivna vjerojatnost Vjerojatnost sto je covjek dozivljava u vezi s kuju u aritmetickim sredinama. No katkada oblik krivulje nece otkriti
pojavljivanjem neke pojave. Npr. ako dugo vremena nije izisao crni broj da se radio superponiranoj krivulji, pa interpretacija rezultata maze biti
na ruletu, dozivljavamo da vjerojatnost za njegovo pojavljivanje postaje
sve veca (> "sazrijevanje sanse"), iii pakdaje nakon sto je upravo izisao
pogresna. Neke znanstvene hipoteze pretpostavljaju dace se neka poja-
.-
va distribuirati po krivulji koja je nastala superpozicijom nekih drugih
broj 10, vjerojatnost za njegovo ponovno pojavljivanje neko vrijeme krivulja: npr. hipoteza o "sklonosti nesrecama" pretpostavlja da bi- ako
manja. Ovamo spada i predrasuda da je npr. u nekoj igri poput "Iota" "sklonost nesrecama" postoji - distribucija nesreca morala biti tzv. "ne-
vjerojatniji ishod 3, 12, 20, 31, 33, 42, nego ishod 1, 2, 3, 4, 5, 6, iako je is- gativna binomna distribucija", koja nastaje superpozicijom niza Poisso-
hod oba ova dogal!ajajednakovjerojatan. Dakako daje kod covjeka koji novih krivulja. P
je upoznat sa zakonima vjerojatnosti, njegova subjektivna vjerojatnost

cesto blizu objektivnoj vjerojatnosti, no nasi stavovi, motivi, zelje i dr.
mogu znatno djelovati na stupanj subjektivne vjerojatnosti: maze nam
se ciniti vjerojatnijim da cemo dobiti glavni zgoditak na lutriji nego da
cemo poginuti u prometnoj nesreci - iako je objektivna vjerojatnost
obicnovecaza ovoposljednje (> "utjecanje"naslucajnedogadaje. ). P

sukladnost u variranju Variranje vrijednosti u jednoj varijabli prati


variranje vrijednosti u drugoj varijabli. Primjerice, postoji sukladnost u
I
variranju varijabli "tjelesna visina" i "tjelesna tdina": s povecanjem
visine povecava se i tezina. Stupanj sukladnost ti variranju izrazava se s
pomocu > koeficijenta korelacije. u statistici se cesee rabi izraz > kore-
lacija, iako je sukladnost u variranju bolji termin jer ne podrazumijeva
nikakvu "povezanost" (osobito ne uzrocnu) medu varijablama. K

suma kvadrata Etapna statisticka vrijednost pri odredivanju varijance


u > analizi varijance (i jednostavnoj i slozenoj). Temelji se na kvadrira-
nim bruto rezultatima koji se uvrstavaju u jednostavne formule. Suma
kvadrata dijeli se pripadnim stupnjevima slobode pa se taka dobije vari-
janca. K

superponirana krivulja Krivulja kojaje nastala zbrajanjem dviju ili vise


krivulja. Ako je do superponiranja krivulje doslo zbog pogreske u mjer-
enju ili metodi rada (npr. prikazivanje visine muskaraca i :lena jednom
krivuljom ), vazno je to otkriti, a cest simp tom je > bimodalna distribu-
cija, koja nastaje superponiranjem dviju distribucija koje se znatno razli-
I

I
I TABUCE SLUCAJNIH BROJEVA 207
~
I
• tablica raspdenja (u anglo-americkoj terminologiji to je izraz scatter
'
I diagram) Tablica s "dva ulaza" koja pokazuje vezano rasprsenje rezulta-
I.
••
ta u dvije varijable (Xi Y) (vidi sliku). Svaka > statisticka jedinica (svaki
ispitanik) prikazana je u tablici (ili dijagramu koji zapravo predstavlja
koordinatni sustav) jednom tockom (iii nekim drugim znakom) s dvije
koordinate: rezultatom uXvarijabli i povezanim rezultatom u Yvarija-
bli). Povrsina koju cine taka dobivene tocke naziva se > korelacijska po,
vrsina, ~oja se priblizava krugu sto je korelacija meduvirl]ablama rna-•
• nj4a postaje pravac kad je korelacija potpuna ( + ili - 1); pri korelacija-
ma izmedu 0 i 1 ima elipsoidni oblik. K

70
I
65
• • I
tablica F-omjera Tablica koja pokazuje granicne vrijednosti F-omjera •
~60
uz razliCite stupnjcve slohode za varijancu u hrojniku i za varijancu u '
"·-c •
nazivniku. Tablica se nalazi u Dodatku C. P '! 55

tablica kontingencije Tablica s dva "ulaza" u kojoj su prikazani > bro- 50


I
jeni podaci koji istodobno pripadaju dvjcma varijahlama, a svaka od njih
• • v
45 ~~--~~--~-+--+--+--+-~
predstavlja jedan "ulaz" u tablici. Varijable su redov1t~ 1~raz~ne s po- 1~1~ 1451W 155160165170175180
mocu dohro definiranih medusobno iskljucivih kvalitatlvnlh (rJede kva- vlalna- em
litativno/kvantitativnih) katcgorija. Tahlica kontingcncijc mozc biti si-
• v •
Prikaz tablicc rasprknja u knjnj su koonlinatc (to~kc u koordinatnom sustavu) mlrcdcnc
istodobno rezultatima u varijabli Xi u varijabli Y. U gornjoj slici svaka tol!ka predstavlja
metricna (npr. 2 x 2, 3 x 3, 4 x 4 itd., pa se takva tablica st~ga JOS. naz1v~
vezani rezultatjednog ispitanika ujednoj i drugoj varijabli. Obifno ima vi§e ispitanika koji
"kvadraticna" tablica) ili asimetricna (2 x 3, 3 x 5 itd. koJU naz1vamo I postiru jednake rezultate u jednoj i drugoj varijabli pa se onda mo~e povetana frekvencija
"pravokutnom" tahlicom). Primjcr 2 X 2 tahlice: jedna varijabla u_~dan takvih jcdnakih koordinata prikazati, primjericc, vetim to~kama (koje svojom veli~inom

dru~a vanJabla
pokazuju frekvenciju).
"ulaz") jest spol s dvije kategorije - musko, zensko, a
( drugi "ulaz") je dab - osobe mlade od 30 go dina, o~obe stan!e ~d 30 go~
dina. u svakom od cetiri kvadratica ove 2 x 2 tabhce nalaz1t. ce se broJ tablice slucajnih brojeva Tablice koje su se svojedobno sastavljale tako
osoba koje su istodobno odredenog spola i odredene dobi: broj zena da se deseterostrana prizma, cije su strane obiljezene brojevima 0 do 9,
mladih od 30 godina; broj zena starijih od 30 godina; broj muskaraca bacala kao "igraca kocka", i biljezili su se brojevi koji su se pojavili na
mladih od 30 godina; broj muskaraca starijih od 30 godina. Tabl~ce ko~­
gornjoj plohi. Zbog lak.Se preglednosti, u tablicama se ti brojevi grupi-
raju u sku pine od po 4, 5 ili vise brojeva. Danas se takve tablice mogu sa-
tingencije temelj su daljnje statisticke elaboracije, tj. racunanJa > hz-
stavljati i kompjutorski, pa vee i mnoga malena dzepna racunala imaju
kvadrat testa i > koeficijenta kontingencije. K
r

'
208 TABUCE SLUCAJNIH BROJEVA t-DISTRIBUCIJA 209

inogu~nost generiranja slucajnih brojeva. Tablica slucajnih brojeva cita Tau koeficijent rang korelacije Metoda za izracunavanje korelacije
I
se bilo kojim smjerom, bilo kojim redom, vertikalno iii horizontalno, ili medu rangovima. Au tor joj je Kendall, a statisticari smatraju da je tame-
dijagonalno, a neki "pedantni" statisticari preporucuju C:ik da se npr. toda bolja mjera povezanosti medu rangovima nego sto je to >Rho koe-
bacanjem novcica odredi hoce li se zapoceti na lijevoj ili desnoj strani ficijent korelacije. Teze ga je racunati negoRho, ajedan od naCina racu-
tablice, parnom ili neparnom redu ili stupcu, itd. Tablica se najcesce nanja (ima ih vise) jest taj da rangove varijableX poredamo od 1 dalje,
uspjesno koristi kod velicinom dosta ogranicenih populacija (npr. Nod pa ispod toga nanesemo korespondentne rangove varijable Y, i racuna-
nekoliko tisuca i1i manje ), a elementi se u uzorak izabiru tako da se iz mo razlike izmedu svakog ranga i svih ostalih rangova, biljezeCi + 1 ako
tab lice citaju sku pine od po onoliko brojeva od koliko znamenki se sa- je drugi rezultat veCi, a -1 ako je manji. SumirajuCi te jedinice dohiva se
stoji velicina populacije. Na primjer, ako neka tvornica ima 850 radnika, izraz S, koji se uvrstava u formulu za Tau:
od kojih zelimo u uzorak izabrati njih 80, a red koji citamo u tablici, ,1au=
. s
izgleda ovako: 3754 0829 9473 9264 8502 5146 itd, u uzorak ce uci ra- fN(N-1)
dnici: 375,408,299,473 (926 otpadajer ta osoba ne postoji), 485,25, 146
itd. Ako se ponovno dobije broj osobe koja je vee izabrana, taj se broj Ako nema vezanih rangova, znacajnost Tau koeficijenta izvodi se u
prcskoci. Pogrcsno hi hilo pomisliti da bi se dobra tahlica slucajnih bro- 'I konacnom rezultatu iz > z-vrijednosti, dakle iz normalne raspodjele. No
ako su neki rangovi vezani, testiranjc znacajnosti postaje dosta kompli-
jeva mogla dobiti i tako da netko "po slucaju", "kako mu padne na •
ctrano.
pamet" izgovara brojeve izmedu 0 i 9. Istrazivanja pokazuju da gotovo
bez iznimke tako dobiveni "slucajni brojevi" statisticki znacajno odstu- U usporedbi s Rho koeficijentom korelacije, gotovo uvijek je Tau
paju od teoretskih frekvencija (tj. da se svaka znamenka u nekom du- nizi. Njcgovc prednosti pred Rho koeficijcntom su ovc: 1. uz Tau kodi-
• • \J .., • • ••

gom nizu hrojeva pojavljuje u slicnoj frekvenciji), i da se obicno nailazi CIJent maze se racunatl 1 parCIJalna korclacija; 2. Tau koeficijent moze
na znatno vecu frekvenciju nekih brojeva (npr. 3 i 7). P sluziti i za izracunavanje povezanosti izmedu jedne ordinalne (rangira-
ne) varijable, i jedne dihotomne nominalne varijahle; 3. ako se nakon
izracunavanja Tau pojavi koji novi rczultat, nc treba cijcli racun pona-
tablicno prikazivanje podataka Prikazivanje podataka u uredenim ta-
vljati, vee se jednostavnim postupkom preracuna novi izraz Tau. Tau se
blicama u kojima se navode obicno sazeti, sumarni podaci da bi se omo- moze racunati i s vezanim rangovima. Kao i Rho koeficijent korelacije, i
gucio bolji i pregledniji uvid u rezultate i njihove odnose. Tablice moraju Tau koeficijent barata samo razlikama medu rangovima, pa time mogu
imati jasan i razumljiv naslov i objasnjenje stupaca i redova u kojima su nastati izoblicenja stvarnih razlika medu rezultatima, i zato nije preciz-
prikazani rezultati; osobito treba pazljivo razjasniti kratice koje se uta- na mjcra povezanosti. P
. . Yp
blici upotrebljavaju. Obicno su redovi i stupci odijeljenicrtama radi lak-
~ . it f? ~
se i bolje preglednosti prikazanih vrijednosti. Postoji opce pravilo da se V-di~tribucija" Niz ("obitelj") raspodjela > t-odnosa za razlicite velicine
u tahlicama prikazuju samo najvazniji rezultati (izvedene statistickc n za razliCite >
vrijednosti), a izbjegava se prikaz mnostva rezultata koje je tesko konzu- : alna distribuci .a, ali su sin.: od nj~.: to vise SL 1 j.1,;..
mirati i vidjeti neke pravilnosti medu njima. Takve tablice s bruto rezul- "'N ·di · n ecima, dok j e u normalno · u
tatima ili npr. tablice koje prikazuju matrice korelacija, sluze uglavnom 99 74% svih rezultata obuhvaceno u ras onu izmedu -3 i + 3 stan a ·
samo kao dokumentacija ili izvoriste daljnje obrade podataka. K devijacija, kod t-distrihucija tajjc postotak to manJi ·to jc manji uzorak.
210 t-DIS'IRIBUCIJA • I TEORIJA MAUH UZORAKA 211
I
stupnjevi slobode gli ~oris~i-ti standardnu devijaciju populacije, _izracy na_te t-vrijednosti
= 00 I
···-············ = 25
_tvonle bt Jednako normalnu raspodjelu kao sto je tvore i stvarne razlike.
'
- · -·- · - · = 9 medu aritmetickim sredinama uzoraka.
.......... ' = 1 U prilogu se nalazi tablica granicnih t-vrijednosti za razine
znacajnosti 0,05 i 0,01, iz koje se vidi kako se granicna vrijednost t po-
veeava smanjivanjem velicine uzorka. P

-
-4 -3 -2 -1 0 +1 +2 +3 +4
I teorem centralnih granica > poucak centra/nih granica

teoretske frekvencije > ocekivane frekvencije


t-distribucija sir a je od normalne distribucije i to tim vise sto se izracunava iz manjeg
uzorka. Ako je ve!icina uzorka vrlo velika (teorijski ) onda je t-distribucija jednaka
teorija i~ara Matematicko-statisticka teorija u vezi s donosenjem ad-
norrnalnoj.
luke u natjecateljskim "igrama" koji "potez" treba povuci. "Igra" ovdje
Na primjer, kod testiranja znacajnosti razlike izmedu dvije arit- nema slicnosti s obicnom djecjom igrom niti s "igrama na srecu", vee se
meticke sredine, a na dva jednako velika uzorka veliCine N = 10; gra- radi ostrateskim odlukama, dakle o "igrama" koje se temelje na iskustvu
nicna vrijcdnost t na nivou @ znosi 2,10, a kod jos manjih uzoraka i znanju, kao ina predvidanju sto bi protivnik mogao uciniti. Teorija iga-
(npr. za 5 stupnjcva slobodc) una iznosi 2,57 (sto znaCi da razlika mora ra u vclikoj sc mjcri upotrcbljava kao model covjekovih postupaka u
biti bart.:m 2,57 pula vcca od svojc pogrdkc da bi jc mogli smatrati sta- ekonomskim i vojnim strategijama. P
tisticki znacajnom na razini od 0,05). U t tablicama umjesto N nalaze se
> stupnjevi slobode, a to kod jednog uzorka znaci (N-1 ), a kod dva uzor- .......::=7 teorija malih uzoraka Sve ono sto je u statistici povezano s malim uzor-
ka (N 1 -1) + (N 2 -1); t-distribucija poznataje i pod nazivom "Studen- cima, au prvom redu s pojmom "mali uzorak". Uobieajeno je da se u
tova" distribucija, jer St? njezin au tor Gosset~ potpisiva.o pseudonimom veCini slucajeva smatra da su mali uzorci ani kod kojihje broj elemenata
"Student". manji od 30. No, dakako, sve sto je u vezi s racunima kod malih uzoraka
Radi boljeg razumijevanja t-raspodjele (o kojoj postoji mnogo ne- postupno dobiva na vaznosti kada smanjujemo velicinu nekog velikog '
sigurnosti medu "potrosaCima" statistickih metoda), valja ukratko rezi- uzorka, pa prema tome nije granica od N = 30 neka "sudbonosna" vrije-
mirati sto t-raspodjela nije, a sto ana jest: dnost nakon koje pocinju vrijediti drugi zakoni. To se najbolje maze vid-
1. t-raspodjela nije distribucija rezultata u malom uzorku. jeti u tablici t-distribudje: kod uzoraka neizmjerne veliCine, granicna
. 2. t-raspodjela takoder nije distribucija vrijednost t na nivou znacajnosti odP = 0,05 iznosi, dakako,jednako kao
stribucija razl!!ca medu aritmetickim sre~inama malih uzoraka oko pra-
-.:.: i kod normalne distribucije, tj. granicna je vrijednost 1,96. Kod uzorka
arit~tick~redin.e iii Ria erazlike,jet.taj,e_djstrib.ucijanm:malna .. velicine N = 120 ta granicna vrijednost vee je 1,98 (sto znaci da je t-di-
• it
!'.-,,- " . 3. t-distribucijajest distri_bucija ? t-odnosa (tj. a stribucija sada vee nest a malo sira od normalne raspodjele ), a kod
L
izmedu neke razlike i njezine J20greske) kaleva se dobiva kada s vun- N = 30 granicna t-vrijednost je vee 2,042. No radi jednostavnosti pri-
...wki odreduje standardna pogreska aritmeticke .,_.
sredine, odnosno stan- likom racunanja, statisticari smatraju da primjena pravila koja vrijede za
'
~ dargpa pogreska razlike izmedu dviju aritmetickih sre~ina, a pri tome se normalnu raspodjelu velikih uzoraka, i na one uzorke koji su manji, ne
I u racun.!f:_ f5£!isti standardna devijacija uzorka. Ka~ bismo u racunu mo- predstavlja nikakvo ozbiljno nasilje nad rezultatima, i nikakvu "paznje
t~·· f
'

TESTIRANJE IDPOTEZE 213


212 TEORIJA MALIH UZORAKA
vrijednu" pogresku, i da tek kada veliCina uzorka postane manja od 30, 6 nizova (i jedan sam znakje niz). Koliko je najmanje nizova potrebno da
valja to uzeti u ohzir i provoditi racune izvorno za male uzorke. P bismo mogli smatrati da se ohje skupine medusobno razlikuju, provjera-
va se ili tablicama (kad je N manji od 20), ili jednim racunom, koji se svo-
teorija vjerojatnosti Skup matematickih zakona u vezi s razliCitim ohli- II di na z-vrijednosti, pa ako je z veCi od 1,96, razlika je statisticki znacajna
cima vjerojatnosti. Iako se osnovne postavke teorije vjerojatnosti po- na nivou nizem od 5%. Dakle, akoje hroj nizova manji od ocekivanog po
ndto i razlikuju medu matematicarima, sami racuni koji se primjenjuju slucaju, smatramo da se grupe medusobno razlikuju. No u nekim sluca-
uglavnom dovode do jednakog rezultata. Osnovni poticaj za razvoj teo- jevima i preveliki broj nizova moze biti toliko sumnjiv da ga necemo
rije vjerojatnosti i pojma "vjerojatnost" uopce hili su hazarderi i kockari, pripisati slucaju, vee namjernom "uredivanju" rezultata: kada bismo
. .' '

koji su postavljali matematicarima svog vremena (XVII. st.) razliCite npr. dobro promijesali 20 igraCih karata (pola jedne, a pola druge. boje)
probleme u vezi s ishodima bacanja igracih kocaka, ili sl. ( > osnovni za- pa bi kod pregleda rczultata svaka iduca bila drugc bojc, dobili bismo
koni vjerojatnosti). P maksimalni broj nizova, tj. 20- a to je jednako tako malo vjerojatno kao i
dace se slucajno dogoditi da su karte poredane samo u dva niza (najprije I
test > statisticki testovi sve jedne boje, a onda sve druge boje ). P

test ekvivalentnih parova > Wilcoxonov test ekvivalentnih parova testiranje hipoteze U svom radu istra:livacvrlo eesto ima neku odredenu
hipotezu o rezultatima koje u vezi sa svojim istra:livanjem ocekuje, ili
test homogenog niza (Run test, Wald-Wolfowitzov test) Neparamet- koja mu se namece u vczi s vee dohivenim rezultatima. Tu hipotezu, '
rijski test kojim se testira da lise dva uzorka statisticki znacajno razlikuju kakva god ona hila, treba provjeriti, i taj posao naziva se testiranje hipo- I
u bilo kojem pogledu: u centralnoj tendenciji, u varijabilnosti, sime- teze. Najcesca hipoteza koju istrazivac testirajc > nul-hipoteza, a ona jc
tricnosti itd. Mo:le se upotrebljavati kod rangiranih rezultata, kao i kod najpoznatija kod provjeravanja neke dohivene razlike izmedu dviju arit-
rezultata dobivenih mjerenjem, nakon sto ih rangiramo. Izvodi se tako metickih sredina i obicno glasi: zapravo nema razlike izmedu aritme-
I
da zajedno rangiramo rezultate obje skupine, dajuCi svakom rangu I tickih sredina dviju populacija (tj. obje aritmeticke sredine potjecu iz
oznaku kojoj od skupina pripada, i analiziramo koliko homogenih nizo- iste populacije), a dohivena razlika potpuno je slucajna. Istra:livac maze
va ukupno ima u cijeloj skali rangova, tj. koliko skupina jednako obi- postaviti i > direktivnu hipotezu (npr. "naCi cu statisticki znacajnu razli-
ljezenih rangova ukupno ima. Na primjer, kada bismo 10 ucenika po- ku u korist grupe B"), alii nju valja testirati kao i nul-hipotezu. Neki sta-
ducavali nekoj vjestini jednom posebnom metodom (eksperimentalna tisticari (npr. Fisher) smatraju da svaku hipotezu, kako god ana glasila,
skupina ), a kontrolnih 10 nisu posebno uvjezbavani (kontrolna skupi- mozemo nazvati nul-hipotezom- pa cemo je istrazivanjem ili potvrditi iii
na ), mogli bismo- aka je metoda zaista uspjesna- dobiti ovakav rang ( od I odbaciti. Vazno je da se oprezno formulira kako nul-hipoteza, taka i
I
najboljega prema najslabijemu): alternativna hipoteza, jer bi se inace moglo upasti u pogresan zakljucak.
Na primjer, aka bi netko testirao sposobnost nekog "medija" u po-
EE E EEE/K/EE/K/E/KKKKKKKKK
gadanju Zenerovih karti (to su karte s pet razlicitih znakova ), i kao nul-
a inspekcijom tih nizova vidljivo je da su medu najuspjesnijima uglav- hipotezu postavio tvrdnju: "Ne postoji ekstrasenzorna percepcija", pa
nom ucenici iz eksperimentalne skupine (E), a medu najmanje uspje- kada bi "medij" pogadao statisticki znacajno bolje od onaga sto se oee-
snima oni iz kontrolne skupine (K). Ukupno u ovim rezultatima imamo kuje u Cistom slucaju, onda bi dakako trebalo odbaciti nul-hipotezu, ne
'
I
I

214 1ESTIRANJE HIP01EZE 1EST STUPNJA PODUDARANJA 215


postoji opasnost prihvacanja alternativne hipoteze, koja bi mogla gla- testovi, statisticki > statisticki testovi
I
siti: "Postoji ekstrasenzorna percepcija". To dakako ne bi bilo ispravno, I
• •
JCT tma veoma mnogo moguCih razloga zbog kojih bi medij mogao
testovi "nezavisni od distribucije" > neparametrijski testovi
pogadati holjc od slucaja. Stoga jc dohro nul-hipotczu formulirati po 'I test predznaka (sign test) Neparametrijski test za testiranje znacajnosti
prilici ovako: "Ne postoji razlika izmedu onaga sto ce mi eksperiment razlike medu zavisnim rezultatima dviju skupina (najeesce rezultatima
pokazati i potpuno slucajno dobivenih rezultata". U tom slucaju, ako tu iste skupine ispitanika, testirane u dva navrata). Moze se testirati razlika
hipotczu odbacimo, alternativna hipoteza cc biti vrlo oprezna: "Postoji u nekoj mjerenoj vrijednosti (npr. broj pogodaka u kos prije i nakon na-
razlika izmcdu dobivenih rezultata i slucajno ocekivanih rezultata". A porne utakmice), iii u nekoj kvalitativnoj kategoriji (npr. u procjeni
cemu tu dobivenu razliku valja pripisati, to je posve drugo pitanje i stati- razlike u stupnju agresivnosti prije i nakon djelovanja nekog postupka ).
stika na njega ne daje odgovor. To je stvar struke i znanstvenog po- Test se provodi taka da se svakom paru rczultata dade predznak + iii-,
drucja, a, dakako, ovisi i o znanstvenom postenju, znanju, iskustvu i vje- iii 0, vee prema tome kako smo oznacili postignute promjenc (predznak
stini istrazivaca. "-" npr. maze znaciti da je kod toga ispitanika umor imao negativan
Formalno, u inferencijalnoj statistici pojam "testiranje hipoteze" ucinak, predznak "+" da jc imao pozitivan ucinak, a "0" da nije bilo ni-
odnosi se na testiranje nul-hipoteze (Ho) koje se temelji na ovoj logici. kakve promjene ). Rezultati s oznakom "0" otpadaju iz daljnje abrade. Iz
Polazi sc od silogizma, tj. valjanog zakljucka koji se naziva modus to/lens tablice testa predznaka cita se koliko najvise smije biti plusova (ili mi-
i koji u statistickom tcstiranju hipotcze ima malo prilagodcni formalni nusa) da bi se razlika mogla smatrati statisticki znacajnom. "Snaga" tog
~1hlik (time jc zapravo deduktivni zakljucak prihlizcn induktivnom) pa testa manjajc od snagc > Wilcoxonova testa ekvivalentnihparova,jcr test
tzgkda ovako: predznaka ne uzima u obzir velicinu razlike, vee samo njezin smjer. Test
predznaka mozc se koristiti i pri testiranjujednog uzorka (pri provjcra-
Ako je A istinito, B ce vjerojatno biti istinito vanju da li medijan neke simetricne distribucije odgovara nekoj speci-
B nije istinito ficnoj vrijednosti). P

test rangova s predznacima > Wilcoxonov test ekvivalentnih parova
Prema tome, A vjerojatno nije istinito
test stupnja podudaranja (goodness of fit) Najecsec znaci primjcnu hi-
f
.., Tvrdnja koja se odbacuje (ili ne odbacuje) u ovom postupku jest
kvadrat testa na one slucajeve kada opazene frekvencije neke dobivene
distribucije usporedujemo s nekom teoretskom distribucijom koju bis-
nul-hipoteza. Radna hipoteza i nul-hipoteza teoretski su medusobno
iskljuCivc: ako jc odhaecna nul-hipoteza, hipoteza je potvrdena s jcdna- mo pod odredenom hipotezom ocekivali: npr. testiramo distribuiraju li
r, kim stupnjem sigurnosti s kojimje nul-hipoteza odbacena. Smisao stati- se bodovi u nekom testu po normalnoj distribuciji ili distribuiraju li se
nesrece u nekoj populaciji radnika neke tvornice po Poissonovoj ili
stickog testiranja hipoteze je ovaj: ako je skup podataka prikupljen pod
pretpostavkom da je nul-hipoteza tocna, on treba biti slican skupovima mozda po negativnoj binomnoj distribuciji. Te su usporedbe vazne zbog
I, podataka prikupljenim uz pretpostavku tocnosti iste nul-hipoteze. interpretacije dobivenih rezultata: ako se rezultati testa distribuiraju po
Stoga je nul-hipoteza prihvatljiva kad su empirijski podaci slicni onome normalnoj distribuciji, mofemo smatrati da je test primjeren po svojoj
sto se ocekuje sukladno nul-hipotez~ a nul-hipoteza se odbacuje kad ta tezini; ako se nesrece distribuiraju po Poissonovoj raspodjeli, vjerojatno
slicnost ne postoji. P ,K je slucaj igrao glavnu ulogu pri njihovu dogadanju, a ako se distribuiraju
I

-
216 1EST STUPNJA PODUDARANJA ' TRANSFORMAOJA REZULTATA 217
po negativnoj binomnoj raspodjeli, radi se o slrupini ispitanika koja nije ticno velik, tj. osX iii os Y, ili obje, bile hi preduge (ne hi, recimo, stale na
I
homogena po nekim svojim svojstvima, pa treba pronaCi po cemu su I uobicajenu stranicu A4 fonnata). U takvom slucaju pretvaranje vrijed-
karakteristicni oni s mnogo, kao i oni s malo nesreca. Pojam se odnosi i nosti na jednoj ili na obje osi iz linearne u npr. logaritamslru skalu
opeenito na provjeru stupnja slaganja empirijskih podataka s nekim omogucuje vrlo prikladan i zoran graficki prikaz varijabli o kojima se
modelom. P l radi (vrlo cesto se graficki prikazi u osjetnom podrucju vida i sluha
upravo taka izraduju).
test sume rangova Neparametrijski test za provjeravanje pripadaju 1i (b) U istrazivanju od>1osa izmedu dvije varijable (u eksperimental-
dva uzorka u populaciju s istim medijanom. Taj test u literaturi nasi i nim istrazivanjima to su nezavisna i zavisna varijabla) maze se utvrditi
druga imena (Wilcoxonov T-test, Mann-Whitneyev U-test). Po smislu da je njihov odnos linearan iii nelinearan. Linearni odnos je jednostav-
I'
je slican > medijan testu, ali mu je > snaga veca. Znacajnost dobivenog niji i omogucuje jednostavnu i razumljivu matematiclru deskripciju s po-
I L
rezultata provjerava se iii uz pomocz-vrijednosti normalne distribucije l mocu > jednad.Zbe pravca regresije, &to, opet, omogucuje razumljive i in-
(ako je N svake skupinc harem 8), ili uz pomoc tablica. P I\ terpretabilne usporedbe medu razlicitim eksperimentalnim situacijama
u kojima su mijenjane nezavisne varijable ili drugi eksperimentalni uvje-
r~:~~~OS' (t•Vl"ljedJiostj~~azlomak kod kojega se U brojniku nalazi neka ti. Ako sene dobije linearan odnos medu varijablama, moguce je prikla-
izracunata· vrijednost, a u nazivniku pogreska te vrijednosti; t-odnos dnom transformacijom (najeesce je to pretvaranje u logaritamslru
- r
najpoznatiji je kod testiranja > znacajnosti razlike izmedu dvije aritme- brojcanu skalu, ali se dakako mogu koristiti i druge brojcane skale)
ticke sredine, pa u tom slucaju izraz t glasi: vrijednosti jedne ili obje varijable dobiti linearan odnos, odnosno izra-
razlika II ziti odnos medu varijablama s pomoeu jednadzbe pravca i taka, zapravo, -I'
t= -
pogre~ka razlike pojednostaviti njihov odnos. Primjer takve transformacije u kojoj je I
varijabla Y (ordinata) iz linearne transformirana u logaritamsku ljestvi-
t-oduos, dakle, okazu'e kolikoje puJq_neka razlika veta od svoje pogre-
cu, prikazan je na slici.
ske. Ako je t harem 1,96 (&to znaci da je razlika gotovo 2 puta veca od
svoje pogreske), smatramo (uz rizik od 5%) da je ta razlika statistickj I y loa 11
I 300 3
znaca ·na P < . Sto je uzorak ·· mora biti veCi da hi se
,: : 't
statisticki I
...

'err ~i¥ci~~u~g~lavnom se upotrebljavala kra-


200 2

tica C.R. (critical ratio), dakle "kriticki odnos" koji pokazuje koliko je I
puta neka vrijednost veca od svoje vlastite pogreske. P
-
I

100

transformacija rezultata U statistici terminom transformacija ozna-


cuje se pretvaranje vrijednosti izrarenih na nekoj > brojcanoj skali u
neku drugu brojcanu skalu. Ciljevi iii razlozi transformacije mogu biti
10
razliciti.
(a) Pri grafickom prikazivanju rezultata u koordinatnom sustavu Prikaz transfonnacije u kojoj je varijabla Y iz linearne ljestvice
opseg rezultata izr<iZenih nalinearnoj brojcanoj skali maze biti neprak- I transformirana u logaritamsku.


I
(

I
218 TRANSFORMACIJA REZULTATA

I
I
t-TABUCA 219
i
(c) Relativno cesto se koriste transformacije koje omogucuju tzv. I (e) Transformacija > broto rezultata u skalu z-vrijednosti koristi se
normalizaciju distribucije dobivenih rezultata. Ak.o postoji opravdana
u m~ogim -~tatistickim postupcima jer olakSava statisticku i racunsku
pretpostavka da se rezultati mjerenja neke varijable distribuiraju sukla- mampulaciJU rezultatima. K
dno normalnoj distribuciji, au konkretnom slucaju mjerenja nije dobi-
vena normalna distribucija, moze se te rezultate prikladnom transfor-
macijom normalizirati. Transformacija ce ovisiti o konkretnim rezulta·
t-raspodjela > t-distribucija
tim apace u nekom slucaju trebati dobivene vrijednosti mnoziti iii dije- I
liti konstantom, ili koristiti drugi korijen, ili ih kvadrirati iii logaritmirati I trenda, analiza > analiza trenda
itd. Takvi su slucajevi kad su dobivene distribucije asimetricne, a trebale
I
'
bi biti simctricne. Neki statisticari se zalazu za redovitu transformaciju tri~.erijalni koe~cijent k?r~lacije (rtrl) > koeficijent serijalne korelacije
dohivenih rezultata, uz ohrazlozenje da je konkretno mjerenje uvijek koJl se upotrebljava kad Je Jedna varijabla izrazena u tri kategorije kao
i izlozeno razliCitim pogreskama. Osim toga, mjerenje je gotovo uvijek ~P:· "i~podprosjecni", "prosjecni", "iznadprosjecni", a druga variJabla
nesavrseno, tj. redovito su dobiveni rezultati na grubljoj skali nego sto su Je 1zrazena na kontinuiranoj skali. K
prave vrijednosti varijable, paje i zato opravdana njihova transformacija
u vrijednosti koje bi se dohile kad bi mjerenje bilo savrsenije. Primjerice,
T-skala .Jed~a od poznatih skala bazdarenja, a sluzi za interpretaciju i
podaci o spolu rcdovito su dihotomizirani, iako- kako to neki istrazivaci
usporedivanJC rezultata. Bazira se - kao gotovo sve takve skale - na > z-
tvrde- varijabla "spol" nije dihotomna varijabla, vee se takoder norma-
vrijednostima, dakle na odstupanju nekog rezultata od aritmeticke sre-
Inn distribuira. Ako jc tome tako, hilo bi opravdano dobivene dihoto-
miziran~ rczultate transformirati u skalu koja reflektira normalnu dis-
~in~ •. izrazen.~ u ter~inima standardne devijacije. Podijeljenaje na 100
tribuciju i polozaj u toj normalnoj dis tribuciji dobivenih dihotomnih Jedt~I~a •. s VTIJednostl 0 na -5 standardnih devijacija, 50 na aritmetickoj
vrijednosti. Transformacije koje normaliziraju distribuciju potrebne su sredtm, I 100 na +5 standardnih devijacija. Izracunava se po formuli:
na prvom mjestu zbog daljnje statistickc obrade rezultata: mnogi stati-
sticki postupci zahtijevaju normalno distribuirane podatke. Tako, prim- T bodovi = 10z +50
jerice, koeficijent korelacije moze biti znatno iskrivljen ako rezultati
- nisu normalno (tocnijc rceeno: simetricno) distribuirani. Npr. ako prosjek iznosi 95, a standardna devijacija 15, rezultat od 142
ima 10(142-95)/15 + 50 = 81,33 T-bodova. T-skala prakticna je stoga sto
Razumljivo je da se transformacije mogu koristiti kad se radi i o
drugim, nenormalnim distribucijama, analogno transformacijama kod mozemo ispravno i "posteno".vrednovati i rezultate, koji se- iako su do-
normalne distribucije. sta rijetki- nalaze izvan +3 i -3 standardne devijacije. p

L, (d) u statistici se koriste cesto i slozenije transformacije u posebne


skale, kao sto je primjerice skala > z-vrijednosti. S jedne strane, takve t-tablica Tablica granicnih > t-odnosa. Uz odredeni broj > stupnjeva
- skale koriste se za odredivanje relativnog polozaja pojedinog rezultata u slobode broj u tablici pokazuje nam koliko najmanje mora iznositi iz-
r skupini rezultata kojoj pripada. To su tzv. ba:ldarne skale u koje se redo- racunata t-vrijednost da bismo npr. uz rizik od 5% iii 1%, sto je u tablici
'
vito transformiraju rezultati osoba Ciji se uspjeh u nekoj aktivnosti hoce oznaceno s 0,05 i 0,01, mogli srnatrati da dobivena vrijednost (najcesce
vrednovati prema rezultatu drugih osobajcdnakih iii slicnih karaktcris- razlika izmedu dvije aritmeticke sredine) nije slu~ajna ( dakle posljedica
tika. Mcdu bazdarnim skala, osim skale z-vrijednosti, vrlo je poznata i ~--uzorko~anja), vecdaje ::> statistickiznacajna, tj. da postoji i \j popula-
eesto koristena skala > decila odnosno > centila. Cljl; t-tabhca nalazi se u Dodatku B. P

r
220 t-1EST

t-test Jedan od najpoznatijih statistickih postupaka. Odnosi se na testi-
ranjc statisticke znacajnosti razlike izmedu dvije aritmeticke sredi~e.
Sastoji se u tome da se dobivena razlika izmedu obje aritmeticke sredme
podijeli standardnom pogreskom te razlike: razlika I standardna pogr~­ f
ska razlike. Ima is to znacenje kao i > t-odnos. (Vidi sve pojmove u vez1 s
> t-distribucijom.) P

t-vrijednost > t-odnos I


I

I
II
lI
I
I
U-distrihucija Takva distrihucija koja doneklc nalikujc na vcliko slovo
I
U, u kojoj najmanje rezultata postoji u sredini raspona izmedu najma-
njih i najvecih rezultata, a najvise rezultata nalazi se na krajevima distri-
I
I bucijc. Nckc pojavc karaktcristicnu sc distrihuiraju na nacin koji odgo-
I •

I

_vara U-distrihuciji: Ollf. stavovi, (vee po svojoj definiciji, da je to "pri-
pravnost pozitivnog iii ncgativnog;:eagiranja na nrcdmctc iii situaci~
daju U-distribuciju, jer obicno nalazimo najmanji broj ispitanika
nemaju stav prema necemu, te su podijeljeni u one s pozitivnim i ones
-
ncgativnim stavom. Distribucija nckih talcnata takodcr cesto nal' j.c.
-
na U-distribuciju: najvise l'udi ili ·ma·u ili nema·u t· . · je (sto
_ se opaza i kod sko~kih ocjena iz takvih 2remet'!,;_ relativno j malo
ucenika sa srednjom ocjenom, dok ih je dosta s losom ili dobrom ocje-
nom). P

\
'
' univarijatna analiza Statisticka analiza rezultata dobivenih mjerenjem
iii opazanjcm samo jcdnc varijahle. K

univarijatno Ono .....st() ~e_ od~osi na §(liDO je~n\l varijablu


-~ -- - -- ----- · - - -- .
(misli se na .
prvom mjestu . ..
na
. ..
statisticku
. . .
obradu rezultata
. .
dobivenih mjerenjem ili/i
---•·· ·· ·· . .. .. . .. . ' ' "

opahnjem jedne varijable ). K



I •v--. • · -• ·-- ~ • ,, ' •' •· •· •

I
I
I
' II

I UZORAK 223
222 USPOREDIVANJE U PAROVIMA I
ku" sad a j~ promijcnjena i iznosi 3/51 = 1/17, dakle sada je manja nego
usporedivanje u parovima Jedna od najjednostavnijih, aujedno i naj- I
I
kod prvo.g tzvlacenja. Ili, ako vjerojatnost neke bolesti u populaciji iznosi
pouzdanijih tehnika rangiranja nekoliko elemenata. Sastoji se u tome I'
I o~re~em postotak, a postoji nekoliko simptoma koji su uz odredenu
'I da se stvore svi moguCi parovi od ukupnog broja elemenata koje tre_ba
rangirati, pa ocjenitelj u svakom paru oznaCi onoga koji je bolji (ljepsi,,
\
I
'
'
I
~eroJatnost .zna~ovi te bolesti, pa kod neke osobe nademo jedan od
' stmptoma: VJer~Jatno~t da ta osoba ima tu bolest sada se promijenila,
visi, ukusniji ... i tome slicno) od drugog clana para. Na primjer, kada bi
on~_post~Je nesto :~ca nego u ukupnoj populaciji. Uvjetnom verojat-
trebalo tom metodom rangirati petero ljudi, onda su svi moguCi parovi

nos~u poceo se bavth Bayes prije oko dva i pol stoljeea, kada je postavio
ovt: SVOJ > Bayesov princip. P
1-2 2-3 3-4 4-5 I
I
I 1-3 2-4 3-5
~~~rak ~~orakje dio populacije koji po svim za mjerenje odredene ve-
I
1-4 2-5 _It.~me vazmm svojs~ma, osim po broju elemenata, reprezentira popula-
1-5 I ClJU. Dakle, u~orakj~ ograniceni. broj clanova neke populacije, izabran
N(N-1) I
Broj parova dobiva se jednostavnom formulom . Na temelju I sa ~:r~om ~a sto bolJe reprezenttra populaciju iz koje je izabran. op_u-
2 I
I
I lactJU J~ ~atme. veCinom nemo~uee, iii veoma tesko ili skupo izmjeriti, pa
dobivenih rezultata izradi se "tablica preferencija" koja pokazuje rang I
I
I
se k?:.t shmo ttme da_iz nj~ uzip1amo :u~o.rk.e 1 i iz njih zakljucujemo na
svakog procijenjenog elementa. Velika prednost usporedivanja u paro- stanJe u populaciji. U najveeem broju slucajeva populaciju ee najbolje
vima sastoji se u tome da se upotrebom te metode maze kontrolirati : predstaYlja ., slul.ajn.Luzorq_k, ali pod uvjetom da je dovoljno velik.
I pouzdanost samog procjenjivaca: nepouzdani i nesigurni ocjenjivaci I
Aka uzorak nije velik (a o > velicini uzorka odlucujemo na osnovi neko-
I
upadaju u pogreske (tzv. > cirkulame trijade) koje se u tablici preferen- '''
liko kriter:ja), treba njegovu reprezentativnost osiguravati na razne
cija oCituju taka sto poneki elementi procjene dobivaju isti rang. p nacine. Taka, na primjer, ako populacija sad!Zi nekoliko razlicitih "slo-
I je~~, ("stratuma"), u uzorak treba izabrati onaj postotak svakcg "sloja"
"utjecanje" na slucajne dogadaje Poznata pojava, cak i kod onih ljudi i koJl odgovara stanju u populaciji. Postoji veCi broj razlicitih vrsta uzo-
koji dobra poznaju pojmove "slucaj" i "vjerojatnost", a koja se sastoji u
ra~a koji se koriste u prakticnim terenskim istrazivanjima, i kojima nas-
tome da se katkada ponasamo taka kao da mozemo utjecati na neki I tOJtmo ustanoviti karakteristike populacije. Dva osnovna uyjeta da uzo-
r -' slucajni dogadaj. Npr. skloni smo unaprijed se kladiti na neki ishod kod I r~k bud~ .rep.r~zentativan za populaciju jesu: 1. on mora biti nepristran,
l, bacanja kocke, a nismo se skloni kladiti kad je kocka vee bacena, a jos ne I
!.1· ne smiJ.e bttl pod utjecajem razlicitih sistematskib .faktr;n:a (>pristrani
znamo rezultat; ili, :klima li baciti kockom brojku 1, to radimo znatno '
uzorak), 1 2.uzorak mora biti dovoljQ.o velik za svr u z ko·u nam 'e
"njeznije" i sporijim pokretima nego ako zelimo baciti brojku 6 (>sub- I Eotreba1,1 (> veliCina uzorka). Iako se cesto maze u praksi cuti zahtjev da
jektivna vjerojatnost, > "sazrijevq.nje sanse"). p
II
uzorak po svojoj velicini mora biti barem odredeni postotak populacije
(npr. 5 ili 1,0%)...taj je zahtjev pogresanjer preciznost uzorka (pod pret-
uvjetna vjerojatnost Vjerojatnost da ee se neka pojava dogoditi pod
posta~kom da n~je p~istr.a?).ovisi gotovo u potpunosti o njegovoj apso-
uvjetom da se neka druga vee dogodila. Na primjer, ako smo iz "spila"
lutnoJ, a ne relattvnoJ vehctm: uz lici~ 50 bit ce rakticki jednako
od 52 igraee karte zeljeli izvuCijednu "desetku" (a vjerojatnost da eemo
!eptezentativan za populaciju velicineN = 1000, kao i za populaciju ad
u tome uspjeti iznosi 4/52 = 1/13), pa se to dogodilo, a izvucenu kartu
nismo vratili medu ostale, vjerojatnost da eemo ponovno izvuCi "deset-
I N - 1.00-.000 A nekoliko puta veCi uzor~ bit ee u oba slucaja bolji

r
-- -

' I <' ' <' < < ' --~·--·
~ -- - - - - - - - - - -
'
1: 1 I' .I : ' I h'l' :I' I' ·II :,I : .' . I . 'II
·! •••
'"'' I I I ' tl
r
"

'
224 UZORAK UZORKOVANJE NA TEMEUU POZNATE VJEROJATNOSTI 225
I

reprezentant popuiacije, \iii i opet prakticki jednako boiji za popuiaciju uzorkovanje Proces iii operacija odabiranja jedinica (statistickih jedi-
od 1000, kao i za popuiaci·u od 100.000. Najcesce vrste uzoraka koje se nica: ispitanika, stvari, pojava itd.) iz popuiacije u uzorak. Ako nije
--c...._
drugacije specificirano, obicno se podrazumijeva da se radio siucajnom
koriste u istrazivanjima jesu ove: > slucajni uzorak, > sistematski uzo-
odabiranju (svaka jedinica ima jednaku vjerojatnost odabira i odabir
rak, > stratificirani uzorak, > prigodni uzorak, > klaster uzorak, > kvotni
svake jedinice neovisan jc o odabiru bilo koje druge jedinice) (> s/ucaj-
uzorak. Gotovo svi statisticki zakoni u > inferencijalnoj statistici vrijedc
samo ako uzorak dobro reprezentira populaciju iz koje je izvaden, a ni uzorak). K
najboiji reprezentant populacije je slucajni uzorak. P
uzorkovanje na temelju poznate vjerojatnosti (engl. probability sam-
pling) U nasem jeziku katkada se javlja izraz "vjerojatan uzorak", sto je
uzorci "uz povrat" Slucajni uzorci j~dnake velicinc kod kojih se, nakon netocno jer probability sampling oznacuje proces uzorkovanja u kojemu
I
sto se izvuce svaki pojedini rezultat, taj rezultat vrati u populaciju, iz ko- i
su jeclinice (statisticke jedinice: ispitanici, predmeti, dogadaji itd.) oda-
je se nakon toga vadi novi rezultat koji se takodervraca itd., svc do zelje- biranc u skladu s nckom poznatom strukturom vjerojatnosti u popula-
ne velicine uzorka. Prema teoretskim matematickim pravilima, p~ema ciji. Tzv. slucajno uzorkovanje (ciji je rezultat > slucajni uzorak) speci-
kojima su stvoreni svi zakoni u vezi s uzorcima, uzimanje uzoraka treba •' jaini je slucaj uzorkovanja na temelju poznate vjerojatnosti, u kojemu
obavljati "uz povrat". Tako npr. ako se populacija sastoji od samo ova struktura vjerojatnosti specificira da sve jedinice (populacije) imaju jed-
cetiri rezuitata: 2, 10, 4, 8, onda su svi moguci uzorci velicineN = 2 ovi: 2 naku vjerojatnost izbora u uzorak. K
- 2; 2 -10; 2- 4; 2- 8; 10- 2; 10 -10; 10 -4; 10- 8; 4- 2; 4 -10; 4- 4; 4- 8; 8- 2; 8
- 10; 8-4 i 8- 8. Iz tako dobivenih uzoraka moze se dok.azati: 1. da arit-
meticka sredina svih moguCih uzoraka iste veliCine odgovara "pravoj"
aritmetickoj sredini populacije; 2. da je varijanca populacije aritme-
tickih sredina uzoraka jednaka varijanci originalne populacije, podije- I

ljenoj s velicinom uzorka (a standardna devijacija je korijen iz toga,


dakie: JN ), i 3. da varijance uzoraka cine takvu raspodjelu oko "pra- '

ve" varijance, da im aritmeticka sredina odgovara pravoj varijanci. Time



se ujedno dokazuje zasto kod izracunavanja standardne devijacije
uzorka treba u nazivniku uzeti (N-1) umjesto N, zeli lise procijeniti stan- '
'
dardna devijacija populacije. Rezimirano receno, iz ove vrste uzoraka
izvedeni su glavni zakoni inferencijalne statistike. Medutim, u realnosti
su populacije obicno tako velike da se prakticki ne cini nikakva veca po-
greska ako uzorak sastavijamo bez vracanja svakog rezuitata u popuia-
ciju. (Jedino kod upotrebe > tab/ice slucajnih brojeva imamo zapravo
situaciju slicnu vracanju rezultata u populaciju, jer se tamo isti rezultat
moze i nekoliko puta pojaviti.) p

I
VARIJABLA 227
sionalnih). Podrazumijeva sedate pojave iii osobine mogu poprimiti
razlicite velicine (otud i takav termin), spontano iii pod utjecajem nekih
drugih pojava ili osobina.
Suprotno znacenje pojmu varijable ima pojam konstante - to je,
dakle, nesto sto sene mijenja, sto ima stalno jednaku velicinu, jednaku
(istu) vrijednost. No, konstantu treba smatrati samo posebnim slucajem
pojma varijable.
Iako se pojam varijable na prvom mjestu odnosi na k.vantitativne
promjene neke definiranc pojave i1i osobine, ipak jc uobicajcno razliko-
vati tiv. k.valitativne varijable. To su one varijable koje takoder variraju,
mogu poprimiti razlicite vrijednosti, ali ne k.vantitativne nego k.valita-
tivnc. Zato sc, kad jc rijcc o tim varijablama, katkada govori o kategori-
jama iii atributima varijable. Takve varijable se u psihologiji, sociologiji,
"vagana" aritmeticka sredina Ne sasvim tocan naziv za > ponderiranu medicini i slicnim znanostima relativno cesto susrecu. Kao primjer ta-
aritmeticku sredinu. Naziv jc nastao nesprctnim prijcvodom cngleskog kvih varijabli mozemo spomenuti spol (varira u kvalitativnim kategori-
jama musko - zensko), nacionalnost (engleska, francuska, spanjolska,
izraza "weighted"' sto dod use znaci "vagan"' ali znaCi i "otezan"' pa u
hrvatska itd.), konfesijsko opredjeljenje (katolik, protestant, musliman
sklopu "weighted average" znaCi "ote:lanu" aritmeticku sredinu, tj. za-
itd.), zanimanje (psiholog, pravnik, elektroinzenjer, lijecnik itd.), nao-
jednicku aritmcticku srcdinu iz nekoliko aritmetickih srcdina, pri cemu
brazba (bez skole, osnovna skola, srednja skola, visa skola, fakultet) itd.
vecu tdinu u konacnom rczultatu imaju aritmctickc srcdinc dobivcnc iz Upotreba takvih varijabli omogucujc samo klasifikaciju statistickihjedi-
veeeg broja mjerenja. p nica u pojedine kategorije v;gijable, sto takoder odgovara definiciji >
mjeren}ai to na ~ n~minain~j skali. Na taj naCin dobiveni podaci naziva-
· varijabla ( od francuske rijeCi variable, koja je latinskog porijekla, a znaCi ju se > brojeni podaci.
nesto sto se mijenja, sto je promjenljivo i sl.; u hrvatskomjeziku katkada Kategorije ili atributi kvalitativnih kategorija moraju biti jasno i
se upotrebljava i rijecpromjen/jivica) Nesta sto se mijenja, sto maze po- jednoznacno definirani taka da jedna statisticka jedinica moze pripadati
primiti razliCite vrijednosti. U matematici se upotrebljavaza promjcnlji- samo jednoj kategoriji.
vu veliCinu za koju se pretpostavlja da predstavlja konzistentnu, jedno- Varijable cije se variranje moze izraziti kvantitativno, sustavom
znacnu pojavu koja se, medutim, ne specificira, ostaje apstraktnom. U brojeva, katkada se, da bi bilo jasno o cemu se radi, nazivaju kvantitativ-
tom smislu upotrebljava se i u statistici kad se radio opcoj razini kao sto nim varijablama, > Kontinuirana varijab/a; > diskontinuirana varijab/a.
su statisticki modeli ili izvodi statistickih formula. No, buduCi da su u U statistici se cesto koristi termin > s/ucajna varijabla.
upotrebnoj statistici predmet manipulacije rezultati (brojcane vrijed- Pojam varijable, kako se koristi u statistici, nije identican pojmu
nosti), pojam varijabla odnosi se na osobine ili svojstva stvari, pojava ili varijable unutar nekog znanstvenog ili strucnog podrucja, jer se tu vari-
osoba, koje je na temelju operativne definicije moguceopazati ili/i mje- jable uvijek definiraju u konkretnim sadr:Zajnim terminima pojava i
riti i koje predstavljaju prihvatljivo prepoznatljiv, jasan i jednoznacan osobina koje se odnose na predmet odredene znanosti iii profesije. Ne-
entitet u nekom podrucju ljudskih aktivnosti (istrazivackih kao i profe- sta tocnije receno, u statistici varijabla se definira vise formalno, apstra-


' ..
I
228 VARIJABLA (J ,L VISEMODALNA DISTRIBUCIJA 229

ktno, a u znanstvenom i profesionalnom podrucju saddajno. Aka su (ier pogreska aritmeticke sredine opada proporcionalno drugim korije-
formalni uvjeti zadovoljeni, statistiku sene tice sadrzaj varijable, ali obje nom velicine uzorka: dva puta manja pogreska dobiva se iz eetiri puta
'
definicije moraju biti kompatibilne pri primjeni statistike u nekom I veeeg uzorka ). '
I
!
znanstvenom ili strucnom podrucju. K I U vezi s drugim uvjetom (b) primjer je ovaj: za ustanovljivanje
I

prosjecne tjelesne temperature odraslog zdravog gradanina Zagreba do-


i
b~~~~vadrirana > standardna devijacija (s 2) ili aritmeticka sredi- •
• voljan je uzorak od mazda desetak zdravih ljudi, jer tjelesna tempera-
I

na k.vadriranih razlika izmedu svakog pojedinog rezultata i aritmeticke I' tura veoma malo varira; > koeficijent varijabilnosti tjelesne temperature
I
a izra~i poka'zatelj_~arijabiliteta 're~tata.
-..;:.,.., ..:.·....!li-..,;',J.., ,.;_.,_ ... ,._..~-· -
>£!!a.:.f I
I
I
je ispod 0,1 %. No za ustanovljivanje prosjecne te:Zine odraslih gradana
. > analiza varijance, > F-omjer). K Zagreb a uzorak mora hiti znatno veci, jer tczina Ijudi varira znatno vise,
'"'""' ,..,._._ tj. koeficijent varijabiliteta iznosi preko 10%.
'
varijanca, prava > ''prava "aritmeticka sredina (i ''prava "standardna de- I
U vezi s uvjetom (c) primjer je ovaj: kada bi neki lijecnik :Zelia testi-
vijacija) rati uspjesnost neke nove vakcine protiv poliomielitisa, trebao bi uzeti
v I vrlo velik broj djece u eksperimentalnu i u kontrolnu skupinu (maZda
velicina :.zorka Sto · uzorak "" ~· J caki po nekoliko tisuca),jerkodmanjeguzorka (npr.100djece usvakoj


tativan a ne > pristran ), ('"on bolje reprezentira o ulaciju izkoje je I skupini) najvjerojatnije ce se dogoditi da nijedno dijete u eksperimen-
.
I
_izvaden · to bez obzira na velicinu po ula_9je~ uzorak velicine 100 I
talnoj i kontrolnoj skupini ne oboli od te bolesti. P
'''
uglavnom ce jednako dobra reprezentirati neku populaciju velicine
N..=_1000, kao i nekoliko-desetaka puta ve6u populaciju. Pozeljna velici-
- na uzorka ovisi o nekolikoiaktoraj to je razlog zasto statisticarvecinom
I
vezani rangovi Zajednicki iii prosjecni rangovi sto ih zauzimaju dva iii
-
ne maze odmah zainteresiranom pojedincu odgovoriti na pitanje kako
I vise jednakih rezultata. Zajednicki se rang dobiva taka da se zbroje
rangovi sto bi ih ti identicni rezultati imali kada ne hi hili identicni, i zhroj
velik uzorak da uzme za svoje istrazivanje. Io_su ovi faktori: ) se podijeli brojem "vezanih" rangova. Na primjer, aka su 7., 8., 9. i 10. re-
I'
a. zetjen.a preciznrut ctataka: sto veca reciznQstnaru je potreb- zultat identicni, ani ee dobiti zajednicki "vezani" rang, koji ce biti:
I!!!J.o..j notreban veCi uzo.r.ak.
-
b. _v~rijabilP!JSt poj~ve koju mjerimo: sto je_p_Qjaya ya(ij.abilnij..l.l, 7+8+9+10 = 8,5
. .

potreban ',e_veCi uzorak. 4


c. Zastu ljeno..s.tm'erene a·ave u populaciji: ako je eka..p.ojava Prosjecni rang maze se izracunati ina drugi nacin: zbroje se prvi i zadnji
vrl rijetkarpotreban je mnogo veCi uzorak nego u slucaiu Q.Qi'!.ve koJl!.i~
znat o..Gesc .-- . - \
rang sto bi ga ti rczultati imali da nisu identicni, i podijele sa 2. U nasem
slucaju to bi znacilo: (7 + 10)/2 = 8,5). Oba postojeca koeficijenta rang
Sto se tice prvog uvjeta (a), problemje dostajednostavan: ako neki ''
korelacije (>Rho koeficijent i > Tau koeficijent) omogucuju racunanje i
proizvodac cipela na uzorku N = 100 ustanovi da je prosjecna velicina
s "vezanim" rangovima. U nekim statistickim testovima provodi se >
stopala djece odredenih godina npr. 20 em, a standardna pogreska te I'
'

korekcija zbog vezanih rangova. P


aritmeticke sredine iznosi 2 em, to znaci da 95%-tne > granice pouzda- '
I
I
;zosti te aritmeticke sredine iznose 20 plus i minus 4 = 16 do 24 em, pa i

ako to proizvodac smatra nedovoljno preciznim, i zeli pogresku smanjiti visemodalna distribucija Distribucija rezultata s veCim brojem vrhova,
na polovicu (tj. na raspon od 2 em), onda treba uzeti 4 puta veci uzorak tj. s vise modalnih (dominantnih) vrijednosti, vrijednosti koje imaju

'I
I

I

I
I
230 VISEMODALNA DISTRIBUCIJA

vecu, istaknutiju frekvenciju. Upotrebljava sci izraz multimodalna dis-


tribucija (> bimodalna distribucija). K ~ •

I
vitalna statistika Prikupljanjc i ohrada podataka (u vidu > deskriptivne I
statistike) o rodcnjima, bolestima, smrti, brakovima i drugim zivotnim t
pojavama u populaciji neke zemlje, pokrajine ili mjesta. Vitalna statisti- I
ka koristi razliCitc indcksc za opisivanje pojcdinih pojava (npr. broj ro-
denih ili urnrlih na 1000 stanovnika, broj umrlih od neke bolesti na 1000
'i
oboljelih, itd.). Vitalna statistika spada u > demografiju. P I
I
'
I
vjerojatnost Definira se na razlicite naCine, vee prema tome kako se I

.pristupa problemu. Najpoznatija definicija glasi da je vjerojatnost broj l


"pogodnih" dogadaja, podijeljena ukupnim brojem moguCih dogadaja;
dakle, vjerojatnost je relativna frekvcncija nekog dogadaja, jer pred- '• Wald-Wolfowitzov test > test homogenog niza
stavlja proporciju vrcmcna (iii broja ishoda ), u kojoj cc se "na dugi rok"
I
kod ponavljanja pokusa pojaviti "pogodni dogadaj": kod bacanja Wilcoxonov test ekvivalentnih parova (test rangova s predznacima)
novl:ica, "glava" 6c st.: nakon mnogo hacanja pojaviti prihlizno u 50%; Ncparametrijski test za testiranje znacajnosti razlike izmedu dva zavis-
broj 3 na igracoj kocki pojavit ce se oko 1/6 puta, dakle njegova vjerojat- na uzorka. Rczultati moraju biti mjercnc vrijednosti, pa se rangiraju
nost je 16,7%, itd. U statistici se vjerojatnost oznacuje izrazomp ili P razlike izmedu parova vrijednosti (bez obzira na smjer razlike ), i daje im
;

(Iat.probabilitas), a krece se odO (nula) do l.P = 0 znaCi dane postoji ni- I'
se predznak "+" ili "-", vee prema tome u kojem je smjeru razlika. Ako
. kakva vjerojatnost za neki dogadaj (npr. da covjek vlastitim snagama I
I
se radi o razlikama do kojih je doslo slucajno, sume pozitivnih i negativ-
skoCi uvis 100m), P = 1 znaci da je nesto potpuno sigurno (npr. da svaki nih razlika trebale bi biti slicne. Ako nisu, tablicama, ili uz pomocz-vrije-
covjek mora umrijcti). U eksperimcntalnom radu najce!iee se koriste dnosti odreduje se moze li se razlika smatrati statisticki znacajnom.
vjerojatnosti 1/20 = 5% (0,05), iii 1/100 = 1 % (0,01), ito kod usvajanja Wilcoxonov test jace je "snage" od > testa predznaka, jer uzima u obzir
'I'
razlicitih > razina znacajnosti u obradi rezultata. Pri tome, znacenje tih ! velicinu razlike. Po svojoj efikasnosti gotovo je ravan parametrijskom
vjerojatnosti je ovo (u primjeru s tcstiranjem statisticke znacajnosti testu > metode diferencije. Kao i test predznaka, Wilcoxonov test moze
neke razlike izmedu dvije vrijednosti): ako zapravo (u populacijama) se koristiti i za testiranje jednog uzorka (npr. pri provjeravanju da lime-
nema razlike izmedu tih dviju vrijednosti, onda bi se razlika koju je is-
;
dijan neke simetricne distribucije odgovara nekoj specificnoj vrijed-
I nosti). P
trazivac dohio, mogla slucajno pojaviti samo jcdanput u 20 pokusa (P < I
0,05), ilijedanput u 100 pokusa (P < 0,01). P I
·- I
I
' Wilcoxonov T -test > test sume rangova

vjerojatnosti, teorija > teorija vjerojatnosti W koeficijent korelacije (koeficijent konkordancije) Kendall je razradio
metodu za izracunavanje stupnja slaganja izmcdu nekoliko rangova i
nazvao je koeficijentom konkordancije W. Logika racuna je veoma je-
I
. --. .
r
'
232 W KOEFICIJENT KORELACIJE \

dnostavna: ako, recimo, cetvorica ocjenjivaca rangiraju sestoricu kandi- •

data u nekoj sportskoj vjestini, u slucaju da nema nikakvog slaganja


medu ocjenjivacima ukupni rang svakog kandidata hio hi slican ukup-
nom rangu svih ostalih kandidata; a kada hi se ocjenjivaci potpuno sla- I
I
I
gali u rangu, sume rang ova pojedinih kandidata morale hi se razlikovati, '
r
ito u "skokovima" koji odgovaraju broju ocjenjivaca. Koeficijent Wte- II
stinl odnos izmedu stvarnog slaganja ocjenjivaca i maksimalno moguceg
slaganja. Kod potpunog slaganja Wiznosi 1, a kod nikakvog slaganja W
je 0. W ne moze hiti negativan, a to nije niti logicki zamislivo: 3 ili vise
ocjenjivaca mogu se potpuno slagati (sto znaci W = 1), ali se ne mogu I
potpuno ncslagati (jcr ako sc suuac 1 polpuno nc slazc sa succm 2 i
sucem 3, onda se suci 2 i 3 moraju slagati!). Znacajnost koeficijenta W
odcitava se iz tahlica, a ako jeN (broj rangiranih elemenata) veci od 7,
X (iii x) Oznaka za varijahlu iii pojedinacne rezultate. Takoder oznaka
mozc sc knristiti i hi-kvaurat distrihucija,jcr sc hi-kvadrat mozc izravno '

l za us apscisa u koordinatnom sustavu.


izracunati iz W, i znacajnost odcitati izN-1 stupnjeva slobode. P
I
'' X' Najcesca oznaka za provizorne statisticke vrijednosti.
/
- v

X Cesta oznaka za aritmeticku sredinu.


'
I

!
'
'

I 'I
i'
'
I
l
'
'

i
I
I

I I
I

I I

'
I I
I
I
I
'
I
I

I ,

i
I

I
II

i
I
I

'
Yatesova korekcija Korektura koja se obavlja kod 2 x 2 hi-kvadrat zajednicka aritmeticka sredina > ponderirana aritmeticka sredina
tahlica, osim ako su frekvencije dosta vclikc. Sastoji se u tome da se do-
bivene razlike izmedu opazenih i ocekivanih frekvencij l smanje·za 0,1, i zajednicka vjerojatnost Vjerojatnost nekog zajednickog ishoda koji je
kk nakon toga provodi izracunavanjc. Yatcsova korekcija naziva sc i posljcdica kombiniranja vise vjcrojatnosti: ishod sume 12 kod bacanj a
t~k2re.kcij~,za kontinui~t", jer se hi-kvadrat test (koji predstavlja konti- dvije igrace kocke ima zajednicku vjerojatnost 1/6 x 1/6 = 1/36; ishod ave
- .• ~,i.....-J.IJt'j ••. ,,.. '.>...
"~ ---
nuiranu distdbuciju) koristi za procjenu distribucije > diskretne vari- kombinacije: "pismo" na novcicu, brojka 1 na igraeoj kocki, i broj 7 na
jable. Danas seta korekcija primjenjuje u manjoj mjeri nego prije, jer ruletu (koji ima 36 brojeva + 0), iznosi: 1/2 x 1/6 x 1/37 = 0,0022 ( dakle to
cini se da nije toliko korisna koliko se mislilo. '
bi se u prosjeku dogodilo nesto vise od 2 puta na 1000 pokusaja). p

Yatesova korekcija gubi svoj smisao ako su razlike izmedu opaze-


zajednicki rang Rang sto ga zauzmu identicni rezultati prilikom rangi-
nih i ocekivanih frekvencija toliko male (manje od 0,25), da bi njihova
"smanjenje" za 0,5 dovelo do - veceg broja. P ranja. U statistickim racunima u kojima se rezultati rangiraju, takvi se
rangovi nazivaju > vezani rangovi. Zajednicki rang dobiva se taka da se
zbroje rangovi sto bi ih ti rezultati zauzimali kada ne bi b;li identicni i
'
podijele se brojem rezultata iii (~to je jednostavnije) taka da se zbroje
prvi i zadnji rang sto bi ih ti rezultati zauzimali, i rezultat podijeli s 2. Pri-
mjer za jedan i drugi postupak: aka su 3 rezultata identicna, a zauzimali
I bi 7., 8. i 9. rang, onda po prvom postupku raeun iznosi (7 + 8 + 9)/3 = 8,
II po drug om postupku (7 + 9)/2 = 8. Praksa, koju katkada vidimo u sport-
• I
I skim natjecanjima, da po dvojica natjecatelja, ako su postigli jednaki re-
I zultat, zauzimaju isti rang koji bi ina~e zauzeo jedan takav rezultat (npr.
I I
da dvojica natjecatelja zauzmu drugi rang, a iduci iza njih je treci po
236 ZAJEDNICKI RANG ' ZAVISNA V ARIJABlA
' 237
I
rangu), nije u skladu sa statistickim principima. U nekim statistickim
u nekim funkcijama kao sto je vrijeme reakcije: u pocetku, s povecanjem
testovima provodi se > korekcija zbog vezanih rangova. P I dobi vrijeme reakcije se skracuje, a nakon odredene zivotne dobi poci-
I
nje se produljivati). Primjena r koeficijenta korelacije na takve rezultate
zakoni vjerojatnosti Niz zakona u vezi s razlicitim situacijama koje
bila bi potpuno pogresna, jer je r-koeficijent predviden jedino za linear-
I
imaju svoju vjerojatnost pojavljivanja. Dva najjednostavnija i najpozna-
I nu povezanost, pace u slucaju zakrivljenog odnosa biti ili umjetno sma-
tija od njih su: (a) zakon sumacije, tj. vjerojatnost dace se dogoditi bilo
njen, ili ce cak biti 0, pa makar varijable bile vrlo evrsto, ali zakrivljeno,
koji od nekoliko mogucih nezavisnih dogadaja, jest suma vjerojatnosti
povezane. Zbog toga je u nacelu, prije nego se racuna odredeni koefi-
svakoga odnjih (npr. vjerojatnostdace na igraooj kocki pasti ili 1, i1i 3, ili
cijent korelacije uvijek potrcbno provjeriti tip povezanosti medu varija-
5, iznosi 1/6 + 1/6 + 1/6 = 3/6 = 1/2 = 0,5; (b) zakon multiplikacije:
blama s pomocu > crte regresije. Aka se radio zakrivljenoj korelaciji koja
vjerojatnost da ee se zajedno (iii nekim definiranim redom) dogoditi dva
ne mijenja smjer, mogu se koristiti koeficijenti >rang kore/acije, no ako
ili viSe nezavisnih dogadaja, jest umnozak vjerojatnosti svakoga od njih
se smjer mijenja, niti oni nisu upotrebljivi, pa se u takvim slucajevima
(npr. vjerojatnost da cemo bacajuci pet novcica /ili jedan novcic 5 puta/
mora koristiti > koeficijent zakrivljene korelacije. P
uvijek baciti "pismo", iznosi 1/2 x 1/2 x 1/2 x 1/2 x1/2 = 1/32 = 0,031,
dakle to ce se dogoditi u prosjeku oko 3 puta na 100 bacanja. Vjerojat-
zavisna varijabla Ona varijabla (pajava) koju istrazujema i zelimo ras-
nost da eemo u "malom lotu" od 10 brojeva dobiti brojeve 2, 3, 7 i 10
tumaciti zbog cega ana poprima razlicite vrijednasti. U eksperimental-
moze se izracunati uz pomocobje ove zakonitosti: vjerojatnost da cemo I
'
I• nom r~du trazimo cimbenike (vrijednasti > nezavisne varijable) a koji-
te brojeve dobiti upravo redoslijedom kako su napisani iznosi 1/10 x 1/9 x
ma ovtse rezultati zavisne varijable, a te cimbenike moze istrazivac pro-
1/8 x 1n = 0,000198, dakle oko 2 puta na 10000 pokusaja. To je zakon
i

'
izvaljna mijenjati; npr. aka istra:lujema odnas izmedu kaliCine alkahala
multiplikacije. Ali buduci da kod Iota nije vaian redoslijed kojim su ti
brojevi izvuceni, znaci data cetiri broja mogu biti izvucena na 24 moguca u ~i i vremena reakcije, onda je vrijeme reakcije zavisna varijabla, a
kohcma alkohola u krvi nezavisna varijabla.
nacina (to je tzv. "zakon kombinacije", a on ovdje iznosi faktorijel broja I
I
4, tj. 4x3x2x1=24), toznacida (primjenomzakonasumacije) trebako- I . Ako istrazivac ne maze svojevoljna manipulirati nezavisnom vari-
I
nacnu vjerojatnost izracunati zbrajanjem prethodne vjerojatnosti dva- I
Jablm~:t, on prati pro.mje~e ~.za~snoj varijabli u vezi sa (spontanim)
deset Cetiri puta (0,000198 X 24) jednako je 0,004752, dakle U prosjeku promJen~ma u ~ezavtsnoJ vanJabh (npr. prati promjene u kvaliteti prija-

oko 4 do 5 puta na 1000 pokusaja. P ma kratkih rad10valava u funkciji kalicine suncanih pjega).
U nekim slucajevima misljenje o tome sta predstavlja nezavisnu a
zakrivljena korelacija Takva povezanost izmedu dvije iii vise varijabli ' s~~ zavisnu v~rijablu ovisi o hipotezi koju pri istrazivanju relimo provje-
koja nije lineama, vee zakrivljena, tj. > crta regresije nije pravac. Postoje ~Jtt: ~~? npr. Jstrazujema pavezanost izmedu mladenacke delinkvencije
dvije glavne vrste zakrivljene povezanasti: ana u kajaj zakrivljenast pa- ~ kohcm~ gledanja nasilnickih televizijskih iii filmskih programa, pa
staji, ali crta regresije ne mijenja smjer (npr. adnas izmedu broja pa- 1~amo htpatezu da gledanje takvih program a manje ili vise uzrokuje de-
I•
navljanja neke vjeStine i radnog uspjeha u toj vjestini: u pocetkuje na- •
'
.hn~entno P<.masanj~, ~nda delinkventno ponasanje predstavlja zavisnu
predak brz, a kasnije sve spariji; u grafickam prikazu dobije se > krivulja van}a~:u: Ali ako mtshmo da "delinkventna licnost" tezi promatranju
~astlm_ckih pr~~ama, onda frekvencija gledanja tih programa predstav-
negativne akce/eracije), i ana u kajaj zakrivljenast mijenja smjer, tj. crta
lJa zav1snu vanJablu, dokje provjera stupnja delinkventnosti nezavisna
regresije ima oblik abrnutag slova U (npr. adnas izmedu d?bi i rezultata
I
I
varijabla.

II
)
i
I
I
I
238 ZAVISNA VARIJABLA ZLOUPOTREBASTATISTIKE 239

Zavisnom varijablom naziva se i ona vrijednost koju mozemo cije iz neke izricito asimetricne iii potpuno pravokutne distribucije ), a
predvidjeti iz vrijednosti neke druge varijable: npr. opseg kruga moze se kao primjer za drugo je kauzalna interpretacija neke postojece korela-
potpuno tocno predvidjeti iz podataka o velicini polumjera kruga. I cije, a da pri tome nacrt eksperimenta nije bio takav da bi dopustao
ovdjc, dakako, mozemo odnos okrenuti pa polumjer smatrati zavisnom,
II
I
I zakljuCivanje na uzrocnu vezu (npr. tvrdnja da korelacija izmedu visine
a opseg kruga nezavisnom varijablom. P
inteligencije i razine skolovanosti dokazuje da skolovanost razvija inte-
ligenciju). Jedan ad najpoznatijih primjera pogresne upotrebe stati-
zavisni uzorak Drugi izraz za uzorke u korelaciji ito uvijek kada nam
sticke metode (kojaje posljedica nedovoljnog znanja) jest povijest kori-
ista skupina ispitanika slu:Z.i kao eksperimentalna i kao kontrolna skupi-
stenja hi-kvadrat testa. Svojedobno je jedan statisticar provjerio sve do
na, odnosno kad se istovrsno mjerenje ponavlja na istim ispitanicima.
njegova doba objavljene istrazivacke radove jedne skupine casopisa u
Na primjer, aka na nekom uzorku ispitamo prosjecno vrijeme reagira-
nja svakog pojedinca u trijeznom stanju, a nakon toga pod utjecajem kojima je koristen hi-kvacL:at test, te je nasao veoma velik postotak ra-
alkohola, pa nas zanima je li dohivcna razlika u vrcmenu rcakcije > sta- dova s pogresnom primjenom: najcesce se radilo o tome da su umjesto
tisticki znacajna, imamo najcisCi oblik zavisnih uzoraka. Ako zbog ra- frekvencija u racun uzimani mjereni rezultati, ili pak o tome da su
zlicitih razloga nije moguce iste ispitanike koristiti kao kontrolnu skupi- umjesto realnih frekvencija u racun uzimane postotne frekvencije (sto
nu (npr. zato sto bi samo ponavljanje mjerenja dovelo do promjene re- potpuno mijenja rezultat, jer seN time svodi na 100). No, dakako, ima i
zultata ), onda mozemo za svakog ispitanika pronaCi njegov "par", tj. is- namjernih zloupotreba statistike, koje se koriste da bi se toboze
pitanika sa sto slicnijim onim karakteristikama koje bi mogle imati utje- "znanstvenim metodama" dokazala neka pojava: one mogu biti na pla-
caja na zavisnu varijahlu (npr. starost, spol, obrazovni status, sociocko- nu dcskriptivnc statistikc, kao sto su npr. neki oblici grafickog prikaziva-
nomski status itd.), pa u tom slucaju opet imamo priblizno zavisnc uzor- nja koji izazivaju drugaciji dojam od onoga koji proizlazi iz cistih cinje-
ke. Zbog toga se takvi pokusi cesto izvode na jednojajcanim, tj. "iden- ' nica: npr. ako se zeli umanjiti dojam nekog povecanja gubitaka (npr.
lI
ticnim" blizancima. U slucaju rada na zavisnim uzorcima koriste se po- povecanja inflacije), usporedivanjem dvaju razdoblja u trodimenzional-
nes to izmijenjeni statisticki postupci provjeravanja znacajnosti razlika nim crtezima 100-postotno povecanje neke vrijednosti nece graficki da-
medu njima, tj. u statistickim formulama mora se uzeti velicina korela- vati taj dojam (kocka dvostrukog volumena ne daje dojam dvostruko
r
cije koja postoji medu rezultatima mjerenja dobivenim u dva navrata (> vece kocke!). Takoder, zeli lise uvecati dojam o nekoj promjeni, rezul-
standardna pogreska razlik<! izmedu dvije aritmeticke sredine, > metoda tati sc prikazu u koordinatnom sustavu komc jc onlinata temcljito
diferencije). P skracena (tj. ne pocinje ad nule, ana to nije u crte:Z.u upozoreno!), pa i
male promjene u mjerenoj pojavi mogu- uz povecanu skalu vrijednosti-
zloupotreba statistike Kao sto se dogada is ostalim znanjima i vje8ti- !' stvoriti dojam da su velike. Jednako tako zloupotrebe mogu biti i na
nama, i statistika se moze zloupotrijebiti. Najeesce zloupotrebe statisti-
planu inferencijalne statistike (npr. namjerno tumacenje korelacijske
ke nisu namjerne, tj. one su posljedica nedovoljnog (ili nikakvog) sta-
veze kao dokaz za uzro~nu vezu ). RazliCite operacije s postocima cest su
tistickog znanja, ili posljedica neprimjerenog zakljucka iz dobivenih re-
primjer proizvoljnog i namjernog iskrivljavanja cinjenica u svrhu zava-
zultata. Kao primjer za prvi slucaj mozemo navesti obavijesti o pojefti- '

njenju neke robe za 150%, upotrebu nekog statistickog postupka koji za ravanja a nih kojima je informacija namijenjena. U podrucjupropagande
konkretnu situaciju ne dolazi u obzir (npr. racunanjc standardne dcvija- takvc su zloupotrehc mozda i najcdee. P

-----------------~----
'
I
240 ZNACAJNOST KOEFICIJENATA KORELACIJE I
I z- VRIJEDNOSTI 241
I
znacajnost koeficijenta korelacije Kao i sve druge izracunate statisticke I z-vrijednosti (standardne vrijednost! Oznacuju olozaj pojedinog re-
'
vrijednosti, tako sui korelacije vrlo rijetko izracunate na cijeloj > popu- I -
zultata u nekoj normalnoj raspodjeli, ito tako da seta vrijednost izrazi u
laciji, nego su dobivene na > uzorcima. To znaci da dobivene vrijedno- I
/ I dijelovima standardne devijacije; npr. ako aritmeticka sredina neke nor-
sti nisu "prave" vrijednosti, nego njihove "procjene" (> standardna po- -
I
I maine raspodjele iznosi 100, a standardna devijacija 10, onda rezultat
gre5ka). Stoga uzvecinu statistickih vrijednosti izracunavamo i pogresku
koja se uz tu vrijednost vezuje. Kod r koeficijenta korelacije iii nekih velicine 110, buduCi da pada tocno na 1 standardnu devijaciju iznad
I prosjeka, ima z-vrijednost + 1, rezultat 85 ima z-vrijednost -1,5 itd.
drugih koeficijenata korelacije (> Rho, > Tau, > multipla korelacija,
I itd.) pogreska se maze izracunati pomocu adekvatnih formula, ali j~ '' z-vrijednost se dakle izracunava po formuli:
I
cesto jednostavnije upotrijebiti tablice koje su izradene za neke koeft- I X-M
cijente korelacije. Iz tablice mozemo - vodeCi racuna o broju parova - I z=---
s
odmah odcitati kolik() mora najmanje iznositi neki koeficijent korela- I
cije da bismo ga mogli smatrati "statisticki znacajnim". Dakako i ovdje,
I pri cemu X znaCi pojedini rezultat, M aritmeticku sredinu, a s stan-
I dardnu devijaciju.
kao i kod svih drugih statistickih vrijednosti kod kojih izracunavamo I
jesu li "statisticki znacajne", zakljueak u velikoj mjeri ovisi o velicini z-vrijednostijcdan su od naj oznatijih naCina > baidarenja nckog
uzorka: i vrlo mala korelacija (npr. 0,05) moze biti "statisticki znacajna" testa. Buduci da se one krecu od -3 do +~_(s aritmetickom sredinom ,
ako je dobivena na vrlo velikom uzorku. Takvu korelaciju interpreti- katkada se, zbog prakticnosti, z-vrijednostima dodaje broj 5, pa se do-
ramo ovako: prakticki smo sigurni da ona nije slucajna, nego da postoji u biva skala od 2 do 8, s prosjekom 5, i u tom slucaju te se vrijednosti nazi-
populaciji, ali je toliko niska da nije gotovo ni od kakve prakticne vaju standardnim vrijednostima. Iz tablica z-vrijednosti moze se odcitati
v •
vaznosti.
I Najeesee se znacajnost > r koeficijenta korelacije, > Rho koefi-
koliki se dio povrsine normalne raspod'ele nalazi iznad iii isood nfu
z-vrijednosti; npr, ako u nekom testu koji daje normalnu raspodjelu s
cijenta korelacije i njima slicnih koeficijenata odreduje po formuli aritmetickom sredinom 50 i standardnom devijacijom 6, neki ispitanik
N-2
postigne 44 boda, to znaci da u skupini ima oko 84% ispitanika koji su
I
t= bolji od njega, a oko Hi% onih koji su slabiji. Tahlica z-vrijcdnosti i
1-r 2 •
I povrsina normalne krivuljc nalazi se u Dodatku A.
Umjestormoze biti p (rho) iii neki drugi koeficijent. U > t-tablici,
uz N-2 stupnja slobode (i odabranu razinu rizika), moze se utvrditi je li _Uz pomoc z-vrij~dnosti i slicnih vriiednosti koje se osnivaju na
I dobivena vrijednost t manja, jednaka iii veca od granicne u tablici ~tandardnoj devijaciji (> skale baidarenja, interpretacije c usporedivanja
•I
(tablica u Dodatku B). Kod koeficijenata korelacije koji se racunaju s rezultata), mogu sc ispravno usporediyati rczultati sto su ih i m ·1
pomocu > hi-kvadrat testa, znacajnost koeficijenta pokazuje x?: ako je I
I postigli u dva ih VISe testova; n r. kada bi tri testa imali ove ros ·eke i
standardne devijacije:
on znacajan, znacajan je i koeficijent korelacije. P,K

C{ Aritmeticka sredina Standardna devijacija


Test 1 50 10
z-skala > z-vrijednosti
I Test 2 100 12
zvonasta krivulja > normalna distribucija Test 3 12 1

I
I
242 z-VRIJEDNOSTI I
I
a tri ispitanika postignu ove rezultate: I
lspitanik Test 1 Test 2 Test 3 Ukupno
A 50 112 10 172 Koristena literatura
B 65 88 12 165
c 46 100 15 161

pogresno bi bilo zakljuCiti da je ispitanika A u ukupnom rezultatu


najbolji a ispitanik C najlosiji. Aka naime rezultate pretvorimo uz-vrije- Besac, F.P., and Besac, P.L. (1985). Statistics for the helping professions.
dnosti, dobivamo avo: London: SAGE Publications.
Bujas, Z. (1981). Uvod u metode eksperimentalne psihologije. Zagreb:
Ispitanik Test 1 Test 2 Tcst3 Ukupno v

Skolska knjiga.
A 0 +1 -2 -1
Castle, W.M., and North, P.M. Statistics in small doses. Edinburgh:
B +1,5 -1 0 +0,5 I Churchill Livingstone.
I
c -0 4
'
0 +3 +2,6 Chow, S.L. (1996). Statistical significance. London: SAGE Publications
Cohen, L, and ~olliday, M. (1979). Statistics for education. London:
pa vidimo da je po ukupnom rezultatu ispitanik C znatno najbolji, a ispi- Harper and Row.
tanik A najlosiji. I Cohen, S.S. (1988). Practical statistics. London: Edward Arnold.
Jos veca korist od z-vrijednosti vidi se u situacijama kada uo12ce I Corsini, R.J. (Ed.) (1994).Encyclopedia of Psychology. New York: John
.l nismo u mo 'UCllQ.sti da zhrajamo "sirovc" (hruto) postignute poene ili
ho · ckog_I2Qicdi~ca, jcrsc ra(h o posvc razlicitim podrucjima. Na
Wiley and Sons.
DuBois. P.H. (1965). An introduction to psychological statistics. New
- primjcr, u nckom pctoboju odrcdcni ispitanik u svakoj od 5 atlctskih dis-
York: Harper ::m d Row, Publ.
ciplina postigne rczultat koji se po vrsti razlikuje od drugih rezultata
(treanje 100m izrazeno je u sekundama, bacanje koplja u metrima, skok Dunn, O.J. (1964). Statistics. New York: John Wiley and Sons.
uvis u ccntimctrima, itd.). Prctvaranjem svakog rczultata uz-vrijednost Dowie, J., and Lefrere, P. (Eds.) (1980). Risk and Chance. Stony Stan-
dobiva se ukupni uspjeh svakog pojedinca. Tablice bodova na ovakvim ford: The Open Univ. Press.
natjecanjima izraduju se na slicnim principima, tj. na principimaz-vrije-
Everitt, B.S. (1996).Making sense ofstatistics in Psychology. Oxford, New
dnosti svakog rezultata. P
York, Tokyo: Oxford University Press.
Ferguson, G.A. (1966). Statirtical analysis in psychology and education.
r London: McGraw-Hill.
Frankfort-Nachmias, C. (1996). Social statistics for a diverse society.
Thousand Oaks: Pine Forge Press.

Potrebbero piacerti anche