Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
'
nclitivnn skala Svaka > skala (opazanja ili/i mjerenja) na kojoj je nume-
rickc vrijcunosti opravdano podvrgnuti aritmetickoj operaciji zbrajanja.
Takve su, primjerice, > intervalna skala i > omjema skala, aline i > no-
minalna skala ili > ordinalna skala. K
...12.. .. _..
~ , ___ A --HIPOTEZA
__ .. -----· -·-·---- ALTERN A TIVN' -
-...:::::.::..:--~· ·--· -'-"-=;_:_
----· - -~--=...:.-- - -·=-=---------
ANALIZA VARIJANCE
l'
ultcrnativna hipotcza Hipoteza, koja je suprotna > nul-hipotezi, tj. hi- gijsko istr3Zivanje organizira u tzv. prirodnim (nelaboratorijskint )
poteza koja predstavlja alternativu hipotezi kojaje podvrgnuta provjeri uvjetirna u kojima je tesko provediv slucajan odabir ispitanika iii ispit a
(> testiranje hipoteze, > nul-hipoteza). Na prirnjer, ako bi nul-hipoteza. nici nisu izjednaceni po tzv. relevantnim faktorirna. Tako npr. ako bi
glasila "pogadanje ovog parapsihologa ne odstupa statisticki znacajno ispitavala djelotvornost dvije metode poducavanja u stvarnim skolsk illl
od slucajnog pogadanja", pa nam obrada rezultata pokaze da nul--hipo- prilikama, bilo hi zbog prakticnih razloga najjednostavnije uzeti dva {t it
tezu moramo odbaciti, prihvacamo alternativnu hipotezu, tj. njegovo vise) postojeca skolska razreda kao dvije sku pine ispitanika ina svakom
pogadanjeodstupa od slucajnog pogadanja. Nozasto odstupa, to vise ne- od njih primijeniti jednu metodu poducavanja. Medutim, ako se dogodt
ma veze s alternativnom hipotezom. Drugim rijecima, ako smo nul-hi- da se ucenici u ta dva razreda razlikuju po inteligenciji, o kojoj cc ta
potezu formuliiali u obliku "ne postoji ekstrasenzorna percepdja", koder ovisiti rezultati poducavanja, onda zakljucci o eventualnim ra~ lt
onda odbacivanje nul-hipoteze nika1:o ne znaci prihvacanje alternativ- kama u brzini kojom je nauccna ista kolicina gradiva, prezentirana jr' I
ne hipoteze u obliku "ekstrasenzoma percepcija postoji". Neki statisti- nom iii drugom rnetodorn, necc biti valjani. Buduci da > kovarijllllt•l
cari alternativnu hipotezu nazivaj1.l i > direktivna hipoteza. P ukazuje na stupanj kovariranja dvije varijable, moguce je > sume kvad
rata u zavisnoj varijabli s pomocu kornponenata kovarijance stattst i kl
•
analiza cestica Statisticka analiza elementarnih dijelova (cestica) psi- kontrolirati s obzirom na eksperimentalno nekontroliranu varijablu. Nn
hologijskog mjernog instrumenta (testa, upitnika itd.). U angloameric- cfekte tc statisticke kontrole utjece velicina kore!acije izmedu nekon
koj se literaturi upotrebljava izraz item analysis. Obicno se sastoji u troliranc i zavisne varijablc (efekt se potpuno gubi aka je korelal'ij
odredivanju tefine zadataka izrazene postotkom tocno rijesenih zada- nu!a ), ali utjcce i veliCina razlika izrnedu sku pin a ispitanika u nekont ru
taka iii odgovora odredenog tipa u upitniku i odredivanju tzv. indeksa liranoj varijabli kao i veliCina razlika u zavisnoj varijabli. K
diskriminativne valjanosti, kojim st.: ustanovljujc koliko ncki zadatak u
testu uspjesno diferencira skupinu boljih od skupine slabijih ispitanika analiza tJ·cnda Statisticka analiza serijc podataka (dobivenih sukcc 1
po ukupnom rezultatu u testu odnosno koliko neki odgovor u upitniku nim opazanjcrn iii rnjcrenjern) kojoj je cilj utvrditi: (a) slijede li sukcc lv
diferencira dvije skupine koje se razlikuju po ispitivanorn svojstvu. Taj ne promjene prikupljenih podataka pravocrtni (linearni) iii zakrivlj
se indeks izraZava > koeficijentom kore/acije, koji pokazuje stupanj po- (nelinearni iii kurvilin.earni) tijek; ako slijede pravac, utvrduje se i nj
,. • vezanosti svake posebne cestice i ulrupnog rezultata u testu (iii upit- gov nagib odnosno strrnina, a ako su nelinearne, utvrduje se tip
niku). Mogu se odredivati i drugi statisticki pokazatelji kao sto su, prim- ljcnosti (primjcrice odgovara li krivulja kvadratnoj iii nekoj drugoj fu
jerice, interkorelacije medu svim eesticama rnjernog instrumenta, koje ciji); i (b) imaju li dvijc krivulje (iii vise njih) podjednak iii razlicit tijck
ukazuju na nutarnju strukturu mjernog instrumenta ili korelacije poje-
•
srnjer. Postoji vise razliCitih statistickih (matematickih) postupaka
dinih cestica s nekom drugom, izvan1skom varijablom. K se koriste u analizi trenda. Analiza trenda omogucuje > ekstrapo/11
• na temelju dobivenih podataka u nekom istrazivanju. K
analiza kovarijance Statisticki postupak koji predstavlja ekstenziju >
ana/ize varijance na slucajeve u kojima nije bilo moguce eksperimental- analiza varijancc (U literaturi na engl. jeziku ohicno se rabi akro
nim postupkom kontrolirati faktor (ili faktore) zbog kojih se sku pine is- ANOVA, od analysis of variance, a u hrvatskom mogla hi se
pitanika u eksperirnentu medusobn<_t razlikuju, a koji su u korclaciji sa kratica ANVA). Statisticki paramctrijski postupak kojim se
zavisnom varijablom. Takvi se slucajevi javljaju pretdno kad sc psihnlo- pbstoji 1i statisticki znacajna razlika izmedu vi~e skupina rezultat
14 ANALIZA VARIJANCE APSOLUTNA VRIJEDNOST
. ' 15
statisticki znacajno ), tocnijc, izmedu vetcg broja aritrncti~kih sredina. ljaju aproksimacijc. Pri tome "ne~to drugo" (skup matematickih iii dru-
Temelji se na procesu odluCivanja koliko od ukupnog (totalnog) varira- gih simhola) rcprczcntira "nc~to" (promjcne pojave koja se istraZt1je) uz
nja individualnih rczultata otpada na sistcrnatski uzrok (utjecaj razli6- ~~~ctpost~vku da to "ne~to drugo" predstavlja dovoljno dobru i upotreb-
•
tih vrijednosti nezavisne varijablc ), a koliko na slucajnc, akcidcntalne lJIVU zamJcnu. Aproksimacijom se, medutim, nikada ne reproduciraju
faktore koji se nazivaju faktorima "pogreske" i koji sene mogu pripisati sve osobitosti osnovnih podataka. Primjerice, srednjom vrijedno~cu ra-
poznatom sistematskom uzroku. Moze se razlikovati > jednostavna zreda rezultata grupiranih u razrede aproksimiramo rezultate koji se
'1' analizavarijance (JANV A) i >slozenaanalizavarijance (SANVA). K nalaze u nekom razredu. Time smo, dakako, zanemarili neke karakteri-
stike rezultata (npr. mcdusobnu razliku rezultata koji spadaju u isti
\ anketa Provodenje ankete (u engl. govornom podrucju koristi se termin razr:d), ~li, s druge strane, u nekim slucajevima to pojednostavlienje
. survey, sto znaci prcgled, izvjestaj, procjenjivanje, anketa, nacrt, plan olak~ava 1~brza~a daljnju statisticku obradu rezultata i, ~to je v<lZnije,
itd.) usko je povezano s koristenjem statistike ito dvojako: pri odabira- olaksava OJihovu mterpretaciju,jer se cesto aproksimacijom odstranjuju
nju uzorka i pri obradi dobivenih podataka. Anketa je, govoreCi opceni- ·akce.~orne znac~jke re~ltata. No, aproksimacija je valjana samo ako je
I to, postupak odredivanja odredenih znacajki i njihove vaznosti na jedi- poshgnuta zamJena koJa ne unosi bitne izmjene u strukturu i smisao ori-
I nicama neke cjeline. Primjena ankete (upitnika i/ili testova) omogucuje gin~inih r~z~!t~ta. Zbog toga se, kad god je to moguce, egzaktno, s po-
zakljucivanje o naravi ispitivanog prcdmcta i omogucujc kvantifikaciju m~cu s~ahst1c~th ~est~:'a provjerava, primjerice, pristaje li neka empirij-
rezultata u obliku procjcne (> procjena parametara) o ponasanju (od- s.kl U.Oi:IVCn~l diStrtbUCIJCI liZ distribuciju-model kojom ce se aproksimira-
govorima) svih statistickihjedinica (koje cine populaciju) ito uz poda- tt ongmalnt rezultati. K
tak o granicama nesigurnosti (ili sigurnosti) procjenc s odredenom
apscisa Horizontalna os (osx) u > koordinatnom sustavu. K
(odabranom) vjerojatnoscu. Te su gran icc ncsigurnosti uzrokovane ma-
lim, slucajnim (akcidentalnim) i mcdusobno nezavisnim varijacijama apsolutna nul a Potpuna stvarna odsutnost pojave koja je predmet mje-
svih vrsta: varijabilitetom medu jcdinicama (ispitanicima, skupinama rcnja (> omjerna skala). K
,_ ispitanika iii predmeta ili drugih statistickih jedinica), varijabilitetum u
primjeni upitnika ili testa, u kodiranju i dekodiranju odgovora ispitani- ~~so~~tn~. procje~a (engl. absolute rating) Procjena neke velicine (veli-
ka itd. Rezultati anketc mogu se podvrgnuti u nacelu svim univarija- cmc 111 vriJednosti podrazaja) ucinjena bez izravne usporcdbe s nekom
tnim, bivar~jatnim i multivarijatnim statistickim postupcima. K drugom vciicinom ili drugim podrazajima. K
'
- - ---
~
16=--
· ___
· · _ _._...::...A:::.R.:::B:..:.ITR
.=.c:..::.AR
:c..::::.c::::..c
NO_~QNDERIRA~~ ----· ____ . ___ ____ ATENUACIJA KOEFfCIJENATA KORELACIJE II
. -· · -- -
-
---~ -----
I arbitrarno ponderiranje > ponderiranje. asocijacija (u statistici) (lat. rijecassociatio znaci udruzivanje, spajanjl·,
savez, pridruzivanje) Upotrebljava se kada se opcenito govori o pow
area uzorak > klaster uzorak zanosti medu varijablama, a odnosi se na hilo koju statisticku vri"
koja pokazuje neku povezanost (ili pomanjkanje povezanosti) mcll11
aritmeticka sredina Jedna od > sredisnjih vrijednosti koje se koriste u
varijablarria, primjerice > koeficijent korelacije, > regresij"sku analiz.t'.
'
statistici, a koja se odreduje taka da se sve vrijednostiu nekom skupu re- v
•
kojim ih jc 10 s tamnom kosom. Kojajc vjcrojatnost da cemo po slucaju
izahrati iz sobc osohu koja cc biti muskarac? To je naravno lake rijesiti:
vjcrojatnost iznosi 0,5 Ucr ima jcdnako muskaraca i zena). No ako
• .. ' j •
doznamo da izabrana osoba, koju jos nismo vidjeli, ima tamnu kosu,
vjerojatnost da je ta osoba muskarac sada je veca od 0,5.
1/2 1/2
'"
Baycsov postulat Ncpoznatc vjcrojatnosti mcdusohno iskljucivih doga- 7/10 8/10 Vjerojatnost da ccmo izmedu 50 muska-
daja ne smiju sc smatrati jcdnakima, a ccsto u zivotu cinimo lu pogrd- raca (od kojih .15 imaju tamnu kosu) i 50
zcna (od kojih jc 10 s tamnom kosom)
ku. Primjcr: aka imamo 3 novcica, od kojih jc jcdan ispravan (daklc slucajnim izhorom "izvuci" tamnokosog
saddi "glavu" i "pismo"), drugi na obje strane ima samo "glavu", a trcCi 50 mu§karaca 50 tena mu~karca iznosi 0,60 ( > Bayesov princip ).
'" na obje stranc samo "pismo", pa iz scsira izvuccmo jed an novCic koji na
.
jcdnoj strani ima "glavu"i zclimo pogoditi sto mu jc na drugoj strani, Racunski sc tocna vjcrojatnost izracunava ovako: vjcrojatnost da iz-
skloni smo kazati da je 50% vjerojatno da je na drugoj strani "pismo". mcuu svih 100 osoba slucajno izaberemo tamnokosog muskarca iznosi
To zakljucujemo zato sto smo iskljuCili iz daljnjc kombinacijc novCic 0,5 X 0,3 = 0,15, dok vjcrojatnost da je to zena iznosi 0,5 X 0,2 = 0,10.
"pismo" -"pismo", pa znamo da.izvuceni novCic moze biti jcdino "gla- Dakle, vjerojatnost da je tamnokosa osoba, koju smo slucajno izabrali,
va" -"glava" iii "glava" -"pismo", i pogrcsno smatramo da za svaku od ovih ujcdn9 i muskarac, iznosi:
mogucnosti (jcr su samo dvijc!) postojijcdnaka vjerojatnost, daklc 50%
, -50%. Ustvari, vjcrojatnostjc oko 6G% dajc novcic "glava"-"glava", a 0,15 = o·oo
oko 34% da je novCic "glava"- "pismo". Baycsov postulat treba razliko- 0,15+ 0,10 '
vati od > Bayesova principa, koji se odnosi na promjenu vjerojatnosti u
vezi s novim informacijama. P 2. primjer: Pretpostavimo da zelimo odluCiti moze 1i jedan zatvorcnik
! biti pusten na uvjetnu slobodu. Dosadasnje iskustvo pokazuje da je
!
• Uayesov princip (Uaycsova vjcrojatnost) Takvo izracunavanjc vjerojat-
•
takva praksa bila u 40% slucajeva uspjesna, tj. zatvorenik se socijalizirao
nosti nekog slucajnog ishoda, koje sc mijenja pod utjccajcm novih iii do- i nijc upadao vise u kriminal. Mozemo li poboljsati prognozu ako dozna-
datnih informacija. mo da 80% uvjctno otpustenih uspijeva aka su ozenjeni, dok medu
1. primjer (vidi sliku ): Pretpostavimo da se u nekoj prostoriji nalazi 50 neozenjenima uspijeva samo 30%. Uz pomoc te nove informacije, aka je
muskaraca, nd kojih p<.:tnacstorica imaju lamnu kosu, i 50 zcna, mcclu nas kandidat ozcnjen, racun izgleda ovako:
'
•
...
•
•
22 BIMODALNJ\ DISTRIBUCIJA BINOMNI POUCAK 23
·-------------------=~~~~~~~~----------------~
graficki prikaz simctricne bimodalne distribucije (A) i asimctricnc hi- teorijsku osnovu za odredivanjevjerojatnosti ishoda nekih dogadaja, sto
modalne distribucijc (B). Bimodalna distribucija pokazujc da su pri u statistici slufi za usporedbu s dobivenim vrijednostima pri nekom
•
_!.lljerenju uklj,uccni ispjtanici ko.ii UQ udgUYara· u ·cdnoznacno i precizm1 mjcrcnju ili opazanju. Uzmimo da sup i q dva medusobno nezavisna i
definiranoj > statistickojj edinici (uzorci · ada· u 'stu isk1juCiva ishoda nekog dogadaja, da je vjerojatnost svakog oct njih 0,5
••
s iju) ilisva mje en·a ni b ~jena . ujedn: (p+q moraju iscrpljivati sve moguce ishode, tj. mora bitip+q=l) te da
EI.ieren·u · oso ednom ispita:niku _(primjerice, u drugom tih dogadaja ima n, onda binom i:z;gleda ovako: (p+q)n. Opec pravilo za
dj$ln od nekoliko_desdaka.mjerenja na w.yltat~_ mjerenja djelovao jc razvijanje binoma jest:
umor is ita · ·) (> vi.~emodalna distribucija). Medutim, postoje i sluca-
jcvi stvarne himodalnc distrihucijc, kao npr. promjcr srca. K
•
(A) (B)
'
Zamislimo si da bacamo kovani novCic, a ishod tog bacanja moze biti ili
"pismo" iii "glava" s vjcrojatnoscu oct 0,5 za "pismo" kao i 0,5 za "glavu".
L.:::::::_ _______\_._
L...::::----- - - - - - -· - - - - -- · - ... Ako istodobno bacimo dva novcica, onda sc vjerojatnost pojedinih is-
Primjcr simctricne (A) i asimetricnc (B) bimodalnc distribucije . hoda moze dobiti razvijanjem binoma (p+q)n, gdje je p vjerojatnost da
•
'
~---- ·--------------------------------
'•
- '
BISERIJALNI KOEHCIJENT
•
KORELACIJE 25
=-24.:.___·__• '_· ---~B::!:IN~OM::.!NJ POUCAK ------~~~~~~~:...:...;_::===-=-==------
canja novcica da bi se baremjedanput teoretski ostvarili najmanjc vjcro- > dihotomizirane varijable (ali koja je stvarno, kad hi hila preciznije rnje-
jatni ishodi. Za gornji primjer to bi bilo ovako: rena kontinuirana i normalno distribuirana) i varijable koja je izrazena
' .
rezultatima na kontinuiranoj ljestvici. Primjerice r111 mogao bi se izracu-
nati izmcdu varijahle "uspjeh na ispitu", koja jc izrazena u samo dvije
) kategorij~.:·"prosli", "pali", i varijahle "intelektualni status" izrazene re-
To znaCi da moramo najmanje 4 puta baciti po dva novcica da bismo teo- zultatima u odgovarajucern testu (dakle, na intervalnoj skali). Za varija-
retski harem jedanput dobili "pismo" na oba novCica (25%) i jedanput
' ' hlu "uspjeh na ispitu" moze se opravdano pretpostaviti da je stvarno
"glavu" na oba novCica (25%) i dva puta najednom novcicu "pismo", a kontinuirana kad bi je hilo moguce precizno mjeriti (vee ljestvica skol-
na drug om "glavu" (50% od 4 bacanja ). Kad bismo bacali de set novcica skih ocjena daje veCi hroj vrijednosti) i da ima normalnu distrihuciju.
istodobno (kad bi, dakle, bilo n = 10), morali bismo, teoretski, novcicc Koeficijcnt ru 1 rnoze se izracunati po ovoj formuli:
baciti 1024 puta da bismo jedanput dohili na svih deset "pismo" i jcdan-
put na svih deset "glavu". U gornjojjednadzhi, kako se vidi, u brojniku se MYl -M
· Yt
nalazi hroj ostvarenih ishoda, au nazivniku broj potrebnih dogadaja da s y,
bi se ti ishodi ostvarili - u teoretskom slucaju. Brojevi koji se u gornjoj
jednadzbi pojavljuju na desnoj strani znaka jednakosti ito u brojniku (tj. Upotrijehljcni simboli imaju ovo-znacenjc: My 1 = aritmcticka sredina u
1,2,1) zovu se "hinomni koeficijcn.ti", a mogu se dobiti is pomocu > kontinuiranoj varijabli (Y) onih ispitanika koji se u dihotomiziranoj vari-
Pascalova trokuta. jabli nalaze u kategoriji kojoj je arbitrarno pridijeljena oznaka "1" (u
' U statistici se ovaj "binomni model" iii "model binomne distribu- gornjcm primjcru to bi hili oni koji su "pali"), a ta je kategorija bli:za is-
cije" vrlo cesto koristi za rezultate u dihotomnim varijahlama u kojima hodislu, kad hi hila prikazana u koordinatnom sustavu; My2 = aritmeti-
su podaci tipa tocno-nctocno, musko-zcnsko, zivi-umrli, postoji ncko cka srcJina u konlinuiranoj varijabli (Y) onih ispitanika koji se u dihoto-
ponasanje-ne postoji neko ponasanjc itd. Model sluzi za postavljanje miziranoj varijabli nalaze u kategoriji kojoj je arbitrarno pridijeljena ,
frekvencije ishoda sukladno njihovoj teoretskoj vjerojatnosti (teoretska oznaka "2" (u gornjem primjeru oni koji su "prosli"), a ta je kategorija
vjerojatnost binarnih ishoda moze biti 0,5:0,5, alii bilo kakav drugaCiji dalje od ishodista, kad hi hila prikazana u koordinatnom sustavu; Syu =
odnos) jer se zatim statistickim postupcima testira nul-hipoteza da .se
standardna devijacija ukupnih rezultata (svih ispitanika zajedno) u Y
dobivene frekvencije ne razlikuju od teorijskih (koje su dohivene po
varijabli; p 1= proporcija ispitanika u kategoriji "1" (n 1/N);p2 = propor-
slucaju, tj. nisu pod utjecajem nikakvog sustavnog faktora, npr. ncke
cija ispitanika u kategoriji "2" (niN); v = visina ordinate normalne kri-
nezavisne varijable ).
• vulje u tocki koja dijeli povrsinu normalne krivulje na segment PI i P2· ,
Kad je vjerojatnost binarnog ishoda 0,5 prema 0,5, povecavanjem ••
broja dogadaja dobivena distribucija ishoda priblizava se normalnoj dis- Logika rhi vrlo je jednostavna: ako jeMy2 vece odMy1, to znaci ua is-
tribuciji (> binomna distribucija, > stablo vjerojatnosti, > Pascalov pitanici u kategoriji "2" postizu u prosjeku vece rezultate u varijabli Yod
trokut). K ispitanika iz kategorije "1", i tada postoji pozitivna korelacija izmedu
varijabli izmedu kojih se odreduje stupanj povezanosti (npr. varijable
bisel"ijalni koeficijent korelacije (rb1iii rb 1.) > Koeflcijent serijalne ko- "uspjch na ispitu" i varijablc "intelektualni status"). Ako je My 1 vece od
relacije koji sc upotrebljava za odredivanje stupnja povezanosti izmcdu M y2>. to 6c ukazivati na ncgativnu povezanost medu varijablama, a ako
'
-26 BISERIJALNI KOEFICIJENT KORELACJ_J!!='=--·-----·-·· ------------~B~R~O~JC=AN~A~SKAL~=A~------------~2~7
medu ovim aritmctickim srcdinama nema nikakvc razlikc (iii jc ona varijablc, a maze se takoder vidjeti opCi tip povezanasti, tj. radi lise o li-
slucajna) anda nema ni povezanosti mcdu varijahlama. nearnoj iii nelineranoj korclaciji. K
Pagreska rh 1 je poznata, pa je mogucc provjcriti njczinu statisticku •
znacajnost, alije logicki razumljiv ijednostavniji naCin usporedbom arit- bivarijatna korelacija Korelacija izmedu dvije varijable. K
•
metickih sredina jedne i druge sku pine ispitanika (My1 iMy2): ako je razli-
biYarijatno Ono sto se odnosi na dvije varijable (istodobno). Taka se
ka medu njima statisticki znacajna, znacajan je i rh;·
govori o > bivarijatnoj distribuciji, > bivarijatnoj korelaciji i sl., za razli-
Za upotreburh1 u daljnjoj elaboraciji nema statistickog opravdanja; ku od > univarijatnog. K
taka primjeriee ovaj kocficijent ne moze se karistiti ni za odrcdivanjc >
lcoeficijenta detenninacije (tj. nc maze ga sc ni kvadrirati). b-koeficijenti > beta ponderi, > regresijski koeficijenti
Ako je patrcbno racunati stupanj pavezanasti izmcdu stvarna di-
hotamne varijable i kantinuirane varijable, onda trcba upatrijcbiti > bodovanje (a) Davanje adredene brojcane vrijednosti svakam pojedi-
point-biserijalni r. K •
nam uspjesno rijesenam zadatku, npr. u nekom testu. U psihologijskim
testovima sposobnosti ili znanja najeesce se svakom rijesenom zadatku
hit (izvedenica ad engl. "binary digit"= dvijc znamenkc) J edinica infor- daje 1 hod, ali hodovi za pajedini zadatak mogu biti i razliciti (sto se
macije kojom dobivamo rczultat izhora izmcdu dvije jcdnako vjcrojatne odrcduje hilo subjcktivnom procjcnam, bilo objektivnijim postupkam
alternative. Ako medu 32 elemcnta treba pogoditi jcdan odredcni cle- izracunavanja tdine pojedinih zadataka), a mogu biti i negativnog pred-
•
ment, za to namje patrebno 5 bita informacija: prvi bit daje odgavor na znaka (npr. kod takvih odgovora koji- pa misljenu konstruktora testa- ..
pitanje je li element u prvih iii drugih 16; drugi hit odgovarajc li u gornjoj prcdstavljaju "antiznanje", tj. potpuno nerazumijevanje podrucja na
iii donjoj polovici prcostalih 16, trcCi bit odgavaraje li u prvoj iii drugoj kojc se odnosi pitanje. Takvom postupku konstruktor obicna pristupa
palovici preostalih 8, cetvrti bit odgovara jc li u prvoj iii drugoj poloviei kada zeli bodovanje uCiniti slicnim svom nacinu ocjenjivanja na usme-
preostalih 4, i peti bit odgovara koji je element ad preostala 2. Matcma- nom ispitu, gdje je sklan kaznjavati besmislene odgovore.) Ukupni broj
ticki, bitje eksponent broja 2, kojim se dobiva ukupni broj mogucnosti: taka pastignutih bad ova naziva se > bruto rezultat. (b) Bodovanje moze
25 = 32. p znaciti i davanje ncke vrijednosti odrcdenom postignutom rezultatu u
nekoj disciplini: npr. u sportu odredeni rczultat u nekaj disciplini dobiva
bivarijatna distribuc~ja (U hrvatskom hi se mogao rabiti i izraz tahlica odrcdcni broj bodava, osnovan na > bazdarenju rezultata tc discipline
• korelacije) Distribucija frekvencija vezanih parova rezultata dabivenih (> skale bazdarenja, interpretacije i usporedivanja rezultata). P ·
pri opazanju ili mjerenju dviju varijabli. Najcesce se koristi pri racuna-
nju korelacije (npr. pavezanost izmedu tjelesne visine i tjelesne tdine, brojcana skala Slijed brojeva ureden prema nekom odnosu medu bra-
,.
vidi slike) odnosno u regresijskoj statistickaj analizi ( > regresija, > crta jevima. Tako npr. linearni niz brojeva (iii linearna skala) je svaki onaj
regresije, korelacija, > tablica korelacijc). U psihalogiji sc dobiva pri slijed brojeva u kojemu su brojevi na skali medusobno udaljeni za istu
apazanju ili mjerenju dvijc varijable na istim ispitanicima iii pri hrajcanu vrijednost. Najcesca takva linearna skala je prirodni niz bro-
-
ponovljenam mjercnju iste varijable na istim ispitanicima. Vizualnom jeva:, ali to moze biti, primjerice, i avakva skala: 5, 10, 15, 20, 25 itd.
inspekcijom bivarijatne distribucije magu se uociti eventualne razlike u VrijeJnosti na linearnoj skali, dakle, rastu (ili padaju) za neki konstan tni
stupnju pavczanasti na razlicitim rezultatskim razinama jedne i drugc faktor.
..
'
•
- ' •• 1'
' .
•
••
:~r. \'
•
'
- ~'-------~B~R~O~J~C~AN~A~S~KALA~~-~--- _ _ BRUTO REZULTAT 29
••
Brojcane vrijednosti na nelinearnim skalama ili nelinearnom nizu kvadrat test, koji se maze upotrijebiti kako za testiranje povezanosti
brojeva medusobno se razlikuju za razlicite brojcane vrijednosti na medu varijablama, taka i za testiranje statisticke znacajnosti razlika me-
razli.citim razinama ..skale. Taka npr. na tzv. geometrijskoj brojcanoj . c.1u frekvencijama.
skal~, k~ko rastu vrljednosti skale, rastu i razlike medu brojevima na
Katkad se brojeni podaci mogu odnositi ina kvantitativne klase, a
skah, ah odnos medu brojevima ostaje isti: 2, 4, 8, 16, 32, 64 itd. Razlike ne samo na kvalitativne kategorije. Takav je slucaj pri > grupiranju rezul-
medu susjednim brojevima na ovoj skali rastu (2, 4, 8, 16,32 itd.), ali oct- tata u razrede sa svrhom provjeravanja oblika distribucije dobivenih re-
nos medu susjednim brojevima ostaje jednak (4:2=2; 8:4=2; 16:8=2
zult.ata. K
it d.).
Brojcane skale treba razlikovati od > skala mjerenja. K '
- .
CIRKULARNE TRIJADE 31
'
ccntralnu vrijcdnost, onda prosjccna placa iznosi 40, i to se obrazlaze
ovako: ima jednako toliko placa kojc su vise, kao i onih koje su nize od te
place. Centralna vrijednost je korisna mjera u neki:n tehnicko-praktic-
nim situacijama: ako na nekom rasponu od 500 km gradnje autoputa po-
stoji 7 opskrbnih stanica, pa se zeli odrediti polozaj glavne opskrbne sta-
nice koja ce vozila opskrbljivati gorivom i servisima ada pri tome vozila
imajurelativno najmanje putovati, ondaje to centralna vrijednost, dakle
u nasem slucaju opskrbna stanica br. 4. P
broj rezultata: aka recimo prvi rezultat u nizu od 10 rezultata porcdanih menata koji se rangiraju metodom usporedivanja u parovima. DoN= 6
po vcliCini (od manjih prema veCima) iznosi bilo koju ckstremno malu nije dopustena ni jedna cirkularna trijada. P
vrijedno'st, a zadnji rezultat bilo koju ekstremno veliku vrijednost, tone
utjece na ccntralnu vrijcdnost. Centralna vrijednost ·stoga se najccscc A
upotrebljava u situacijama._kada trcba naCi "prosjek"nckoliko vrijetlno- / "-.
C B
sti, ajedna ili dvije su ekstremne: prosjecna placa petero ljudi koji imaju
place 10, 20, 40, 70,300 nekihjedinica, prema aritmetickoj sredini iznosi Primjer "cirkularne trijade":
88, sto je besmislica jer nijedne place nema u toj zoni. A ako izracunamo aka je A bolji od B, a 8 bolji od C, onda C ne mo~e biti bolji od A.
-·
'
' • • --
•
- ••
~2'----------~C~L~U:._-:S~TE~R ANALIZA
'
C-SKALA 33
cluster analiza > klaster analiza crta regresije U koordinatnom sustavu crta (ili krivulja) koja spaja
to ekes koordinatama odredenim > parcijalnim srednjim vrijednostima u
cluster uzorak > klaster uzorak jcdnoj varijahli i > fiksnim vrijednostima u drugoj varijahli. Crta regre-
I sijt; zorno pokazuje tip odnosa izmcdu varijahli: ako je pravac (>jed-
correlation ratio > koeficijent zakrivljene korelacije (eta) nadiba pravca regresije ), onda jc povczanost mcdu varijablama linearna
I
(> linearna kurelacija), ako crta regresije nijc pravac, tada se radio >
C.R. > kriticki odnos, > t-odnos zakrivljenoj korelaciji. K
Cramerov <I> (Fie) Nova varijanta > Fi-koeficijenta korelacije. Kao i C-skala Jcdna od skala bazdarenja, a sluzi i za intcrpretaciju i usporedi-
f!i, takoder se racuna iz hi-kvadrata (s pomocu >tab/ice kontingencije), vanjt; rczultata. I ona sc, kao vcCina takvih skala, osniva na normalnoj ra-
Jednostavnom formulom: spodjdi, s aritnH~tickom sredinom 5 i standan1nom dcvijacijom 2. Saddi
2
11 razreda, od kojih svaki zauzima 0,5 standardne devijacije: razred
<I> = . __;_X:..___ vrijednosti 0 zauzima prostor od -2,75 do -2,25; razred 5 od -0,25 do
c N(s-1)
+0,25; razrcd 10 od +2,25 do + 2,75 standardne dcvijacije. Skalu je
• v •
pn cemu s1mbols oznacuje manji b:oj stupaca ili redova u tablici kontin- predlozio Guilford u svrhu hazdarenja vclikog hroja tcstova za vojsku
•
•
gencije (sto znaci da tablica ne mora biti kvadraticna ida moze imati vise tijekom 2. svjctskog rata, ali jc kasnijc predlozio modifikaciju te skale,
-.
od dva stupca ili reda). Za razliku od .Fi-koeficijenta, koji vrlo rijetko spajajuCi razrede 0 i 1, kao i razrede 9 i 10 u po jedanrazred tako da nova
moz~ poprimiti vrijednost 1, Cramerov Fi moze imati sve vrijcdnosti od 0 skala, nazvana "standardnih devet" ("standard-nine", skraceno "stani-
'
do 1;~to mu je pogotovo prednost prcd > koejlcijentom kolltint;encije, uc"), sadrz.i !) stupnjcva. Objc varijantc tc skalc u nas su manje u upo-
koji uopce ne moze postiCi vrijcdn"Jst 1. P trchi. P
•
strumenta. Jedan od nacina njegova izracunavanjaje s pomocu ave for-
!
mule:
krl'
a = -----'---·
1+(k-1)rl'
gdje je k broj cestica u instrumentu, a rl' prosj~cna kordacija m~clu cc-
sticama. K
I
I
•
•
' DIHOTOMNA V ARIJABLA 35 '
d Najce5ce znaci razliku izmcdu nckog rczultata i aritmctickc sredinc, a tcstova) itd. U deskriptivnu statistiku spada i proucavanje karakteristika
koristi sc prilikum racunanja standardnc dcvijacijc, ako sc nc koristi razlicitih > statistickih distribudja, a poscbno > nonnalne distribucije.
izraz (x- M). No neki statisticari koristc taj znak i za razlikc mcdu rango- Nos razvojcm matcmatickih statistickih metoda i razvojem teorije vje-
vima (umjesto D). Kao i D, d predstavlja kraticu ad "difcrcncija". P I
'
rojatnosti pojavila su se pitanja u vezi s > uzorkom i > populacijom, a to
I su na prvom mjestu pitanja o tome kakvoj se pogresci izlazemo aka iz
d' Ohicno sluzi za oznaeavanjc nckc provizornc razlikc iii razlikc oct
I ncke konkrctno ustanovljcnc Cinjcnicc, dobivenc mjerenjcm na uzorku,
donosimo zakljuckc o populaciji. Taj dio statistikc dobio je naziv > infe-
neke teorijskc vrijcdnosti. K
I rencijalna statistika. P
''
D Obicno oznacuje razliku iimedu dva ranga (npr. kod > rho koefi- devijacija (lat. de u slozenicama oznacuje odjeljivanjc, otklanjanje i sl., a
I,
c(ienta korelacije), iii pak neku razliku izmedu dviju brojcanih vrijcd- i rijcc via znaCi put) Tcrmin koji se upotrebljava u svim znanstvcnim
nosti (npr. dvijc aritmctickc srcdinc). Prcdstavlja kraticu od "difcrcn- I podrucjima, a oznacava odstupanje od utvrdenih normi, standarda,
cija". Moze znaciti i > dominantnu vrijednost. P •
I
prosjcka ili bilo koje druge referenicne pozicije (> standardna devija-
'
cija). K.
"daska" s cavlicima > Galtonova "daska" s cavlicima
-·a i ' (engl. kratica za degrees of freedom) "> "' stupnjev1 slobode ·· · ft
\
I
dihotomna val'ijabla Varijabla koja jc izrazena s pomocu samo dvijc
delta Nacin izgovaranja za grcko slovo o, !!.., ili katkada za D ili d, au
i· kvalitativne ili kvantitativne klase (primjerice musko-zensko; zivi-umrli,
vecini slucajeva ti znakovi znaee razliku izmedu dvije vrijednosti (npr.
( ozenjcni-neozenjeni; ima djece-ncma djece; ima automobil-nema auto-
izmedu dva ranga, dvije aritmeticke sredine i sl.) P
t
'
I •
i
- ------------ . - ---- ---------
---------
- __,_ __
• - ------- - - - ---- ..
,_,, ' .
'' DISKRIMINATIVNOST MJERENJ A 37
36 DIHOTOMNA V:..:AR.=..:.:I:.:::JAB~L::::A~----- _ _
- ..
~
mobil itd.). Cesto se i varijable koje je moguce izraziti s pomocu veceg drat nije statisticki znacajan, moramo nasu dire~tivn~ hipot~~ odb.a-
broja kvantitativnih klasa, pa i tzv. > kontinuirane varijable, reduciraju citi. No, neki statisticari (npr. Fisher) upozoravaJU da 1 takvu d1rekt1v-
na samo dvije vrijednosti, zbog nepreciznosti mjerenja iii iz nekih drugih nu" hipotczu mozemo smatrati - nul-hipotezom. Treha ~e samo ~refor~
razloga. Tada se obicno govori o riihotomiziranoj varijabli, a naji::esce sc mulirati u drugi oblik: distribucija bod ova u tom testu nece se razbko~at1
kao tocka dihotomizacije uzima neka sredisnja vrijednost (centralna od teoretske distribucije, koju bismo ocekivali kada bi test bio pretezak.
vrijednost iii aritmeticka sredina), iako nije rijedak slucaj dihotomiza- Aka to ne ustanovimo, odbacujemo ovako formuliranu nul-hipotezu.
cije na osnovi neke arbitrarno odabrane vrijednosti. Neki smatraju da I
I·
Valja upozoriti da neki statisticari direktivnu hipotezu ~ijele na jed-
nosmjemu i dvosmjemu: jednosmjerna bi bila onda ~ada btsmo p~etp?·
•
nema stvarno dihotomnih varijabli, nego da je u pitanju samo pojedno-
• i'
stavljenje iii teskoca u preciznosti m,ierenja, no ipak se u upotrehi razli- stavili da ccmo naCi razliku u nekom odrcdcnom smJCfU (npr. ~aJC ~~lt
kuju dihotomne varijable (one kojc "stvarno" imaju samo dvijc kntcgo- I mcticka srcdina nckc populacijc statisticki znacajno vcca od antmetlckc
I
rijc) i dihotomizirane varijable (one koje su stvarno kontinuiranc, ali su \ sredine neke Jruge populacije ), a dvosmjerna je onda kada samo pret-
namjerno iii zbog nepreciznosti mjerenja izrazene u samo dvije katego- postavljamo da cemo naCi razliku, ito hilo kojeg si~lje-ra . Takoder. treba
•
I
I
rije iii dvije vrijednosti). K kazati da ncki statisticari dircktivnu hipotczu naz1vaJU 1 alternatlvnom
cngleskom jeziku scatter diagram. Smatramo da hi se u hrvatskom I dircktno mjerenje Izravno mjerenje s pomocu istovrsnih veliCina, tj.
mogao koristiti izraz > tab/ica raspdenja. K
• mjcrcnjc koje nc zahtijcva transformaciju vcliCinc mjcrcnja u ~eku dru-
g1.1 vrst pojavc (> irulirektno mjerenje). Primjcr dircktnog (1zravnog)
direktivna hipoteza Hipotcza o nckoj karaktcristiei jcdnc, dviju iii vise
mjcrcnja ·c mjcrcnjc prostornc protege mctarskom skalom. K
populacija.·Za razliku od > llul-hipoteze, koja najccscc glasi <.Ia ustvari
nema razlike izmedu rezultata koji smo dohili i nckog drugog rczultata I•
•
I > v; kod ko ·e izmedu o ·edinih vri ·edna· ·
(npr. da nema razlike medu aritmetickim sredinama dviju populacija), •
direktivna hipoteza pretpostavlja da postoji neka odrcl1cna karakteristi- I postoji skokovit, nckontinuiran rijclaz, t'. kad su vri' edno ·ti vari· .llll
I
ka u populaciji koja tu populaciju na odredcni dcfinirani nacin razlikuje jasno mcdusobno odijcljcnc._Upotrcbljava s~ i · . . . .. .
I
od drugih. Na primjer, na temelju inspekcije jednog testa znanja mozc rijabla ;Takvajc vcCina varijabli kQjf sc sastQ.JC od kvahtatlvn_t~ll~ ~an ~·
nam se uciniti da je taj test prete:Zak za populaciju kojoj je namijenjen. tativno/kvalitativnih kategorija: primjerice varijabla ~J?ol, skala skolsk1h
Nas .1direktivna hipoteza mogla bi stoga glasiti ovako: ako taj test primi- •ocjena itd.Mnogi, medutim, dde da manj~-vise sve_va~ija~l~a~~kon
jenimo na veCi broj ispitanika, once dati izriCito asimetricnu distribuciju I
I
tin;-irane ( > kontinuirana varijabla) prijelaze medu poJe.dtm~Yr~Jedn~
I
I
I
'
'
I
38 DISPERZIJA REZULTATA II
DI~IRIBUCIJE, 39
s nekom odredenom distribucijom (> normalizacija distribucije). . I raka iz neke populacije dat ce normalnu rapodjelu (Cak i onda kada
I populacija nije normalno distribuirana) (> poucak centra/nih granica);
Postoji veCi broj matematicki opisanih distribucija. U statistici
bacajuCi mnogo puta 10 novciea i kod svakog bacanja zabiljditi ishod
koja se koristi u psihologiji, najcesCi i najpogodniji modeli za diskretne I -{broj "glava" i broj "pisama") i izracunavajuCi svaki put hi-kvadrat (iz
v.arijable su: > binomna distribucija, > Poissonova distribucija, > nega:.
ttvna binomna distribucija. Katkada se upotrebljava geometrijska dis- l razlike izmedu oeekivanih i opazenih frekvencija ishoda "glava" i "pi-
tribucija, hipergeometrijska distribucija, a moguce je upotrebljavati, I smo"), dobit eemo hi-kvadrat raspodjelu za 1 stupanj slobode, bacajuCi
ovisno o vrsti podataka kojima se raspolaze, i druge distribucije kao I igrace kocke dobit eemo distribuciju uzoraka hi-kvadrata za 5 stupnjeva
I
modele. Za kontinuirane va.."'"ijable najc~sce se koristi > normalna i slobode itd.
(Gaussova) distribucija, zatim > hi-kvadrat distribucija, > t-distribucija, I
> F-distribucija. Za bivarijatne i multivarijatne slt.Jeajeve takoder pos- I
toje razvijeni matematicki modeli distribucija. Na slici su prikazane nor- I cnih pojmova, nuZan za rarurnijevanje
I
~al~a di~~ribucija (A), Poissonova (B), asimetricna (C) i bimodalna (D) '
.
~ -·- ~ - ~-·--··. . . . .. --- -
, ., ~- ---~-.... · .. , . . -·-
~ - ;. ... . . '
__ __ __ ~------ ~--···: , ~- . ...... ,., .. ......... ,... __.. __, _-_ __ ..... .-.......
~
•'
I t= razlika = 7_ = 2, 3
dvosmjerni test > dvosmjemo i jednosmjemo testiranje I
pogre.Ska razlike 3 '
I
I
'
'
dvosmjerno i jednosmjerno testiranje Izraz ~e upotrebljava uglavnom ito na > razini znacajnosti manjoj od 5% (sto se biljeZi P < 0,05). K.ao
I sto se vidi, dvosmjernim testiranjem testira se statisticka znaeajnost
kod testiranja statisticke znacajnosti razlike izmedu dvije aritmeticke i
sredine, a njegovo znaeenje moguee je protumaciti graficki (vidi sliku). neke razlike s obzirom na njeZinu apsolutnu velicinu: za razliku veliCine
I
'
I
7 malo je vjerojatno da se slueajno pojavi aka medu obje populacije ust-
' .
vari nema razlike. No aka je istrazivaeeva hipoteza izricito jednosmjer-
·2,5% l,So/o I na (npr. "populacijaA ima statisticki znaeajno veeu aritmeticku sredinu
I
•
od populacije B"), onda ce istraZivac promatrati samo jednu stranu
'
X
(desnu) krivulje; ako je odlucio da i ovdjeradi uzrazinu znacajnosti 0,05,
.'
I' onda je dovoljno da razlika bude samo 1,64 puta veca od svoje pogreske
t
-3
.
0 3 9 (t = 1,64 iii vise), pa da mozemo kazati da se takva razlika slueajno maze
Razlik_a_vcli~ine 2 (to~ka x) izmedu dvije aritmcti~ke srcdinc mozc se doista i slu~jno pojaviti samo u 5% ili jos manje slueajeva (aka ona medu populacijama
dogod1ti, ako nam ra~un poka.Ze da Qi se mogle slucajno dogoditi ~ak i razlike ve!icine '
ne postoji). Mnoge tablice > granicnih (kriticnih) vrijednosti razlicitih
9 .. Ako istra.Ziva~ opravdano pretpostav!ja da razlika tpore postojati samo ujednom !
statistickih testova sadrze stoga oznake granicnih vrijednosti za jed-
smjeru, onda se i razlika, koja se u "dvosmjernom testiranju" jo~ ne bi smjela smatrati
' nosmjerne i za dvosmjerne testove. Medutim, mnogi statisticari protive
statisti~k:i zna~jnom (jer jet manji od 1,96) more proglasti statisti~k:i zna~jnom
(vidjeti tekst dvosmjemo i jednosmjemo testiranje). se jednosmjernom testiranju znaeajnosti tvrdeCi da gotovo nikada sa sig-
urnoscu ne moremo predvidati smjer neke razlike, ida bi uvijek razliku
BuduCi da > standardna pogreska razlik~ izmedu dviju aritmetickih trebalo testirati dvosmjernim testom. Prakticki se naime dogada (> ra-
sredina znaCi zapravo standardnu devijaciju velikog broja razlika medu zina znacajnosti) da zbog "fiksiranosti" na standardne razine znacajnosti
'
.- , .
menta, a ne nakon njega, jer ako to odreduJemo nakon sto vee tmamo
gotove rezultate, onda odluka u velikoj mjeri ovisi o tome kako smo ve-
•• -
, ..
-
lik t dobili. P
•'
menta itd. Za sve te varijable pretpostavlja se da djeluju nesistematski,
tj. po slucaju, pa je zato kod velikog broja mjerenja aritmeticka sredina
•
njihova ukupnog djelovanjajednaka nuli. One uzrokuju varijabilitet re-
zultata te se zato velicina pogreske neizravno odreduje na temelju sla-
•
'
I
44 EKSPERIMENTALNA POGRESKA II
I
'
ganja odnosno neslaganja rezultata dobivenih ponovljenim mjerenjem. t
Pretpostavlja se, takoder, da varijable koje uzrokuju eksperimentalnu I
pogresku nisu u medusobnoj korelaciji niti su u korelaciji s predmetom l
I
,
mjerenja. K '
I
• • • • • I
ekstra olac.. a Zakl"ucivanje o neutvrdenim neispitamm, ne1zm ere- '
r
nim p.o_dacima ili odnosima medu odacima na osnovi ostojeCih oda- I'
I
l
taka.J ermin se najeesee upotrebljava Rri zakljy§ivanju o tijeku neke I.
I
krivulje (koj:'l poka_z,!lj~ odnos izmedu dvije varijable) na temeru dobi- II
. · oblika krivul ali izvan · .. · >· I
I
polacija ). Primjerice, pri ispitivanju broja reRroduciranih rijeci u ucen ·u I
i
- . '
II
i F > F-omjer, > F-test, > analiza varijance
'I'
-- ......... - -·
25
-! I
•
'
~
20 i
' F' > Scheffeov test
-~
z: I
Ekstrapolacija: produ~avanjem vjero- ''''
jatnog oblika krivulje dobivene na te- u- 15
!
'
'
'
- . -
.
•• t
'. ' •
•
'
FISHEROVE Zr- VRIJEDNOSTI 49
48 F-DISTRIBUCIJA '
uvijek u brojnik F-odnosa stavljamo veeu varijancu (jer zelimo vidjeti PredznakFi-koeficijenta treba odrediti naknadno, na osnovi inspekcije
'
koliko je puta ona veea od manje varijance), dok kod stvaranjaF-distri- 2 x 2 tab lice. ZnacajnostFi-koeficijenta moze se odrediti prema znacaj-
bucije moramo F izraeunavati uvijek na jednakom odnosu, npr. uvijek •'
nosti hi-kvadrata (hi-kvadrat = ¢ 2N).Fi-koeficijent ne moze dosecijedi-
varijanca A/varijanca B (ier inaee nikad ne bismo dobili rezultat ispod I
nicnu vrijednost aka su distribucije varijabli razliCite. ·
•
vrijednosti 1!). Tablica F-distribucije nalazi se u Dodatku C. P BuduCi da je Fi-koeficijent zapravo Pearsonov koeficijent korela-{
'
cije r primijenjen na dihotomne varijable, moguee ga je izracunati is po-
Fergusonov test monotonije trenda Neparametrijski test kojim se te- mocu formule:
•
stira pokazuju li promjene koje se kod istih ispitanika zbivaju pod razli- •
da sc ta di stribucija pretvori u priblizno normalnu distribuciju ito uz po- jedna grupa bolja ad druge .. Theta se maze racunati i kada su rezultati u
moc korc ktivnog faktoraz, koji je po njemu dobio naziv Fisherov z,. Uz grupama (npr. kada vise ispitanika ima istu ocjenu iii isti broj bodova).
pomo6 tahli cc F-vrijcdnosti (vidi tablieu u Dodatku F) pretvori sc svaki Theta ima nekih prednosti pred Tau koefieijentom: kod potpune
kocficijcnl korelacijc r u odgovarajuci Zn pa se nakon toga moze testi- ' povezanosti Theta poprima vrijednost 1 (a Tau, primijenjen na ovakve
'
rati jc li neka razlika izmedu dva koefieijenta r statisticki znacajna (> slucajeve, rijetko prelazi 0,70). Opeenito uzevsi, rezultati primjene Tau i
stwulardna pogrd ka razlike izmedu dva r koeflcijenta korelacije). P Theta na istom materijalu dosta sc razlikuju: katkada je rezultat visi u
jcdnom, a katkada u drugom postupku. P
•
I
~· .
•
. .. . . ..
' .' - -. - •
~· -
•
I
' •
52 F-TEST
•
janca veea od druge varijance. Stoga se kod.testiranja znacajnosti razlike
•
rnedu varijancarna u brojnik uvijek stavlja veca varijanca. (No F -distri-
•
bucija, koja je osnovica F-tablicarna, dobivena je dijeljenjem velikog •
' •
broja F-omjera, kod kojih u brojnik uvijek stavljarno varijancu istog
uzorka, a ne obvezno vecu varijancu ). F -test dobio je ime u pocast statis-
ticaru Fisheru, koji je razvio tu metodu. F-test i F-omjer su istovrsni po-
jmovi, ali se katkada razlikuju taka sto se termin F-test koristi za uspo-
·,
redbu varijanci dva uzorka, a terrnin F-omjer koristi se u > analizi vari-
I.
jance. P
' •
' •
•
. .
-·
- - ....
'
GALTONOVA "DASKA S CAVLICIMA" GRAFICKI PRIKAZ DISTRIBUCIJE REZULTATA 55
vii!IIJI:t skri.!cc kuglicu po slucaju, to se na njezinu putu do dna najcesce populacija svake godine porasla 3 puta. To se dobiva odredivanjem geo-
11 1111 'l'nj i skrctanj a ponistavaju, pa najvise kuglica dospije u srednji pre- metrijske sredine, koja jeN-ti korijen iz umnozaka izmeduNbrojeva:
llll.tl', lJ krajnje pre tince dospiju samo or.e kuglice koje sukod svakog
1
goodness of fit > test stupnja podudaranja
I + 0,9
OB
0,1 gornja granica razreda > grupiranje rezultata u razrede
o.e
0,5
o. ~ graficki prikaz Prikaz rezultata dobivenih opazanjem ili mjerenjem s
0, '
I pomocu jednostavnih ili slozenih geometrijskih likova (krugova, kvad-
0,1 I
0,1 '. rata, kocaka i sl.), nekih drugih figura (figura covjeka, broda itd.) ili s
!--+-- I ·-1----1--1
0
10 12 14 18 18 20 22 24 26 2!1 3J 32
pomocu dvodimenzionalnog i1i visedimenzionalnog ( obicno) pravokut-
I nog kuon.Jinatnug sustava, da hi s~.: stu zornijc pokazali mlnosi unutar
'
pojedinih varijabli ili trendovi i odnosi izmedu dvije iii vise varijabli.
I I Vlllja kmnulativnih frekvencija ili Galtonova oziva. I
I
• Graficki prikaz omogucuje. zorni uvid u > interpolaciju i > ekstrapola-
ciju, as pomocu grafickog prikaza mogucc su i nckc solucijc prakticnih
u I 1 yui.Jn •• mmnulna distri/Jucija
I problema (primjerice, graficka solucija pri predvidanju najvjerojatnijeg
'',
rezultata u Yvarijabli na temelju poznavanja rezultata uXvarijabli). K
'"" 11 11 , n·rlln a (G) To je kao i > aritmeticka sredina takoder
,
'
1 11 till I d111 lt' IHI ' ncijc , a pre tezno se koristi kao mjera prosjecne graficki prikaz distribucije rezultata Prikaz u > koordlnatnom sustavu
1 l d 1 lllllllllt· n u. Na primjer, ako je neko mjesto 1995. god. imalo cestine kojom su dobiveni rezultati nekog mjerenja ili opazanja. Obicno
1 "" 111 ,,, l'l'lh. god. 9000, a 1997. god. 18000 stanovnika, ondaje l se na apscisu stavljaju vrijednosti rezultata, ana ordinatu koresponden-
1 1 1111 111! 111 l'l'llt.god inibio4,5putaveCiodbrojau1995.godini,a tna frekvencija rezultata. Na apscisu se mogu staviti bruto rezultati iii re-
'
1 1 II 1 , 11111/ pndl l ll' 2 puta vcca od one 1996. god. Prosjecno je I zultati grupirani u razrede (> grupiranje rezultata u razrede), a u tom
I.
I
I
I
"'• ' f I
.- w-• ·- --·
. -- -
.. . - - . . .
.. . . -. . ' -- -. •' ~
I
'
56 GRAFICKI PRIKAZ DISTRIBUCIJE REZULTATA GRUPIRANJE REZULTATA U RAZREDE 57
slucaju stavljaju se na apscisu ili srednje vrijednosti razreda ili granice • rdnu pogresku (pa dobijemo 68-postotne granice pouzdanosti), iii "do-
razreda. Ako su na apscisi bruto rezultati ili srednje vrijednosti razreda, damo" 2 (tocnije 1,96) standardne pogreske, pa dobivamo 95-postotne
onda se obicno dobivenc tocke spajaju crtama tako da se dobije > poli- granice pouzdanosti, a dodavanjem 2,58 standardne pogreske dobi-
gon frekvencija ili > laivulja distribucije frekvencija. Ako su na apscisi .varna 99-posto,,t~~" ~r~n.!c.~ pouzdanosti. ~~lJ>f~iko~Ltog"postupkll
granice razreda, onda se disuibucija rezultata prikazuje > histogramom. • . . . . .... zanvatj nutu ·(n.i cak prijede na negativne vrijednosti),
Katkada se- uglavnom samo zbog vizualnog efekta- distribucija prika- "'
::If;~.: . . . ''" . 'f~iki nije: stafisticki ~a:cajna~1P
zuje stavljanjem vrijednosti rezultata na ordinatu, a njihova cestina na I
'
apscisu. Glavni razing prikazivanja distrihucijc rczultata graficki jest
•
granicna (kriticna) vrijcdnost Broj, najccs6e u nekoj tablici, koji poka-
zorniji uvid u njezin oblik. K zujc koliko najmanje (iii najvise) mora iznositi neki rezultat (npr. > t-
odnos, > t-test, > hi-kvadrat test i dr.) kojim provjeravamo mozemo li
gran ice pouzdanosti Raspon u kojem mozemo uz manju ili vecu vjero- prihvatiti ili odbaciti nul-hipotezu. Svaki statisticki test ima svoje gra-
jatnost occkivati da sc nalazi prava vrijcdnost nekc karakteristike koju nicnc odnosno kriticnc vrijednosti, izrazene u jedinicama kojc taj test
smo izmjerit: na uzorku; npr. neka aritmcticka srcdina, dobivena na koristi: na primjcr, granicna vrijednost t za odbacivanjc nul-hipotcze I
uzorku, vise ili manje odstupa od prave aritmeticke sredine populacijc. kod testiranja statistickc znacajnosti razlika izmcc1u dvijc aritmctickc
I
Takodcr, razlika izmcdu dvijc aritmctickc srcdinc koju smo mjcrcnjcm srcdinc na razini znacajnosti 0,05 za vel ike uzorke iznosi 1,96, ana razini
dobili, najvjerojatnije nije "prava" razlika, tj. ona koju bismo dobili da
I
0,01 ona iznosi 2,58; granicna vrijednost hi-kvadrata za 1 stupanj slo-
smo mogli izmjeriti sve slucajevc u obje populacijc. Pogreska kojoj se hode na razini 0,05 iznosi 3,14, za 5 stupnjcva slohoclc 11 ,07 itd. p
izlazemo kad iz uzorka zaklju~uie,~o.~~~_r,o~ula~~ju, na~iva se _ > stan~ar-
dna Pogreska.. . cta J·e ~l<~cm
~ran'ii"!<"· ·"'··<esl("'
..,L.f..... ".P9&f: 7'iak'oae'f~W'fi~!
.......~a~ ---~L...~....J,_.!l
grupiranje rezultata u razrede Sazimanje rczultata dohivcnih mjcrcn-
jem ili opazanjem u manji broj statistickih (brojcanih) klasa odnosno
r
•
za nJu .-c;J!.·'·~ 1
•
razrcda. Koristi se u statistickim racunima koji se teinelje na tzv. >
• I ,. ,
~aa · akle izracunamo s_ki'acenzm pos!_upcima i za provjeravanje oblika > distribgcije rezyltata.
standardnu pogresku npr. neke aritmeticke sredine, onda mozemo naCi Skraceni postupci najcesce polaze od grupiranih rezultata jer vee
raspon ili interval u kojcm se uz vjerojatnost 68%, iii 95%, iii 99% (ili samo rupiran ·e rezultata u razrede skracu ·e racunski postupak. Grupi-
vise) nalazi prava vrijednost populacije. Najvise se u statistici upotre- ranje rezultata u razrede odvija se u nekoliko jednostavnih
' treha ·e vise rezul ta
bljavaju 95-postotne granice pouzdanosti i 99-postotne granice pouzda-
nosti. Ako neka aritmeticka sredina iznosi 50, a njezina standardna po- ·e rezultata bit ce i vise
. razreda. Ohicno se (arhitrarno) uzima broj izmedu 10 i 20 to je 'i
greska iznosi 2, onda su 68-postotne granice pouzdanosti te aritmeticke I
' hroj razreda, povecava se mogucnost iskrivljavanja stvarnih bruto
sredine 50 plus minus 2, dakle interval izmedu 48 i 52, 95-postotne gra-
tata, pa se zato preporucuje da se nikako, ili samo iznimno, uzima manje
nice pouzdanosti 50 plus minus 1,96 stand}rdne pogreske = 50±3,92,
.Jld-.7-r.azreda (osim u slucajevima kad rezultati ne omogucuju veci hroj
dakle 46,08 - 53,92, a 99-postotne granicc pouzdanosti dobivamo ako razrcda). VcCim hroj~_;m razreda nc postiz~_; s~_; cilj sazimanja r~_;zultata u
nadenoj razlici "dodamo" 2,58 standardnc pogreske. Ako testiramo sta- manji broj brojcanih klasa. Preporucuje se, takoder, uzeti neparan broj
tisticku znacajnost neke razlike izmedu dvije aritmeticke sredine, logika razreda, iako to nikako nije nuzno. Sljedeca odiuka odnosi se na
je potruno jednaka: nadenoj razlici "dodamo" lijevo i desno 1 standa- odrcdivanje velicinc > intervala razreda, za koji se ohi¢no koristi simhol
'
!'
•
'
dtHlSIi; tako ce prava donja granica najnizeg razreda biti 16,5, a prava
l'lllllja tog razred a bit ce 20,5. To razlikovanje potrebno je u nekim sta-
ll 11 k1lll racunima. Nakon sto smo odredili razrede, utvrdit cemo fre-
kvt•ol'iju rczul tata u svakom razredu tako da cemo prebrojiti sve rezul-
1,11<' koji spadaju u neki razred prema njihovoj numerickoj vcliCini. Pose
111p11 k j'rupiranj a rezultata u razrede u prilicnoj_je mj_eri arbitraran; cilj
..., • v• • • •v
11111 I'' dohiti "sto bolju distribuciju", pa se zato preporucuJe ucmttl vtse •
pok 11 aja da bi se postigao taj cilj. Osim toga, prvi pokusaj ne mora usp::
It 11npr. zhog toga sto uzimamo cjelobrojnu vrijednost intervala, pa nam • '
111 1110?: • uogoditi da dobijemo veCi ili manji broj razreda nego sto smo
, , lit h. 'l'ako bismo u gornjem slucaju s veliCinom intervala i = 4 dob.ili •
. ,. . .
I , , riL' 11 razred a. U ponovljenim pokusajima mozemo uzetl vect mter-
v tl , IIi mozcmo pomicati donju granicu najnizeg razreda (ona ne mora '
"dl\''v:r rati n~jnizem rezultatu, ali dakako najnizi razred mora obuhva-
•
• .'
.. ·- " .. . . . '
...- --
".•
_......
~
.
-
·-· ·-·-- · - ~~ ·-
. - ··- .
• -~- . .. ~ .
'
HI-KVADRAT DISTRIBUCIJA Ij
61 tr"•-.....
50, a drugi sat brzinom 100, onda je prosjecna brzina 75). No u gornjem
primjeru vozacje udaljenost od 200 km prosao za 4 sata, au povratku za
2 sata, pa je dakll: ukupno 400 km pro~ao za 6 sati, ~to znaCi 400/6 = 66,7
km/sat. P ·
. ~ ·r
•
hazarderska zabluda > "sazrijevanje sanse': > subjektivna vjerojatnost
L~
-~ 20
1.'1.• s
a. s.• 10
2 2 10
U nasem slucaju dobivamo: H == = = 66,7 km I sat.
100 50
-1 + 1 0,03 0
0 ~lc::2~J ~5~6~7:t8~9=1
f4 0 11 12 13
16171 819 20
:X:'
Do pogreske u rezoniranju dolazi zato sto u racun uzimamo samo
Hi-kvadrat distribucije (uz razlitite stupnjeve slobode ), koje bismo dobili u slul:ajevima
brzinu, a ne i vrijeme provedeno u nekoj brzini; aka je vrijeme jednako,
kada nema nikakvog razloga, osim listog slulaja, da se opazene frekvencije razlikuju od
onda je aritmeticka sredina to can odgovor (tj. aka 1 sat vozimo brzinom ol:e!Ovanih frekvcncija.
I
'
'
62 HI-KVAD RAT DISTRIBUCIJA
HIP01EZA 63
•
distribucije za 1,~;? i 10 stupnjeva slobode (s.s.). Iznad vrijednosti 11,1 da~ nz~rak (g_~r~ji·v ri~jer s rezultatima_testa), dva (grimjer
imajos 5% rezultata, ito je vrijednost koju mozemo odcitati u tablici hi- mu~ko-zen~ko) llt VI~~..nJth._,.U pone kim slucajevima racunanje se pro-
kvadrata (tablica je prilozena u Dodatku G). Analizom hi-kvadrat dis- vod)t na nesto drugaCIJI nacm od standardne formule ( > McNemarov
tribucije (vidi sliku) npr. za 5 stupnjeva slobode mozemo ustanoviti da se test .
najceSCi hi-kvadrat krece oko vrijednosti 3 - 4, pa da je stoga mali hi- Standardna formula ima ovaj oblik:
•
kvadrat jednako tako malo vjerojatan kao i veoma veliki - ako nema
sistematskog razloga da se opazene frekvencije razlikuju od ocekivanih. X 2 = ~ (!,, - [,) 2-
., LJ [, '
U slucaju suvise malog hi-kvadrata mozemo stoga zakljuCiti da je on
"predobar a da bude istinit", tj. da su vjerojatno rezultati falsificirani gdje !o ?znacuje opazene frekvencije, a fc teoretske fre!cvencije.
kako bi izgledali sto blize idealnim teoretskim frekvencijama. p . Najla~se se hi-kvadrat test izracunava aka rezultate unesemo u
• tabhcu s ovtm stupcima:
'
'
' '' '
'' '
'
'•••• •
'''
'•
• • •
•
'
••
•' •'
• ' •
•••
•
••' ''
'••
' •
'
'
' ••
hipo~eza (od grc. rijeci hypothesis, sto znaci podloga, osnova) Opcenito
znact.pr~t.postavku koju treba provjeravati i dokazivati. U znanosti to je
~d~a th pretpostavka kojom se nudi provizorno (privremeno) obja-
snJenJe _n:ko~ skupa opazenih podataka i odnosa medu njima ili provi-
zor~o rJesenJe znanstvenog problema. Kad je znanstvena hipoteza for-
muh~~~a .u operativnim terminima, tj. taka da ju je moguce provjeriti
empmJskim postupcima (opaZanjem iii mjerenjem), obicno se naziva
radna hipot~za, eksperimentaina hipoteza, altemativna hipoteza i sl. u
~sihologiji hipoteza je redovito tvrdnja o nekim osobinama pop~lacije,
t]. tvrdnja koja vrijedi opcenito, za cijelu populaciju, kao na primjer
"Frustracija izaziva agresiju", "Muskarci i zene su jednako inteligentni",
"Ponavljanje verbalne grade povecava kolicinu upamcenog materijala"
itd. Hipotezu je moguce formulirati i provjer:avati u vezi s razlicitim
o~~binam~ u populaciji koje se odnose na sredisnje vrijednosti, varija-
• '
,,. ostalc u etc istc· u samoj (ormuli_t ovisnost i- adrata b~htet, obhk distribucije itd. U empirijskim znanostima provjeravanje
_ o vclicini uzorka n,i je vidljiva ). Hi-kvadrat test om mozemo testirati je- htpoteze temelji se na logickom postupku odbacivanja posljedice, a to je
• .' . .. - -~ .. .. . .. •
u formalnoj logici jedan od dva nacina na koja se ostvaruje mijesani hi- Hullova skala Jcdna od skala bazdarenja, a sluzi za interpretaciju i
poteticki silogizam, tj. postupak posrednog zakljuCivanja u kojemu je usporedivanje rezultata. Osniva se na pojmu > z-vrijednosti, dakle na
praemissa maior ili prva premisa (antecedent) hipoteticki sud, a prae- aritmetickoj sredini i standardnoj devijaciji, i obuhvaca 100 jedinica s
missa minor ili druga premisa kategoricki sud. Mijesani hipoteticki sud vrijednosti 0 na -3,5 standardne devijacije, vrijednosti 50 na aritmetickoj
ima dva nacina, modus ponens (postupak afirmiranja antecedenta) i sredini, i vrijednosti 100 na +3,5 standardne devijacije. Izracunava se po
modus toll ens (postupak odbacivanja konsekvencije ). U statistickom > formuli:
testiranju hipoteze > nul-hipoteza sluzi kao tvrdnja koju se odbacuje. K
Hullovi bodovi = 14,2Rz + 50
histogram > Graficki prikaz u kordinatnom sustavu odnosa izmedu
Npr. u testu s aritmetickom sredinom 50 i standard nom devijacijom 10,
veliCine rezultata i njihove cestine s pomocu stupaca. Na apscisi se nala-
rezultat 60 ima 14,28 (65-15)/10 +50= 71,42 Hullovih hodova. P
ze vrijednosti rezultata a sirinom svakog stu pea oznaccn je jedan rezul-
tat iii klasa (razn..:J) rczultata. Na oruinati sc nalazi ccstina rczultata i
vis ina svakog stu pea proporcionalna jc ccstini kojom sc pojavio ncki rc-
zultat ili klasa, tj. povrsina stupca odgovara broju rezultata u razredu ili
klasi. Na slici su prika-
zani rezultati mjerenja 80
• •
visine mlade2:i odredene
60
dobi grupirani u raz.redc.
K 40
30
.
20
'cr distribucik)J
£=100 1- 1-rx/)
Kako je vidljivo iz formule, djelotvornost prognoze izrazava se u posto-
cima (jersc mnozi sa 100), tj. ako je recimo E = 35%, onda to znaci dace
prognoza biti 35% tocnija u odnosu na prognozu "naslijepo", odnosno
indeks (lat. index znaCi prokazivac, uhoda; kaziprst) Velicina (obic~o na prognozu koja se ne bi temeljila na poznavanju stupnja povezanosti
oznacena nekim simbolom, a najcesce latinskim ili grckim slovom) koJa izmedu dvije varijable. Maksimalna pogreska, tj. najmanje tocna prog-
pokazuje neku stalnu promjenu (u vremenu ili/i prostoru), ali koj~ nije nozajest ona koju mozemo napraviti kad imamo samo podatke o arit-
moguce izravno opaziti ili izmjeriti, vee je izvedena vrijednost koja po- metickoj sredini i standardnoj devijaciji u varijabli u kojoj prognoziramo
kazuje odnos medu nekim promjenljivim veliCinama. Nerijetko _s~. za- neki rezultat (u takvom eemo slucaju uvijek prognozirati aritmeticku
mjenjujc terminom > koeficijent. Primjcricc, takav je indeks koeftctJent sredinu, a pogreska kojoj se pri tome izlazemo jednaka je standardnoj
varijabilnosti, indeks nataliteta i sl. K devijaciji u toj varijabli). Djelotvornost prognoze je zapravo razlika
'
izmedu standardne devijacije u varijabli u kojoj se prognozira rezultat i
indeks asimetrije Indeks ko'i okazu·e u ko'em stu n·u neka distribu- > rezidualnog varijabiliteta, koja razlika je izrazena u postocima maksi-
cija frekvencija Q_dstupa o_E potpune simetrij~. Normalna di~~r~ucija je malnog varijabiliteta (maksimalne pogreske koja je jednaka standard-
- simetricna i u nje su > aritmeticka sredin.E:.J.. > centrqlnq_¥!JJednoscnu- noj devijaciji u varijabli u kojoj se prognozira rezultat). Na primjer, neka
. • me rigkfjednake, Qa se na toj Cinjenici termaji i ovaj inCleks: je Mx=84.2, sx= 12.36; My=57.1, sy=9.45 i rxy=0,54. Ako bismo u ovom
3 (1.1·..- C), gdje jeM aritmeticka sredina, C centralna vrijednost, as slucaju htjeli prognozirati rezultat u Yvarijabli na temelju rezultata uX
a=
s varijabli ina temelju korelacije izmeduX i Yvarijable, efikasnost prog-
standardna dcvi· acija nckc odrcdenc distribuci· c. i\ko jc distribucija noze iznosila bi E = 100 ( 1- ~1- 0,54 2
) = 16. lli:
simetricna, a ce tada iznositi nula (q); sto je asimetricn~st v~ca, bit.ce i ~
veci. Ako je a negativne vrijednosti, to znaci da posto 1 vece o tlan e Sy-sy(x) ·100= 9,45-7,95 ·100= 16%
rezu tata u ~podrucju veCih vrijednosti _ na desnoj strani aps~i~e u, gra- sy 9,45
- fickom p_rikazu distribucije ), je! ce tad a centralna vrij~dnost bttt ~ca o~ (syje standardnadevijacija u varijabli Y, a sy(•l > indeksrezidualnogvari-
aritmeticke sredine • t;kv_? o~tupanje naziva se > negativna a~zmetr~ jabiliteta). Prema tome, prognoza ce biti 16% tocnija od prognoze "na-
-cnost distribucije. Pozitivna vriiednost ind~ksa asii!!_et.Die pokazu e da JC slijepo". K
•
'
. ..:'.. :.·;~ ·. .. - ~
. --.-------
...- .
.. --. '
--
·~· ~
. -- -
... ,•
' -
. -
'
mericke ·· se nalazi na granici prve eetvrtine ( rvog..
•. ~
nom stu pea zivc iii clektricni napon otklonom kazaljke na voltmetru. K -
) i trece ~M1ill~;< (..U:~~g, kyartil<~; u nizu rezultata oredanih o
inferencijalna statistika Naziv za onaj stupanj statistickog nacina mi-
velicini: • • " • 0 •
indirektno mjerenje Svako (neizravno) mjerenje u kojemu se veliCina interakcija (u statistici) Opcenito oznacuje posljedicu vezanog (zavi-
r
mjerenja ne izrazava istovrsnom (> direktno mjerenje), nego nekom sP.og) utjccaja dviju iii vise varijabli odnosno Cimbcnika. U > sloienoj
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ··h ' • )" ,._ •
' INIERPOLACIJA 71
70 INTERAKCIJA (U STATISTIC!)
analizi varijance govori se o interakcijskom efektu onda kad rezultat u (ili "krivulje") u grafikonu nisu paralelne (krizaju se ili zatvaraju neki
kut), postoji interakcija. Je li interakcija statisticki znacajna, pokazat ce
r zavisnoj varijabli, dobiven pod utjecajem jedne razine jedne nezavisne
varijable, ovisi o istovremenoj prisutnosti odredene razine druge neza-
racun analize varijance.
Maze postojati i interakcijski efekt drugog recta u faktorijalnom
visne varijable. Interakcijski efekt prvog recta moze postojati u > faktori-
eksperimentu s tri nezavisne varijable (ako su nezavisne varijable
jalnom eksperimentu s dvije nezavisne varijable (ako nezavisne varijable
oznacene sA, B i C, onda se biljezi Ax B x C) itd. Katkada se interak-
oznaCimo s A i B, onda interakcijski efekt biljezimo AxB). Na slici je cijski efekti dvije varijable nazivaju interakcijskim efektima nizeg red a a
graficki prikazan interakcijski efekt u najjednostavnijem slucaju slozene oni ~zr::e~u tr~ i .vi~e .varijabli..int.erakcijski efekti viseg recta. Postojadje
•• analize varijance s dvije nezavisne varijable, a svaka od njih ima samo statlsttcki znacaJmh mterakClJSkih efekata u > slozenoj analizi varijance
dvije vrijednosti ili dvije kategorije: A i B, te I iII. Na lijevom grafikonu utjece na formiranje > F-omjera i na interpretaciju glavnih efekata ( >
vidi se da ee rezultat u zavisnoj varijabli u kategoriji I jedne nezavisne slozena analiza varijance). K
varijable, vezan uz kategoriju A druge nezavisne varijable, biti znatno
nizi nego kad je katcgorija I vezana uz B. Naprotiv, u kategoriji II jedne interakcijski efekt > interakcija (u statistici)
nezavisne varijable postignuti su u zavisnoj varijabli podjednaki rezulta-
interkorelacije > Koeficijenti korelacije izmedu jedne varij able i manj eg
ti i u A i u B kategoriji (za Aje samo malo manja vrijednost nego za B).
ili veceg broja drugih varijabli; izraz se najce5ce koristi za koeficij ente
lnterakcija se graficki moze prikazati stavljajuCi jednu nezavisnu varija-
korelacije jedne varijable i niza drugih varijabli prikazanih u > matrici
hlu na apscisu, a druga se prikazuje zasebnim "krivuljama". Tako je na korelacija. Termin interkorelacija katkada se koristi umjcsto termina
slici u lijevom grafikonu nez.avisna varijabla "A,B" stavljena na apscisu, koeficijent korelacije ili termina > korelacija. K
a nezavisna varijabla "I,II" prikazana je zasebnim crtama. Na desnom
grafikonu prikazanaje ta ista interakcija, alije sada na apscisi nezavisna interkvartilno odstupanje > indeks poluinterkvartilnog rasprsenja (Q)
varijabla "I, II". I ovdje se vidi dace rezultat u zavisnoj varijabli pod utje-
cajem jedne vrijednosti jcdne nezavisne varijable ovisiti o prisutnosti . interpolacija Postupak kojim se na temelju dvije (ili vise) poznatih vrije-
dnosti o.dreuu· nepoznatavrijed.nost.k.Q_· e 1 z' 'z edu tih oznatih
odredene vrijednosti (A ili B) druge nezavisne varijable: ako je prisutno
vrijednosti (vidi sli!rn). Ako je odnos medu varijablama linearan, onda
A, rezultat ce biti manji, ako B, rezultat ce biti veCi. Opcenito, kad crte
'
' _se vrijednos.ti mogu int~r olirati s dovoljnom precizno.Scu. Ako, medu- -
70
70
--t.-A "" tim, odnos (krivulja kojom je p_ti-
e I e B
--6-11
65 • ""-..
.., ------·---···----·--··----, kazan odnos izmedu dvije varija-
...... ,
00 ·
60 l ,.
ble) mij.enja-S-mj.er, inter.pulrujj a
55
,
!' .na kriticoim.mj.estima m.o~.e f}ove-
50 ! _s_tLd0-bi·~a0--po.gresnib.zakljucaka.
"'
45
10 .
i' (> ekstrapolacija). K
''
~t---~·------~----- ''
40 .t---- -+-- --+------< I II 0~--------~~·~----~
A B 0 15 3) <45 00 105 120 135
Orafi~k a ski ca interakcije u slozenoj analizi varijance. Detaljan opis nalazi se u tekstu
81 Grafitki prikaz interpolacije.
( > ill ll!rakcija ).
• '
- .
'
72 IN'IERVALNA PROCJENA I1EM ANALIZA 73
intervalna procjena Oznaka za graniee ( > granice pouzdanosti) u koji- interval ra:~:reda Razlika izmedu gornjih graniea (iii donjih granica)
ma se s odabranom sigurnoscu (ili rizikom) nalazi statisticka vrijednost razreda rezultata grupiranih u razrede ( > grupiranje rezuttata u razrede ).
koju proejenjujemo (to je obicno parametar). K Ako postoji prakticna iii statisticka potreba sazimanja vrijednosti rezul-
tata u manji broj statistickih (brojcanih) razreda iii klasa iii ako ne posje-
intervalna skala Za ovujc skalu karaktcristicno odredivanje jcdnakosti
dujemo dzepno racunalo pa moramo sve sami izracunavati, kod izracu-
intervala iii razlika. Zbog ..toga se naziva
.... ............ ... - .. ,_ . i, sl_c?l.iot je.clnakih jeqiniea, tj.
·'
- ~ --- -. · · ~·~ ~
100 bod ova u nekom testu ne mora biti jednaka razlici izmedu 40 i 50 bo- .
dova u tom istom testu. No, psihometricari, koji su se savjesno bavili tom ·
Cinjenicom (jer veCina statistickih postupaka zahtijeva rezultate mjere-
nja harem na intervalnoj skali), ustanovili su da standardnim statis-
tickim postupeima na nizu psihologijskih mjerenja, za koja samo djelo-
micno mozemo smatrati da nam daju vrijednosti na intervalnim skala-
ma, dobivamo dovoljno upotrebljive rezultate, zapravo takve kao da
nam se vrijcdnosti mjerenja nalazc na intervalnim skalama. P, K
'
dnosti, najcesce ima ovaj oblik: varijabiliteta pogreske). Polazi se od pretpostavkc da su svi ispitanici,
bez obzira kojoj skupini pripadali, iz iste populaci}e i da se prema tome
. s )
Y=r xy S
Y (X-Mx +My medusobno ne razlikuju po rezultatima u zavisnoj varijabli ( opcenito >
X
nul-hipoteza glasi da nema razlike medu skupinama), tj. da se aritme-
gdje je y najvjerojatniji bruto rezultat ~.Y vari!.abli za br~to ~~zul:a~~ ~x
tickc srcdinc pojcdinih skupina ispitanika nc razlikuju od njihovc zajc-
varijahli uz korclaciju rxy izmcdu tc dVIJC varlJ<\hlc ( o~dJC tdJ kocflcqc~t
dnicke aritmeticke sredine i da se ta zajednicka aritmeticka sredina ne
korelacije ima smisao koeficijenta nagiba pravca); sx 1Sy s~ kore.s?ondc-
I
'
76 JEDNOSTAVNA ANALIZA V ARIJANCE JEDNOSTAVNA ANALIZA V ARIJANCE 77
Ovdje se radi o varijancama pa zato ove razlike treba kvadrirati, a,
X=.u+a+£ naravno, razlika ima koliko i ispitanika pa ih treba sve zbrojiti i tako do-
gdje jc .u prava aritmeticka sredina ili aritmeticka srcdina populacije biti zbroj kvadriranih razlika. Kad se ti zbrojevi podijele s pripadnim
(koja predstavlja pravu vrijednost mjerenja), a je nezavisna varijabla stupnjevima slobode, dobiju se varijance. U stvarnoj provedbi jednosta-
(tocnije: vrijednosti nezavisne varijable ili razlicite eksperimentalne . vne analize varijance, varijance se odreduju na temelju tzv. suma kvad-
situacijc ili jednostavno sistematski faktor koji djeluje ili maze djelovati rata koje se dijele pripadnim brojem stupnjeva slobode. Te sume kvad-
na rezultate mjerenja ), a e je pogrdka cija je aritmeticka sredina pri rata dobiju se kvadriranjem bruto rezultata i uvrstavanjem u radne fo-
vecem broju mjerenja odnosno ispitanika jednaka nuli, njezina vari- rmule. Radna formula za odredivanje tzv. totalne sume kvadrata maze
janca predstavlja varijancu rezultata i nije u korelaciji (nezavisna je) s imati ovaj oblik:
ostalim fakorima u ovoj strukturnoj formuli. Dakle, ovdje .u predstavlja
konstantnu vrijcdnost, a a i £ uzrokuju varijabilitet rezultata. Analizom X1 + X2 +... + Xc - --'--------......::.:..:._____:_~
N
varijance utvrduje se kakav je omjer izmedu varijance a i varijance £ i
Sa X oznacen je svaki pojedini bruto rezultat, sa subskriptima 1,2... g
taj se omjer naziva F-omjer. Ako je varijanca a dovoljno puta veca od
oznacene su skupine (grupc) ispitanika koje su bile u razlicitom eksperi-
varijance e, to znaci daje sistematski varijabilitetveCi od slucajnog vari-
mentalnom tretmanu (aplicirane su razlicite vrijednosti nezavisne vari-
jabiliteta i tada se odbacuje nul-hipoteza. Zapravo, kod jednostavne
jable), aN oznacuje ukupan broj ispitanika (svih skupina). Kad seta
analize varijance smisao F-omjera je ovaj:
suma kvadrata podijeli pripadnim brojem stupnjeva slobode (u ovom
(procjena varijance pogreJke) +(n pula procjena efekata nezavisne varijable) slucaju to ce biti N-1 ), do bit ce se tzv. totalna varijanca, koja pokazuje
F= (procjena varijance pogreJke) ukupno variranje rezultata bez obzira kojoj skupini pripadaju. Lako se
Ovdje se radio procjenama zato sto baratamo uzorcima, a ne pravim, maze vidjeti da je ovaj postupak identican postupku koji se redovito rabi
populacijskim vrijednostima. za racunanje varijance ( odnosno standardne devijacije) iz bruto rezulta-
Prethodno navedena strukturna formula maze se pisati u termin- ta (tzv. skraceno racunanje, jer se polazi od bruto rczultata, a ne od
ima razlika, odnosno varijance zato sto se mjereni (dobivcni) rczultati razlika):
' .
manje ili vise razlikuju od prave vrijednosti; jedan od moguCih nacma
takvog prikaza zarezultate nekog stvarno obavljenogmjerenjaje ovaj:
s2 = N
N-1
Ovaj se identitet moze citati ovako: razlika svakog pojedinog rezultata Suma kvadrata za variranje izmedu grupa maze se izracunati ovako:
(X) od ukupne ili zaj~dnicke aritmeticke sredine svih ispitanika koji su
sudjelovali u nekom eksperimentu (Mu) maze se prikazati kao zbroj
razlikc izmedu svakog pojedinog rezultata (X) od aritmeticke sredine
skupine kojoj ispitanik u eksperimentu pripada a kojoj je aplicirana
'
neka od::-edena vrijednost nezavisne varijable (M~:) i razlike izmedu pri- Ovdje je s n 1, n 2, ... , ng oznacen broj ispitanika u svakoj skupini. Kad se
padne skupine u ekspcrimentu (Mg) i ukupne aritmeticke sredine (Mu)· ova !;Uma kvadrata podijeli pripadnim brojem stupnjeva slobode (to je u
'
•
'
KLASTER 81
klaster analiza Vrsta > multivarijatne analize koja maze graficki prika- klinicka metoda (klinicki pristup) (1) Pristup proucavanju psiholoskih
zati interkorelacije medu pojedinim varijablama: varijable koje su fenomena (i normalnih i patoloskih) koji se temelji na osobnoj, intuitiv-
mcdusohno u visokoj korclaciji, Cine slicnc >korelacijske profile. Na noj, subjektivnoj analizi. (2) Pristup proucavanju psiholoskih fenomena
primjer, aka na velikom broju ljudi izvrsimo mjerenja razlicitih tjelesnih na osobnoj, individualnoj razini; pristup koji uzima u oazir sve idiosin-
karakteristika (visina, tdina, duljina potkoljenice, duljina nadlaktice, krati<~ne karakteristike pojedinca - osobitosti prezentnog statusa po-
opseg natkoljenice, debljina potkoznog tkiva, opseg grudiju, duzina jedinca te njegov razvoj. Ovakav se pristup cesto konfrontira sa > stati-
vrata, debljina prsta, opseg kukova itd.) pa sve dobivene vrijednosti stickim pristupom, koji zanemaruje osobitosti pojedinaca, a usmjeruje se
medusobno koreliramo, dobit cemo velik broj interkorelacija. Aka u samo na ono sto je zajednicko nekoj, na odredeni nacin definiranoj,
koordinatnom sustavu, kome su na apscisi pojedine varijable, ana ordi- skupini pojedinaca. Stvarno, ta se dva pristupa n11Zno medusobno nado-
nati visina korelacije, izradimo > korelacijski profil svake pojedine vari- punjuju, odnosno predstavljaju samo polazisne tocke u prouea.v anju psi-
jable, dobit cemo dvije ocito odvojene skupine profila, dakle dva klas- holoskih fenomena. Primjerice, s pomocu psihologijskog testa kojim se
tera koji pokazuju da se sve tjelesne karakteristike mogu svrstati pod ispisuje funkcija pamcenja moze se utvrditi da je neka odredena osoba
postigla znatno ispodprosjecni rezultat; tu konstataciju mogli smo izve-
dva osnovna faktora, a logicka analiza sadrzaja pojedinih varijabli poka-
sti usporedujuCi rezultat te osobe sa zajednickim, opCim rezultatima
zuje da su to visina i tezina. P
(normama) skupine kojoj ana pripada (recimo da se radio mladoj zen-
•
skoj osobi sa srednjoskolskim obrazovanjem) i pri tome smo se posluzili
klastcr uzorak Sastavlja sc tako ua sc populacija (kojajc ograniccna, ali
statistickim podacima koje smo dobili na uzorku populacije kojoj ta
velika, npr. stanovnici nekog velegrada) podijeli u odredeni broj
osoba pripada. Kad budemo trazili uzroke ispodprosjecnog rezultata
skupina (npr. plan grada se podijeli na 50 sektora), nakon toga se po
ave osobe, posluzit cemo se klinickim pristupom pa mozemo, recimo,
slucaju odabere odredeni broj tih sektora, pa se nakon toga izvrsi mjere-
ustanoviti da je ta osoba pod stalnim stresom, ili je imala traumu s organ-
nje ili anketiranje svih osnovnih jedinica u izabranim sektorima ( dakle •
skim ostecenjem itd. K
svih stanovnika). Takvi uzorci najcdce se koriste u razlicitim socio-
loskim ili ekonomskim istrazivanjima; anketari imaju zadacu da u sva- klinicka predikcija Predikcija o ponasanju i dozivljavanju pojedinca
kom sektoru zaista obuhvate sve clanove (ida se vracaju na adrese onih koja se temelji na idiosinkraticnim podacima o pojedincu (> klinicka
koje nisu pronasli taka dugo dok ih ne nadu ). Klaster uzorak maze biti s . metoda), a po potrebi koriste se i podaci dobiveni > statistickim pristu-
jednim stupnjem iii s vise stupnjeva: npr. u nekom sveucilisnom gradu pom (npr. razlicite norme koje se koriste u evaluaciji rezultata koje poje-
od svih fakulteta izaberu se po slucaju neki fakulteti, u tim se fakulte- dinci postifu u psihologijskim testovima). K
tima na isti naCin izaberu odsjeci, u odsjecima grupa studenata i na njoj
se obavi ispitivanje. Klaster uzorakje losija varijanta > slucajnog uzorka, klinicki pristup > klinicka metoda
a ako se radio jednostupanjskom klaster uzorku, onda on donekle moze
sliCiti i > stratificiranom uzorku, jer je broj Ijudi u svakom sektoru nejed- koeficijent Termin koji se rabi u svim znanstvenim podrucjima, pa taka i
nak, pa on mozc (ali ne mora!) odrafavati i "stratume" stanovnistva. u statistici, a doslovno bi znacio "tvoriti zajcdno". U statistici obicno se
Klaster uzorak na geografskim podrucjima poznat je i pod nazivom koristi da bi se jednom simbolickom ili numerickom vrijednoscu izrazio
"area-uzorak". P • opCi stupanj odnosa medu nekim pojedinacnim vrijednostima ili neku
84 KOEFICIJENT ' KOEFICIJENT KONTINGENCIJE 85 '
!I
stalnu pramjenu, pa taka imama kaeficijent varijahiliteta, kaeficijent katkada i za svaki kaeficijent karelacije karisten kad varijabli koje nisu
korelacije itd. U matematici i tehnickim padrucjima, kao i u statistici izrazene u kvantitativnim (mjerenim) vrijednastima, nego u kvalitativ-
(npr. beta-ponder) upatrebljava se i za konstantnu vrijednast (kan- nim ili kvantitativnakvalitativnim kategorijama. K
stantu) kojom se npr. mnozi neka dahivena vrijednast iii vrijednast u ne-
koj jednadzbi. K koeficijent atenuacije > korekcija zbog atenuacije
koeficijcnt alUcnacije Vrijcdnost koja, kad se kvadrira, pokazujc koliki koefic~jent determinacije Kvadrirani kaeficijent korelacije (r ;Y) koji
dio varijance nije zajcdnicki dvjema varijablama izmedu kojih je pokazuje proporciju (iii postotak, aka je jos pomnozcn sa 100) za-
izracunat > koeficijent korelacije. Pakazuje, za razliku od koeficijenta jednicke > varijance dviju varijabli, adnasna praparciju faktora (jednog
kordacije, stupanj neslaganja medu varijablama. Odreduje se taka da se ili vise njih) kaji su adgavarni za dabiveni stupanj sukladnosti u vari-
iz > koeficijenta nedetenninacije (1 - r 2) izvadi drugi korijen, a obicno sc ranju rezultata dviju varijabli (varijablc x i varijahlc y). Tako npr. aka
2
oznacuje simbolam k: korelacija iznosi 0,50, anda koeficijent determinacije od 0,25 (0,50 =
0,25) znaci da postoji oko 25% zajednickih faktora koji uvjetuju kovari-
ranjc vrijcdnosti tih dviju varijahli. Jcdnak je smisao kocficijenta detcr-
minacije i kod > multiple korelacije. K
Upotrebljava se i kao pokazatelj slaganja nekog madela s konkretnim
podacima: manji k pokazuje vece slaganje i obrnuto. K koeficijent disperzije > rasprsenje rezultata.
koeficijent asocijacije (> asocijacija u statistici) Jedan ad rjede upo- koeficijcnt konkordancije > Kendallov koeficijent konkordancije W
trebljavanih > koeficijenata korelacije koji pokazuje koliko se dobivena
raspadjela frekvencija u 2x2 tablici kantingencije razlikuje ad slucajne kocficijent kontingcncije (K) Koeficijcnt koji pokazujc stupanj povcza-
raspodjele. Karisti se za dihotomne varijable, a odreduje se s pomacu nosti izmedu varijabli koje su izrazenc s pamacu kvalitativnih kategorija
formule: (ne mjerenih vrijednasti). Odreduje se na temelju > tab/ice kontingen-
ad-be cije i > hi-kvarlmt tr:sta:
Q=-- •
ad+bc
K= 2
gdje Q znaci koeficijent asocijacije, a slovima a, b, c i d oznacena su po- N+x
jedina polja (kvadratiCi) u tablici kontingencije iduCi slijeva nadesno i 2
gdje K znaci kaeficijent kontingencije, X = hi-kvadrat test, aN ukupan
•
odozga prema dolje. Predznak koeficijenta asocijacije ovisi o naCinu broj ispitanika. BuduCi da je paredak kvalitativnih kategorija u tablici
smjestanja podataka u tablicu kontingencije pa ga zato treba logicki kontingencije uglavnom proizvoljan, a formula omogucuje samo pozi-
odrediti naknadno. Kako nema tearijske statisticke padloge, koeficijent tivni predznak, stvaran predznak koeficijenta kontingcncije treba odre-
asocijacije serijetkaupotrebljava. Premaautoru G. U. Yuleu, naziva se i diti nakon inspekcije raspareda vezanih frekvencija u tablici. Kocfici-
Yuleov kaeficijent asocijacije. jent kontingencije ne maze doseCi vrijednost 1, a maksimalna vrijednost
Katkada se tcrmin koeficijent asacijacije upotrebljava za svaki kaja se racunom maze dobiti avisi o broju kategorija kajima je izrazena
kaeficijent namijenjen odredivanju stupnja korelacije u 2x2 tablicama, a svnka varijabla. Zbog toga se - da bi se koeficijenti kontingencije dobi-
•
••
'
86 KOEFICIJENT KONTINGENCIJE KOEFICIJENT MULTIPLE KORELACIJE 87
veni iz tablica kontingencije razliCitih velicina mogli medusobno uspo- njegovu statisticku znacajnost (> znacajnost koeficijenta korelacije, >
redivati- preporucuje da se izracunata vrijednost korigira tako da se po- standardna pogreska koeficijenta korelacije) i tek onda ga interpretirati.
dijeli maksimalno mogucom vrijednoscu. Maksimalna vrijednost koefi- Interpretacija koeficijenta korelacije na prvom mjestu ovisi o vrsti vari-
cijcnta kontingencijc mozc sc odrcditi s pomocu ove formule: jabli izmedu kojih se racuna korelacija. Ipak se, katkada, kao gruba ori-
jentacija navodi da koeficijent korelacije apsolutne vrijednosti izmedu
0,0 i 0,2 ukazuje na nikakvu ili vrlo slabu povezanost; izmedu 0,2 i 0,4 na
slabu povezariost; izmedu 0,4 i 0,7 na srednju povezanost, a vrijednosti
gdjc jc k broj katcgorija u jcdnoj odnosno drugoj varijabli. Tako, prim- preko 0,7 ukazuju na veliku povczanost medu varijablama. Koeficijent
jerice, za 3x3 tablicu kontingencije Kmw:= 0,816. Ovakvo odredivanje korelacije, bez obzira na numericku velicinu i statisticku znaeajnost, po-
maksimalnog koeficijenta kontingencije vrijedi samo za kvadraticne ta- kazuje samo stupanj sukladnosti u variranju dvije varijable, a ne ukazuje
blice kontingencije. Znacajnost koeficijenta kontingencije obicno se na uzrocno-posljedicnu vezu medu varijablama (na osnovi koeficijenta
odreduje na temelju znacajnosti hi-kvadrat testa: ako je hi-kvadrat korelacije ne moze se utvrditi uzrokuje li jedna varijabla promjene u
znacajan, znacajan je i koeficijent kontingencije. Za koristenje koefici- drugoj varijabli ili neka treca varijabla uzrokuje sukladne promjene u
jenta kontingencije ne postavljaju se zahtjevi o obliku distribucije (sime- promatranim varijablama ).
tricnost iii sl. ). Koeficijcnt kontingcncije, mcdutim, nije opravdano kori-
Postoji velik broj koeficijenata korelacije koji se razlikuju po tehni -
• stiti u slozenijoj statistickoj claboraciji (cak niti za odrcclivanjc > koeflci- ci iztacunavanja, a prilagodeni su specificnostima varijabli izmedu kojih
jenta determinacije). K se odreduje stupanj povezanosti pa je zbog toga uvijek nuzno najprij e
,, utvrditi prikladnost odredenog koeficijenta korelacije .~a primjenu na
koeficijent korelacije Vrijednost koja pokazuje stupanj > korelacije
rezultatima ispitivanih varijabli. Osobito je vazno prije izracunavanja
medu varijablama. Numericka velicina koeficijenta korelacije moze po-
koeficijenta korelacije odrediti postoji 1i medu promatranim varijabla-
primiti bilo koju vrijednosti od 0 (nul a) do + 1 odnosno -1. Vrijednost ma linearna ( > lineama zavisnost) ili > zakrivljena korelacija, jer primje-
+ 1 oznacuje potpunu pozitivnu korelaciju, a -1 potpunu negativnu ko- na nekih koeficijenata korelacije (Pearsonova koeficijenta r) u slucaju
rclaciju. Koeficijent korelacije od 0 pokazuje da nema povezanosti zakrivljene korelacije moze dati neadekvatan opis povczanosti iii cak
medu varijablama, odnosno da postoji samo slucajan konvarijabilitet sasvim netocan rezultat (kao primjerice u slucaju kad crta regresije ima
medu rezultatima za koje je izracunat koeficijent korelacije. Ili, dru- oblik obrnutog slova U, pa iako stvarno postoji povezanost medu varija-
gacije receno, promjene u jednoj varijabli odvijaju se nczavisno od blama r ce poprimiti vrijednost blizu nule ). K
promjena u drugoj varijabli. Vrijednost koeficijenta korelacije izmedu 0
i 1 ukazuju na manju ili vecu djelomicnu povezanost medu varijablama,
koeficijent multiple korelacije Koeficijent koji pokazuje stupanj pove-
tj. na manju ili vecu sukladnost u variranju rezultata dviju (iii vise) varija-
zanosti izmedu optimalne (linearne) kombinacije > prediktorskih vari-
bli. Pozitivni predznak koeficijenta korelacije pokazivat ce da su prom-
jabli (kojih moze biti dvije i1i vise) i > kriterijske varijable. Za slucaj s dvije
jene u promatranim varijablama manje-vise istosmjerne (povecanje
prediktorske varijable formula glasi:
vrijednosti u jednoj varijabli prati povecanje vrijednosti u drugoj varija-
bli); negativni predznak koeficijenta korelacije znaCi da je povecanje
vrijednosti jedne varijable praceno smanjivanjem vrijednosti u drugoj
varijabli. Za svaki izracunati koeficijent korelacije potrebno je utvrditi
I
gdje je Ry. 12 koeficijent multiple korelacije izmedu kriterijske varijable Y daje manje varijabiliteta u Yvarijabli objasnjivo varijabilitetom uXvari-
i dvije prediktorske varijable 1 i 2. Sarsu oznaceni koeficijenti korelacije jabli, a to ujedno znaci ida je manja povezanost (manji koeficijent kore-
(Pearsonovi) izmedu pojedinih varijabli. VelicinaR ovisi o veliCini kore- lacije) izmedu X i Y varijable. Maksimalna vrijednost koeficijenta
lacije izmedu svake pojedine prediktorske varijable i kriterijske varija- rezidualnog varijabiliteta maze doseci vrijednost ukupnog rasprsenja u
ble kao i izmedu samih prediktorskih varijabli. Iz gornje se formule Yvarijabli, a to se dogada kad povezanost Xi Yvarijable nije veca od
mozc vidjeti da sc u slucaju r12 = 0, R jednostavno dobije iz r2 + r2• slucajne. Kao sto je moguce u Yvarijabli tqko je koeficijent rezidualnog
Vclicina R maze se odrediti is pomocu :>beta pondera. K varijabiliteta moguce odrediti i uXvarijabli. Teorijski, koeficijent rezi-
•
•
90 KOEFICIJENT SERIJALNE KORELACIJE KOLMOGOROV-SMIRNOVLJEV TEST 91
rijetko upotrebljavaju. Koeficijente serijalne korelacije nije opravdano koeficijent zakrivljene korelacije eta (7]) (u anglo-americkoj literaiuri
koristiti za odredivanje proporcije zajednickih faktora (tj. pretvoriti u > nalazi se pod nazivom correlation ratio) Koeficijent korelacije kod koje-
koeflcijent determinacije) kao ni za prognozu rczultata ujcdnoj varijahli ga linearnoj promjeni jcdne odgovara nelinearna (zakrivljena) promje-
na osnovi poznavanja rezultata u drugoj varijabli. K na druge varijable. Primjerice, takav odnos postoji izmedu trajanja rada
i srcanog ritma; izmedu stupnja osvjetljenja i radnog uCinka u vidnom
koeficijent theta > Freemanov koeficijent 8 (theta) zadatku itd. Temeljna formula za odredivanje koeficijenta zakrivljene
koreiacije izmedu varijable Xi varijable Y izgleda ovako:
kocficijent varijabilitcta > rasprJenje rezultata. s y•
7]=
koeficijent varijabilnosti (J-') (koristi se i termin koeficijent relativnog sY
varijabiliteta) Izraz koji nam pokazuje relativn! varijabilitet neke poja- gdje je s y· standardna devijaeija > parcijalnih srednjih vrijednosti u y
ve, ito taka sto standardnu devijaciju prikaze kao postotak aritmeticke varijabli za fiksne vrijednosti u X varijabli oko aritmeticke sredine u Y
sredine: aka je u nekom mjerenju aritmeticka sredina 100, a standardna varijabli (My), a s Y standardna devijacija u Yvarijabli. Maze se izracu-
devijacija 10, onda je stan dar dna devijacija 10% vrijednosti aritmeticke nati i koeficijent s vrijednostima u X varijabli; ta vrijednost moze biti
sredine. Koeficijcnt varijabilnosti racuna se vrlo jednostavno: V = razlicita ad one izracunate u Yvarijabli. Nije poznat nacin odredivanja
(s!M) • 100 (sa 100 sc mnozi da se izrazdobijc u postocima). Neke pojavc znacajnosti koeficijenta zakrivljene korelacije eta. Brojcana vrijednost
varirajujacc, a nekc manje; npr. tdina kod ljudi varira oko 15%, a visina ovog koeficijenta uvijekje pozitivna, jer eta koeficijent mjeri samo stu-
nest a preko 5% (sto se i vidi bez ikakvog mj erenj a: ljudi mnogo vise vari- panj povezanosti, a ne i smjer povezanosti, pa zato eta koeficijent za-
raju u debljini ncgo u visini); tjelesna temperatura (zdravih) ljudi varira pravo nema predznaka.
veoma malo (ispod 0,5% ), itd. Aka standardna devijacija prelazi 33% Uz pomoc eta-koeficijenta moguce je i izracunavanje stupnja
vrijednosti aritmeticke sredine, iz toga se maze zakljuCiti ne samo da povezanosti izmedu jedne > ordinalne skale iii > nominalne skale i jedne
mjerena pojavajako varira vee ida distribucija nije simetricna Uer M- 3s > intervalne skale (samo u navedenom smjeru, aline i obrnuto). K
zahvaca nulu i prelazi u negativne vrijednostf). No na mjernoj skali s
pozitivnim i ncgativnim vrijednostima (npr. skala atmosfcrske tempera- kohorta Skupina ljudi koji imaju (barem) jednu zajednicku, dobra de-
ture) koeficijent varijabilnosti dakako ne mora uopce ukazivati na rela- finiranu osobinu. Npr. skupina ljudi jednake dobi. K
tivni varijabilitet: prosjecna temperatura u jednom zimskom mjesecu
maze biti +2, a standardna devijacija 4. Iz toga proizlazi da se koefi- Kolmogorov-Smirnovljev test Neparametrijski test za testiranje pri-
cijent varijabilnosti maze upotrebljavati u pravilu samo kod > omjemih__ padaju li dva uzorka istoj populaciji, i to u razlicitim pogledima: u cen-
skala, a kod intervalnih skala veoma oprezno, tj. samo u situacijama tralnoj tendenciji, u varijabilitetu, u "uskosti" ili "sirokosti" distribucije,
usporedivanja istog svojstva izmedu dva ili vise uzoraka: mozemo npr. itd. Osniva se na usporedbi dviju kumulativnih frekvencija iz oba
na osnovi rezultata jednog testa znanja ustvrditi da u tom testu najviSe uzorka, a testira se ili uz pomoc hi-kvadrata (kod vec:h uzoraka) ili uz
variraju ispitanici grupe A, a najmanje ispitanici grupe B. Aline maze- pornoc posebnih tablica. Test se maze koristiti i za testiranje jednog
rna ustvrditi da ispitanici grupe A vise variraju npr. u inteligenciji nego u uzorka, aka nas zanima da lise maze smatrati da uzorak predstavlja
slucajan uzorak. P
introvertiranosti! P
•
KOORDINATNI SUSTAV 93
92 KOMBINACIJA DVAJU {ILl VISE) TESTOVA ZNACAJNOSTI
konstantni faktori U statistici oznacavaju > predmet mjerenja kojegaje
kombina~ija dvaju (iii vise) testova znacajnosti Ako ~ dva iii vise po- pokazatelj > prava vrijednost mjerenja. Nazivaj).l se konstantnim faktori-
kusa dobtjemo rezultate koji su is tog smjera (npr. aritmeticka sredina A ma zato sto se pretpostavlja da je ono sto se mjeri ili opaza relativno kon-
stalno je veca od aritmeticke sredine B), ali razlika ni u jednom ad
stantno (barem za vrijeme jednokratnog ili ponovljenog mjerenja ili ~. ,
... N
01 02 03 04 01 " )0
~~ ~
Ako u dva istovrsna istrazivanja oba
puta dobijemo neku razliku u istom 'J
20~ koordinatni sustav Svaki sustav koji sluzi odredivanju polozaja tocke
smjeru, ali koja ni u prvom ni u p
,.,_
"'
(iii sku pine tocaka) u prostoru odredenih dimenzija s pomocu brojeva ili
drugom istrazivanju nije statistitki
znacajna, uz pomoc ovog nomogra- ..
to
....
to \
'
f11tt 1 se nulom; horizontalna os naziva se apscisa, a obicno se oznacava sax;
znacajna. Of
ot aa 03 04 ~ 01 oe 10 20 ao 40
.ti:U
so eo 10 100
Of
vertikalna os naziva se ordinata i obicno se oznacava say. Ovaj sustav na-
I
I
ziva se jos i kartezijanskim, po latinskom imenu (Renus Cartesius) fran-
p '
'
I)(,
•
- - .... _ ·- --- .
..
'
•
'
KORELACIJSKA POVRSINA 97
96 KOREKCIJA ZBOG VEZANIH RANGOVA
nicke varijance kod promatranih varijabli (> koeficijent determinacije),
rekture. Za vezane rangove u Rho korelaciji, korekcije se ozbiljnije is-
zatim, objasnjavajuCi (u statistickom smislu) varijabilitet jedne varijable
plate samo kod niskih koeficijenata, kao i kod takvih rezultata koji su
s pomocu varijabiliteta druge varijable moze se preciznije predvidjeti
blizu > granicnoj vrijednosti. P
ponasanje rezultata u varijablama (> regresijska analiza, > jednadiba
~-
pravca regresije, > multipla korelacija) i, napokon, predstavlja polazisnu
korelacija U statistici oznacuje _sukladnost u variranjti vrijednosti dviju 1
osnovicu slozenije statisticke elaboracije (> faktorska analiza) s pomocu
(ili vise) varijabliyStupanj sukladnosti u variranju izrazava se > koeficije- koje se, na primjer, u psihologiji mogu empirijski klasificirati osobine i
ntom korelacije. Najveci stupanj sukladnosti u variranju, tzv. potpuna sposobnosti !judi. K
korelacija iii funkcionalna veza, postoji kad svakoj vrijednosti u jednoj
•
varijabli, ali da odredenoj vrijednosti varijableX odgovara vise razlicitih korelacijski omjer > koeficijent zakrivljene korelacije 1'J (eta)
vrijednosti varijable Y. Sto je korelacija manja, to je i varijabilnost y
vrijednosti koje se javljaju uz neku odredenu X vrijednost, veca i obr-
korelacijska povrsina "Povrsina" koju u koordinatnom sustavu zauzi-
nuto, sto je korelacija veca, manje je razlicitih Y-vrijednosti koje se vezu
maju individualni rezultati pojedinih elemenata ( statistickih jedinica; is-
uz odredenuX-vrijednost. Tako npr. postoji korelacija izmedu tjelesne
pitanika) u dvije varijable, izmedu kojih se racuna korelacija. Ako kore-
visine i tjelesne tezine u !judi; sukladnost u variranju ove dvije varijable
lacije nema, rezultati su rasprseni po cijeloj povrsini koordinatnog sus-
(visina i tezina) ocituje se u tome da su visi Ijudi i tezi (kako raste visina,
tava, i formiraju povrsinu, koja priblizno odgovara krugu. Ako postoji
raste i tezina ), ali samo u prosjeku, jer svi !judi iste visine nisu jednako
dosta visoka korelacija, rezultati formiraju elipsu (koja se kod pozitivne
teski.
korelacije penje slijeva nadesno, a kod negativne zdesna nalijevo ). Sto je
Pojam korelacije odnosi se na prvom mjestu na sukladnost u vari:?
koeficijent korelacije visi, elipsa je uza, a ako korelacija iznosi + 1 iii -1,
ranj~ v~rijabli ~oj_e, su izrazene na > intervalnoj skali ili na > omjemoj f.<' v • 0 .., • • • • •
ili k;.ralitativne kategorije ), kao sto su, primjerice, spol, boja oCiju i sl. Na Korelacijska povrsina korisna je kod dokazivanja da sc povcca-
r
osnovi same velicine korelacije ne mote se nista zakljucivati o uzrocno- njem > strogosti selekcije moze i test relativno niskc korclacijc s krite-
posljedicnom odnosu medu varijablama:' I rijem (npr. uspjehom u poslu) uspjesno koristiti. Povisimo li granicu u
i
Upotreba korelacije vrlo je rasirena ( osobito u nekim znanostima testu iznad koje cemo prilikom neke selekcije primati kandidate, pave-
kao sto je, primjerice, psihologija) jer omogucuje utvrdivanjc zajt:d- caw se proporcija uspj<.:Snih prcma neuspjcsnima u kasnijcm radu. P
-·-
•
100 KRITICNI ODNOS ' KRUZNI DIJAGRAM 101
jedobno su statisticari postavljali zahtjev da kriticni odnos mora biti naj- njihove kumulirane (zbrajane) cestine pojavljivanja (ordinata) (> ku-
manje 3 (tj. da razlika bude 3 putaveca od svoje pogreske), no kasnijeje- mulativne frekvencije). Krivulja kumulativnih frekvencija rezultata, koji
zbog posve opravdanih razloga (vidi o tome npr. > pogreska tipa 1 i tipa se inace normalno distribuiraju (u skladu s normalnom iii Gaussovom
2) - taj kriterij ublazen, pa se najcesce zahtijeva da kriticni odnos (tj. t) distribucijom), ima sigmoidni oblik (oblik razvucenog velikog slova S)
bude (kod velikih uzoraka) harem 1,96 (za razinu znacajnosti od 5%). (vidi sliku). Na > papiru vjerojatnosti normalna distribucija daje pravac
Kao sto je pozna to, sto su uzorci manji, potreban je veCi t da bismo (vidi sliku). Katkada se..naziva Galtonova oziva iii samo oziva, ali su oba
razliku mogli smatrati statisticki znacajnom (> t-distribucija). p ova naziva, medutim, ponesto zastarjela, tj. u novijem statistickom na-
zivlju rjede se rabe. K
krivulja distribucije Graficki prikaz odnosa vrijednosti (rezultata) ne-
kog mjerenja i cestine kojom se te vrijednosti pojavljuju. Obicno se na
Kruskal-Wallisov test (H) Neparametrijski test analize varijancc koji
apscisu u koordinatnom sustavu nanose numericke vrijednosti mjere-
nja, a na ordinatu njihova frekvencija. Krivulja distribucije zorno poka- umjcsto hrojcanih mjcrnih podataka koristi rangovc. Ako su uzorci vcti
zuje o kakvoj vrsti mjerenja i kakvoj pojavi se radi, a sluzi i pri donosenju od 5, test ima hi-kvadrat distribuciju, pa se iz tablica hi-kvadrata
odlukc o odabiru i opravdanosti upotrebc odredenih statistickih postu- odCitava znacajnost. Aka su skupine manje (5 iii manje u svakom
pakana dobivenim podacima. Krivulje s kojima se najeesce u statistici uzorku), znacajnost se mozc odcitavati iz poschnih tahlica. U slucaju >
baratajesu krivulja > normalne distribucije, > Poissonove distribucije, > vezanih rangova, postupakje kompleksniji. P
binomne distribucije itd. K
kruzni dijagram Nacin grafickog prikazivanja relativne frekvencije iii
krivulja kumulativnih frekvencija Graficki prikaz u koordinatnom postotka, uz pomoc kruznih isjecaka razliCitc vclicinc. Kut koji u
(surednom) sustavu odnosa vrijednosti rezultata mjerenja (apscisa) i kruznom dijagramu zauzima pojedini postotak, racuna se prcma for-
.... muli:
•••
•••
••• kut = frekvencija · 360
.=....__ _..:..___ _
'
• I
. N
,_"'
u
c:
Q)
1CX)
Ill .•
. ~ Na primjer, ako na ukupno 500 ispitanika njih 75 imaju neku karaktcri-
~
., Ill
·u- 70 '
I• stiku, ta ce skupina u krugu zauzimati isjecak pod kutom od (75 x
·h
.~
-
~....
itl
.. . ... ....... ...... .. ....... .............. "
0
'til ..
~
..
."
I
'
360)/500 = 54 stupnja. Primjer kru-
.....ro
-E:::1
Ill
SJ .... .. ........... .... .... .............. . . znog dijagrama koji prikazuje rezul-
.() "• tatc diplomskih ispita na Filozof-
J:i :II I
'
10.2 KUDER-RICHARDSONOVE FORMULE KVALITATIVNA VARIJABLA 103
Kudcr-RJchardsonove formule Formule s pomocu kojih se procjenjuje 4+7+6+9) itd. Graficki prikaz kumuliranih frekvencija, koje su inace
pouzdanost testa, a osnivaju se na tezini cestica koje saddava test i na normalno distribuirane, u linearnom koordinatnom sustavu (osX vrij e-
varijanci ukupnih rezultata u testu. Postoji veCi broj ovih formula, a dnosti rezultata, os Ykumulirane frekvencije) pokazuje karakteristican
najvi ~ c su u upotrehi one s oznakom 20 i 21. Ona s oznakom 20 ima ovaj oblik: razvuceno slovo S (vidi sliku pod > krivulja kumulativnih frekven-
oblik: • cija). Za odredivanje nekih statistickih vrijednosti (npr. > centralna
n s2-
r =--
LPq vrijednost, > indeks poluinterkvartilnog rasprsenja) nuzan je podatak o
kumulativnim frekvencijama pa njihova utvrdivanje predstavlja redo-
n n-1
vito etapu u takvim racunskim postupcima. Centralna vrijednost i polu-
gdje je r, koeficijent pouzdanosti, n broj cestica u testu, s2 varijanca uku- interkvartilno rasprsenje maze se odrediti i grafickom solucijom s po-
pnih rezultata u testu, p proporcija ispitanika koji su tacna rijesili neki mocu grafickog prikaza kumuliranih frekvencija. K
zadatak (cesticu) u testu, a q = 1- p.
Uz pretpostavku da su sve cestice u testu jednake tezine, formula kurticnost (engl. kurtosis, a dolazi od grcke rijeci koja znaci ispupeenje,
ima ovaj oblik (i oznaku 21 ): zakrivljenost, konveksnost) Termin kojim se opisuje opCi oblik zvonaste
krivulje (> nonnalna distribucija) u smislu njezine zakrivljenosti, a
n _ M(n-M)
r = 1 graficki pokazuje kolika je koncentracija rezultata oko aritmeticke sre-
n n-1 ns 2
dine. Normalna zvonasta krivulj a je > mezokurticna, a krivulj a koj a svo-
gdje je M aritmeticka srcdina rezultata u testu. K jim oblikom odstupa od mezokurticnosti maze biti > leptokurticna iii >
platikurticna. Kurticnost se u statistici opisuje s pomocu > momenta
kumulativna distribucija U statistici se cesto koristi kumulativna ra- (cetvrtog reda). U hrvatskom jeziku, na zalost, jos nemamo do barter-
spodjela frekvencija koje se inace distribuiraju normalno (Gaussova ra- ' min za kurticnost, pa predlazemo da se koristi sintagma zakri.vljenost
spodjela) jer graficki prikaz u linearnom koordinatnom sustavu raspod- nonna/ne kii.vulje. K
jele tih kumuliranih frekvencija ima karakteristican oblik razvucenog
slova S (vidi sliku pod > kri.vulja kumulativnihfrekvencija) (> kumula- kurtosis (engl.) > kurticnost
tivne frekvencije). K
kvadriserijalni kocficijcnt korelacijc (r~cvud) > Koeficijent serija/ne ko-
kumulativnc frekvencije Frekvencije dobivene postupnim redoslijed- re/acije koji se upotrebljava kad je jedna varijabla izrazeha u cetiri kate-
nim zbrajanjem (kumuliranjem) cestina kojima su se pojavile pojedine gorije, a druga je izrazena na kontinuiranoj skali. K
subklase (razredi) iii pojedinacni rezultati pri nekom mjerenju (ili
opazanju), odnosno ukupan zbroj frekvencija kojom se pojavio neki re- kvalitativna varijabla Pojam > varijablevezanje uzkvantitativne aspe-
zultat (iii klasa ili razred) i svi rezultati koji su mu po numerickom (ili ne- I kte pojava, stvari itd., pa je izraz "kvalitativna varijabla", aka se shvati
kom drug om) redoslijedu prethodili. Primjerice, ako je subklasa ili re- doslovno, zapravo contradictio in adjecto. Ali, buduCi da se (osobito u
zultat XI imao frekvenciju 4, subklasa ili rezultat x2 frekvenciju 7, x3
•
• psihologiji) koriste varijable koje imaju razliCite vrijednosti (iii tocnije
frekvenciju 6, x4 frekvenciju 9 itd., tada ce kumulativne frekvencije receno: razliCite razine ), koje nisu sasvim kvantitativne naravi, vee pred-
izgledati ovako: 11 (iz 4+7 ili 11+6), 17 (iz 4+7+6 ili 17+9), 26 (iz stavljaju neki kvalitativno-kvantitativni bastard, uobicajeno je koristiti i
'
•
- .•. - - -' .
nekog drugog testa, irna tri puta veCi ponder. Ako test A irna aritrneticku
lacije koji se upotrebljava kad je jedna varijabla izrazena u pet katego- I
sredinu 15, i standardnu devijaciju 3, a test B aritmeticku sredinu 40, i
rija, a druga na kontinuiranoj ljestvici. K I
'
I standardnu devijaciju 10, onda razlika od 3 bod au testu A znaci jednako
'I
•
I veliku razliku ' kao i razlika od 10 bod ova u testu B, jer obje razlike iznose
kvotni uzorak U izvedbi (a ne u nacelu) jedna od najlosijih varijanti > I .
'
' jednu standardnu devijaciju. Stoga kod jednostavnog zbrajanja bodova
stratificiranog uzorka: to je zapravo neslucajni stratificirani uzorak. Ako
I
'
oba testa mozemo i ozbiljno pogrijesiti: ispitanik sa 24 boda u testu A i
poznajemo npr. strukturu stanovnistva nekog grada, i zanima nas mi-
sljenje razlicito starih !judi i djece o nekom produktu; izracunamo ko-
I
I
35 bodova u testu B ima ukupno 59 bodova, a ispitanik sa 12 bodova u
; testu A i 55 bodova u testu B ima ukupno 67 bod ova, ali on je ustvari u
liko bi u uzorku velicine 1000 trebalo biti odraslih preko 50 godina, koli- ''
I ukupnom rezultatu znatno slabiji od prvog ispitanika; ako naime njiho-
ko ispod 50 god., koliko muskaraca, koliko zena, koliko djece itd., ian- '
I
' ve rezultate pretvorimo u > z-vrijednosti, onda prvi ispitanik ima ukup-
ketarima dademo uputu da po svom slobodnom izboru anketiraju iz no z = + 2,5, a drugiz = +0,5. Ukidanje latentnog ponder a od velikogje
I·.
svake od ciljanih skupina unaprijed definirani broj prolaznika. Uzorak znacenja prilikom selekcijskih postupaka kada se na velikom broju kan-
moze dati dosta problematicne rezultate jer biranje "po slobodnom didata primjenjuje nekoliko testova, pa je potrebno uciniti rang kandi-
I
izboru" cesto je rukovodeno subjektivnim faktorima anketara, koji i ne '
data (npr. pri klasifikacijskim ispitima na fakultetima). No buduci da-
prilazi osobama koje rnu se ne svidaju iii za koje smatra da bi odbile uz velik broj kandidata - pretvaranje individualnih rezultata u z-vrijcd-
'•
I
razgovor. Osim toga, tim nacinom biranja (u prolazu) iskljuceni su gra- I
nosti predstavlja opse:lan posao, mnogo je jednostavnije (uz nuznu pret-
dani koji se voze svojim vozilima i1i javnim prijevozom, oni koji u to vrije- postavku da ni jednom od testova ne zelimo dati vecu vaznost) to pro-
rne rade itd. P vesti na ovaj nacin: bruto rezultati svakog testa pomnoze se faktorom
... •
,
'
Ieptokurticnost (od grcke rijcci leptos, koja zna~i t~na~, vit~~~ Karakt~
ristika zvonaste krivulje distribucije koja se ocitUJC u IzrazitiJem grupi-
ranju rezultata oko sredisnje vrijednost_i, o_d~o~:n~ u sma~j~nom _r~s
prsenju rezultata, zbog cega krivulja t~ dJstnbuctJe 1zgleda VIsoka 1VIt-
ka" (> kurticnost). Obrnuto: '> platikurticnost. K
. .
- - -- . ~-- - -
.
-- - .
'
McNEMAROV 'JEST 109
108 MANN-WHI1NEYEV U-'IEST
na to mjesto stavlja jedinicna vrijednost, koja pokazuje da varijabla
Mann-Whitneyev U-test >test sume rangova
' sama sa sobom najvise korelira). Matrica korelacija sluzi kao polazisna
• •
'
onim sto se ustvari dogodilo: ako nadena distribucija dogadaja nikako \ Razlike koje su se dogodile, nalaze se u celijama AiD, i McNemarov
I
ne odgovara modelu, hipoteza biva odbacena; obrnuto, ako nadena dis- • test ce nam pokazati je li promjena statisticki znacajna. Racuna se po
tribucija odgovara modelu, onda bi hipoteza mogla biti tacna (no u tom I
• formuli: '..1
('
'
slucaju treba pri zakljucivanju biti vrlo oprezan, jer bi mozda i neka I
( (A-D) 2
I 2
druga hipoteza mogla imati jednaki model). P '
I \ ' X = A+D
l -
matrica (u statistici) Svaka tablica kojom se u redovima i stupcima pri- ' ili s primjenom > Yatesove korekcije, ako je (A .f. D) manje od 20:
'
' 2
kazuju neki podaci s pomocu brojeva ili nekih drugih simbola (primje- I
I
I
(lA- D-1)
X2 = _::___ __:.._:.__
rice > matrica korelacija). K I
I A+D
Iako ovaj test spada u hi-kvadrat, valja uociti da bi racunanje teoretskih
matrica korelacija Moze se upotrijebiti i izrazkorelacijska matrica. Ta-
blicno prikazane sve korelacije izmedu tri ili vise varijabli ili, preciznije
I
'
MEDIJAN
MJERENJE (U PSIHOLOGill) 111
•
a.naliza ukaze na neku zakonitost koja nije mogla biti ustanovljena u po-
-=~>finJere centr~inetendenci.iefu nas se koristi termin > sredisnje vrijed-
jcdinacnim istrazivanjima ( > kombinacija dvaju test ova znacajnosti). p
nosti. To su brojcanevrijednosti koje "reprezentiraju" skupinurezultata
u slucajevima kada rezultati imaju tendenciju grupiranja oko neke sre-
•
disnje ili neke druge vrijcdnosti, dakle kada postoji odredena "tcndcn-
kod provjerav,anja statistickc znacajnosti razlike izmcdu dvijc. aritmc- cija centriranja", tj. > centralna tendencija. Tako je npr. > aritmeticka
ticke sredine, ako uzorak nij£_ ve!_ili:, i ako su rezultati rvog I drugqg sredina uspjesna mjera grupiranja rezultata oko neke vrijednosti kojaje
mjerenja u korelaciji (npr. ako je ista skupina ispitanika tes~i.rana u dva uglavnom po sredini izmedu svih rezultata. > Dominantna vrijednost
•
navrata ). Metoda je vrlo jcdnostavna i "elegantna", a sastop se u tome ukazujc na grupiranje rczultata na vrijednosti koja moze, aline mora biti
x. ki k razlike izmcdu i rezultata po sredini svih vrijednosti. BuduCi da uz "centralnu tendenciju" rezul-
d a sc u ral,;uns
za svaki element ~vakog i~Qitanika), te se izracuna aritmeticka sredina tati vcCinc mjcrcnja pokazuju i tcndcnciju rasprsivanja, to se moze ka-
tih razlika, njihova stamlarJJna tlf_vijaciia i njihova standardna pogrdka. zati da je centralna tendencija skupine rezultata to izrazitija sto je ras-
A buduCi da radimo s razlikama, standardna pogre "ka r-redstavlja stan- prsenje rezultata oko neke rcprezentativne vrijednosti manje, i obrnuto.
ardnu ogrcsktUazlike_, uakle upr.av..u.oru ~ · azimQ. Tim postupkom I
I
Aje lito rasprsenje relativno veliko ili malo, pokazuju razlicite mjere >
_ izbjegavamo klasicni postupak testiranja statistick~ znac.~jno~ti r~zlike I rasprsenja rezultata, od kojih je jedna od najkorisnijih > koeficijent vari-
I' jabilnosti. P
medu aritmetickim sredinama zavisnih uzoraka, kOJI zahtlJCVa Izracuna-
vanja korclacijc medu rczultatima oba mjcrcnja, i uvrstava~jc koe~.i-
mjerenje (u psihologiji) Pridjeljivanje brojeva objektima, pojavama
cijwta korelacije u osnovnu formulu. Primjeno e.tod4Jiifer.en.cl.J.\;:-
itd. u skladu s pravilima (> skala mjerenja). Opcenito govoreCi, pravilo
k_or~ acija je automatski u.ra v ta. P
, -
\\
-· • . ..---
,.
.
-. . -
I
MON1E CARLO METODE 113
112 MJERENJE (U PSIHOLOGill)
'
pridjeljivanja brojeva pojavama maze biti hila koje konzistentno pravilo tata ad aritmeticke sredine u nekoj distribuciji rezultata podignuto na
I'
(osim pridjeljivanja po slucaju). Medutim, za mjerenje su posebno i-tu potenciju (potencija momenta prvog reda je 1, drugog 2 itd.), aN je
vazne cet:ri znacajke sustava brojeva, jer te znacajke determiniraju broj rezultata koji cine neku distribuciju.
pravila koja se pri mjerenju koriste, a time je ujedno odredena i razina
mjerenja odnosno skale mjerenja. 1. Svaki brojcani simbol ima svoj
:Lcx-M) ·
Moment prvog reda je m 1 = N = 0; moment drugog reda je
identitet, tj. onje sigurno razliCit od svakog drugog broja i reprezentira 3
uvijek isto (> nominalna skala). 2. Svi brojevi koji nisu identicni, manji :Lcx-M) 2
2
:Lcx-M)
m 2 =- N = s ; momenttreeegredaje m 3 = N ;
su ili veCi, pa se zato mogu redati po velicini (> ordinalna skala). 3. Za
razlike medu brojevima vrijedi isto sto i za same brojeve pa se moze ''
I
c d .
moment etvrtog re a Je m4 = L (X- M)
N
4 (X v •
oznacuJe sva
ki .
poJe-
utvrditi i red medu razlikama (> intervalna skala). 4. Sustav brojeva I •
sadrzi jedinstven broj -nul a- koji pokazuje odsutnost bilo kakve pojave dini rezultat, aM aritmeticku sredinu).
ili hilo kakvc kolicine (> omjema skala). K Moment prvog rcda zapravo je definicija aritmeticke sredine, mo-
ment drugog recta prcdstavlja varijancu, moment trceeg rcda pokazujc
dominantna vrijednost asimetricnost (engl. skewness) distribucije rezultata (> simetricna distri- I
-~---===
r
I
i
'
' I
114 MULTIPLA KORELACIJA I MULTIVARIJA1NA ANALIZA 115
multi pia korelacija Multivarijatni postupak kojim se odreduje stupanj
I
I' lorn) (Y) i skup prediktorskih varijabli (koje se katkad ne sasvim oprav-
''
povezanosti izmedu jedne varijable (koja se obicno naziva kriterijskom ' dano nazivaju nezavisnim varijablama) (X) s pomocu linearne jedna-
varijablom ili samo kriterijem) i optimalno ponderiranc kombinacije dzbe: .
;
nekoliko drugih varijabli (koje se obicno nazivaju prediktorskim vari-
jablama ili samo prediktorima). Ponderi su odredeni na principu
najmanjih kvadrata tako da minimiziraju rezidualnu ili nepovezanu Regresijski ili b ponderi obicno su odredeni s pomocu metode najma-
varijancu. Formula za multiplu korelaciju (R) jedne varijable (Y) s k njih kvadrata taka da je minimizirana suma kvadrata odstupanja za-
ponderiranih varijabli (X), u terminima bivarijatne kordacijc i stan- visnih (pravih kriterijskih) vrijednosti od korespondentnih predvidenih
dardnih pondera parcijalne regresije ("beta") izgleda ovako: vrijcdnosti, tj. minimizirana je L (Y- Y') 2
• > Multipla korelacija stoga
.._ , .._ ~
• •
strukata; najpoznatija takva tehnika je faktorska analiza (i eksplora-
torna i konfirmativna). K
dobivenih pri opazanju iii mjerenju dviju iii vise varijabli na istim ispi- I
'
'
tanicima. Kad se radio dvije varijable, onda se redovito koristi termin > '
'
bivarijatna distribucija. K
i
I •
''
negativna akceleracija Takav porast neke varijable, koji u vremenu (iii
I
'
paralclno s linearnim porastom druge varijablc).J2.ostaje svc SllQri·i. Na
primjcr, oporavak organizma u tijeku odmora odvija se najprije brzo, a
kasnije sve sporije. Alco je usporenje posve pravilno, negativna akcelera-
• cija prikazuje se izrazom:
''
'
Y=X"
' ,
I
pri cemu je a eksponent koji je manji od 1. P
I
'
'
negativna asimetricnost distribucije Takva distribucija koja nije sime-
'
' tricna, nego se veCina rezultata nalazi na njezinoj desnoj strani, dok je
lijeva strana manje iii vise produzena (vidi sliku). Naziva se "asime-
tricnost ulijevo". Negativna asimetricnost distribucije nastaje zbog ra-
zlicitih razloga, npr. stoga sto se neka pojava u prirodi iii drustvu doista
tako distribuira, ili zato sto je neki test prelagan za ispitanike na koje je
'
I primijenjen, pa stoga veCina ispitanika postize natprosjecne rezultate, a
II
')
''
' Negativno asimetri~na distribucija.
I
' '
I
'''
I
NESISTEMATSKI VARIJABILNI FAKTORI 119
I 118 NEGATIVNA ASIMETRICNOST DISTRIBUCIJE '
test je ogranicen brojem zadataka. Pri mjerenju neke varijable moze se testovima u statistici suj!FkV~flji})~~t 'i Rho . e.
• dobiti i zbog djelovanja nekih > sistematskihfaktora kao sto je, primjeri- , ¥.~9~i. ·~-t ~!i~ti~~~i.neparametrijske test~v~· riazivaju . . . · ·
I cc, vjczba. P
_}1i·~:<?.~-~~~~-i~~~ij~" (nez~visni od distribucije; distribution free tests),
pn cemu sc mislt da sc om mogu koristiti kod bilo kojeg oblika distribu-
• cije. Drugi se, pak, statisticari tome protive jer smatraju da se izraz "ne-
negativna binomna distribucija Distribucija koja nastaje superpozici-
~a~:~etrijski testovi" odi1?~i- sam<? na takve hipoteze koje .I1e zah~ijevaju
jom niza > binomnih distribucija ili > Poissonovih distribucija. U psiho-
Iznqt~ pret~os~avku ~?~~om> parametru populacijc. Ncparamctrijski
Jogiji najpoznatiji primjcr za takvu distrihuciju jc hipotcza o tome da sc
t.c ~tov1 .u vchkoJ ~u vec1m JCdnostavniji i lakse razurnljivi od parame~rij
ljudi mcdusobno razlikuju po tzv. "sklonosti nesrccama". Pod prctpo-
skih, ~~~~_ci.<:l~~.a. 9~-~,tqm~ni~ :> .s:n(lg~ od_ ~jih, a nedostatak im je ito da su
stavkom da "sklonost nesrecama" doista postoji, najopravdanije je pret-
u komplel<smm el{spenmentima, u KoJima mampuliramo veC!m bro ·em
• postaviti da se ona medu ljudima raspodjeljuje po normalnoj distribu-
yarijablC znatno manje upotre J1VI. •
I ciji. U tom slucaju treba pretpostaviti da 6e mali broj ljudi s najmanjom
"sklonosti nesrccama" imati prosjccno i najmanje nesreca, ne5to veCi n~sistemats~.varija~ilni faktori Svi faktori koji pri OQa:lanju ili I!,ljerc-.
broj !judi s vecom "sklonosti" imat ce prosjccno vlse nesreca itd., i napo- nJu neke vchcme (poJave, fenomena, atributa) utjecu na velicinu dobi-
kon opet vrlo mali broj ljudi s vrlo vclikom "sklonosti" imat ce prosjecno vene vrijednosti, ~ njihova djelovanje je slucajno (kako se to obicu'o
vrlo mnogo nesrcca. No, kod svake od tih skupina ovisi i o slucaju koliko kaze: po zakonu slucaja). Svaki > rezultat · · · · rezulta-
ce tko odstupati od prosjeka skupinc. A buduCi da se radi o rijetkim • ,ntnaje vrijednost djelovanja >. konstantnih Wktpra i nesistematski vari-
'
dogadajima, svaka ce skupina tvoriti Poissonovu distribuciju, ali dakako I'
' jabilnih faktora. BuduCi da nesistematski vari'abi . i · · · -lu.·.u
svaka drugaCiju,jer ce se te distribucije razlikovati po aritmetickoj sredi- '
,slucaju,aritmeticka sreg!na njihova djelovanja jcdnakajq,nuJj, a o njiho-
ni i po povriini. Zhroj (superpozicija) svih tih Poissonovih krivulja dat ce .., . ..
vu. rasp~senJu ov1s~ > rasprJenje dobivenih rezultata; opcenito, sto je pri
negativnu binomnu distribuciju. P mJerenJU neke poJave vise nesistematski varijabilnih fakto:r.a (odnosno,
~to na ne~ pojavu djeluje vise nesistematski varijabilnih faktora), vece
negativna korelacija > koeficijent korelacije
JC rasprsenJe rezultata mjereoj.a, Nesistematski varij~hilni faktori odgQ-
ncograni~ena populacija > populacija vorni sui za normalni ili zvonasti oblik distribucijc rczultata ( > norma-
Ina distribucija). Nesistematski varijabilni faktori su faktori koji- iako se
neparametrijska statistika Onaj dio statistike koji se koristi > nepara- dobro zna da postoje i djeluju na rezultate- izmicu kontroli ili elimina-
v
metrijskim testovima jer karakteristike podataka koji se obraduju, ne I ciji. Sto jc pri nekom mjcrcnju moguce kontrolirati vise tih faktora, rc-
I'
odgovaraju propisima > parametrijske statistike (> neparametrijski tes- '
•
zultati mjerenja imaju manje rasprsenje, tj. mjerenje je tocnije jer je
\
tovi). P manja vjerojatnost odstupanja od prave vrijednosti (odnosno konstant-
nih faktora ). N ace no ovo su te~elj~i_ izvori dj,e.lpyauj.a ncsis!ema.tsk.i.h
nepristrani uzorak > pristrani uzorak I
varijabilnih faktora: nesistematske romjene u isgi aniku -~ispitani..ci•
.
I• ma),; faktori u neposrednoj okolini u kojgj~.e obaylja · · · o aza-
neparametrijski testovi _Statisticki postupci koji se koriste kada podaci '
nje, ukljucivo i neko.ntrolirane nesistcmatske faktore eks,p.c._rim.cntalnc
koji se obraduju i analiziraju, odstupaj.u od distribucije koja se moZe .
.analizirati > p.JLram~trijskim testovima, ili su izr:;tzei}i na fi/fii1Jtinqliiim.
ili istrazivacke cedme.;_sam postupak mjercnja il!_pg.aZ,an,j ·.~
f pokon, djelovanje slucaja na slucaj,_pri. odabi:r:anju > uzorka. Nesiste-
iii> ordinalnim skalaina:Najpoznatiji medu brojnim neparame .. ;. ~.1111
J
•
-----. -· ..• - · ~ .. - ......
. -------
•
'
I'
opceprihvacenoj definiciji mjerenja: pridjeljivanjc simbola odredenim ·-
nivo rizika > razina znacajnosti definiranim atributima stvari iii pojava u skladu s pravilima pridjdjiva-
!
I
nja. Takoder, u novije vrijeme sve je vise statistickih testova namijenje-
nivo znacajnosti > razina znacajnosti nih obradi podataka dobivenih na nominalnoj skali. P,K
, ,~,
-
nomina Ina skala Ova skala spada medu najnesavrsenije "skale", jer se I
u
-
I nomogram Graficko pomagalo za odcitavanjc nckc odrcdcnc zavisnc
zapravo ne radi ni o kakvoj skali: pomocu ~ominalne (iii kategorijalne) !
,-
I
vrijednosti iz jedne, dvije ili vise drugih poznatih nezavisnih vrijcdnosti.
skale rezultate opazanja i1i "mjerenja" svrstavamo u kvalitativne ili ap- '
•• C.
!
visoke; u one bez motivacije, one sa srednjom motivacijom i jako motivi-
rane, it d. ~Q.~:f.l..L!.~f!l~~~ . p_()~!~P~!c. . !t ()V.Qj sk:l:lE ~l:lstoj~ se u brgjenju
I ' -
I'
S~_ll.~.a.j_~Y.a.. t1 ~.Y.a~~t~?t~gor.ijj. .
I
i
Brojevi, koji se cesto pridjeljuju kategorijama nominalne skale
. . ' I
.
v • • '
! '1
/'·- ..
- . .1
·- -- -- --· - · - ~---
,
/
,. ' r'
.
~;~~~DISTRIBUCIJA
...- .• ~
'
122 NOMOGRAM \ .. ·.123 \[:/'
~
U statistici, na primjer, iz visine praporcije u uzorku odredene velicine tom" krivuljom distri-
mozemo na nomogramu odcitati 95%-tne ili 99%-tne granice pouzda- bucije rezultata, koJa je
nosti te proporcije (vidi slike: garnja slika 95%-tne granice, donja slika
IJIJ'Y,;-tnc gran icc); iii iz vcliCinc dvaju uzoraka i ukupnc proporcijc ncke
pojavc u ta dva uzorka mazemo nomogramom dobiti podatak kolika je
razlika u proporciji potrebna da bi bila statisticki znacajna na razini 5%
Obje tendencije
iii 1% itd. p
mogu se holje razum-
jeti uz pomoc razliCitih
normalitet distribucije Ovim se izrazom oznacava i proces i rezultat primjera. Jedanje ovaj:
provjere odstupa li neka konkretno dobivena > distribucija statisticki ako mnogo puta mjeri-
znacajno od normalne distribucije. Provjera se, u nacelu, provodi taka "-····· .. -··-·
- mo neku pojavu kojaje
·3• ·2• -h X +ls +2s +3s
da sc usporcdc ili (a) stvarno dabivene frekvcncije koje cine dobivenu "takva kakva jest" (sto
L' idealnoj "normalnoj distribuciji" oko 68% rezultata predstavlja tendenciju
distribuciju s frekvencijama koje bi bile u skladu s riormalnom distribu-
nalazi se u intervalu izmedu ·1 i + 1 standardne devija· postizanjajednakog re-
cijom, a koje se lako odrede na temelju tablica standardizirane norma- cije; preko 95% rezultata obuhvaceno je intervalom od zultata ), pri mjerenju
Inc distribucijc, ili (b) usporedbom odabranih povrsina normalne dis- -2 do +2 standardne devijacije, a preko 99,7% rezultata
radimo (nesvjesno i ne-
tribucije i stVarno dobivene distribucije; povrsine standardizirane nor- intervalom od ·3 do +3 standardne devijacije.
hotice) manje ili vece
maine distribucije takoder je moguce odrediti s pomocu tablica nor- pogreske, pa se zato re-
maine distrihucije (vidi tablicu u Dodatku A). K zultati pojedinacnih mjerenja manje ili vise razlikuju (a to predstavlja
tendenciju razlikovanja rezultata ). _Nesistematski varijabilni faktori po
normalizacija distribucije Takva > transforrnacija rezultata (abjasnje- · skrecu ili ereni rezultat cas na a cas na drugu
nje pod tackom c) kojom se postize da distribucija rezultata koja odstu- seta , i stoga
pa od normalne postane normalna ili priblizno normalria. K
-
i n~jvise rezultata koji adgovaraju pravoj vrijednosti mjerene pojavc,
koja adgovara kanstantnim faktorima (za avu lagiku nastanka nor-
-maine distribucije do6ar je piiinjer > altonova "daska s cavliCima").
normalna distribucija Opce je iskustvo gotovo svih nas da kod opazanj a
Za neke druge situacije u kojima je nesta teze zamisliti neku silu kaja
i mjerenja razliCitih predmeta, pojava, procesa i osoba nalazimo najvise
tendira tome da rezultati budu jednaki, balji su primjeri nastanka nor-
"srcdnjih", "prosjecnih" rezultata, a sve manjc onih koji od tog "prosje- maine distribucije s bacanjem novCica i djelovanja "cis tog" slucaja na re-
ka" sve vise odstupaju. qo te pojave dolazi zbog razlicitih razloga, koji se zultat.e. U strogom smislu kad bacanja novcica se zapravo radi o jednoj
svi daju syesti.nadvije "sile" ko'e dj~_luju n3: rezultate: jedna_je sila ona drugaj distribuciji, tj. o > binomnoj distribuciji, ali kad je N vrlo velik, ta
-koja utjece na_to darezultati mjerenja budu uvijekjednaki (a uvjetovana distribucija gotavo potpuno odgovara normalnoj distribuciji. Slicno
je > konstantnim.J_aktorima, tj. anima koji su uvijekjednaki, a to Je ve- nam i > stablo vjerojatnosti zorna maze pakazati postanak narmalne dis-
- liCina pojavc iii prc~mct~jcrenja ili opaza9j,!!)z ~ druga.~ila utjccc na tribucije.
razlikovanje rezultata (i uvjetavana je razliCitim > nesiste~atskim vari-- rNarmalna j~ dis!ti~u~ij~ po_!P~IJ,? ,de~~n!~.~~.~~~•.dv~_p_!E~~~}E~: >
jabilnim faktJ rima . Te dvije tenpencije rezulti!aju tipi ~,nom "zvonas- ~ritn:z~!-~.~'2.!J1:..~£I.tf:i..'!22!.. i..?:..~!9JJ.if-!1!.4r.~t?...'!!.~~yfi£!.cji.e.'!};. Drugim rij e Cim a,
111m;m1'1::' '!
~ --- ~-~ ~--
- - -
'
, I
126 NORMALNA DISTRIBUCIJA '
' NVL-IDPO'IEZA 127
I
U izravnoj vczi s time, normalna distribucija prcdstavlja i osnovicu I da prihvacanje nul-hipoteze ne znaci da je posve sigurno da npr. neka
I
za razumijevanje nekih bitnih pojmova > inferencijalne statistike, a u I' razlika ne postoji, vee to znaci dane mozemo tvrditi da razlika postoji jer
I
prvom redu pojma "standardne pogreske". Formulirano malo dru- razlik:u nismo uspjeli potvrditi. Takoder valja reCi da odbacivanje nul-
l
gaCijc, mogli bismo kazati ovako: osoba koja ne razumije logik:u i zakone ''
hipoteze nikako ne znaci da je zbog toga automatski prihvacena >alter-
normalne distribucijc nc mofc razumjeti niti statistiku (a potpuno "me-
nativna hipoteza. Na primjer, kada u nekom eksperimentu iz ekstrasen-
hanicka" primjena statistickih pravila maze cesto zavrsiti besmislenim
zorne percepcije ustanovimo da ispitanik pogada poledine karata sta-
rezultatom!). P
tisticki znacajno vise nego sto bi to mogao po slucaju, tada odbacujemo
nul-hipotczu kojajc mogla glasiti "nema ekstrascnzorne pcrccpcije", ali
normiranje > baidarenje
t~ dakako ne znaci da prihvacamo alternativnu ili direktivnu hipotezu,
'
tj. da ekstrasenzorna percepcija postoji Qer je dobra pogadanje "medi-
nul-hipoteza Najcesce se koristi pri testiranju statisticke znacajnosti ra-
' ja" moglo imati i razliCite druge uzroke). Novalja primijetiti darecenica
zlike medu aritmetickim sredinama, meQ.u koeficijentima korelacije itd.
.(> statisticki znacajno), a g!asi, na .pr.imjcr: cm.p.i.t:~js.ki-cl.OOw~-a:tli*a=
"nema ekstrasenzorne percepcije" ne bi hila dobra formulirana nul-
hipoteza, jer bi ona zapravo morala glasiti ''nema razlike izmedu do-
medu aritmetickim sredinamaje slucajna,jer medu aritmetickim sredi-
bivenih rezultata i rezultata koje ocekujemo po slucaju". P
- nama obiju populacija nema razlike; iii: dobivena korelacija je slucajna, .
•
jer u populaciji korelacija izmedu tih varijabli ne postoji. Logika nul-
J tipots-ce e-sniva sc na > normalnoj distribuciji: aka izmcdu dvij.~popula ~
>'-..!'. razlike u aritme · · ·
velik hroj uzoraka_iz ob'e opulacije i registrirajuci dobiyene xazlike
m1:du aritmetickim srcdinama uzoraka, dobili normalnu distrihuciju ra-.
-;lika kojima je aritmeticka ~redina 0 (nula) 1 a st~ndardna geyjj,acija
__yrij.GeMs-t-kojtl-ffil.zivamo > standardnapogrdka razlik: izme~u ~viju ~tj-
tmetiC:kib sredina, j koj.ujako izr.acunam.o. Ako ncka nasa razhka 1znosJ 5,
A kn mcdu dvjcma pnpulacijarna nmw ra1.likc 11 aritmcti~kim srclli nanm, 117.astPpnim u;o:i -
· a njezina standardna pogrcska iznosi 1, onda jc ta razlika statis~icki
manjem uzoraka iz obje populacije dobili bismo (zbog djelovanja slu~aja) normal11u dis-
_znacajna,jer- pod pretpostavkom da medu nopulacijama mana razhk~ ~ tribuciju razlika mcdu aritmcti~kim srcdinama parova uzoraka. Ta bi normalna raspod-
slucajno dobivene razlike mogle bi se kretati.pQprilici od -3 do + 3 (v1d1 ' jela irnala aritmcticku sredinu 0 (nula) (jer su populacije identicne), a standardnu devija-
.lijcvu sliku). Naprutiv, ako standardna pogrcska tc ra~lik~ izm~si ~ (vic~i ciju te raspodjclc nazivamo "standardna pogre~ka ra1.likc medu aritmcti~kim srcdinama" .
1\ku ncka tlubivcna razlika izmedu dva uzurka iznosi 5, a standardna pogrc~ka te razlike
desnu sliku), onda nadena razlika od 5 posve dobra pnstaJe .u ~~~tnbuct-
iznosi 1, onda je iz lijeve slike jasno da je prakticki nemoguce dobiti razliku vecu od 5, ako
ju razlika kojima je aritmeticka sredina nula- pa stoga z~klJUCUJe~~ da medu populacijama zapravo nema razlike. Dakle, razliku smatramo "statisticki znacaj-
I
razlika nije statisticki znacajna, nego je vjerojatno dobJVena slucaJn?: '
nom". Naprotiv, razlika velicine 5 mogla bi se Iako i slucajno dogoditi, ako bi njezina stan-
Nije nuzno da nul-hipoteza glasi "nema razlike':, jer ona. moze gl~stt~ dardna pogreska iznosila 4 (desnaslika), pastoga takvUrazlikunebismomoglismatrati
' statisticki znacajnom.
npr. i: "razlika u populaciji nije veca od 10", pa se 1stom logtkom te~ttra I
ova hipoteza: ustanovljuje se koliko nadena razlika odstup~ od antm~~
ti cke sredine razlika, kojima je aritmeticka sredina 10. ValJa upozontJ
•
1
• •
•
~ .
•
• • ·- ..
'
OMJERNA SKALA 129
l
iznosi 1/4 = 0,25, onda sansa da necemo izvuCi tu kartu iznosi 3/4 = 0,75.
Prema tome, odnos sansi iznosi 0,25/0,75 = 0,3333.
Aka u razlicitim popularnim prikazima nademo npr. podatak da
vjerojatnost neke covjekove karakteristike iznosi 1 prema 7 (dakle od
ukupno 8ljudi, u prosjcku eemo kod jednog naCi to svojstvo, a kod 7 ga
necemo naCi), to znaci daje vjerojatnost takvog nalaza zapravo 1/8 (na 8
Ijudi kod jednog eemo naCi tu karakteristiku). Do odredene konfuzije
maze doCi u razumijevanju stoga sto racun 117 iznosi 0,143, a prava
vjerojatnost da cemo medu 8 Ijudi naCi jednoga s tom karakteristikom
iznosi 1/8 = 0,125.
"Odnos sansi" je izraz za koji u hrvatskom nemamo za sada pravu
rijec iii sintagmu. Bitno je to da taj izraz ujedno oznacuje i neku mjeru
• povezanosti: ali za razliku od ostalih mjera povezanosti (ili korelacije),
oceklvane (teoretske) frekvenclje Frckvencijc kojc u pojedinim katego- odnos sansi u visini 1,0 znaci da nema povczanosti medu varijablama
rijama oeekujemo pod nekom odredenom hipotezom. Na primjer, ako (0,5 je vjerojatnost daCe se nesto dogoditi, a takod~r 0,5 je vj~~ojatno.s~
ispitujemo frekvencije pojedinih ocjena na diplomskom ispitu stude- da se to nece dogoditi). Velicina veze mjeri se razhkom (pozltlvnom 1h
nata i studentica, pa nas zanima razlikuju li se te dvije skupine po dis- • negativnom, vee prema tome u kojem smjeru gledamo podatke) pre rna
tribuciji ocjena, > nu/-hipoteza ce glasiti da nema razlike mcdu njima, i vrijednosti 1,0: O<.lnos sansi is pod 1,0 upucuje na negativnu povezanoBt, a
pa da ee dakle proporcija svake ocjene biti jednaka kod djcvojaka i mla- I iznad l,O na izravnu, tj. pozitivnu povezanost. Ako bismo npr. nasli (iz-
dica. Oeekivane frekvencije najpoznatije su u primjeni > hi-kvadrat misljeni primjer) medu 100 muskaraca da su njih 5 manje ili vise slijcpi
za boje, a medu 100 zena samo jednu, onda odnos izmedu sansi iznosi
testa, kod kojeg se one uvijek moraju izracunavati, i usporedivati s >
5/95:1/99 = 0,053:0,001 = 53, sto ukazuje na jaku povezanost izmedu
opazenim frekvencijama. Izracunavanje ocekivanih frekvencija nije
spola i sljepoce za boje: kod zena sljepoca za boje vrlo je rijetka, a kod
uvijek potpuno jednostavno, i ne moze se provoditi potpuno automat-
muskaraca ona iznosi nekoliko postotaka. P
ski, vee treba savjesno voditi racuna o tome kakve frekvencije odgova-
raju postavljenoj hipotezi. P
ogranicena populacija > populacija
odds ratio > odnos "sansi" I t;~fu.i;@~Jllla~~"Ratio" skala) Najbolja skala mjerenja: ne samo da
posjeduje - kao i > intervalna skala-E.~~is.tantn~ jeP,inice, tj. dana bilo
odnos "sansi" (odds ratio) U nas rjede koristen izraz, ali u razlicitim kojem dijelu skale jednaki intervali odgovaraju i jednakim fizikalnim
statistick,;m tekstovima na engleskom jeziku crsto nailazimo na izraz razlikama, vee ..ta skala posjeduje apsolutnu nultu vrijednost. To znaci da
,.- ......... . .. " ... . ...
'~ ·-·-· _,
"odds ratio" ili skraceno "odds", stoga je uputno upozoriti na razliku " '
se jedino u tim skalama moze kazati da je nesto npr. "tri puta veee" od
izmedu pojma "odnos sansi" i "vjerojatnost" (iii "sansa") Odnos "sansi" necega drugoga: stol duzine 150 em tri je puta duzi od stola dliZine 50 em
je odnos izmedu "sanse" dace se nesto dogoditi i sanse da se to nece do- (pa makar to mjerimo bilo kojim duzinskimjedinicama), kamen od 300
goditi. Na primjcr, ako sansa za izvlacenje karte "as srce" izmedu 4 asa kg trije puta tezi od kamcna teskog 100 kg (u bilo kojim tdinskimjcdini-
\.
•
•
I
'
OMJERNASKALA~~----------------
ORDINALNA SKALA 131
130 I . .
earn a), vrijeme od 45 minuta tri je puta duze od 15 min uta. To je zaista Zbog toga, naravno, nije opravdano (iako se to eesto cini!) iz-
I
prikazani u omjernim skalama, a >.;.,koeficijentvari{abilnosti tetykod om- as OCJenom 2 se prolazi na ispitu. Unutar kategorije "prolazi se" ocjene
jt:rnih Hlutla ima svojt: potpuno Iog1cko op~avdanJe. P >
2, 3, 4 i 5 samo ukazuju na razlike u prolaznom znanju, tj. od "jedva" pa
sve do "izvrsno''. Iz toga proizlazi da su stvarne i smislcne razlike izmedu
opazene frekvencijc Frekvencije stvarno dobivene pri opafanju (broje-
>
susjednih ocjena iznad ocjene 2 znatno manje od r.azlike izmedu 1 i 2.
nju) pripac.Jnih dcmcnata (statistickih jcdinica) odrcdenim, unaprijed >
Vee prema kriteriju pojedinih nastavnika, za neke nastavnike postoji
ddiniranim, kategorijama ili kvantitativnim klasama. Ako, na primjcr, veca razlika izmcdu ocjcne 3 i 4 nego izmedu 4 i 5, iii jc pak obrnuto.
priiikom ispitivanja misljenja ginekologa o tome treba li ili ne treba zeni Uz ordinainc jc skale dopustena, d~k:ako, primjena svih stati-
pri porodu dati ancstt:ziju, ud 100 Iijccnika njih 50 misli c.Ja trcha, 35 da stickih postupaka koje primjenjujemo uz > nominalnu skalu, a uz to i
. izracunavanje ccntraine vrijcdnosti, kocficijcnata rangkorelacijc kao i
nc treba, a 15 nema o tome definitivno misljenje, onda su 50, 35 i 15
drugi neparametrijski postupci.
opazene frekvencije u kategorijama "da" ,"ne" i "ne znam". Njih u >hi-
No, ipak valja reci da u nekim slucajevima ima opravdanja za iz-
kvadrat testu usporedujcmo s > ocekivanim frekvencijama, tj. onima .., • 0 ....
•
132 ORDINALNA SKALA '
•
svaka kategorija (klasa) ima samo jedan clan. Sasvim formatno pravila II
I ove skate mogu se formulirati ovako:
•
' •
•
Kako se vidi ovdje je,za razliku od nominalne skate, relacija medu cla-
novima skate asimetricna. )
osjetljivost mjerenja U statistici znaci razlikovanje predmeta mjerenja P (iii p) U statistici znaci: (a)vjcrojatnost (od lat.probabilitas). Najcdcc
na temelju rezultata dobivenih mjerenjem neke osobine (pojave, feno- ., se u statistickim postupcima "Vida kod testiranja razlike izmedu stati-
mena) na razlicitim individuumima. Sto mjerni instrument bolje razli- stickih vrijednosti (> t-odnos, analiza varijance), gdje oznacuje razinu
kujc razlicitc ispitanike, za koje se pretpostavlja da se stvarno razlikuju u rizika (> razina znacajnosti) koju netko zeli prihvatiti kao npr. P< 0,05;
pogledu razvijenosti osobine kojaje predmet mjerenja, to je on osjetlji- J
(b) moze znaCiti i proporciju u kojoj se neko svojstvo pojavljuje: npr.
viji, a ta ee se njegova znacajka ocitovati u rasprsenju dobivenih rezulta- p = 0,3, znaCi 30%; (c) u statistickim tablicama obicno znaci povrsinu
'
ta (> rasprsenje rezultata). K \ neke krivulje iii dio njezine povrsine, jer se ustvari takoder radi o vjero-
'•'
I
jatnosti rezultata. Npr. u tablici normalne raspodjelePpokazuje povrsi-
osnovni ~kup > populacija I' nu krivulje od aritmeticke sredine do tog rezultata, iii povrsinu od tog re-
•
I zultata pa do blizeg kraja krivulje: uzz-vrijednost 1 (sto znaci da je neki
''
I
J rezultat tacna na + 1 standardne devijacije) citamo dap iznosi 0,3410 ili
I 0,1587 (vee prema tome koji dio krivulje tablica pokazuje: oba broja za-
'
''
• jedno daju zbroj 0,5, dakle 50%). A taj broj ujedno pokazuje i vjerojat-
nost dace neki slucajno izvadeni rezultat iz populacije pasti izmedu arit-
meticke sredine i te z-vrijednosti (iii te vrijednosti i kraja krivulje ). P
p Ima isto znaccnje kao i > P, ali se vise upotrebljava kod oznacavanja
'' proporcija u dihotomnih (iii dihotomiziranih) varijabli: p = proporcija
' u kojoj se neko svojstvo pojavilo, a q = proporcija u kojoj se to svojstvo
'
'·
nije pojavilo pa iz toga slijedi da je p + q uvijek = 1. Sa p se oznacava i
• vjerojatnost (ili razina rizika) pri jednosmjernom testiranju razlika
•
medu statistickim vrijednostima (> dvosmjemo i jednosmjemo testi-
ranje). P
•
••
•
•
' ' I I I ' ,
'
. _ , _
-- -- - -
- -~-~
. .. . -~ -- - ... -- -
' .
134 PAPIR (NORMALNE) VJEROJA'INOSTI PARCIJALNA KORELACIJA 135
papir (normalne) vjerojatnosti Papir, po izgledu slican milimetarskom statistika sluzi se > parametrijskim testovima i iz dobivenih vrijednosti iz-
papiru, kojemu je apscisa linearna skala na kojoj se bilje:le rezultati vode se zakljucci o > parametrima populacije. P,K
""
I
mj ercnja u ckvidistantnim jedinicama, ana ordinati se biljeze relativne
~af~!D~'irlj;~r~I;'f~"Statisticki postupci koji se upotrebljavaju kada
kumulativne frekvencije, ali je ordinata tako podesena (suzena u sredi-
podaci koji se obraduju udovoljavajn odredenim uyjetima, naiQesce
ni, a prosirena prema krajevima) da relativne kumulativne frekvencije
tomu da im kao ida su
normalne distribucije daju pravac. Stoga razliCita odstupanja od pravca
na papiru vjerojatnosti ukazuju na razliCite vrste odstupanja distribucije
od normalne distribucije (npr. asimetricna distribucija, bimodalna dis- ,.. . ~
(npr. standardne
tribucija itd.) (vidi sliku). P p
..... -----·+
:~ +·------~ / --- T ~:----:~ parcijalna korelacija Katkada mozeino izmedu dvije varijable dobiti
eo
70+-
t==)l:====:;t/-'~==~~~==~j~'---
.L-
visoku korelaciju zato sto ina jednu ina drugu varijablu istodobno na isti
~~~-----f~---~t-~~~- nacin djeluje neka treca varijabla. Medu starijim statisticarima bila jc
~ H----~f/+--:;/.-{-_/' @ asimclr ija udcsn o poznata sala da je glavni dokaz tvrdnji da "rode donose djecu" to sto
:lO W----1-/+/~/?L----@ 1u;inw tri ja uli jevo postoji relativno vclika korclacija izmcdu broja roda i broja novorodene
20 W----([-1)-/--/-tf/,l./-._/11------ © koni~nnst
djece u selima velikog broja zemalja (u kojima :live rode). No, tu poveza-
10 '----)-
/ / @ :l (ll j o ~ I C IIO~I
6 / / :. /._., -- - - -- - - - ---- - --- · ® bim odal nost nost (ipak) je uzrokovao "treCi faktor", a to je vclicina naselja: stu je nc-
ko naselje vcce, to ima vise kuca s dimnjacima, pa stoga i vise roda, a uje-
Na "papiru vjerojatnosti" jedino idealna normalna distribucija dala bi pr~:ac dno - zbog veceg broja stanovnika- i vise rodene djece. Ili, kad bismo u
(vidi dcSnU sJikU UZ pojam krivu/ja kumu/atiVIlih frekvencija), dok CC raz!JcltC • jednoj osnovnoj skoli izmjerili duzinu stopala sve skolskc djecc i ujcdno
drugacijc distribucije dati krivulje razlicitih (nelinearnih) oblika. procijenili sposobnost pisanja svakog djeteta, takoder bismo dobili viso-
ku korelaciju, jer sto su djeca starija, to imaju vcce stopalo, a ujedno i sve
para~e~~ fJ statistici oznac · · eku bro'canu vrijedn?~t (n~r. ~it~~ bolje pisu; a ocito je vrlo mala vjerojatnost da postoji ikakva korelacija
hc sredinu ili standardnu devijaciju),! oja karakterlZ!ra d1stnbuc1JU izmedu duzine stopala i vjestine pisanja. U svim takvim slucajevima
·· se vrijednost obicno oznacuje grckim slovima, dok se ko- treba iskljuciti djelovanje tog treceg faktora (ili vise njih, ako ih ima), tj .
.pg-ndentnc vrijednosti uzorka nazivaju "statistici"( nom. jed.: > sta- dr:h ti ga konstantnim. Tada se stvarna korelacija izmedu dvije varijable
tistik), i oznacuju se latinskim slovima. P (izmcdu kojih nas korelacija zanima) moze izracunati uz pomoc for-
mule za parcijalnu korelaciju- koja se u slucaju kada postoji samo jed an
parametrijska statistika Onaj dio statistike koji ustanovljuje "Cinj~ "treCi faktor" naziva parcija/na kore/acija prvog reda - glasi ovako:
nicno stanje", tj. izracunava glavne karakteristikc nekog. uzorka (ant~ )
,.- meticku sredinu, standardnu devijaciju itd.) ili stupanJ povezanostl 't3r
'12 -
23
' r = --;:::;===~~==~
medu varijablama mjerenih na uzorku (korelaciju). Glavn~ zadaca p~ 12. 3 ~(1-rn2)(1-r2/)
'
rametrijske statistikc jest procjcna populacijskih vrijednostJ na temelJU
gdje je r 12_3 , korelacija izmedu varijable 1 i 2 kad se iskljuCi utjecaj ( od-
rezultata dohivenih na uzorku. Pri tome se polazi od pretpostavke ~-no
nosno korelacija) trece varijable na jednu i drugu varijablu. Sa r12 itd.
rmalnoj distribuciji u populaciji iz koje se uzorci uzimaju. Parametnjska
•
. - .
'
kako, tada i racunski postupak postaje sve slozeniji. Mnogi statisticari koder, lakSe uocavanje i nekih pogresaka pri rezoniranju o vjerojatnosti
isticu da parcijalna korelacija pokazuje "sto bi bilo kad bi bilo", pa da za- nekih ishoda. Na primjer, na pitanje "Kolika je vjerojatnost da kod ba-
pravo nem.1 realno znacenje ako se mjerenjem ili opazanjem ne mogu canja 8 novciea dobijemo rezultat4 G- 4 P", velik ce broj Ijudi odgovoriti
dobiti podaci koji nisu pod utjecajem neke "treee" varijable. P,K ' da je vjerojatnost 50%. No uvidom u Pascalov trokut vidimo da je sansa
nata za odredivanje > crte regresije (druga koordinata je fiksna vrijedno- anglo-americkoj literaturi obicno e product-moment correlation; i u nas
st) (> kor:dacija, > crta regresije, > regresijska analiza). K se katkada rabi termin koeficijent korelacije umnoiaka i1i samo koefi- ·- or
Pascalov trokut J ednostavna metoda (bez upotrebe form uta) za iz- cijent umnoiaka) Odreduje se na temelju umnoza~~. p;u:ova!ezultata u ~ .. ,..,, .-- ...,........,.:,~~-..\ . ... • t _,
L
racunavanje > binomne distribucije i nekih drugih racuna. Sastoji se od varijablama •W•izmedu kojih se racuna korelaciJa~ Koeficijenf korelacije r
<::J~i::t' :1,.; ,,flo,l<j.IJ"'ocl.:'~<-i7~ •·,,
• ·-\ ' ,,· , ....-,~, ·~- ~
citanja ubiljezenih brojevajednog "trokuta", sto ga Cine redovi brojeva opravdano je racunati samo (1) ako su rezultati u obje varijable prave
koji u vrhu poCinju brojem 1, a svaki daljnji red nastaje zbrajanjem lije- ,numericke vrijednostj, tj. ako su barem na > intervalnoj skali; (2) ako je
vog i desnog broja u redu iznad njega, te poprima oblik, prikazan na slici. broj rezultata veci od 30 (N > 30) ~(3) ako su distribucije u varijablama
Taj sistem bio je poznat vee u 14. stoljeeu u Kini, ali je dobio ime po ' simetricne (jer asimetricnost distribucije utjece na oblik povezanosti
matematicaru Pascalu, koji je nasao mnoge njegove korisne primjene. - medu varijablama; > lineama zavisnost; > zakrivljena korelacija); i (4) r-"-'
Primjer za primjenu: Ako npr. bacamo 8 komada novciea 256 puta, onda ako je povezanost~edu varijablama ravnocrtna (linearna). J esu li zado-
I
teoretske frekvencije "glave" (G) i "pisma" (P) mozemo citati iz osmog voljena prva dva zahtjcva, nijc tt:Sko utvrditi; provjcra druga dva zahtjc-
reda: 1 putaO G- 8 P, 8 puta 1 G-7P, 28 puta2 G- 6 P, 56 puta3 G- 5 P, va cini se kontrolom oblika > distribucije rezultata u svakoj od varijabli
70 puta 4 G- 4 P, 50 puta 5 G- 3 P, 28 puta 6 G- 2 P, 8 puta 7 G -1 P, i 1 ' .. te kontrolom oblika > crte regresije. Postoji jos i zahtjev o > homosce-
puta 8 G- 0 P. Pomocu Pascalova trokuta mozemo izracunati i razlicite dascitetu, ali ga je prakticki tesko kontrolirati, pa se obicno i ne kontro-
'
druge probleme racuna vjerojatnosti. Pascalov trokut omogucuje, ta- lira vee se samo pretpostavlja da nije u znatnijoj mjeri narusen .
.,
'
nag zbroja bruto rezultata u svakoj varijabli. Prema tome, sam racun se uopce, iii izvedenu statisticku vrijednost (taka se za aritmeticku sredinu
najjednostavnijc provodi standardiziranorn tablicorn s ovim stupcima: takoder maze reCi da je podatak). U svakom slucaju podatak uvijek ima
empirijsku podlogu. K
Ispitanici X y XY
0
•• •• •• • 0
0
• • • ••
0
• 0
· pogreska Pojam pogreske u statistici (osobito u inferencijalnoj statis-
tici) vrlo je vazan pa zato mnogi statisticari, napola u sali, kazu kako sta-
~,> Znacaj1lost koeficijenta korelacije r maze sc odrediti s pomocu -~ tistika zapravo i pociva na ~·pogresci". Opci koncept parametrijske sta-
t-testa Koeficijent korelacije r jedini se od svih koeficijenata korelactJe tistike polazi od pretpostavke postojanja tzv. > prave vrijednosti mjere-
moze upotrijebiti u daljnjoj, slozenijoj statistickoj elaboraciji (npr. > nja. Prava vrijednostje idealna vrijednost predmeta mjerenja koja pos-
multipla korelacija, > faktorska a1Jaliza) (> pogreJka koefi.cijenta korela- toji u populaciji (koncept jednako vrijedi za mjerenje jedne velicine na
cije). K razlicitim statistickim jedinicama kao i za ponovljena mjerenja jedne
velii:ine na jednoj statistickoj jedinici) i tu bi se vrijednost moglo dobiti
percentil > skala centila mjerenjem cijele populacije (aka je populacija konacna odnosno neiz-
rnjcrno velikim brojern rnjcrenja, ako se radio beskonacnoj populaciji),
platikurticnost (od grckc rijcci plate, sto znaCi. ra~an, _rl~sna~: sirok)
ali takoder uz uvjet da je moguce ostvariti idealno mjerenje (mjerenje
Vrst > kurticnosti, tj. karakteristika zvonaste krlVUlJe dtstnbuclJe frek-
koje ne trpi ni od kakvih pogresaka). BuduCi da je svako mjerenje ·
vencija, koja se ocituje u slabije izrazenom grupiranju rezultata oko sre-
podlozno utjecaju mnostva razlicitih cirnbenika (koji su medusobno
disnje vrijednosti, dakle u povecanorn varijabilitet_u ~azultata, pa stoga
nezavisni i koji djeluju po slucaju), to sui dobiveni rezultati izlozeni po-
I
krivulja izgleda "spljostena" i "siroka" u usporedbt s tdealnom normal-
gresci. No, povecavanjem broja mjerenja i racunanjem aritmeticke sre-
nom distribucijom, a pogotovo se razlikuje od "uske" i "vitke" > lepta-
,t
I '
140 POGRESKA POGRESKA TIPA 1 I TIPA 2 (ALFA I BETA POGRESKA) 141
dine iz dobivenih rezultata mozemo dobiti vrijednost koja je to bliza pra- · tocna, tj. stvarno nema razlike medu populacijama. Pogreska tipa 2
voj vrijednosti mjerenja sto je veCi broj mjerenja; tocnije receno, razlika (beta pogreska) je obrnuta: prihvacamo nul-hipotezu, koja stvarno nije
od prave vrijednosti mjerenja povecavanjem broja mjerenja smanjuje se istinita. Ta je situacija prikazana na tablici:
na razumno (iii prakticno) prihvatljivu vcliCinu. Pogreska kojoj je
izlozen svaki pojedini rezultat izra.Zava se njegovom razlikom od aritme- Stvarno stanje u populaciji
ticke sredine skupa rezultata kojemu i taj rezultat pripada. , I
~
Odluka Nema razlike ilcii"postoji
~
Cimbenici (faktori) koji djeluju na svako mjerenje (tj. svaki je re- ' • $1-
Odb~CUJ~mo
zultat dobiven pod njihovim utjecajem) imaju nekoliko izvorista: nesus- ~ Pogreska tipa 1 (alfa) Ispravno
tavne trcnutacnc fizioloskc i psihickc promjene u ispitaniku; nesustavne nul-hipotezu
.
varijacije u neposrednoj okolini mjerenja; sam postupak mjerenja (ni je- fPfifi'l~~-,
·- - ..
· .,. -;rer~- 1 -"1' ·'\'":· y Ispravno Pogreska tipa 2 (beta)
dan postt:pak mjerenja nije savrsen); nesustavni utjecaji sredstava mjer- 9
~""riUI~lir ote:Zu
... "· P.....
enja (instrumenata koji sluze pri mjerenju); nesustavne trenutacnc
promjene u mjeritelju i u njegovu ponasanju vezanom uz mjerenje.
Drugo izvoristc pogreske je proces ili operacija uzorkovanja, pa se Uz "strozi" kriterij testiranja znacajnosti razlike (npr. P< 0,01) izla:le-
zato pogreska nastala tim procesom naziva > pogreska uzorkovanja mo se riziku da cemo nepravedno odbaciti neku razliku koja zapravo
(engl. sampling error). Ovdje nas vise ne zanima gore spomenuta po- postoji (pogreska 2), a uz "blazi" kriterij odluke (P< 0,05) postoji izvjes-
greska mjerenja. Odabiranje uzorka iz populacije po slucaju izvrgnuto tan rizik da cemo prihvatiti neku razliku kao realnu (tj. odbacit cemo
je djelovanju slucaja na slueaj, pa zbog toga aritmcticka sredina svakog nul-hipotezu) a razlika zapravo ne postoji (pogreska 1). U svakodnev-
uzorka, iako je veca vjerojatnost dace biti jednaka, moze odstupati od nom zivotu nase su odluke zapravo izlozene pogrcskama ovog tipa: ako
prave vrijednosti mjerenja (tj. od populacijske vrijednosti). U ovom trazimo vrlo veliku sigurnost u odluci je li neki optuzenik kriv ili nije,
slucaju velicina pogreske moze se izraziti s pomocu > standardne po-
proglasit cemo mnoge krivce neduznima (pogreska 2), a ako nam je za
greske aritmeticke sredine. Jednako vrijedi i za druge statisticke vrijed-
odluku potrebno samo nekoliko dokaza, proglasit eemo mnoge ne-
nosti, a ne samo za aritmeticku sredinu (> standardna pogreska propor-
duzne krivima (pogreska 1). Nemoguce je izbjeci te pogreske: sto vise
cije, > pogrdka koeficijenta korelacije). Aka se radio neslucajnim po-
grdkama (tj. Cimbenicima koji ne djeluju po slucaju), onda se govori o nastojimo izbjeCi pogresku 1 (povecavajuCi razinu znacajnosti), to se vi-
pristranom uzorku ili pristranom uzorkovanju (> uzorak, > slucajni se izlazemo pogresci 2, i obrnuto. Odluku o prihvatljivoj razini znacajno-
uzorak). K sti valja donijeti u skladu sa situacijom: zelimo li biti gotovo potpuno si-
gurni da neki postupak ima ucinka (jer je on veoma skup, pane dolazi u
pogreska koeficijenta korelacije > standardna pogreska koeficijenta ko- obzir ako je neefikasan), treba uzeti strozi kriterij, tj. osigurati se razi-
relacije nom znacajnosti od 0,01 ili 0,001 (ili jos nizom!) da je postupak zaista
djelotvoran. Naprotiv, radi lise o nekom postupku koji nije ni komple-
pogreska mjerenja > standardna pogreska ksan niti skup, niti opasan, amogao bi imati spasonosan utjecaj na situa-
ciju (neka operacija novom tehnikom), odlucit cemo se za blazi kriterij
pogreska tipa 1 i tipa 2 (alfa i beta pogreska)i£ogreska tipa 1 ~alfa po- u
(0,05, pa cak i vise, dakle 0,10 ili 0,20). privatnom zivotu odlueujemo
greska) sastoji se u tome da odbacimo > nul-hipotezu, a ona je zapravo I
se za neke postupke kojihje uspjeh samo malo vjerojatniji od nekog dru- I
•
biranja uzorka po slucaju (> slucajni uzorak) zbog slucajnih razloga hotomne vanJable.
( obicno se kaze zbog djelovanja slucaja na slucaj) aritmeticka sredina Bu~uCi _da j~ rph zapravo Pearsonov r, pogreska mu je poznata, pa se
I uzorka maze se razlikovati od aritmeticke sredine populacije (odnosno za odr~dt:an!e nJegove tnacajnosti maze koristiti > tablica znacajnosti r
v
od prave vrijednosti mjerenja). Sto je uzorak veCi, to je i vjerojatnost (s ~o~t~aJemh N-2 st~pnj~ slobode). Koeficijent rpb nije opravdano
takvog odstupanja manja. Aritmeticka sredina aritmetickih sredina ve- kons~th. ako se n~. radJ o dthotomnoj nego o dihotomiziranoj varijabli
likog broja uzoraka istc vdiCine i iz istc populacijc jest velicina koja sc
(ak~ Je Je_d~a. vanJabla dihotomizirana, a druga kontinuirana tada ,
maze konshti > biserijalni r). K ' sc
prihvaca kao vrijcdnost populacijc odnosno kao prava vrijcdnost mjerc-
nja. Standardna devijacija distribucije (koja ce sigurno biti normalna)
tih aritmctickih srcdina pokazatelj jc vcliCinc pogreske koja maze nas-
tati zbog uzorkovanja ( > standardna pogreska aritmeticke sredine ). P,K
hotomnoj i kontinuiranoj varijabli. Postupak zahtijeva da se jedna kate- Rijetki slu~ajni dogadaji distri-
20 buiraju se po tzv. Poissonovoj dis-
gorija u dihotomnoj varijabli oznaCi jednim brojem (svi ispitanici u toj
trihuciji, koja ja"'ve~nom·j;tiitl'
kategoriji imaju tada taj "rezultat''), a druga drugim brojem (to jc "rc-
~o,ilsimetrl~tia~a slici jc prika~
zultat" svih ispitanika u toj kategoriji); to mogu biti bilo koja dva zano' koliko dana u 100 dana
razlicita broja, ali je uobicajeno koristiti brojeve 1 i 2 ili 0 i 1, i zatim se opliZanja u nekoj robnoj kl!Ci nije
izracuna Pcarsonov r po njcgovoj formuli. Mozc sc, mcdutim, upotrijc- u nalazni urcd kucc primljcn niti
jedan izgubljeni predmet, koliko
biti i ova formula:
dana je predan 1 predmct itd .
. '
. -
'
'
144 POISSONOVA DISTRIBUCIJA POLUINTERKVARTILNO ODSTUPANJE
--------~~=~~~~~~~~~~~~=----------
145 '
Za razliku od normalne distrihucije, koja je definirana aritme- Poligon frekvencija manje je precizan nacin grafickog prikazivanja
tickom sredinom i standardnom devijacijom, Poissonova
-
od > histograma, jer kod histogram a (koji se sastoji od stupaca nad sva-
(nazvana po matematicaru Poissonu) - ' ... ~
potpuno-
.- ,.. ..
~
kim razredom, pa se zato moze koristiti samo ako su rezultati grupirani
r tiCJro.m sre~nom,jer je _ ~~· ·~ · _ . . . .u razrede, ili svaki cijeli hroj._ujedno znaci i "razred") povrsina svakog
. To'znaci da je Poissonova raspodjela to sira sto joj je aritmeticka sredina stu ca tacna odgovara i ek.Yenciji rezultata u tom razredu, dok kod po-
veca. U odredenim uvjetima (kad je N vrlo velik, a P hlizu 0), Poissono- ligona samo cjeloku Jna Jovrsina krivulje odgovara ukupnoj frekvenciji,
va raspadjela prihlizava se > binomnoj distribuciji, no "smislena" razlika ua e uku_pnom hroju rezultata N). _No, da h1 to zaista hila taka, va,Ja
izmedu nJih je u tome sto kod hinomne raspodjele znama ne samo koli- kod crtanja poligana "uzemljiti" krivulju, tj.lijevo i desno spustiti je po-
ko se puta neki dogadaj pojavio, vee i koliko se puta nije pojavio (npr. SVC } la
-. -
!!I,?~CISU.
- -
kod sto hacanja navCica znamo koliko je puta palo "pismo", a koliko pu-
·: ·I""'C·...,;-1.--- --
~ .~ Usprkos manjoj preciznosti poligana frekvencija u usparedhi s hi-
ta nije palo), dak kod Poissonave raspodjele!znamo samo koliko se·putf ·~ stogramom, aligon se eesee koristi u grafickom prikazivanju rezultata i
neki dogadaj
··-.~,r,.
-l:.,._ --&.~~ T
pojavio ~pr. aka za
,:;',•.,;. . .l:'
vrijeme oluje hiljezimo koliko je puta
_to zato sto (a) krivulj~se vise prihlizava realnQj distr.ihuciji rezu tata ad
hljesnwo, m1 ne znamo koliko puta nije hljesnulo!). P -
.histograma,j_ h kod Jrikaza dvije iii vise distribucija na jednoj slici pri-
kltzivan·e histograma dala hi pasve nepreglednu sliku, za razliku ad do-
poligon frekvencij~Jedan od nacina grafickog prikazivanja > distribu- ~- -
hre pre le nosti iju ili ise krivul" ana istoj_IDici (is tom koordinatnom
cije rezultata n~kog mjerenja ito u > @£!dinatnom sustavu. Sastoji se u sustavu). P
- tome da se na apscisu unesu vrijednosti rezultata (ako su rezultati grupi-
rani u razrede, onda su to_sreOrije vriJednosti razreda), ana ordinatu
poliranc vrijcdnosti Vrijednosti (tackc u koordinatnom sustavu) kojc
frek:vencije, pa se spajanjem tocaka (bilo crtama od tocke do tocke, hilo
sluze za izvlacenje krivulje pri grafickam prikazivanju odnosa izmedu
> metodom ''slobodne rnke") u koordinatnom sustavu dohije crtez koji
dvije varijahle, a koje su dobivene nekim postupkom izgladivanja krivu-
je ohicno vise iii manje slican > nonnalnoj distribuciji (vidi sliku).
lje, kaa sto je primjerice > postupak "pomicnih srednjih vrijednosti ". Ta-
v eo
ka dohivene vrijednosti ne koriste se za daljnju statisticku ohradu, vee
70 samo za zorno (graficko) prikazivanje odnosa medu varijablama. K
1:~~~~----~~~--~-=========~~~
125 145 1as 185 225 245 265 285 305 325 345 3115 x
:ns
polozaj pojedinog rezultata u grupi > z-vrijednosti, > decili.
I
vrijome rellkcUe u me
poluinterkvartilno odstupanje > indeks poluinterkvartilnog rasprsenja >,
Poligon frekvencija dobiven iz velikog .broja mjerenja vremena reakcije. (Q)
'
PONDER :...:::..J.)_ _ _ _-~
POPUIACIJA (OSNOVNI .§_K_UP 14~
7
146
ponder "Te:l.ina" ili vaznost sto je neki rezultat ima medu drugim re- .. Aritmeticka sredina maze biti ponderirana i nekorn arbitrarnorn
VTIJedno~?u ili vr~jed?.os~u koja je dobivena slozenijom statistickom
zultatima. U sumi brojeva 1, 2 i 1000daleko najvecu tdinu ima najveCi
ela~.oraCIJO~, konstect pn tome rasprsenje rezultata, korelacije s nekim
broj, dakle 1000, jer ako druga dva broja izostavimo, zbroj se bitno nece
va~IJabl~vma I sl. !ed~n od nacina odredivanja zajednicke ponderirane
promijeniti. U nekim statistickim racunskim postupcima ponder se ja- ant~et1cke sredme Jest koristenje > standardne pogreske aritmeticke
vlja "sam od sebe": npr. u sumi bodova nekoliko testova najvecu tezinu sredzne za svaku vrijednost, prerna formuli:
u znaeenju ukupnog zbroja ima rezultat testa s najvecom standardnom
devijacijom (> latentni ponder). U drugim situacijama namjerno daje- M1 M2 M
2 + 2 +... + 2n
mo nekim rezultatima vecu tezinu (npr. u > ponderiranoj aritmetickoj -
M= SM SM S
. 1
I
1
2 M.
1 --
sredini, tj. u aritmetickoj sredini dobivenoj iz nekoliko aritmetickih sre- 2 + 2 +... + 2
dina, veCi ponder imaju aritmeticke sredine s veCim brojem rezultata ); u sM, sM. sM.
nekim je pak statistickim racunima (> multipla korelacija) ukljuceno
gdje sM oznacuje standardnu pogresku aritmeticke sredine. Kako se iz
optimalno ponderiranje, tj. takvo davanje tezine rezultatima pojedinih
. for~ule vidi, vecu tezinu dobit ce ana aritmeticka sredina koja ima
testova koje ukupno daje najvisu korelaciju s kriterijem (> beta pon-
manJU standardnu pogresku. P,K
dni). r
' pond.e~iranj~ Davanje "tezine" (pondera) pojedinim rezultatima u
ponderirana aritmeticka sredina Pri odrcdivanju aritmetickc sredinc
skuptm.drugth rezultata (> ponder). Pod ovim nazivom obicno se misli
dviju ili vise aritmetickih sredina svakoj aritmetickoj sredini ne daje se na namJ~rno ponderiranje, a ne na ono koje dolazi "samo od sebe", npr.
jednaka vaznost (tj. zajednicka aritmeticka sredina nije jednostavna zbog vece standardne devijacije jednog testa medu drugim testovima ili
aritmeticka sredina svih aritmetickih sredina) nego svaka od aritrne- zbog veceg broja u sumi nekoliko brojeva. Kod prirnjene razliCitih tes~o
tickih sredina dobiva razliCitu "tezinu" ili ponder. Najce~ce se uzima u va znanja k~nstr~ktori testa cesto se odluce na ponderiranje pojedinih
obzir N (broj rezultata) na temelju kojega je svaka aritrneticka sredina zadataka koJe om smatraju vaznijima od drugih: ako su npr. neki zadaci
izracunata. Takva formula izgleda ovako: po konstruktorovu misljenju, mnogo tezi od ostalih, pa bi kandidata tre~
balo posebno nagraditi aka ih je uspio rijesiti, konstruktor katkada
odluci da te zadatke ponderira, tj. da npr. umjesto 1 bod kandidat za
.. .., .
nJesem zadatak ~obije 2 iii vise bodova. Ovarno se moze ubrojiti i povre-
~ena praksa nekih konstruktora testova znanja da uspjesno rjesenje ne-
gdje je M ponde.rirana aritrneticka sredina, M 1, M 2 itd. pojedinacne
kih zadataka smatraju "conditio sine qua non", tj. aka kandidat ne rijesi
aritrneticke sredine, NI> N 2 itd. pripadni broj rezultata (ili ispitanika). ~ev za~atke o:e :x:ste (a oni predstavljaju bitne clemente gradiva),
Na taj naCin dobivena aritmeticka sredina potpuno odgovara rezultatu rJesenJa se dalJe mti ne provjeravaju, nego se smatra da kandidat nije za-
koji bismo dobili da smo sve rezultate zbrojili i podijelili njihovirn bro- dovoljio. P
jern, dakle odgovara osnovnoj formuli za . aritmeticku sredinu:
~o~u~acija (osnovni skup) Izraz znaci (a) sve slucajeve (sve statisticke
Jedtmce) u nekom konacnom skupu elemenata (npr. sve stanovnike ne-
-
.. -
-- -~ -
--- .
• •
148 POPULACIJA (OSNOVNI SKUP) HGRANICA 149
•
I
kog grad a) i u tom se slucaju govori o ogranicenoj populaciji, iii (b) potpuna korelacija Ako koeficijent korelacije iznosi ± 1, onda se govori
neizmjerni broj slucajeva u nekom beskonacnom skupu elemena ta ( npr. 0 potpunoj korelaciji, sto znaci da svakoj vrijednosti jedne varijable
•
ako mjerimo brzinu reagiranja u funkciji intenziteta podrazaja, popula- odgovara samo jedna vrijednost druge varijable (nema nikakvog > rezi-
~·
ciju predstavlja neizmjerni broj mjerenja) i u tom se slucaju govori o dualnogvarijabiliteta, odnosno > indeks rezidualnogvarijabiliteta jednak
neizmjernoj iii neogranieenoj populaciji. P je nuli). U takvom je slucaju > pravac regresije koji povezuje Y s obzirom I
se opravdano moze pretpostaviti koja bi vrijednost mogla doci iza za- . podjeli Cak i onda kada po- 1: 1\rllmCii~kil uedina ltlllmc.lilkih ue.duu. uwraka - 15,)f)
dnje (kao npr. pri poliranju krivulje koja prikazuje distribuciju frekven- pulacija i znacaJno odstupa :
A
cija, gdje jc vrijcdnost iza krajnje, nula). Ako prvo izgladivanjc nije do-
voljno, moze se provesti jos jedanput. K
od normalnosti (vidi sliku ).
Poucak centralnih granica
..
:
,.,
od velike jc vaznosti u stati-
postupak razlika > metoda diferencije
stickim postupcima > infe-
postupak "slobodne ruke" Postupak izvlacenja krivulje koja najbolje 220
ll
200
pristaje dobivenim vrijednostima (koordinatama) u koordinatnom sus- 110 Atitmctitk.a srcdin~ populacijc • 6,8
tavu, pri cemu se nastoji da krivulja prode kroz sto vise dobivenih "Poucak centralnih granica" govo- 110
Aritmctit!lc.ii sredina ar itmctit:kih srcdina uzoralu '"" 6,9
140
tocaka, a zbroj odstupanja od tocaka kroz koje krivulja ne prolazi treba ri nam da sc aritmeticke sredine 1:10
biti podjednak na vise i na nize od krivulje. Izvlacenje krivulje slobo- (dovoljno vclikih) uzoraka distri-
....
100
manje > nesistematski varijabilnih faktora. • ·v a distribucija maze biti.i.llQ§l"edica <!jelovanja nekog sistemats
u statistici se koristi termin > granice pouzdanosti, sto znaci da faktora
-pri mjerenju ili
se u odredenim granicama s odredenom sigurnoscu nalazi neka vrijed- _opazanju neke pojave, kao
nost (> procjena parametra), a upotrebljava se kod intervalnih pro- _sto je, primjerice djeloxanje
cjena vrijednosti populacije. Tu, dakle, pouzdanost ima znacenje sigur- umora. P
nosti. K
Pozitivno asimetricna distribucija
frekvencija.
povezanost u statistici tcrmin povezanost znaci zapravo > sukladnost ll f
.. I
•
•
. .. ~
.. ...
•
I
•
152 "PRAVA" ARITMETICKA SREDINA ' PRIGODNI UZORAK 153
prediktorske varijable Ili prediktori, kod > multiple korelacije sve one
pogreika aritmeticke sredine) da s dosta velikom sigurnosti ocijenimo u
varijable za koje se odreduje zajednicki stupanj povezanosti s > kriterij-
kojem se intervalu nalazi prava vrijednost. Na tim se postupcima osni-
vaju logika i metode > parametrijske statistike i > neparametrijske sta- skom varijablom. K
tistike. P
predmet mjerenja U psihologiji, pretpostavljena (hipoteticka) veliCina,
psiholoski entitet za koji se pretpostavlja da je moguee odredenim psi-
pravac regresije > jednadiba pravca regresije
hologijskim mjernim instrumentom mjeriti ili opazati njegove kvantita-
tivn<.: karakt<.:ristike. No, predm<.:t mj<.:rcnja je uvijek izved<.:na vrij<.:dnost
"prava" varijanca > "prava" aritmeticka sredina (i "prava" standardna zbog toga sto na opazeni ili mjereni rezultat nuzno djeluju i drugi fak-
devijacija) tori, a ne samo predmet mjerenja. Ti "drugi faktori" djeluju kao slucajna
varijahla, pa je zato na temelju ponovljcnih istovrsnih mjcrenja moguec
prava vrijcdnost mjcrcnja Pret ostavl· en a vri ·cdn ) "'+ (osohinc, derivirati pravu velicinu mjerenja. Svaki rezultat mjerenja (iii opazanja)
atn uta) kojaje predmet ...,... din if!!funi~Q.te ima ovu strukturu X= ~,+X,, gdjcXznaci izmjerenu iii opaz<.:nu vrije-
dnost (rezultat mjercnja), XP pravu velicinu mjerenja (prcdmct mjcrc-
nja ), a X, sve > nesistematske varijabilne faktore koji su utjecali na ko-
_velikog broja mjere~ja odnosno iz populacij~ Ako se radi o mjerenju nacni rezultat mjerenja. Ako se pretpostavi da ee pri vecem broju pono-
jedne vel' · o ·ave osobine na ·ednom individuumu, onda o ula~ vljenih mjerenja biti M x, = 0 Uer nesistematski varijabilni faktori djc-
ciju redstavlja neizmjerno velik broj rojerenj~. a ,ako se radi o mjerenj~ luju po slucaju), onda cc hiti i X= Xr K
jedne yelicine (pojave, osobine) na razlicitim individuumima (razlicitim
- ~ statis.tickimjedinicama), ondSLllUpulacij.utine sye statisticke jedinicc_ prigodni uzorak Uzorak koji se sastoji iz elemenata (predmeta, situa-
(koje udovoljavaju nekoj definiciji); u oba slucaja pravu vrijednost mje- cija ili ljudi), koji su nam "pri ruci". U strucnim publikacijama moze se
renja cini rosjecna vrijednost (~ritmeticka sredina) populacije (> "pra- procitati dosta kritika na prigodni uzorak, jer on zaista moze biti veoma
va" aritmeticka sredina). Tu vrijednost (osim u rijetkim slucajevima po > pristran uzorak; najcesce se kao primjer spominju uzorci bolesnika:
~u
-
lo granicenih o ulaci'a}_procjenj.uj.e se na temelju vrijed~ neka nova metoda lijecenja gotovo bez iznimke provjerava se na prigod-
nosti > uzorka. K I
nom uzorku, tj. na prisutnim pacijentima. To dakako u nekim situacija-
ma moze imati i veoma negativnu stranu Uer se u takvim prilikama rije-
•
' Takva distribucija rezultata u kojoj je svaki re- tko koristi kontrolna grupa ili grupa s "placebom"), no opcenito o prigo-
'· .
zultat (iii grupa rezultata, ako su oni rasporedeni u "razrede") za- dnom uzorku valja reCi ovo: pristranost prigodnog uzorka ovisi o tome
stupljen u jednakoj ili slicnoj frekvenciji. To moze biti zato sto svaki re- sto se ispituje: ako bismo na studentima fakulteta tjelesnog odgoja is-
zultat ima jednaku vjerojatnost pojavljivanja; npr. kada bismo 600 puta trazivali prosjecnu izdrzljivost mladih ljudi u nekim naporima, onda bi
•
bacili jednu ispravnu igracu kocku, morali bismo svaki od sest moguCih takav uzorak bio izriCito pristran; zakljucivanje na postotak frigidnosti
ishoda dobiti priblizno 100 puta, dakle uglavnom jednako cesto. p kod zemi, ana osnovi takvih slucajeva koji su registrirani u psihijatrij-
skim ordinacijama bilo bi pogresno iz istih razloga pristranosti uzorka;
prediktor > prediktorske varijable zakljucivanje na zastupljenost neuroticnosti na osnovi uzorka studenata
•
• •
'
154 PRIGODNI UZORAK PROGNOZAREZULTATA 155
psihologije takoder bi predstavljalo upotrebu pristranog uzorka. Pozna-
to je da su svojedobna Kinseyeva istrazivanja razlicitih oblika seksual-
nog ponasanja bila kritizirana upravo stoga sto je istrazivanjc radeno na
studentima, dakle na uzorku koji u pogledu seksualnog ponasanja moze
biti veoma pristran. No ako se prigodni uzorak koristi za istraZivanje
problema za koji ne mqzemo ustanoviti da ima ikakve direktne veze s
4 '" .. 1 • "' -· ·-
•
•
--.
'
I
156 PROPORCIJA
-
proporcija Broj > statistickihjedinica koje imaju neko odredeno svoj-
stvo, izrafen na skali od 0 do 1, a oznacava se slovomp. Ostale statisticke
jedinice koje nemaju to svojstvo, oznacavaju se sq. Zbroj p+q uvijek
mora biti jednak 1. Proporcija pomnozena sa 100 daje > postotak. K '
L...
prosjek OpCi izraz za > srediJnju vrijednost ili > centralnu tendenciju,
koji se rabi ne samo u statistici. Katkad se tim terminom oznacuje sarno
> aritmeticka sredina. K
q = 0,75. p
dijan iz svih rezultata svih uzoraka uzetih zajedno, pa se uz pornoc hi-
kvadrat testa provjerava ima li razlika medu uzorcima u pogledu frek-
vencije rezultata ispod iii iznad medijana. P
rang Redno mjesto, polozaj sto ga neki rezultat zauzima medu ostalim rangova, skala > ska/a rangova
rezultatima, kada su svi rezultati pored ani redom ( od najveceg pre rna
najmanjem, od najboljeg prema najslabijem, iii obrnuto ). Ako se rezul- raspodjela > distribucija
tatX nalazi na 9. mjestu po redu, on zauzima 9. rang. U slucaju da neko-
liko rezultata ima istu vrijednost (ili, primjerice, nekoliko trkaca isto- raspodjela kumulativnih frekvencija > kumulativna distribucija
dobno stigne na cilj), oni zauzimaju isti rang ( > "vezani" rangovi). > Or-
r~spon Razlika izmedu najveceg i najmanjeg rezultata u nekom mjere-
dinalna skala koristi rangove. P
nJu. Raspon nam donekle moze posluziti kao grubi pokazatelj varijabil-
nosti rezultata mjerenja. No, raspon rezultata je nesiguran pokazatelj
rangiranje Redanje rezultata od najveceg pre rna najmanjem, od najbo-
rasprsenja nzultata, jer ovisi o samo dva rezultata, najmanjem i naj-
ljega pre rna sve slabijima (ili obrnuto ). Rezultate redamo n~jces~e o~da
kada treba od ukupnog brojarezultata uzeti samo odredem broJ naJbo- vecem, pa aka su pri mjerenju slucajno dobiveni ekstremni rezultati ra-
ljih, pa se iz ranga rezultata uzmu samo oni koji se nalaze ~ okviru broj~
sp~n ce biti povecan, iako se mozda svi ostali rezultati homogeno grupi-
rezultata koji ulaze u daljnji postupak: medu 100 kand1data za nek1 ~a.Ju oko nek~ vrijednosti. Osim toga, sto je uzorak mjerenja veci, raspon
Ima te_ndenciJu porasta Qer se povecava vjerojatnost pojavljivanja eks-
natjecaj uzima se u daljnji postupak npr. p.~hdvades.et po. ran~u. ~?ze
tremmh rezultata). Stogaje > standardna devijacija neusporedivo bolji
se, dakako, koristiti i kad se hoce odbaciti odredem broJ omh koJI su
· najslabiji po rangu. P
P?k~z~telj variranja rezultata oko nekog prosjeka. Osim mnogih drugih
fljezimh prednosti, valja istaknuti i to da se ona ne mijenja sistematski
povecavanjem ili smanjivanjem uzorka. p
rang korelacija Stupanj povezanosti medu rangovima. Za razl~ku od ~
Pearsonova koeficijenta korelacije r, koji vodi racuna o tome kohko svaki
-=~ raspdenje rezultata Svakom je eovjeku pozna to da pri ponavljanom
pojedini rezultat odstupa od ostalih rezultata, rang ~ore~acija, ~uduc~ da • • • •
IDJerenJu tste pojave (npr. pri uzastopnom mjerenju vremena reakcije
se sluzi rangovima, ne moze te stvarne razlike uztmatl u obztr, vee su
· kod is tog covjeka), kao i pri jednokratnom mjerenju neke karakteristike
razlike izmedu susjednih rangova uvijekjednake, tj. 1 rang, sto dakako
na velikom broju slucajeva (> statistickihjedinica) (npr. mjerenje tezine
' dovodi do toga da rang korelacija predstavlja neprecizniji indeks pove-
dvogodisnje djece ), gotovo bez iznimke dobivamo rezultate koji su
zanosti od koeficijenta korelacije r. No ako ne posjedujemo mjerene re-
razliciti, ali ujedno i slicni jer se grupiraju oko neke > sredisnje vrijedno-
zultate, nego samo rang rezultata (npr. neki nastavnik mo~ev15 s~oj~~ sti, a to je najcesce aritmeticka sredina (> nesistematski varijabilni fakto-
ucenika poredati po rangu marljivosti i po rangu skolske uspjcsnostJ ), 1h
ri). 0 velicini rasprscnja rezultata oko nckc sredisnjc vrijednosti ovisi i
•
•
- -· ·-
--~
~
• •
-- ~ .-
I 161
160 RASPRSENJE REZULTATA I RAZREDI
'
vrijednost odnosno "reprezentativnost" te sredisnje vrijednosti: sto su va na normalnoj raspodjeli, kod testiranja statisticke znacajnosti neke
rezultati "gusce" grupirani oko sredisnje vrijednosti, to je ana bolji
razlika . . k
razlike mi uz pomoc formule: t == . ustanov1JUJemo o-
pogreska razltke
"reprezentant" tih rezultata; a ako grupiranja uopce nema, sredisnja se
vrijednost dakako moze izracunati, ali ana nema statisticki smisao (npr. liko puta je neka razlika veca od svoje vlastite pogreske. Aka je (kod ve-
prosjecni kucni broj desne strane neke ulice ). likih uzoraka) ana 1,96 putaveca, znacajnaje nanivou P < 0,05, a ako je
2,58 puta veca, na nivouP < 0,01. Razlika koja nije harem 1,96 puta veca
Postoje razlicitc mjere kojc vise iii manje uspjesno ukazuju na
od svoje pogreske, nijc statisticki znacajna, jer je rizik da smo pogrijcsili
velicinu rasprsenja rezultata oko neke sredisnje vrijcdnosti (a koje nazi-
va'llo indeksima raspdenja). Najjednostavnija (ali i najmanje tacna) u zakljucku veci od 5%. To se onda biljezi ovako: P > 0,05. Za male
mjera je > raspon, tj. razlika izmedu najveceg i najmanjeg rezultata uzorke (uglavnom ispod N = 30) te se vrijednosti mijenjaju, tj. t mora
medu svim rezultatima mjerenja, a jedna od najboljih i najpoznatijih biti to veci sto je uzorak manji (> t-distribucija). Razina znacajnosti jed-
mjera rasprsenja rezultataje > standardna devijacija. Uz standardnu de- naka je pogresci alfa (a) ili pogresci tipa 1 ( > pogre.Ska tipal i tipa 2). -
vijaciju cesto je potrebno usta!loviti radi lise o relativno malom ili rela- U vezi sa standardiziranim i uobicajenim razinama znacajnosti
tivno velikom rasprsenju, jer npr. neka standardna devijacija velicine 10 (5% i 1%) upozoravaju neki moderni statisticari kako je kod mnogih is-
prcdstavlja dosta veliko rasprsenje rezultata kojima aritmcticka sredina trazivaca doslo do "fiksiranosti" za tc standardiziranc razinc. U jcdnom
iznosi 50, ali vrlo malo rasprscnje neke normalne distribucij~ kojoj je svom radu o "nepovredivosti" nivoa 0,05 Skipper kaze ova: "Nc bi bilo
aritmeticka sredina 500. Stoga se koristi i mjera koja pokazujerelativnu tesko naCi dokaze koliko se neki istrazivac raduje kada ( ... ) ustanovi
velicinu rasprsenja, a to je > koeficijent varijabilnosti (V). P
znacajnost na nivou od 0,05, a koliki je njegov uzas ako iz tahlice procita
znacajnost ad 'samo' 0,10, ili 0,06. Gotovo kao da razlika izmedu 0,05 i
ratio skala > omjema ska/a 0,06 znaCi razliku izmedu 'dobra' i 'zla', 'casnog' i 'nccasnog', 'uspjeha' i
'neuspjeha' ". Stoga neki statisticari sugeriraju da hi istrazivac morao u
razina znacajnosti Rizik koji preuzimamo kad tvrdimo da je nesto ·> . svom radu samo izvijestiti koju razinu statisticke znacajnosti je dobio u
statisticki znacajno, tj. da nijc slucajno. Na primjcr, aka tcstiramo sta- , ' svom istrazivanju, a prcpustiti citaocu da odluci mozc li tu razinu prihva-
tisticku znacajnost razlike izmedu dvije aritmeticke sredine pa kazemo \, titi iii nc. P ~
'
I
da je ta razlika statisticki znacajna "na razini rizika od 5%", onda to t
0
I l/ .-_
zakljucka manji od 1%. Buduci da se logika statisticke znacajnosti osni- I razreda kojemu po svojoj numerickoj veliCini pripadaju. K
'
'
'
I
Y = i)o + !) 1x + e
regresije, crta > crta regresije
gdje je Y > kriterijska varijabla,X > prediktorska varijabla, 1) 0 i 1) 1 su >
)
••
regresije, pravac > pravac regresLJe regresijski koeficijenti, a e pokazuje pogresku prognoze (> standardna
I pogrdka) koja ima teoretsku vrijednost nula. To je jednadzba linearne
regresijska analiza~ (termin regresija dolazi od latinskog regressio, sto regresije. Nelinearna regresija moze biti kvadratna, kubna itd. i opisa-
znaCi povrat, vracanje, odstup, uzmak, nazadovanje) U statistici regre- ' na je odgovarajuCim jednadzbama. K
sija znaCi odnos izmedu odabranih vrijednosti jedne varijable (v~rijabl~*
X) is njima povezanih vrijednosti druge varijable (var~ble ~; taJ odnos f!i!~1J.!'19~~!!£ijenf Broj koji pokazuje koliko su vrijednosti u >
opisuje > jednadzba pravca regresije kao i > regresijsk~jednadzba. Rel~ kriterijskoj varijabli vezane za vrijednosti u > prediktorskoj varijabli, ili
tivni polozaj (izrazen s pomocu z-vrijednosti) povezamhrezultata u obJe za koliko se jedinica povecala vrijednost u kriterijskoj varijabli ako se
varijable bit ce jednak Qednako udaljen od aritmeticke sredine) samo wijednost prediktorske varijable povecala za 1. Regr~sijski koeficijent
kad je povezanost medu varijablama potpuna; sto je povezanost medu je dio > regresijskejednadzbe. U standardiziranom obliku (izra:len kao
. . -- ·-
. - -
z-vrijednost, tj. u jedinicarna standardne devijacije) naziva se beta koefi- bli). Rezidualni varijabilitet maze se prornatrati u Yvarijabli polazeCi od
cijcnt iii > heta ponder, au nestandardiziranorn obliku naziva se b koefi- (odahranog) rezultata u X varijahli, iii uX varijahli polazeci od rezultata
cijent. K u Yvarijabli. VeliCina rezidualnog varijabiliteta izrazava sc s pomocu >
koeficijenta rezidualnogvarijabiliteta. U prognozi rezultata u jednoj vari-
rektangularna distribucija > pravokutna distribucija jabli na temelju poznavanja rezultata u drugoj varijabli (ili u vise drugih
varijabli) i poznavanja stupnja povezanosti medu tim varijablarna sluzi
rcJatlvnc frckvcncijc > Frekvencije rczultata izrazcne kao postotak iii
kao indcks > standardna pogrdka prognvze. K
proporcija od ukupnog N (ukupnog broja rezultata ). K
rcprezcntativna vrijcdnost Brojcana vrijednost koja "reprezentira", rezultat Opcenito, ishod ili posljedica nekog opazanja ili mjerenja
"zastupa" iii "prcdstavlja" skupinu od vi~c vrijcdnosti; u na~cmjcziku za izrazena nckim simholom. U tom smislu rezultatom sc naziva i deskrip-
takvu vrijcdnost rahi sc tcrmin > sredLfnja vrijednost ili > prosjek. U sta- tivni ili kvalitativni ishod opazanja. U statistici sc rezultatom naziva sa-
tistici k:riterij reprezentativnosti skupa bruto rezultata jest: (1) da je rno onaj ishod opazanja ili rnjcrcnja koji se mozc izraziti brojkom, ali
zhroj odstupanja manjih vrijednosti jcdnak zhroju n.dstupanja vecih moze znaciti i neku izvedenu brojcanu vrijednost, kao sto je > arit-
vrijednosti od te reprezentativne vrijednosti; torn k:riteriju udovoljava > metitka sredina, > kvejicijent kore/acije i sl. U najopccnitijcm smi!llu, u
'' svakodnevnorn govoru rijec rezultat koristi se za. ishod bilo koje vrste
aritmeticka sredina, (Lei-)= (Ld+) m '
aktivnosti. K
(Ld- )+(Ld+) = O,gdje d oznacujerazlikuizrnedusvakogpojedi-
nog rezultata i aritrneticke sredine (d =X- M) ; (2) da se vrijednost na- . Rho koeftcijent korelacijc (naj~c~ec se ozna~ava grckim slovom p ==rho)
lazi po sredini skupine rezultata poredanih po velicini; torn k:riteriju Koeficijent koji pokazuje stupanj povezanosti medu ordinalnirn varijab-
odgovara > centralna vrijednost, iii (3) da se vrijednost u skupini rezul- larna (varijablarna izrazenirn na ordinalnoj skali). Najjednostavniji po-
tata najcesce pojavljuje, tj. da irna najvecu frekvenciju; torn kriteriju stupak za izracunavanje >rangkorelacije (autorSpearman, 1904). Sa-
odgovara > dominantna vrijednost. Postoje jos i druge vrijednosti, koje- stoji se u tome da se kvadriraju razlike (D) rnedu korespondentnirn ran-
vee pre rna situaciji - najbolje reprezentiraju neku skupinu rezultata kao govirna obje varijable, i sum a tih kvadriranih razlika uvrsti se u formulu:
sto su > geometrijska sredina te > harmonicna sredina. P,K I
'
ljivanja, isparivanja; rezidualan znaci koji je zaostao, koji preostaje, pre- • Postoje razliCite forrnule za korigirani Rho kod > vezanih rangova, no u
'''
ostali) Varijabilitet rezultata koji je preostao u jednoj varijabli (npr. va- praksi se njihova upotreba gotovo ne isplati,jer se upotrebom tih formu-
rijabli Y) i kad se prornatra povezanost s rezultatima u drugoj varijabli I'
v
' la znatno poveca posao izracunavanja, a rczultat jc samo malo drugaciji
(npr. v~rijabli X). Sto je povezanost (> korelacija, > koeficijent korela- od rezultata bez prirnjene korekcije: Rho se smanji, i to posve neznatno
cije) izrnedu Xi Yvarijable veca, rezidualni varijabilitet ce biti rnanji i, ,
kod visokih korelacija, a nesto vise kod niskih korelacija. Rho koefi-
naravno, obrnuto. Pri korelaciji od 1 on iznosi 0 (nula ), a pri korelaciji cijent korelacije ustvari predstavlja r-koeficijent korelacije primijenjen
od 0 (nul a) jednakje varijabilitetu (izrazenom > standardnom devijaci- na rangove.
•
'
6, iako stvarne razlike mogu biti posve razlicite ), to rang korelaclJa pred-
stavlja samo aproksimaciju stvarne visine povezanosti, ako se primijeni
na mjerene rezultate koji se rangiraju.
Granicne vrijednosti rho koeficijenata korelacije za razliciti broj
parova (N) nalaze se u tablici u Dodatku E. P
'
'
168 SHEFFEOV 1EST I SIMETRICNA DISTRIBUCIJA 169
> analizom varijance ustanovili da uzorci ne pripadaju istoj populaciji. s kategorijama. > biserijalni koeficijent korelacije, > triserijalni koefi-
I
I cijent korelacije, > kvadriserij2lni koeficijent korelacije, > kvintiserijalni
Scheffeov test moze se izracunati po ovoj formuli: i
•
I koeficijent korelacije. K
I
-
Siegel-Tukeyev test Neparametrijski test za testiranje znacajnosti razli-
ka u varijabilitetu izmedu dvije skupine rezultata. Nacin racunanja
'
• slican je > testu sume rangova, ali je nacin rangiranja drugaciji: medu
pocetne rangove idu rezultati koji su ekstremni u bilo kojem smjeru. U
gdje je FM - M F-omjer za razliku izmedu aritmeticke sredine skupine '
I
• • parametrijskoj statistici taj test donekle odgovaraF-testu, iako je njego-
a i aritmcticke sredine skupine b (dvije odabrane skupine izmedu vise
I va snaga sigurno manja od snage F-testa. P
skupina ispitanika za cije je rezultate provedena analiza varijance ); Mu i I
I
Mt> pripadne aritmeticke sredine skupine a i skupine b; Vmc varijanca I
! sigma U statistici cesto sinonim za standardnu devijaciju (malo grcko
medu grupama u provedenoj analizi varijance; n" i nb broj ispitanika u slovo sigma cr). Velikim grckim slovom sigma (E) u statistici se uvijck
skupini a i skupini b. Tako dobivenaF-vrijednost mora se usporediti sF' oznacava zbrajanje. P
koji se dobije mnozenjcm granicnc vrijednosti (iz tahlica za odcitavanje I
I
znacajnostiF omjera u analizi varijance) za izracunati F-omjer u pretho- sigma skala Jedna od skala bafdarenja, a sluzi za interpretaciju i
'
dnoj analizi varijance s (g-1), tj. s brojem skupina (za koje je obavljena i usporedivanje rezultata. Kao i > z-vrijednosti, sigma skala temelji se na
I
analiza varijance) manje 1. FM. - M. usporeduje se sF' da bi se mogla • standardnoj devijaciji i podijeljenaje na 100 jedinica, s vrijednosti 0 na -3
donijeti odluka treba li ostati na nul-hipotezi (H0) ili je treba odbaciti I standardne devijacije, 50 na aritmetickoj sredini i vrijednosti 100 na +3
(ako je FM. - M• manji odF' ostajemo na nul-hipotezi, ako je jednak iii standardne devijacije. Izracunava se po formuli:
veci odF' odbacujemo nul-hipotezu). P •
I sigma bodovi = 16,66 z · 50
I
selekcionirani uzorak > uzorak
I Npr. u testu s aritmetickom sredinom 80 i standardnom devijacijom 10,
I
, I rezultat 90 ima 16,66(90-80)/10 + 50 = 83,3 sigma bodova. P
serijalna korelacija Oznacuje korelaciju izmedu dvije stvarno > konti-
nuirane varijable, od kojih je jedna izrazena samo s pomocu dvije katego- I
sign test > test predznaka
rije ili klase (biserijalna korelacija ), iii tri (triserijalna korelacija), iii ceti- I
i
•
\
I
l
•
•
' ~
"sirovi" rezultat > bruto rezultat t?.me sto centili ne predstavljaju "ekv.jdistantae" j.edinice ako je distribu-
a 1 - --
• "" -=-
sistematski uzorak Takav uzorak u koji uzimamo svaki n-ti clan neke .J_e na mnogQvzemrasponu nego 1% tezultata
populacije. Npr. zelimo li iz populacije velicine 1000 dobiti uzorak od _nek~ d~~tribuc~je (vi.~i sliku gdje su centili usporedeni sa standardnim
100, uzimamo u uzorak svaki deseti element populacije. Sistematski deVIJac1~a~a, tJ .. ~-VI1Jednostima). Slican se problem javlja i za bilo koju
uzorak najcesce po svojim karakteristikama dobro zamjenjuje > slucaj- -drugu ~~stnbuc~Ju.kod koj.e postoji tendencija gruP,iranja rezultata oko
ni uzorak, koji je najbolji reprezentant populacije (> uzorak). P nek~ ':1Jednosti, tJ. ko~ SV1h ~~stribuci' a rezultata koje nisu pravokutne.
Ekv1d1stantne su gramcne VflJednosti centila jedino kad je distribucija
prayokutna. · Stoga se k d ti'J .. •
skala Svaki uredeni niz brojcanih vrijednosti koji omogucuje smjestanje . . o cen a ne Sm1Je 1Zracunavati "pros:iek" '1'
" ku ., 'I' ~ 11
neke pojave na odgovarajuce mjesto na tom nizu prema stvarnoj iii pro- u pm centi 1Znekolikotestovazanekogispitanika Racv ki
·1 k · uns se cen-
cijenjenoj velicini iii promjeni u velicini pojave. Niz ne mora uvijek biti tt ne og rezultata racuna po formuli:
skala mjerenja ). K
t
I
' f
skala centila (percentila) Spada medu skale baZdarenja, a sluZi za inter-
pretaciju i usporedivanje rezultata. Pokazuje u kojem se postotku medu Centili obuhva~aju redom po
\
I 1% rezultata neke skupine mje-
svim rezultatima neki konkretni rczultat nalazi: 1. ccntil obuhvaca 1% .'
' renja, pa stoga ni u kojoj ne-
najslabijih rezultata, 2. centil 1% iduCih najslabijih rezultata, itd; 100. I .kvadratifnoj distribuciji, dakle
centil obuhvaca 1% najboljih rezultata. Prednost skale centila pred os- niti u normalnoj distribuciji, ne
talim skalama,.kaje sluze za iste svrhe (npr. > z-vrijednosti, > T- skala, > I predstavljaju "e.kvidistantne"
'
jedinice te stoga nije dopu~teno
Hullova skala itd.) nor-
~
izra~unavanje npr. "prosje~
maln T b em riblizno normalnu raspodjelu (sto zahtijevaju sve skale nog" ccntila.
'
I'
J,
I
-- ----~--,....... ----....... -
. . -. - . -
'
I
I SKALE BAZDARENJA, IN'IERPRETACIJE I ... 173
172 SKALA DECIIA
I
skala decila Spada medu skate bazdarenja, a sluzi za interpretaciju i I rang ova, kao i razlika izmedu 1. i 6. ranga ), ali stvame razlike medu re-
usporedivanje rezultata. To je zapravo 10 puta "grublja" skala od > ska- 'I• zultatima mogu biti potpuno drugacije: drugi trkac na cilju jedne trke
•
~- '
/e centila, tj. ona dijeli rezultate u sk:upine od po 10% (umjesto 1% ). Ako maze biti nekoliko centimetara iza prvoga, a treCi maze biti nekoliko de-
neki rezultat padne u prvidecil, znaci da spada medu 10% najslabijih re- setaka metara iza drugoga, no razlika u rangu izmedu prvog i drugog i
zultata, a najbolji rezultati padaju u 10. decil. U prakticne svrhe (npr. drugog i treceg jednaka je: iznosi 1 rang. .-
kod kategorizacije kandidata na nekom selekcijskom postupku) cesto je
Neprikladnost skate rangova maze se prilicno ublaziti ako uzme-
dovoljno rezultate dobivene na nekim testovima podijeliti u 10 katego-
• mo nekoliko skala rangova, pa izracunavamo njihov prosjek (iii zbroj):
rija, a to se postize skalom decila. No zbog istih nedostataka koje ima i •
'•
na primjer, ako je skupina ispitanika testirana uz pomoc 3 testa, pa ako ••
skala centila (tj. zbog toga sto se decilni rezultati ne smiju zbrajati niti od ispitanike rangiramo u svakom testu, i uk:upni rezultat svakog ispitanika
•
1
njih traziti neki prosjek), u selektivnim postupcima mnogo se cesce izrazimo sumom njegovih rangova, taj ee nam zbroj dati znatno realniji
upotrebljavaju skale, osnovane na standardnoj devijaciji, kao npr. > z- ukupni rang ispitanika nego da smo jednostavno zbrojili > bruto rezu/-
vrijednosti i druge skale (> skale bazdarenja, interpretacije i usporediva- tate svakog ispitanika, pa da smo prema tome zbroju rangirali ispitanike.
nja rezultata) (vidi sliku uz > skala centila ). P VeCi broj provedenih (vlastitih) provjera pokazao je da je slaganje
izmedu ranga dobivenog zbrajanjem rangova i ranga dobivenog najis-
skala, intervalna > intervalna skala pravnijim postupkom (tj. pretvaranjem bru.to rezultata u z-vrijednosti)
'l'
vrlo visoko, tj. rang-korelacija rho je preko 0,95, cak i do 0,99. P
skala mjerenja Skala mjerenja determinirana je svojstvima brojcanog
sustava koja odreduju pravila pridjeljivanja brojeva pojavama (> mjere-
I skala standarda (standardna skala) > z-vrijednosti
nje u psihologiji). Ta pravila jesu: utvrdivanje identiteta (> nominalna
skala), utvrdivanje reda (> ordinalna skala), utvrdivanje razlika (> in-
telvalna skala) i utvrdivanje omjera (> omjema skala). Ovimje pravili- skale bazdarenja, interpretacije i usporedivanja rezultata Vrlo cesto
ma ujedno odredena i razina mjerenja koja je definirana dopustivim I
moramo interpretirati rezultat nekog ispitanika (tj. ocijeniti koliko taj
•
> transformacijama koje skalu ostavljaju invarijantnom. DrugaCije '' rezultat u usporedbi s drugim rezultatima "vrijedi"), iii usporedivati re-
!
reeeno, skalu definira mogucnost manipuliranja brojcanim vrijednosti- zultate istog ispitanika u razlicitim testovima, ili pak izracunati ukupni
ma koje nece promijeniti empirijske informacije dobivene transponira- uspjeh razliCitih ispitanika u nekoliko > prediktorskih varijabli. Za tu
njem mjerenih pojava u vrijednost skate. K svrhu upotrebljavaju se razlicite skale bazdarenja nekog testa, sportske
\
• discipline ili sl. Tako se npr. svaki pojedinacni rezultat maze izraziti >
skala, nominalna > nominalna ska/a centilom (ili > deci/om ), u koji on spada, ali se najbolje metode sastoje u
I
I tome da se svaki rezultat izrazi u terminima odstupanja od prosjeka, da-
I
skala, omjerna > omjema skala I
I kle u terminima standardne devijacije. U tom podrucju najpoznatije su
I > z-vrijednosti (standardne vrijednosti), kao i drugc skale koje se osniva-
skala rangova Skala dobivena na temelju rangiranja rezultata. Ako re- I
zultate odredcnog broja predmeta, osoba i sl. rangiramo, dobivamo do- l' ju na standardnoj devijaciji (> C-ska/a, > T-skala, > sigma-skala, > Hu-
sta "primitivnu" skalu u kojoj su razlike medu jedinicama skate samo I /lova skala). Ove skate ne treba brkati sa> skalama mjerenja, iako obje
\ skupine skala cesto nose isti naziv. P
formalno ekvidistantne (npr. razlika izmedu 5. i 10. ranga iznosi 5 I
\
I
' SLUCAJNA V ARIJABLA 175
SKEWNESS '
174
skup rezultata Svaka skupina rezultata nekog opazanja ili mjerenja (sto
skewness (engl.) Stupanj u kojemu krivulja _distribuc~je o~~tup~ o~ podrazumijeva da su svi rezultati te skupine dobiveni u istim ili Larem
(potpune) simetricnosti. U nas se ~p~tre~ljava tzraz > s1metncna d!stn-
prihvatljivo jednakim uvjetima mjerenja i1i opazanja). Skupinu rezulta-
bucija, odnosno > asimetricna d1stnbucqa. K ta nazvat cemo skupom rezultata u svim onim slucajevima u kojima ne
skraceni postupci U statistici to su postupci koji obicno u vecoj mj~ri mozemo dokazati i pokazati da su dobiveni r.a uzorku. Mozemo to reCi i
skracuju tacunanje, koje bi inace, s obicnom radnom f~r~ulom, btlo ovako: svaki uzorak je skup, ali svaki skup nije uzorak. K
'
'
I
'ke od "normalnog" postupka ili je razlika prihvatljivo mala. Jcdan ! slozena analiza varijance (SANVA) Statisticki postupak koji pred-
razl I . . · vk
I
od najpoznatijih skraeenih postupaka je izracunavan~.e ar~:metlc e_ sr~- I stavlja ekstenziju > jednostavne analize varijance, koji se upotrebljava
dine i standardne devijacije "po skracenom postupku , pn cemu se md~ I •
kad se u istrazivanju koristi vise od jedne nezavisne varijable. Glavni do-
vidualni rezultati skupljaju u manji ili veCi broj "razreda", pa se vonda ~z bitak takve statisticke analize je tzv. > interakcija. Postoje vrlo razliciti
tako grupiranih rezultata po posebnoj form~~i ~~ skrac~n-~ r~cu~anJ~ '
•'
modeli primjene ovog statistickog postupka pa se stoga za svaki poje-
''
izracuna aritmeticka sredina i standardna devtJaCtJa. Statts~tcan su ~~~~ '' dinacni slucaj treba konzultirati specifiena literatura, kao sto je primje-
sljali ~kracene postupke raeuna uglavno~ zbog t~ga da d~tsta olakSa~u ~ rice knjiga B.J.Winer, Statistical principles in experimental1.esign, New
ubrzaju statisticka izracunavanja, a time 1 smanJe mogucnost pogreske York, McGraw-Hill book comp, 1962. K
Cija jc vjcrojatnust to vcca sto racun duzc trajc. Danas kad s~ ra~una ug-
'
\
lavnom racunalima, takvi se postupci vrlo rijetko upotreblpvaJU. slucaj Ishod u nekom sustavu koji ovisi vjerojatno o brojnim, nama
Logika skracenog postupka sastoji se u tom~ ~a se o?rc_di ncka '
ncpoznatim uzrocima, koji su obicno izvan tog sustava. Najjednostavniji
provizorna vrijednost, pa se ond~ ta vrije_dnost kon~~~a nekim tzrazom ;'
primjer djelovanja slucaja je > binomna distribucija, npr. rezultat baca-
koji zahtijeva manje racuna da bt se dobtla prava vrtJedno~t.. v • nja novcica, kod kojegje vjerojatnost da padne "glava" jednaka vjerojat-
No i danas se upotrebljavaju skraceni postupc~ u v_eC!m slucaJeva nosti da padne "pismo". Svakako postoje razlozi da je novcic pao na
kada racun zahtijeva odredivanje razlika (npr. razhka ~zme~u svakog ( "glavu" ili "pismo", ali oni su nam nepoznati, ajednaka "sansa" za "gla-
pojedinog rezultata i aritmeticke sredine )._ T~ko se za :acunanJe >stan- '
'
I vu" i "pismo" pokazuje dati faktori nisu sistematski, tj. da ne djeluju u
I
dardne devijacije s pomocu racunala konstl formula. jednom smjeru, vee "po slucaju" u razlicitim smjerovima. Tako slucaj
- npr. djeluje na rasprsenje pogodaka puske oko samog centra cilja. P
I
-·
'
176 SLUCAJNA V ARIJABLA "SNAGA" TESTA 177
"opazanja" te varijable) ne maze se znati tocan ishod (s potpunom sigu- preostalih elemenata da budu izvuceni postaje postupno sve veca (ier u
rnoscu) nego samo njegova vjerojatnost, koja u ovom slucaju iznosi 0,5 bubnju preostaje sve manje elemenata ). Tab lie~ slucajnih brojeva
(iii 50%) za svaki od ishoda. No, pri velikom broju "opazanja" ili "mje- najvise sc koriste kod biranja slucajnog uzorka iz brojcano relativno
renja" broj ishoda svake od vrijednosti varijable (u ovom slucaju "pi- ogranicenih populacija (npr. izvlaeenje slucajnog uzorka ucenika neke
smo" i "glava") priblizava se svojoj vjerojatnosti iii, tocnije receno, skole, radnika neke tvornice), a radi se taka da se iz tablice citaju sku-
vjerojatnost je odredena na osnovi relativnog broja ishoda svake vrijed- pines onoliko znamenaka od koliko se sastoji i populacija (npr. ako je
nosti varijable pri dugotrajnom ili beskonacnom ponavljanju opazanja veliCina populacije N = 3800, onda se iz tab lice citaju po eetiri broja, pa
ili mjerenja varijable. Ukupan zbroj vjerojatnosti ishoda svih vrijednosti se izaberu oni clanovi populacije koji na listi populacije nose te brojeve;
kod slucajne varijable mora iznositi 1. K brojevi koji ne postoje, preskacu se, a takoder se preskace rezultat kojije
vee izvucen). Kod veoma velikih, a pogotovo kod "neizmjernih" popula-
slucajni uzorak Uzorak u kojem svaki clan populacije ima jednaku cija upotreba tablice slucajnih brojeva prakticki ne dolazi u obzir pa se
sansu da bude izabran u uzorak i izbor jednog clana ne smije utjecati ni onda sluzimo drugim vrstama uzoraka, koje posve uspjesno zamjenjuju
na koji nacin na izbor bilo kojeg drugog clana. Slucajni uzorak najbolje · slucajni uzorak. Jedan od njihje > sistematski uzorak, kod kojeg se u uzo-
reprezentira populaciju, uz uvjet daje dovoljno velikjer, ako se popula- rak uzima svaki n-ti clan populacije. P
cija sastoji od nekoliko "slojeva" ("stratmna"), veliki slueajni uzorci po-
I
sve ce dobro reproducirati i postotne odnose medu tim slojevima. (Aka •
•
~'.S.nl!:Ja,~~~'ta Vjerojatnost odbacivanja .~ul~hipoteze, ako je ta hipoteza
slucajni uzorak zbog nekih razloga ne maze biti dovoljno velik, onda se \ "zaiS.:! :;P.~~~~s~a. Dakle, to j~_:¥P~sob~o~~.~e_~g &tatistickog testa da ot-'
upotrebljava > stratificirani uzorak, kod kojeg namjerno stavljamo po- t krije~ilekU bwiku izm'edu.dvije populacije;' ako ta razlika doista
treban postotak u svaki "sloj", no unutar "sloja" izbor pojedinaca opet je Receno statistickim rjecnikom, snaga testa ocituje se u vjerojatnosti
slucajan.) Normalna raspodjela dobiveila je na slucajnim uzorcima, a izbjegavanja pogreske tipa 2 (> pogreika tipa 1 i tipa 2). U cjelini gleda-
. ,.. ,... .
~·
buduci da se logika statistickog zakljucivanja gotovo u cijelosti osniva na no, {~~~g~; neparametrijskih testJva manja je od snage parametrijskih,Jl
karakteristikama normalne raspodjele, slucaj'ni uzorakje jedan od "ka- iako kod nekih testova (npr. > Friedmarwv test) gotovo da i nema razli-
mena temeljaca" kako > deskriptivne, taka i > inferencija/ne statistike. ke, a u nekim posebnim situacijama snaga neparametrijskih testova
Dakako, pojam "slucajni" ne znaci "bilo kako" izabran uzorak, nego maze biti i veca nego kod parametrijskih: buduCi da parametrijski testa- •
uzorak biran po strogim principima, tj. sukladno njegovoj definiciji. vi uzimaju u obzir i velicinu odstupanja pojedinog rezultata od prosjeka,
Prakticno, postoje dva nacina dobrog izbora slucajnog uzorka, ito: (a) maze se dogoditi da nekoliko ekstremno aberantnih rezultata toliko
upotreba > tab/ice s/ucajnih brojeva ili slucajni brojevi generirani s po- povecaju standardnu pogresku aritmeticke sredine da npr. t-test pokaze '
mocu racunala i (b) izvlaeenje iz "bubnja" (ili slii~an postupak koji da razlika izmedu dvije aritmeticke sredine nije statisticki znacajna. No
mozemo vidjeti prilikom izvlacenja brojeva tombole, Iota itd.) i u tom ako su ti aberantni rezultati u istom smjeru (tj. oni povecavaju razliku
slucaju svaki zeton ili kuglica u bubnju mora predstavljati jednu osobu tj. izmedu obje skupine ), onda ce se neki neparametrijski test (koji ne vodi
jednog clana populacije. No tablica slucajnih brojeva svakako je najbolji racuna o velicini odstupanja) mazda pokazati korisnijim jer ee on hiti
postupak,jer on u cijelosti oponasa "idealno" izvlacenje slucajnog uzor- sposobniji da odbaci nul-hipotczu, ako je ona ustvari pogrcsna. Na
ka, tj. izvlacenje > uzorka "uz povrat" (gdje se svaki izvuceni rezultat primjer, kada bi neka terapijska metoda gotovo kod svih bolesnika do-
vraca natrag u populaciju), dok kod izvlacenja "iz bubnja" sansa vodila do neke pozeljne posljedice, a kod nekih bi ta reakcija bila veoma
• I
. ;•
'
'
!
178 SNAGATESTA SREDNJA VRIJEDNOST RAZREDA 179
jako._ izra.Zena, bilo bi logicno zakljuCiti da je terapija u c}.eli~i uspjesna - centralna vrijednost) i1i cestine pojavljivanja (kao sto je to > dominantna
iako ·bi zbog tih veoma aberantnih rezultata parametrt)Ski test mogao vrijednost). K
"zakazati", tj. ne odbaciti nul-hipotezu. P
sredisnjn vrijednost poloznjn > Sredi.~nja vrijednost koja se odrcduje na
Snedecorove F-tablice Analogno > t-tablicama, Snedecorove tablice temelju polozaja rezultata u skupu rezultata, a ne na temelju brojcane
pokazuju > granicne vrijednosti > F-omjera, kako bismo mogli zakljuCiti vrijednosti rezultata. Tipicna takva sredisnja vrijednost je > centralna
razlikuju li sc dvijc varijance statisticki znacajno. P vrijednost. K
' . .
Spearman-Brownova formula Formula koja omogucuje p~ocje~~. > .:::=~ srednja vrijednost razreda Aritmeticka sredina i~medu gornje i donj ~
pouzdanosti testa koji je produzen ili skracen, a poznata mu J:~eh~ma granice > razred__a . •Rezultati grupirani u razrede gube svoju "individu-
•
pouzdanosti samo poeetnog oblika; npr. test odredene duzme 1m~~
•
•
•
I
•
'
Srednje vrijednosti razreda najcesce se koriste pri grafickom pri- vanje podataka koji su izrazeni u kvalitativnim klasama, tzv. brojenih
kazivanju distribucije frekvencija rezultata dobivenih mjerenjem iii podataka, zahtijeva uglavnom samo njihova jasno smje8tanje i prebroja-
opazanjem i predstavljaju uporisne tocke (obicno) na apscisi. P,K vanje u odgovarajucim kvalitativnim kategorijama. K
v
srednje kvadratno raspdenje Naziv za > standardnu devijaciju, jer se stabilnost statistickih vrijednosti Terminom stabilnost u statistiCi se
odreduje kvadriranjem razlika izmedu svakog pojedinog rezultata i oznacuje svojstvo nepromjenljivosti iii neosjetljivosti izracunatih sta-
aritmeticke sredine. K tistickih vrijednosti povecavanjem i1i smanjivanjem broja rezultata (N).
Sto je N veCi, veca je i stabilnost statistickih vrijednosti. Stabilnost sta-
======> srednje odstupanje Jedna od mjera varijabilnosti rezultata: prosjecna I tistickih vrijednosti ovisna je i o djelovanju > nesistematski varijabilnih
apsolutna veiicina odstupanja pojedinih rezultata od neke > srediJnje faktora: sto vise takvih faktora djeluje, potreban je i veci N i obrnuto, jc;r
vrijednosti, a najeesce od aritmeticke sredine. Buduci da zbroj svih pozi- nesistematski varijabilni faktori povecavaju rasprsenje rezultata. Mjera
tivnih i negativnih odstupanja od aritmeticke sredine daje kao rezultat stabilnosti je pogreska koja se veze uz svaku statisticku vrijednost: >
nulu, to se srednje odstupanje racuna tako da se zbroje sve apsolutne standardna pogreJka aritmeticke sredine, > standardna pogreJka koefi-
velicine odstupanja, i podijele brojem odstupanja: cijenta korelacije itd. K
. ds . IX-MI
srednJe o tupanJe = '---N--'
--...::....,.. stablo vjerojatnosti Jedan od jednostavnih i razumljivih grafickih pri-
kaza razlicitih ishoda pri prikazivanju > binomne distribucije (pa i nor-
gdje je saX oznacen svaki pojedini rezultat, saM aritmeticka sredina, a ~ maine distribucije). Najce-
:=-
saN broj rezultata.
'
I ~
g Moguti
sec sc; koristi kad jc; sansa
I
Srednje odstupanje bolja je mjera rasprsenja od > raspona, ali ~
ishodi 50%:50%, npr. pri bacanju
s 1
novcica. Na donjoj slici pri-
znatno slabija od > standardne devijacije, te se rijetko u statistickim
K 2
racunima koristi. P kazano je "stablo vjerojat-
s 3
nosti" za situaciju u kojoj
K 0 nas zanima vjerojatnost da
sredivanje podataka BuduCi da proces prikupljanja podataka (mjer- II s s s
enje iii opazanje) ne mora uvijek biti po redu koji pogoduje statistickoj cenekaobitelj, koja zeli Ce-
l obradi rezultata, sredivanje podataka u statistici znaci zapravo pri-
I K
K
s
®
(J) tvero djccc, dohiti 4 sina
premu pod ataka za daljnju statisticku obradu, njihova sredivanje prema K 8 (S = sin, K = kCi).
nekom redu: redanje po velicini, > grupiranje rezultata u razrede i tome s 9
I
I
I
' I
•
I
'
I
II
r 182 STABLO VJEROJA1NOSTI
STANDARDNA DEVIJACIJA 183
Kao sto iz slike vidimo, vjerojatnost za sina iznosi 0,5 (kao i za
je aritmeticka sredina. _S, ... <lfdJ?.a devi'acija koristi se jedino uz aritme-
kcer). Ako je prvo dijete S, kod drugog djeteta opet postoji jednaka ''
I' !icku sredinu i ima jedino svoj smisao ako je distribucija rezultata barerp
vjerojatnost za S i K. Ako jc drugo dijete S, za trece dijete opet vrijcdi
priblizno noq nalna. U idealnom slucaju ( dakle, kod normalne distrib~
isto pravilo, itd. Na slici se vidi da za cetvero djece postoji 16 moguCih is-
hoda, a samo jedan od svih 16 ishoda je S,S,S,S, dakle vjerojatnost je 1/16 cije), ako od aritmeticke sredine "zagrabimo" Iijevo i desno za jednu
iii P - 0,06, a to znaci dace se to u prosjeku dogoditi oko 6 puta na 100 standardnu devijaciju (M ± ls), obuhvatili smo oko 68% svih rezultata,
obitelji s cetvero djece. s M ± 2s obuhvacamo oko 95% svih rezultata, as M ± 3s obuhvatili
Iz stabla vjerojatnosti mozemo odcitati i svaku drugu zeljenu kom- smo gotovo sve rezultate, tj. 99,73% svih rezultata (vidi sliku uz na-
binaciju: na primjcr, kombinacijc 2S i 2K (ako rcdoslijcd nije vazan!) tuknicu > nonnalna distribucija). Doslovno sve rezultate ne mozemo
mogu se dogoditi prosjecno 6 puta od 16 slucajeva, dakle vjerojatnostje obuhvatiti niti s desetak iii vise standardnih devijacija Iijevo i desno od
p = 0,375, sto znaci gotovo 4 takva slucaja na 10 obitelji s cetvero djece. aritmeticke sredine, jer krivulja normalne distribucije dodiruje apscisu
No, ako nam je vazan redoslijed, onda iz stahl a vjerojatnosti vidimo da je tek u beskonacnosti (neizmjernosti), tj. krakovi krivulje asimptotski se
I za svaki od 6 moguCih redoslijeda vjerojatnost 1/16, dakle jednaka kao i priblizavaju apscisi. Drugim rijecima, i rezultat koji je udaljen od arit-
I vjerojatnost za sva 4 djeteta S ili sva 4 K (> zakoni vjerojatnosti). P meticke sredine za, recimo, 15 standardnih devijacija, maze se slucajno
dogoditi, ali vjerojatnost takvog ishoda je ekstremno malena. Ako dis-
standard Kritt1-ij ili uvjet kojemu mora biti udovoljeno, a koji se tribucija rezultata nije normalna, negp npr. izricito asimetricna .. stan-
propisujc za razlicitc situacije (npr. za prijam na neko radno mjesto, za dardna devijacija gubi svoj smisao ·er na jedno · stt ani krivulje vee sa, re-
uvrstavanje sportasa u reprezentaciju itd.). p cimo, 1s dolazimo do kraja, dok na drugoj strani rezultati se otefu i
znatno reko 3 iii 4 standardne devijacije.
} standardizacija Odredivanje i definiranje svih relevantnih situacijskih
Normalna distribucija (a onaje potpuno definirana aritmetickom
karakteristika (kriterija) nekog postupka ili mjerenja. Na primjer, test je
sredinom i standardnom devijacijom) predstavlja osnovnu Iogiku
standardiziran ako su propisani svi bitni uvjeti njegove primjene, kao sto
racuna vjerojatnosti, tj. povrsina normalne distribucije znaCi ujedno i
su upute ispitanicima, vremensko trajanje pojedinih zadataka, nacin ko- vjerojatnost. Primjer: vjerojatnost da cemo iz skupine rezultata koji
rigiranja rezultata, broj bodova za pojedina rjesenja, osnovne,norme do- daju normalnu distribuciju slucajno izvuci rezultat koji se nalazi u inter-
bivcnc > baidarenjem testa (aritmeticka sredina, standardna dcvijaci- valuM ± 1s iznosi 68%, vjerojatnost dace izvueeni rezultat biti veCi od
ja ), eventualno podjela bodova u decile iii centile, a u nekim testovima M ± 1s iznosi oko 16% itd.
(npr. nekim testovima licnosti) dane sui interpretacije pojedinih rezul- Izracunavanje standardne devijacije vrlo je jednostavno: po svom
tata u testu. Kad se kaze da je test primijenjcn u "standardnim uvjcti- smislu, standardna devijacija je drugi korijen iz prosjecnog kvadriranog
' ma", to znaci da su svi rezultati dobiveni ujednakim, tj. unaprijed propi- odstupanja rezultata od aritmeticke sredine (dakle, drugi korijen iz >
sanim uvjetima. ·P varijance), pa njezina formula glasi:
I
•
•
'
----
'
mnogih racuna, a narocito u > inferencijalnoj statistici, u nazivniku se ~~aJ!~a!dna .pogrdka ~ribri~tilb,.reiline Standardna devijacija distri-
N mijenja u > stupnjeve slobode, pa formula za s glasi: bucije aritmetickih sredina uzoraka iste velicine oko prave aritmeticke
_sredine, tj. oko aritmeticke sredine populaQij~Uzimamo li iz neke po-
ulaci ·e velik bro · slucajnih uzoraka iste veliCine, i izracunamo li aritme-
ticku sredinu sv~kog uzorka, 9obit temo velik broj aritmetickih sredin~
N-1 I
I - koje ce se distribuirati po . . s aritmetickom sredi-
~
L
gdje je sM standardna pogreska aritmeticke sredine, s standardna de-
s= vijacija uzorka i N broj rezultata u uzorku (velicina uzorka ).-Xa normal-
N-1 p.a_distribucija_yeliko_g !?~·a £1!itmetickih sredina bit ce, dakako, to sira
i
.Sto · zorakmanji a k uzorkavelicin~N ~1 ta distribucija bit ce jed~ .
gdje je X svaki pojedini rezultat, aN je broj rezultata. naka distribuciji opulacije (vidi sliku: simbol a oznaeuje standardnu
''•
Osim citavog niza prednosti sto ih standardna devijacija ima pred '
'
I devijaciju populacije, a aM znaCi standardnu pogresku aritmetickih sre-
nekim drugim mjerama raspdenja rezultata (npr. pred > rasponom, > ''
dina uzoraka razlicite velicine ).
poluinterkvartilnim rasprsenjem i dr.), njezina je prednost ito sto smanji- \
vanje ili povecavanje velicine uzorka ne djeluj~ sistematski na standar- I Oistn"bucija mdtvldualruh
'I vrijtdraost1 u pvpulaciji
dnu devijaciju,vec nna -uzmanja iii ~ca slncajna kolebaJ?:ia- ostaj.e pri- · I 0 ~ 10
'
standardna pogreska Pogreska kojoj se izlaZemo kada iz neke vrijed- I· OM= 7,07
Di.stribu.cija arilmttitkih Jrtdina
uzoraktz vdilint N :::a 2
nosti dobivene mjerenjem na > uzorku, zakljucujemo o toj istoj vrijed- I
I
)
nosti (parametru) u > populaciji (npr. o pravoj aritmetickoj sredini, o a,., = S, 78 Dirtribucija aritmttit kih sredina
t uzorako vdil inr: N :c J
pravoj korelaciji ·.. ·p,_Q- ''
\
•
tzracuna-
v I •
O'M z:; S Distribucija aritmelilkih Jrtdin. a
uwraka vclitint N = 4
1j<
vanja standardnih pogresaka za razlicite statisticke vrijednosti uvijekje
aM 2,5 Di.stribucija aritmetitk.ih Jrcdin.a
jednaka, tj. zanima nas kako izgleda distribucija tih vrijednosti, ako I
:;::r
uzoraka vtUtint N = 16
I sredina oko prave
bismo iz populacije uzimali neizmjerno velik broj uzoraka iste velicine.
ticke sredine
Standardna pogreska naziva se i > pogreska uzorkovanja (> distribucija je uza §to je DiJtrib':'clja aritmttil kih sredino
O~o~ = 2
uzoraka vtl1lint N ::~:~: 25
uzoraka) P cano veci.
I
I
I
186 STANDARDNA POGRESKA ARITMETICKE SREDINE '
STANDARDNA POGRESKA KOEFICIJENTA KORELACIJE 187
. ..
. ' . . .. . . . ·~
I
I
BuduCi da dobivena vrijednost predstavlja po svom _smtslu sta,rt· . ' tata, i (b) za situaciju kada korelacija u populaciji iznosi +0 80 a·uzorci
dardnu devijacij~, to za nju wijede isti zakoni koji vrijede za standardnir su ta~oder vclicinc R parova. Kako viuimo, ako u populac:ji 1;ema ko-
,• devijadji.i: dko 68% svih aritmetickih sredina nalazi se u intervalu plus i
r~laCIJe, po slucaju bi se cak mogle dobiti i korelacije od -1 iii + 1. A kada
· minusjedna standardna pogreska oko aritmeticke sredine populacije,
b1 stv~r~a k~relacija u populaciji iznosila +0,80, uzorci velicine 8 parova
oko 95% aritmetickih sredina u intervalu plus i minus dvije standardne
mogh b1 dati korelacije od -0,20 pa do + 1,0.
pogreske itd. Iz toga dak!e zakljucujemo da neka, na uzorku dobivena,
aritmeticka sredina, uz 68%-tnu vjerojatnost ne odstupa od aritmeticke
srcuinc populacijc za vise ou jcunc stanuardnc pogrdkc, uz 95%-tnu
vjerojatnost za vise od dvije standardne pogreske itd. Dak!e, ako neka
aritmeticka sredina, dobivena na uzorku velicine 100, iznosi 80, a njezi- r = o.so........._,
na standardna devijacija 10, onda njezina standardna pogreska iznosi
101 ..JlOo = 1, pa iz toga zakljucujemo ovo: postoji oko 6H% vjerojat-
nosti da nasa aritmeticka sredina (veliCine 80) ne odstupa od arit-
meticke sredine populacije za vise od 1, dakle aritmcticka sredina popu-
lacijc mogla bi biti negdjc izmcdu 79 i Hl; postoji oko 9YY,J vjcrojatnosti
•
tla nal1cna vrijcdnost nc odstupa od prave aritmeticke srcdine za vise od 'f
dvije (tocnije: 1 ,96) standardne pogreske.' da~e aritmeticka sredi~a •
•
'
I
188 STANDARDNAPOGRESKAPROGNOZE \ __________::.
STAND_~R!?.~_A POG_!{ESKA RA~~!ffi IZMED~:::.:..
·· _ __ l.B.~
I
standardna pogreska prognoze Pri > prognozi rezultata u jednoj vari- I da postoji 95% vjerojatnosti da se pravi postotak djece s jakim stupnjem
•
jabli na temelju poznavanja rezultata u drugoj varijabli i poznavanja I karijesa krece negdje izmedu 50 i 70% (0,6 plus i minus 2 x 0,049). Stan-
stupnja povczanosti medu varijahlama, pogreska kojoj jc takva progno- I dardna pogrdka proporcije moze biti vrlo korisna u prakticnom radu.
za izlozena izrazava se s pomocu > koeficijenta rezidualnog varijabili- Na primjer, pretpostavimo da se u nekom kraju u kojem zivi milijun sta-
teta, koji tada ima smisao pogreske i naziva se standardnom pogreskom novnika, pojavi opasna zarazna bolest koju valja odmah suzbiti protu-
prognoze. Ako se prognozira rezultat u Yvarijabli na temelju rezultata u mjerama. Zdravstvena ekipa poslana na teren, uzme uzorak (npr. >
X varijahli (koristcci > jednadzhu pravca regresije), onda sc pogrcska sistematski uzorak) od 500 !judi, i ustanovi daje 25% njih zarazeno. Pod
'
moze izracunati ovom formulom:
pretpostavkom da ekipa od troje !judi moze na dan poduzeti sve potre-
bne mjere za 1000 zarazcnih, koliko ekipa od po troje Ijudi treha smjesta
poslati na teren, ako zelimo zarazu zaustaviti? BuduCi da nadeni posto-
gdje je sy standardna devijacija u Yvarijabli, a rxy koeficijent korelacije. tak oboljelih nije pravi postotak cijele populacije, izracunamo i standar-
Pogre~ka prognoze omogucuje procjenu intervala u kojemu sc progno- dnu pogrcsku proporcije i dobijemo prakti~ki 0,02, dakle 2 posto. Ako
zirani rezultat nalazi s odredenom (odabranom) sigurnoscu ili rizikom zclimo prcdvidjcti najgorn mogucnost, uzct ccmo 99,7%-tnc granicc
(> intervalna procjena). K pouzdanosti, tj. dodamo nadenoj vrijednosti 3 standardne pogreske, pa
dobijemo da je mazda zarazeno cak 31% !judi (25% + 3 X 2% ), dakle
.standardna pogreska
.
proporcije Pogreska kojoj se izlazemo kada iz
oko 310.000 njih. To hi znacilo da bi oko 310 ckipa od po trojc ljudi mo-
neke proporcije, dobivene na uzorku, zaklju~ujemo na proporciju u
glo u jednom danu izvrsiti sanaciju svih oboljelih.
•
populaciji. K.ao i sve vrste standardnih pogresaka, i standardna pogreska l
poporcije nije nista drugo nego standardna devijacij_a v~likog broja pro- I Kada su uzorci relativno mali, ili jep vrlo nizak ili vrlo visok, dis-
porcija dobivenih iz uzoraka, oko rave propo.rc~~p.o.pulac!ie. Ako.je I tribucija uzoraka populacije nije vise simetricna, pa se u tom slucaju .
- uzorak dosta velik i ako proporci'a "e izricito niska n r. is od 0 10) I
• • ' t
I
•
I / )
gdjc je s M,-M, standardna pogrcska razlikc, a s M, i s M, su pripadnc > I g~je sus M isM, standardne pogreske proporcija, a rkoeficijentkorela-
1
standardne pogrdke aritmetickih sredina. Standardna pogrcska arit- I
CIJe. Ako su zavisni uzorci mali, mnogo jednostavnije je upotrijebiti >
s
JN' pa sc zato gore navedena
meticke sredine racuna se po formuli metodu diferencije. P
formula moze pisati i ovako: ~ta~dardna pogreska razlike izmedu dviju proporcija Pogreska kojoj se
Izlazemo ~ada iz neke razlike medu prQ.l!Orcijama zakljuCujema. na
s M 1 -M 1 = ''
pra"v'U raz~tku medu ro orci'ama o ulacija. Racuna se po istom prin-
\ ct.pu k~o 1 > standardna pogreska razlike izmedu dviju aritmetickih sre-
BuduCi da dobivena vrijednost po svom smislu predstavlja stan- dma, t]. pogreska je drugi korijen iz sume kvadriranih standardnih po-
dardnu devijaciju, to za nju vrijede isti zakoni kao i za standardnu devija- gresaka proporcija:
I
ciju (vidi o tome diskusiju pod > standardna pogreska aritmeticke sredine
•
STANDARDNA POGRESKA RAZUKE IZMEBU ...
' STATISTICKA JEDINICA 193
192
vijaciji (iii varijanci) populacije i standardnom devijacijom koja se na-
-
S p,-p, -
2
S plq, +
2
S plqz
ziva. standardna pogreska standardne devijacije, i racuna se po formuli:
'
s
gdje su Sptq pripadne standardne pogreske proporcije.
s • = .fiN
•
t-odnosa ustanovtmo
• •
gdje je s standardna devijacija uzorka, aN veliCina uzorka.
voje su uzorc1 a u uzorctma . . Medutim, ako su uzorci relativno mali, distribucija standardne de-
zak ili visok (> standardna pogreska proporcije), mozemo sma!~att, d.a JC vijacije i varijance hila bi asimetricna, pa standardnu pogresku nema
razlika > statisticki znacajna na > razini znacajnosti P < 0,05, ako JC do- smisla racunati (jer standardna pogreska- kao i standardna devijacija-
I
biveni t yeCi ool.9"6.' 0 ne . . . ari.., buduci da distribucija p to vise '
'
I
I
pretpostavlja normalnu raspodjelu). Stoga se ovdje racunaju samo >
od normalne raspodjele sto je uzorak ·· i sto granice pouzdanosti, a one se odreduju nesto kompleksnijim postup-
_ nrPr ll,1 =.k~.w.
kom. Taj se postupak osniva na hi-kvadrat distribuciji. P
_ bud~! bart!m 3 (umjcsto 1,96). Nazalost, medu statis~icarima .nema P?t-
punog slaganja u tome kako velik mora biti uzorak, 1 kakav mora bttt p, L
standardne vrijednosti > z-vrijednosti
pa da bi se mogla pretpostaviti normalna raspodjela (npr. neki kafu ~~ I
Np ili Nq moraju biti veci od 10, a neki da ukupni izraz Npq mora bttl stanine > C-skala
barem 9).
Ako su uzorci zavisni (npr. ista skupina ispitanika u dva navrata), statisticka jedinica Pri mjerenju iii opazanju jcdne :¥elicine (osobine,
postupakje metodoloski identican testiranju znacajnosti razlike izmed_u svojstva, pojave, atributa) .na razlicitim elementima; (indiyidl.!.umima)=
zavisnih aritmetickih sredina; standardna pogreska time postaje manJa potrebnaje jasna ijednoznacna definicija tih elemenata koji se onda na-
jer se pod korijenom odbija dvostruka korelacija, pomnozena jednom i ziVaju statistickim jedinicama. Primjerice, ako predmet mjerenj ~pre -
drugom standardnom pogreSkom: stavlja tjelesna visina djecaka starih 14 godina u Hr:vatsl<Ql, onda svaki
cetrnaestogodisnjak nrcdstavlja tatisticku jediniQ.l;l. a svc statisticke j_c-
dinice cine > populaciju (tzv. ogranicenu populaciju). Pri ponavljariju
mjerenja jedne veliCine na jednom elementu, statisticku jedinicu pred-
gdje sus p lq pripadne pogreske proporcije, a r koeficijent korelacije. P stavlja svako pojedino mjerenje definirano na odredeni (iasan, jedno-
znacan i precizan) nacin, a populaciju predstavlja neizmjerno velik broj
standardna pogreska standardne devijacije Standardna devijacija niza _p
mjerenja (tzv. neogranicenu populaciju). psihologijskim mje~enjim q i,
standardnih devijacija (i varijanci), dobivenih iz mnostva uzoraka iste ~pazanjima najcesce statisticke jedinice su osobe (individuumi, koji se
velicine, uzetih iz iste populacije, a koje se rasprsuju oko prave standar- tada nazivaju ispitanicima), ali to mogu biti, primjerice, citave skole ili
dne devijacije (ili varijance). Ako bismo izjedne populacije opetovano §.licne ins.tituci' e n~ke dobra definirane sku pine !judi itd. Primjer stati-
vadili velik broj velikih uzoraka (neki statisticari tvrde barem velicine sticke jedinicc pri mjerenju jedne osobine na jednom individuumu mozc
N = 100), i iz svakoga od njih racunali njihovu varijancu odnosno stan- biti mjerenje vremena jednostavne senzomotoricke rea:kcije: statisticka
dardnu devijaciju, dobili bismo priblizno normalnu distribuciju tih vrije- jedinica je operativna definicija mjerenja, au ovom slucaju to je vrijeme
dnosti, s aritmetickom sredinom koja odgovara pravoj standardnoj de- koje protekne od trenutka zadavanja podraiaja (treba navesti kakvog
•
•
i
194 STATISTICKA JEDINICA I
STATISTICKI 1ESTOVI 195
podrazaja: svjetlosnog, zvucnog i sl. kao i njegove fizikalne karakteristi- njihovih granica, solidno iskustvo u znanstvenom istrazivanju i oprez
ke, poput duljine elektromagnetskih valova upotrijebljenog svjetla, ras- prilikom interpretacije dobivenih rezultata.
pona intenziteta upotrijebljenih podrazaja, frekvencije zvucnih titraja i
I U psihologiji, za razliku od > klinicke metode, statisticki pristup je
sl.) do pocetka reakcijc ispitanika (treba navesti vrst reakcije: je 1i to po- ' takav pristup kojim se uz pomoe odgovarajuCih psihologijskih metoda i
dizanje kaziprsta s tipke strujnog prekidaca, je li to pomicanje cijele prikladnih statistickih postupaka utvrduju zajednicke i opee znacajke
ruke i sl.). K uze ili sire skupine individuuma. Ovaj pristup zanemaruje pojedinacne,
idiosinkraticne osobitosti pojedinaca ispitivane sku pine ljudi jer je orije-
statisticke distriblicije Postoji mnogo razliCitih distribucija rezultata. ntiran na otkrivanje same pojave (fenomena) koja je predmet istraziva-
Medu njima svakako su najpoznatije i najkorisnije > normalna distribu- nja. Statistickim pristupom otkrivaju se znacajke, recimo, apsolutne os-
!'
cija i > binomna distribucija. Ako se,_na primjer, radio vrlo rijetkim, a jetljivosti nekog osjetnog sustava i njezine ovisnosti o razlicitim faktori-
slucajnim pojavama, takve se pojave distribuiraju po tzv. > Poissonovoj ma; otkrivaju se karakteristike pameenja i cimbenika koji utjecu na pa-
distribuciji, nekc sc pojave distribuiraju po > negativno binomnoj distri- meenje. Istrazivaca pri tome ne zanima apsolutna osjetljivost neke
buciji, neke po > pravokutnoj distribuciji; vrijednosti malih uzoraka dis- odredene osobe i1i pameenje neke odredene osobe, vee samo njezin re-
tribuiraju se po > t-distribuciji. Nadalje, postoji > hi-kvadrat distribuci- zultat u mjerenju te osobine koji zajedno s ostalim rezultatima osoba u
ja, > F-distribucija, > distribucija r-koeficijenta korelacije, itd. P ispitivanoj skupini omogueuje otkrivanje karakteristika ispitivanog fe-
nomena. P,K
nosti nckc pojavc, pa pre rna tome plan ira i uzorak (iii uzorkc) i to kako stavljaju samo formalnu barijcru, jcr kada ih naucimo citati i razumjeti,
samu vrst uzorka (slucajni, stratificirani itd.), taka i pribliznu veliCinu teskoee nestaju. P
uzorka. Statisticki pristup ocituje se i u razumnom razlikovanju "stati-
sticke znacajnosti" nekog rezultata od stvarne, realne i prakticne znacaj- ~-~atisticki
"''•... .
.,_ .testovi
..
Uobicajeni naziv za one postupke u > inferencijalnoj
nosti toga istog rezultata. Ukratko, statisticki pristup zahtijeva ne samo statistici koji provjeravaju vjerojatnost da se neki dobiveni rezultat
formalno poznavanje glavnih statistickih postupaka vee i poznavanje dogodioslucajno, tj. da nije odraz stanja u populaciji. Tako npr. t-testom
•
STATISTICKI TESTOVI STATISTICKO TESTIRANJE HIPOTEZE 197
196
provjeravamo mozemo 1i neku razliku izmedu dvije aritmeticke sredine (b) Izraz "znacajno" dovodi do konfuzije zbog drugacijeg znacenja te
'
smatrati > statisticki znacajnom, hi-kvadrat testom provjeravamo I rijeci u svakodnevnom govom: kada npr. ka2;emo da je student A
I
odstupaju li nckc opazcnc frekvencije toliko od pod nekom hipotezom znacajno bolji od studenta B, onda to znaci da razlika medu njima nije
ocekivanih ferekvencija dane mozemo smatrati da se to slucajno dogo- 1,
mala, vee velika. I zato mnogi ljudi kada cuju da je npr. neka razlika
I
dilo, F-testom provjeravamo razlikuju 1i se dvije > varijance toliko da izmedu dvije aritmeticke sredine "statisticki znacajna" (a pogotovo
se ta razlika uglavnom ne moze pripisati slucaju, testom znacajnosti II kada cuju samo term in "znacajna") ili da je neka korelacija "statisticki
kodicijcnta korclacije prnvjcravamo hi 1i se takva korelacija mogla znacajna", to shvatc kao dajc razlika mcdu aritmctickim srcdinama vc-
slucajno pojaviti i onda aka medu populacijama nema nikakve pove-
lika, ili da je korelacija visoka. No, dakako, uopee se ne radi o tome ko-
zanosti itd. P
lika je neka razlika ili kolika je visina korelacije, vee kada se kaze da je
I ndto "statisticki znacajno", to znaci da ono sto smo mjerenjem na
I
"statisticki znacajno" u > inferencijalnoj statistici znaci 9.~ ~(;*l;l cinje- uzorku dobili, nijc slucajno, te da bismo slican rczultat do hili i kod pono-
I
nica, ustanovljena na uzorku ili uzorcima,
.
nije. . slucajna, vee da ~na (uz I
I
vnih mjerenja na drugim uzorcima, pa prcma tome ta nal1cna cinjcnica
........
~~-·
odrcl1eni rizik pogrcsnog zakljucka) postoji i u > populaciji; npr. _ako vrijedi i za populaciju. I veoma mala razlika medu dvije aritmeticke sre-
smo na dva uzorka (istih iii razlicitih veliCina) ustanovili da posi.ojc dim: ffiOZC biti Statistit:ki znacajna (?itO !lC ffiOZC dogoditi k.ada SU UZOTCi
razlike u njihovim aritmetickim sredinama, mozemo 1i smatrati da takve veliki), a to znaci da i u populaciji post~ji neka mala razlika izmedu tih
ili slicne razlike postojc i u populacijama, tj. nije li razlika koju smo do- dviju aritmetickih srcdina. Iz toga proizlazi da nesto sto je statisticki
hili na nasa dva uzorka mazda slucajan rezultat, a zapravo medu dvjema I znacajno uopce ne mora biti od hila kakvog prakti<::nog znacenja: na
populacijama iz kojih potjecu nasi uzorci, uopce nema razlike (tj. oba primjer, svi !judi navccer su 1-3 mm nizi ncgo ujutro (ito jc dakako viso-
uzorka potjecu iz iste populacije). Ili, u uzorku od 50 ispitanika ustano- ko statisticki znacajno, jer sc radi o populaciji !), a ipak ta razlika nema
vili smo da korelacija izmedu broja ponavljanja neke vjestine i stupnja I nikakvog prakticnog znacenja. U znanostima u kojima postoji dosta ve-
uspjcsnosti u toj vje8tini iznosi +0,70; mozemo li smatrati da bismo pozi-
likvarijahilitet pojava koje mjcrimo (npr. u psihologiji, sociologiji, peda-
tivnu korelaciju (ne nuzno iste visine!) nasli i mjercnjem drugih uzoraka
gogiji, medicini - jer se sve one have covjekom, a pojave u vezi s eovjc-
ispitanika? Drugim rijecima, bismo li korelaciju, nadenu na uzorku,
kom obicno variraju mnogo vise od pojava u vezi s nekim fizikalnim ili
nasli i u populaciji? Sam izraz "statisticki znacajno" (koji se osim toga
kemijskim zakonom) oct velike je vaznosti prilikom nekog istraiivanja
cesto upotrebljava samo u obliku "znacajno"), uzrokuje mnoge nespo-
ustanoviti mozemo li ndto sto smo istrazivanjcm konstatirali smatrati
razume kod laika pa i kod pocetnika u statistici, za sto postoje dva glavna
razloga: "opeom pojavom" ("opCim zakonom") iii je nas nalaz mozda samo
(a) logika i nacin misljenja kod primjene statistickih metoda i tehnika za slucajan ishod, posljedica varijabiliteta uzorka. Stoga je provjeravanje
provjeravanje "statisticke znacajnosti" ponesto su neuobicajeni, i dosta "s~atisticke znacajnosti" dobivenog rezultata (sto se provodi razlicitim
komplek:sni, pa - kako kafu neki nastavnici statistike - odredeni broj slu- ~ statistickim testovima) jedan od neophodnih uvjeta za postizanje
•
• '
~ 198 STATISTIK
I
'
STATISTIKA 199
I
statistik Malo poznat izraz, koji koriste neki statisticari anglo-amc- analiziranju i interpretiranju brojcanih podataka dobivenih savjesnim
rickog jezicnog podrucja, a oznacuje one karakteristike uzorka koje u opazanjem i/ili mjerenjem razlicitih objekata iii procesa.
populaciji nazivamo > parametrima. Tako npr. aritmeticka sredina po- Prvi poticaji matematicarima (koji su stvaraoci matematickih me-
pulacije je parametar, a aritmeticka srcdina uzorka je statistik. Uo- toda statistickih analiza), potjecu od kockara, koji su matemati:::arima
•
bicajeno je kod nekih autora da se parametri oznacuju grckim, a statisti- postavljali razliCita pitanja u vezi .s vjerojatnoseu razlicitih ishoda kod
ci latinskim slovima. P hazardnih igara (npr. kod igara kockom). ProucavajuCi zakone "sluca-
ja", matematicari su otkrili razlicite oblike "slucajnih distribudja", a
medu njima i tzv. > nonnalnu distribuciju (Gaussovu), koja predstavlja
statistika Za statistiku mozda u pojacanoj mjeri vrijedi opaska jednog
kamen temeljac u statistickom naCinu razmisljanja i zakljucivanja.
statisticara (Mainland), koji kaze da nijedna definicija ne znaci mnogo
"Averzija" prema statistici, na koju nailazimo kod mnogih !judi,
tako dugo dok nismo proucili ono sto radimo- a tadaje svaka definicija potjece iz cinjenice sto se (zato sto su matematicari stvaraoci statistike)
gotovo nepotrebna. Postoji preko 100 definicija statistike, i one se uglav- bavljenje statistikom poistovjecuje s bavljenjem matematikom, tj. statis-
nom razlikuju po tome koliko sc "dalcko" protde analiza mjercnjem iii tika se poistovjecuje s matematikom. No, cinjenica da su matematicari
brojenjem dobivenih podataka: ako se zadovoljavamo samo tablicnim razradili statisticke metode nikako ne znaci da covjek koji se koristi sta-
prikazima izmjerenih podataka, i smatramo da je to "statistika", onda tistickim metodama, mora dobro znati matematiku: mnogi odlicni
statistika doista znaCi samo urcdenc brojcanc ili postotnc podatkc one- vozaci automobila veoma malo znadu o automobilskom motoru i o me-
koj pojavi. Ako nas zanimaju nckc prcciznijc karaktcristikc izvjcsnog hanici.
procesa ili pojave (npr. postoji li povezanost izmedu visine i tezine Ijudi, Za covjeka danasnjice statistika zapravo znaci "statisticki nacin
'
misljenja", a za to zaista nije potrebno znanje matematike. Ustvari, nije
i kako je ta povezanost visoka, ili odgovor na pitanje distribuira li se
potrebno vise od poznavanja cetiri osnovna racuna! (Vee i malo kom-
covjekova tezina po normalnoj raspodjeli jednako kao i covjekova visi-
pleksnije postupke, kao npr. vadenje drugog korijena, podizanje nekog
na), onda "statistika" znaci sredeni i sustavni opis mjerenih pojava, i broja na trecu potenciju, rjesavaju postojece tablice, koje saddi veCina
konstataciju 0 nekim cinjenicama do kojih dolazimo tek primjenom ne- statistickih udzbenika, iii jeftina dzepna elektronska racunala ). "Sta-
kih racunskih postupaka (> deskriptivna statistika). A ako prilikom ne- tisticki nacin misljenja" znaci prilaziti istrazivanju pojedinih problema
kog istrazivanja ustanovimo neku zanimljivu cinjenicu, pa nas u prvom na nacin koji osigurava dobivanje sto pouzdanijih podataka: pocevsi od
redu zanima da 1i ta Cinjenica zaista postoji iii je nas rezultat mazda definiranja problema i izrade nacrta i metode istrazivanja iii eksperi-
slucajan (npr. aka smo nasli povezanost izmedu koli~ine alkohola u krvi menta, preko biranja uzorka (iii uzoraka) na kojem (ili kojima) cemo
obavljati mjerenje, pa sve do odabiranja metode abrade podataka (jer
i brzine reagiranja, iii smo nasli da su zene uspjesnije u detektiranju
upotrijebljena metoda abrade ovisi u velikoj mjeri o tome sto nas u is-
"neverbalnih signala" od muskaraca), pa primjenom razliCitih sta-
trazivanom problemu zanima). A za sve to naravno nije potrebno biti
tistickih postupaka pokusavamo odgovoriti nato pitanje, onda "statisti- matematicar (jer vjerujemo matematicarima da su formule koje su nam
- ka" znaci zakljucivanje iz konkretnog slucaja na "opCi zakon" ( > infere- dali, ispravne ), ali je potrebno razumjeti logiku statistickog misljenja i
ncijalna statistika). Aka iskljucimo prvi, najnizi nivo kao nesto sto je da- zakljucivanja, a to naucimo poznavajuci statistiku (narocito "normalnu
nas vee prefivljeno unutar pojma "statistika", tj. brojcane podatke "sa- raspodjelu").
me za sebe" ne smatramo statistikom, onda nam preostaju druge dvije Definitivna interpretacija dobivenih rerultata ovisnaje, dakako, i o
razine pa bismo najkraee mogli reCi da je statistika znanost o skupljanju, primijenjenim statistickim postupcima (ier ako su oni bili neadekvatni,
•
I
200 STATISTIKA
I STRATIFIKACIJA 201
zakljucci mogu biti temeljito pogresni), ali je najvecim dijelom ovisna o procese ciji ishod se predvida s nekom vjerojatnoscu, a ne s potpunom
I
'
opazene......
distribucije
..... ···-·· ..
i idealne (ocekivane) distribucije imaju isti N, istu
stanje neznatno poboljsati: povrsina B veca JC ?d .povrs~~e ~ (B 1 D su
" " ' ' ' ' ' '
- 1 r~jli1Jq
' '
II''' ,
-
' '·
~ - - -- •
I
I TABUCE SLUCAJNIH BROJEVA 207
~
I
• tablica raspdenja (u anglo-americkoj terminologiji to je izraz scatter
'
I diagram) Tablica s "dva ulaza" koja pokazuje vezano rasprsenje rezulta-
I.
••
ta u dvije varijable (Xi Y) (vidi sliku). Svaka > statisticka jedinica (svaki
ispitanik) prikazana je u tablici (ili dijagramu koji zapravo predstavlja
koordinatni sustav) jednom tockom (iii nekim drugim znakom) s dvije
koordinate: rezultatom uXvarijabli i povezanim rezultatom u Yvarija-
bli). Povrsina koju cine taka dobivene tocke naziva se > korelacijska po,
vrsina, ~oja se priblizava krugu sto je korelacija meduvirl]ablama rna-•
• nj4a postaje pravac kad je korelacija potpuna ( + ili - 1); pri korelacija-
ma izmedu 0 i 1 ima elipsoidni oblik. K
•
70
I
65
• • I
tablica F-omjera Tablica koja pokazuje granicne vrijednosti F-omjera •
~60
uz razliCite stupnjcve slohode za varijancu u hrojniku i za varijancu u '
"·-c •
nazivniku. Tablica se nalazi u Dodatku C. P '! 55
dru~a vanJabla
pokazuju frekvenciju).
"ulaz") jest spol s dvije kategorije - musko, zensko, a
( drugi "ulaz") je dab - osobe mlade od 30 go dina, o~obe stan!e ~d 30 go~
dina. u svakom od cetiri kvadratica ove 2 x 2 tabhce nalaz1t. ce se broJ tablice slucajnih brojeva Tablice koje su se svojedobno sastavljale tako
osoba koje su istodobno odredenog spola i odredene dobi: broj zena da se deseterostrana prizma, cije su strane obiljezene brojevima 0 do 9,
mladih od 30 godina; broj zena starijih od 30 godina; broj muskaraca bacala kao "igraca kocka", i biljezili su se brojevi koji su se pojavili na
mladih od 30 godina; broj muskaraca starijih od 30 godina. Tabl~ce ko~
gornjoj plohi. Zbog lak.Se preglednosti, u tablicama se ti brojevi grupi-
raju u sku pine od po 4, 5 ili vise brojeva. Danas se takve tablice mogu sa-
tingencije temelj su daljnje statisticke elaboracije, tj. racunanJa > hz-
stavljati i kompjutorski, pa vee i mnoga malena dzepna racunala imaju
kvadrat testa i > koeficijenta kontingencije. K
r
'
208 TABUCE SLUCAJNIH BROJEVA t-DISTRIBUCIJA 209
inogu~nost generiranja slucajnih brojeva. Tablica slucajnih brojeva cita Tau koeficijent rang korelacije Metoda za izracunavanje korelacije
I
se bilo kojim smjerom, bilo kojim redom, vertikalno iii horizontalno, ili medu rangovima. Au tor joj je Kendall, a statisticari smatraju da je tame-
dijagonalno, a neki "pedantni" statisticari preporucuju C:ik da se npr. toda bolja mjera povezanosti medu rangovima nego sto je to >Rho koe-
bacanjem novcica odredi hoce li se zapoceti na lijevoj ili desnoj strani ficijent korelacije. Teze ga je racunati negoRho, ajedan od naCina racu-
tablice, parnom ili neparnom redu ili stupcu, itd. Tablica se najcesce nanja (ima ih vise) jest taj da rangove varijableX poredamo od 1 dalje,
uspjesno koristi kod velicinom dosta ogranicenih populacija (npr. Nod pa ispod toga nanesemo korespondentne rangove varijable Y, i racuna-
nekoliko tisuca i1i manje ), a elementi se u uzorak izabiru tako da se iz mo razlike izmedu svakog ranga i svih ostalih rangova, biljezeCi + 1 ako
tab lice citaju sku pine od po onoliko brojeva od koliko znamenki se sa- je drugi rezultat veCi, a -1 ako je manji. SumirajuCi te jedinice dohiva se
stoji velicina populacije. Na primjer, ako neka tvornica ima 850 radnika, izraz S, koji se uvrstava u formulu za Tau:
od kojih zelimo u uzorak izabrati njih 80, a red koji citamo u tablici, ,1au=
. s
izgleda ovako: 3754 0829 9473 9264 8502 5146 itd, u uzorak ce uci ra- fN(N-1)
dnici: 375,408,299,473 (926 otpadajer ta osoba ne postoji), 485,25, 146
itd. Ako se ponovno dobije broj osobe koja je vee izabrana, taj se broj Ako nema vezanih rangova, znacajnost Tau koeficijenta izvodi se u
prcskoci. Pogrcsno hi hilo pomisliti da bi se dobra tahlica slucajnih bro- 'I konacnom rezultatu iz > z-vrijednosti, dakle iz normalne raspodjele. No
ako su neki rangovi vezani, testiranjc znacajnosti postaje dosta kompli-
jeva mogla dobiti i tako da netko "po slucaju", "kako mu padne na •
ctrano.
pamet" izgovara brojeve izmedu 0 i 9. Istrazivanja pokazuju da gotovo
bez iznimke tako dobiveni "slucajni brojevi" statisticki znacajno odstu- U usporedbi s Rho koeficijentom korelacije, gotovo uvijek je Tau
paju od teoretskih frekvencija (tj. da se svaka znamenka u nekom du- nizi. Njcgovc prednosti pred Rho koeficijcntom su ovc: 1. uz Tau kodi-
• • \J .., • • ••
gom nizu hrojeva pojavljuje u slicnoj frekvenciji), i da se obicno nailazi CIJent maze se racunatl 1 parCIJalna korclacija; 2. Tau koeficijent moze
na znatno vecu frekvenciju nekih brojeva (npr. 3 i 7). P sluziti i za izracunavanje povezanosti izmedu jedne ordinalne (rangira-
ne) varijable, i jedne dihotomne nominalne varijahle; 3. ako se nakon
izracunavanja Tau pojavi koji novi rczultat, nc treba cijcli racun pona-
tablicno prikazivanje podataka Prikazivanje podataka u uredenim ta-
vljati, vee se jednostavnim postupkom preracuna novi izraz Tau. Tau se
blicama u kojima se navode obicno sazeti, sumarni podaci da bi se omo- moze racunati i s vezanim rangovima. Kao i Rho koeficijent korelacije, i
gucio bolji i pregledniji uvid u rezultate i njihove odnose. Tablice moraju Tau koeficijent barata samo razlikama medu rangovima, pa time mogu
imati jasan i razumljiv naslov i objasnjenje stupaca i redova u kojima su nastati izoblicenja stvarnih razlika medu rezultatima, i zato nije preciz-
prikazani rezultati; osobito treba pazljivo razjasniti kratice koje se uta- na mjcra povezanosti. P
. . Yp
blici upotrebljavaju. Obicno su redovi i stupci odijeljenicrtama radi lak-
~ . it f? ~
se i bolje preglednosti prikazanih vrijednosti. Postoji opce pravilo da se V-di~tribucija" Niz ("obitelj") raspodjela > t-odnosa za razlicite velicine
u tahlicama prikazuju samo najvazniji rezultati (izvedene statistickc n za razliCite >
vrijednosti), a izbjegava se prikaz mnostva rezultata koje je tesko konzu- : alna distribuci .a, ali su sin.: od nj~.: to vise SL 1 j.1,;..
mirati i vidjeti neke pravilnosti medu njima. Takve tablice s bruto rezul- "'N ·di · n ecima, dok j e u normalno · u
tatima ili npr. tablice koje prikazuju matrice korelacija, sluze uglavnom 99 74% svih rezultata obuhvaceno u ras onu izmedu -3 i + 3 stan a ·
samo kao dokumentacija ili izvoriste daljnje obrade podataka. K devijacija, kod t-distrihucija tajjc postotak to manJi ·to jc manji uzorak.
210 t-DIS'IRIBUCIJA • I TEORIJA MAUH UZORAKA 211
I
stupnjevi slobode gli ~oris~i-ti standardnu devijaciju populacije, _izracy na_te t-vrijednosti
= 00 I
···-············ = 25
_tvonle bt Jednako normalnu raspodjelu kao sto je tvore i stvarne razlike.
'
- · -·- · - · = 9 medu aritmetickim sredinama uzoraka.
.......... ' = 1 U prilogu se nalazi tablica granicnih t-vrijednosti za razine
znacajnosti 0,05 i 0,01, iz koje se vidi kako se granicna vrijednost t po-
veeava smanjivanjem velicine uzorka. P
-
-4 -3 -2 -1 0 +1 +2 +3 +4
I teorem centralnih granica > poucak centra/nih granica
koji su postavljali matematicarima svog vremena (XVII. st.) razliCite npr. dobro promijesali 20 igraCih karata (pola jedne, a pola druge. boje)
probleme u vezi s ishodima bacanja igracih kocaka, ili sl. ( > osnovni za- pa bi kod pregleda rczultata svaka iduca bila drugc bojc, dobili bismo
koni vjerojatnosti). P maksimalni broj nizova, tj. 20- a to je jednako tako malo vjerojatno kao i
dace se slucajno dogoditi da su karte poredane samo u dva niza (najprije I
test > statisticki testovi sve jedne boje, a onda sve druge boje ). P
test ekvivalentnih parova > Wilcoxonov test ekvivalentnih parova testiranje hipoteze U svom radu istra:livacvrlo eesto ima neku odredenu
hipotezu o rezultatima koje u vezi sa svojim istra:livanjem ocekuje, ili
test homogenog niza (Run test, Wald-Wolfowitzov test) Neparamet- koja mu se namece u vczi s vee dohivenim rezultatima. Tu hipotezu, '
rijski test kojim se testira da lise dva uzorka statisticki znacajno razlikuju kakva god ona hila, treba provjeriti, i taj posao naziva se testiranje hipo- I
u bilo kojem pogledu: u centralnoj tendenciji, u varijabilnosti, sime- teze. Najcesca hipoteza koju istrazivac testirajc > nul-hipoteza, a ona jc
tricnosti itd. Mo:le se upotrebljavati kod rangiranih rezultata, kao i kod najpoznatija kod provjeravanja neke dohivene razlike izmedu dviju arit-
rezultata dobivenih mjerenjem, nakon sto ih rangiramo. Izvodi se tako metickih sredina i obicno glasi: zapravo nema razlike izmedu aritme-
I
da zajedno rangiramo rezultate obje skupine, dajuCi svakom rangu I tickih sredina dviju populacija (tj. obje aritmeticke sredine potjecu iz
oznaku kojoj od skupina pripada, i analiziramo koliko homogenih nizo- iste populacije), a dohivena razlika potpuno je slucajna. Istra:livac maze
va ukupno ima u cijeloj skali rangova, tj. koliko skupina jednako obi- postaviti i > direktivnu hipotezu (npr. "naCi cu statisticki znacajnu razli-
ljezenih rangova ukupno ima. Na primjer, kada bismo 10 ucenika po- ku u korist grupe B"), alii nju valja testirati kao i nul-hipotezu. Neki sta-
ducavali nekoj vjestini jednom posebnom metodom (eksperimentalna tisticari (npr. Fisher) smatraju da svaku hipotezu, kako god ana glasila,
skupina ), a kontrolnih 10 nisu posebno uvjezbavani (kontrolna skupi- mozemo nazvati nul-hipotezom- pa cemo je istrazivanjem ili potvrditi iii
na ), mogli bismo- aka je metoda zaista uspjesna- dobiti ovakav rang ( od I odbaciti. Vazno je da se oprezno formulira kako nul-hipoteza, taka i
I
najboljega prema najslabijemu): alternativna hipoteza, jer bi se inace moglo upasti u pogresan zakljucak.
Na primjer, aka bi netko testirao sposobnost nekog "medija" u po-
EE E EEE/K/EE/K/E/KKKKKKKKK
gadanju Zenerovih karti (to su karte s pet razlicitih znakova ), i kao nul-
a inspekcijom tih nizova vidljivo je da su medu najuspjesnijima uglav- hipotezu postavio tvrdnju: "Ne postoji ekstrasenzorna percepcija", pa
nom ucenici iz eksperimentalne skupine (E), a medu najmanje uspje- kada bi "medij" pogadao statisticki znacajno bolje od onaga sto se oee-
snima oni iz kontrolne skupine (K). Ukupno u ovim rezultatima imamo kuje u Cistom slucaju, onda bi dakako trebalo odbaciti nul-hipotezu, ne
'
I
I
-
216 1EST STUPNJA PODUDARANJA ' TRANSFORMAOJA REZULTATA 217
po negativnoj binomnoj raspodjeli, radi se o slrupini ispitanika koja nije ticno velik, tj. osX iii os Y, ili obje, bile hi preduge (ne hi, recimo, stale na
I
homogena po nekim svojim svojstvima, pa treba pronaCi po cemu su I uobicajenu stranicu A4 fonnata). U takvom slucaju pretvaranje vrijed-
karakteristicni oni s mnogo, kao i oni s malo nesreca. Pojam se odnosi i nosti na jednoj ili na obje osi iz linearne u npr. logaritamslru skalu
opeenito na provjeru stupnja slaganja empirijskih podataka s nekim omogucuje vrlo prikladan i zoran graficki prikaz varijabli o kojima se
modelom. P l radi (vrlo cesto se graficki prikazi u osjetnom podrucju vida i sluha
upravo taka izraduju).
test sume rangova Neparametrijski test za provjeravanje pripadaju 1i (b) U istrazivanju od>1osa izmedu dvije varijable (u eksperimental-
dva uzorka u populaciju s istim medijanom. Taj test u literaturi nasi i nim istrazivanjima to su nezavisna i zavisna varijabla) maze se utvrditi
druga imena (Wilcoxonov T-test, Mann-Whitneyev U-test). Po smislu da je njihov odnos linearan iii nelinearan. Linearni odnos je jednostav-
I'
je slican > medijan testu, ali mu je > snaga veca. Znacajnost dobivenog niji i omogucuje jednostavnu i razumljivu matematiclru deskripciju s po-
I L
rezultata provjerava se iii uz pomocz-vrijednosti normalne distribucije l mocu > jednad.Zbe pravca regresije, &to, opet, omogucuje razumljive i in-
(ako je N svake skupinc harem 8), ili uz pomoc tablica. P I\ terpretabilne usporedbe medu razlicitim eksperimentalnim situacijama
u kojima su mijenjane nezavisne varijable ili drugi eksperimentalni uvje-
r~:~~~OS' (t•Vl"ljedJiostj~~azlomak kod kojega se U brojniku nalazi neka ti. Ako sene dobije linearan odnos medu varijablama, moguce je prikla-
izracunata· vrijednost, a u nazivniku pogreska te vrijednosti; t-odnos dnom transformacijom (najeesce je to pretvaranje u logaritamslru
- r
najpoznatiji je kod testiranja > znacajnosti razlike izmedu dvije aritme- brojcanu skalu, ali se dakako mogu koristiti i druge brojcane skale)
ticke sredine, pa u tom slucaju izraz t glasi: vrijednosti jedne ili obje varijable dobiti linearan odnos, odnosno izra-
razlika II ziti odnos medu varijablama s pomoeu jednadzbe pravca i taka, zapravo, -I'
t= -
pogre~ka razlike pojednostaviti njihov odnos. Primjer takve transformacije u kojoj je I
varijabla Y (ordinata) iz linearne transformirana u logaritamsku ljestvi-
t-oduos, dakle, okazu'e kolikoje puJq_neka razlika veta od svoje pogre-
cu, prikazan je na slici.
ske. Ako je t harem 1,96 (&to znaci da je razlika gotovo 2 puta veca od
svoje pogreske), smatramo (uz rizik od 5%) da je ta razlika statistickj I y loa 11
I 300 3
znaca ·na P < . Sto je uzorak ·· mora biti veCi da hi se
,: : 't
statisticki I
...
tica C.R. (critical ratio), dakle "kriticki odnos" koji pokazuje koliko je I
puta neka vrijednost veca od svoje vlastite pogreske. P
-
I
100
•
•
I
(
I
218 TRANSFORMACIJA REZULTATA
•
I
I
t-TABUCA 219
i
(c) Relativno cesto se koriste transformacije koje omogucuju tzv. I (e) Transformacija > broto rezultata u skalu z-vrijednosti koristi se
normalizaciju distribucije dobivenih rezultata. Ak.o postoji opravdana
u m~ogim -~tatistickim postupcima jer olakSava statisticku i racunsku
pretpostavka da se rezultati mjerenja neke varijable distribuiraju sukla- mampulaciJU rezultatima. K
dno normalnoj distribuciji, au konkretnom slucaju mjerenja nije dobi-
vena normalna distribucija, moze se te rezultate prikladnom transfor-
macijom normalizirati. Transformacija ce ovisiti o konkretnim rezulta·
t-raspodjela > t-distribucija
tim apace u nekom slucaju trebati dobivene vrijednosti mnoziti iii dije- I
liti konstantom, ili koristiti drugi korijen, ili ih kvadrirati iii logaritmirati I trenda, analiza > analiza trenda
itd. Takvi su slucajevi kad su dobivene distribucije asimetricne, a trebale
I
'
bi biti simctricne. Neki statisticari se zalazu za redovitu transformaciju tri~.erijalni koe~cijent k?r~lacije (rtrl) > koeficijent serijalne korelacije
dohivenih rezultata, uz ohrazlozenje da je konkretno mjerenje uvijek koJl se upotrebljava kad Je Jedna varijabla izrazena u tri kategorije kao
i izlozeno razliCitim pogreskama. Osim toga, mjerenje je gotovo uvijek ~P:· "i~podprosjecni", "prosjecni", "iznadprosjecni", a druga variJabla
nesavrseno, tj. redovito su dobiveni rezultati na grubljoj skali nego sto su Je 1zrazena na kontinuiranoj skali. K
prave vrijednosti varijable, paje i zato opravdana njihova transformacija
u vrijednosti koje bi se dohile kad bi mjerenje bilo savrsenije. Primjerice,
T-skala .Jed~a od poznatih skala bazdarenja, a sluzi za interpretaciju i
podaci o spolu rcdovito su dihotomizirani, iako- kako to neki istrazivaci
usporedivanJC rezultata. Bazira se - kao gotovo sve takve skale - na > z-
tvrde- varijabla "spol" nije dihotomna varijabla, vee se takoder norma-
vrijednostima, dakle na odstupanju nekog rezultata od aritmeticke sre-
Inn distribuira. Ako jc tome tako, hilo bi opravdano dobivene dihoto-
miziran~ rczultate transformirati u skalu koja reflektira normalnu dis-
~in~ •. izrazen.~ u ter~inima standardne devijacije. Podijeljenaje na 100
tribuciju i polozaj u toj normalnoj dis tribuciji dobivenih dihotomnih Jedt~I~a •. s VTIJednostl 0 na -5 standardnih devijacija, 50 na aritmetickoj
vrijednosti. Transformacije koje normaliziraju distribuciju potrebne su sredtm, I 100 na +5 standardnih devijacija. Izracunava se po formuli:
na prvom mjestu zbog daljnje statistickc obrade rezultata: mnogi stati-
sticki postupci zahtijevaju normalno distribuirane podatke. Tako, prim- T bodovi = 10z +50
jerice, koeficijent korelacije moze biti znatno iskrivljen ako rezultati
- nisu normalno (tocnijc rceeno: simetricno) distribuirani. Npr. ako prosjek iznosi 95, a standardna devijacija 15, rezultat od 142
ima 10(142-95)/15 + 50 = 81,33 T-bodova. T-skala prakticna je stoga sto
Razumljivo je da se transformacije mogu koristiti kad se radi i o
drugim, nenormalnim distribucijama, analogno transformacijama kod mozemo ispravno i "posteno".vrednovati i rezultate, koji se- iako su do-
normalne distribucije. sta rijetki- nalaze izvan +3 i -3 standardne devijacije. p
r
220 t-1EST
•
t-test Jedan od najpoznatijih statistickih postupaka. Odnosi se na testi-
ranjc statisticke znacajnosti razlike izmedu dvije aritmeticke sredi~e.
Sastoji se u tome da se dobivena razlika izmedu obje aritmeticke sredme
podijeli standardnom pogreskom te razlike: razlika I standardna pogr~ f
ska razlike. Ima is to znacenje kao i > t-odnos. (Vidi sve pojmove u vez1 s
> t-distribucijom.) P
I
II
lI
I
I
U-distrihucija Takva distrihucija koja doneklc nalikujc na vcliko slovo
I
U, u kojoj najmanje rezultata postoji u sredini raspona izmedu najma-
njih i najvecih rezultata, a najvise rezultata nalazi se na krajevima distri-
I
I bucijc. Nckc pojavc karaktcristicnu sc distrihuiraju na nacin koji odgo-
I •
I
•
_vara U-distrihuciji: Ollf. stavovi, (vee po svojoj definiciji, da je to "pri-
pravnost pozitivnog iii ncgativnog;:eagiranja na nrcdmctc iii situaci~
daju U-distribuciju, jer obicno nalazimo najmanji broj ispitanika
nemaju stav prema necemu, te su podijeljeni u one s pozitivnim i ones
-
ncgativnim stavom. Distribucija nckih talcnata takodcr cesto nal' j.c.
-
na U-distribuciju: najvise l'udi ili ·ma·u ili nema·u t· . · je (sto
_ se opaza i kod sko~kih ocjena iz takvih 2remet'!,;_ relativno j malo
ucenika sa srednjom ocjenom, dok ih je dosta s losom ili dobrom ocje-
nom). P
\
'
' univarijatna analiza Statisticka analiza rezultata dobivenih mjerenjem
iii opazanjcm samo jcdnc varijahle. K
I
I
I
' II
•
I UZORAK 223
222 USPOREDIVANJE U PAROVIMA I
ku" sad a j~ promijcnjena i iznosi 3/51 = 1/17, dakle sada je manja nego
usporedivanje u parovima Jedna od najjednostavnijih, aujedno i naj- I
I
kod prvo.g tzvlacenja. Ili, ako vjerojatnost neke bolesti u populaciji iznosi
pouzdanijih tehnika rangiranja nekoliko elemenata. Sastoji se u tome I'
I o~re~em postotak, a postoji nekoliko simptoma koji su uz odredenu
'I da se stvore svi moguCi parovi od ukupnog broja elemenata koje tre_ba
rangirati, pa ocjenitelj u svakom paru oznaCi onoga koji je bolji (ljepsi,,
\
I
'
'
I
~eroJatnost .zna~ovi te bolesti, pa kod neke osobe nademo jedan od
' stmptoma: VJer~Jatno~t da ta osoba ima tu bolest sada se promijenila,
visi, ukusniji ... i tome slicno) od drugog clana para. Na primjer, kada bi
on~_post~Je nesto :~ca nego u ukupnoj populaciji. Uvjetnom verojat-
trebalo tom metodom rangirati petero ljudi, onda su svi moguCi parovi
•
nos~u poceo se bavth Bayes prije oko dva i pol stoljeea, kada je postavio
ovt: SVOJ > Bayesov princip. P
1-2 2-3 3-4 4-5 I
I
I 1-3 2-4 3-5
~~~rak ~~orakje dio populacije koji po svim za mjerenje odredene ve-
I
1-4 2-5 _It.~me vazmm svojs~ma, osim po broju elemenata, reprezentira popula-
1-5 I ClJU. Dakle, u~orakj~ ograniceni. broj clanova neke populacije, izabran
N(N-1) I
Broj parova dobiva se jednostavnom formulom . Na temelju I sa ~:r~om ~a sto bolJe reprezenttra populaciju iz koje je izabran. op_u-
2 I
I
I lactJU J~ ~atme. veCinom nemo~uee, iii veoma tesko ili skupo izmjeriti, pa
dobivenih rezultata izradi se "tablica preferencija" koja pokazuje rang I
I
I
se k?:.t shmo ttme da_iz nj~ uzip1amo :u~o.rk.e 1 i iz njih zakljucujemo na
svakog procijenjenog elementa. Velika prednost usporedivanja u paro- stanJe u populaciji. U najveeem broju slucajeva populaciju ee najbolje
vima sastoji se u tome da se upotrebom te metode maze kontrolirati : predstaYlja ., slul.ajn.Luzorq_k, ali pod uvjetom da je dovoljno velik.
I pouzdanost samog procjenjivaca: nepouzdani i nesigurni ocjenjivaci I
Aka uzorak nije velik (a o > velicini uzorka odlucujemo na osnovi neko-
I
upadaju u pogreske (tzv. > cirkulame trijade) koje se u tablici preferen- '''
liko kriter:ja), treba njegovu reprezentativnost osiguravati na razne
cija oCituju taka sto poneki elementi procjene dobivaju isti rang. p nacine. Taka, na primjer, ako populacija sad!Zi nekoliko razlicitih "slo-
I je~~, ("stratuma"), u uzorak treba izabrati onaj postotak svakcg "sloja"
"utjecanje" na slucajne dogadaje Poznata pojava, cak i kod onih ljudi i koJl odgovara stanju u populaciji. Postoji veCi broj razlicitih vrsta uzo-
koji dobra poznaju pojmove "slucaj" i "vjerojatnost", a koja se sastoji u
ra~a koji se koriste u prakticnim terenskim istrazivanjima, i kojima nas-
tome da se katkada ponasamo taka kao da mozemo utjecati na neki I tOJtmo ustanoviti karakteristike populacije. Dva osnovna uyjeta da uzo-
r -' slucajni dogadaj. Npr. skloni smo unaprijed se kladiti na neki ishod kod I r~k bud~ .rep.r~zentativan za populaciju jesu: 1. on mora biti nepristran,
l, bacanja kocke, a nismo se skloni kladiti kad je kocka vee bacena, a jos ne I
!.1· ne smiJ.e bttl pod utjecajem razlicitih sistematskib .faktr;n:a (>pristrani
znamo rezultat; ili, :klima li baciti kockom brojku 1, to radimo znatno '
uzorak), 1 2.uzorak mora biti dovoljQ.o velik za svr u z ko·u nam 'e
"njeznije" i sporijim pokretima nego ako zelimo baciti brojku 6 (>sub- I Eotreba1,1 (> veliCina uzorka). Iako se cesto maze u praksi cuti zahtjev da
jektivna vjerojatnost, > "sazrijevq.nje sanse"). p
II
uzorak po svojoj velicini mora biti barem odredeni postotak populacije
(npr. 5 ili 1,0%)...taj je zahtjev pogresanjer preciznost uzorka (pod pret-
uvjetna vjerojatnost Vjerojatnost da ee se neka pojava dogoditi pod
posta~kom da n~je p~istr.a?).ovisi gotovo u potpunosti o njegovoj apso-
uvjetom da se neka druga vee dogodila. Na primjer, ako smo iz "spila"
lutnoJ, a ne relattvnoJ vehctm: uz lici~ 50 bit ce rakticki jednako
od 52 igraee karte zeljeli izvuCijednu "desetku" (a vjerojatnost da eemo
!eptezentativan za populaciju velicineN = 1000, kao i za populaciju ad
u tome uspjeti iznosi 4/52 = 1/13), pa se to dogodilo, a izvucenu kartu
nismo vratili medu ostale, vjerojatnost da eemo ponovno izvuCi "deset-
I N - 1.00-.000 A nekoliko puta veCi uzor~ bit ee u oba slucaja bolji
r
-- -
•
' I <' ' <' < < ' --~·--·
~ -- - - - - - - - - - -
'
1: 1 I' .I : ' I h'l' :I' I' ·II :,I : .' . I . 'II
·! •••
'"'' I I I ' tl
r
"
'
224 UZORAK UZORKOVANJE NA TEMEUU POZNATE VJEROJATNOSTI 225
I
reprezentant popuiacije, \iii i opet prakticki jednako boiji za popuiaciju uzorkovanje Proces iii operacija odabiranja jedinica (statistickih jedi-
od 1000, kao i za popuiaci·u od 100.000. Najcesce vrste uzoraka koje se nica: ispitanika, stvari, pojava itd.) iz popuiacije u uzorak. Ako nije
--c...._
drugacije specificirano, obicno se podrazumijeva da se radio siucajnom
koriste u istrazivanjima jesu ove: > slucajni uzorak, > sistematski uzo-
odabiranju (svaka jedinica ima jednaku vjerojatnost odabira i odabir
rak, > stratificirani uzorak, > prigodni uzorak, > klaster uzorak, > kvotni
svake jedinice neovisan jc o odabiru bilo koje druge jedinice) (> s/ucaj-
uzorak. Gotovo svi statisticki zakoni u > inferencijalnoj statistici vrijedc
samo ako uzorak dobro reprezentira populaciju iz koje je izvaden, a ni uzorak). K
najboiji reprezentant populacije je slucajni uzorak. P
uzorkovanje na temelju poznate vjerojatnosti (engl. probability sam-
pling) U nasem jeziku katkada se javlja izraz "vjerojatan uzorak", sto je
uzorci "uz povrat" Slucajni uzorci j~dnake velicinc kod kojih se, nakon netocno jer probability sampling oznacuje proces uzorkovanja u kojemu
I
sto se izvuce svaki pojedini rezultat, taj rezultat vrati u populaciju, iz ko- i
su jeclinice (statisticke jedinice: ispitanici, predmeti, dogadaji itd.) oda-
je se nakon toga vadi novi rezultat koji se takodervraca itd., svc do zelje- biranc u skladu s nckom poznatom strukturom vjerojatnosti u popula-
ne velicine uzorka. Prema teoretskim matematickim pravilima, p~ema ciji. Tzv. slucajno uzorkovanje (ciji je rezultat > slucajni uzorak) speci-
kojima su stvoreni svi zakoni u vezi s uzorcima, uzimanje uzoraka treba •' jaini je slucaj uzorkovanja na temelju poznate vjerojatnosti, u kojemu
obavljati "uz povrat". Tako npr. ako se populacija sastoji od samo ova struktura vjerojatnosti specificira da sve jedinice (populacije) imaju jed-
cetiri rezuitata: 2, 10, 4, 8, onda su svi moguci uzorci velicineN = 2 ovi: 2 naku vjerojatnost izbora u uzorak. K
- 2; 2 -10; 2- 4; 2- 8; 10- 2; 10 -10; 10 -4; 10- 8; 4- 2; 4 -10; 4- 4; 4- 8; 8- 2; 8
- 10; 8-4 i 8- 8. Iz tako dobivenih uzoraka moze se dok.azati: 1. da arit-
meticka sredina svih moguCih uzoraka iste veliCine odgovara "pravoj"
aritmetickoj sredini populacije; 2. da je varijanca populacije aritme-
tickih sredina uzoraka jednaka varijanci originalne populacije, podije- I
I
VARIJABLA 227
sionalnih). Podrazumijeva sedate pojave iii osobine mogu poprimiti
razlicite velicine (otud i takav termin), spontano iii pod utjecajem nekih
drugih pojava ili osobina.
Suprotno znacenje pojmu varijable ima pojam konstante - to je,
dakle, nesto sto sene mijenja, sto ima stalno jednaku velicinu, jednaku
(istu) vrijednost. No, konstantu treba smatrati samo posebnim slucajem
pojma varijable.
Iako se pojam varijable na prvom mjestu odnosi na k.vantitativne
promjene neke definiranc pojave i1i osobine, ipak jc uobicajcno razliko-
vati tiv. k.valitativne varijable. To su one varijable koje takoder variraju,
mogu poprimiti razlicite vrijednosti, ali ne k.vantitativne nego k.valita-
tivnc. Zato sc, kad jc rijcc o tim varijablama, katkada govori o kategori-
jama iii atributima varijable. Takve varijable se u psihologiji, sociologiji,
"vagana" aritmeticka sredina Ne sasvim tocan naziv za > ponderiranu medicini i slicnim znanostima relativno cesto susrecu. Kao primjer ta-
aritmeticku sredinu. Naziv jc nastao nesprctnim prijcvodom cngleskog kvih varijabli mozemo spomenuti spol (varira u kvalitativnim kategori-
jama musko - zensko), nacionalnost (engleska, francuska, spanjolska,
izraza "weighted"' sto dod use znaci "vagan"' ali znaCi i "otezan"' pa u
hrvatska itd.), konfesijsko opredjeljenje (katolik, protestant, musliman
sklopu "weighted average" znaCi "ote:lanu" aritmeticku sredinu, tj. za-
itd.), zanimanje (psiholog, pravnik, elektroinzenjer, lijecnik itd.), nao-
jednicku aritmcticku srcdinu iz nekoliko aritmetickih srcdina, pri cemu
brazba (bez skole, osnovna skola, srednja skola, visa skola, fakultet) itd.
vecu tdinu u konacnom rczultatu imaju aritmctickc srcdinc dobivcnc iz Upotreba takvih varijabli omogucujc samo klasifikaciju statistickihjedi-
veeeg broja mjerenja. p nica u pojedine kategorije v;gijable, sto takoder odgovara definiciji >
mjeren}ai to na ~ n~minain~j skali. Na taj naCin dobiveni podaci naziva-
· varijabla ( od francuske rijeCi variable, koja je latinskog porijekla, a znaCi ju se > brojeni podaci.
nesto sto se mijenja, sto je promjenljivo i sl.; u hrvatskomjeziku katkada Kategorije ili atributi kvalitativnih kategorija moraju biti jasno i
se upotrebljava i rijecpromjen/jivica) Nesta sto se mijenja, sto maze po- jednoznacno definirani taka da jedna statisticka jedinica moze pripadati
primiti razliCite vrijednosti. U matematici se upotrebljavaza promjcnlji- samo jednoj kategoriji.
vu veliCinu za koju se pretpostavlja da predstavlja konzistentnu, jedno- Varijable cije se variranje moze izraziti kvantitativno, sustavom
znacnu pojavu koja se, medutim, ne specificira, ostaje apstraktnom. U brojeva, katkada se, da bi bilo jasno o cemu se radi, nazivaju kvantitativ-
tom smislu upotrebljava se i u statistici kad se radio opcoj razini kao sto nim varijablama, > Kontinuirana varijab/a; > diskontinuirana varijab/a.
su statisticki modeli ili izvodi statistickih formula. No, buduCi da su u U statistici se cesto koristi termin > s/ucajna varijabla.
upotrebnoj statistici predmet manipulacije rezultati (brojcane vrijed- Pojam varijable, kako se koristi u statistici, nije identican pojmu
nosti), pojam varijabla odnosi se na osobine ili svojstva stvari, pojava ili varijable unutar nekog znanstvenog ili strucnog podrucja, jer se tu vari-
osoba, koje je na temelju operativne definicije moguceopazati ili/i mje- jable uvijek definiraju u konkretnim sadr:Zajnim terminima pojava i
riti i koje predstavljaju prihvatljivo prepoznatljiv, jasan i jednoznacan osobina koje se odnose na predmet odredene znanosti iii profesije. Ne-
entitet u nekom podrucju ljudskih aktivnosti (istrazivackih kao i profe- sta tocnije receno, u statistici varijabla se definira vise formalno, apstra-
•
' ..
I
228 VARIJABLA (J ,L VISEMODALNA DISTRIBUCIJA 229
ktno, a u znanstvenom i profesionalnom podrucju saddajno. Aka su (ier pogreska aritmeticke sredine opada proporcionalno drugim korije-
formalni uvjeti zadovoljeni, statistiku sene tice sadrzaj varijable, ali obje nom velicine uzorka: dva puta manja pogreska dobiva se iz eetiri puta
'
definicije moraju biti kompatibilne pri primjeni statistike u nekom I veeeg uzorka ). '
I
!
znanstvenom ili strucnom podrucju. K I U vezi s drugim uvjetom (b) primjer je ovaj: za ustanovljivanje
I
na k.vadriranih razlika izmedu svakog pojedinog rezultata i aritmeticke I' tura veoma malo varira; > koeficijent varijabilnosti tjelesne temperature
I
a izra~i poka'zatelj_~arijabiliteta 're~tata.
-..;:.,.., ..:.·....!li-..,;',J.., ,.;_.,_ ... ,._..~-· -
>£!!a.:.f I
I
I
je ispod 0,1 %. No za ustanovljivanje prosjecne te:Zine odraslih gradana
. > analiza varijance, > F-omjer). K Zagreb a uzorak mora hiti znatno veci, jer tczina Ijudi varira znatno vise,
'"'""' ,..,._._ tj. koeficijent varijabiliteta iznosi preko 10%.
'
varijanca, prava > ''prava "aritmeticka sredina (i ''prava "standardna de- I
U vezi s uvjetom (c) primjer je ovaj: kada bi neki lijecnik :Zelia testi-
vijacija) rati uspjesnost neke nove vakcine protiv poliomielitisa, trebao bi uzeti
v I vrlo velik broj djece u eksperimentalnu i u kontrolnu skupinu (maZda
velicina :.zorka Sto · uzorak "" ~· J caki po nekoliko tisuca),jerkodmanjeguzorka (npr.100djece usvakoj
•
•
tativan a ne > pristran ), ('"on bolje reprezentira o ulaciju izkoje je I skupini) najvjerojatnije ce se dogoditi da nijedno dijete u eksperimen-
.
I
_izvaden · to bez obzira na velicinu po ula_9je~ uzorak velicine 100 I
talnoj i kontrolnoj skupini ne oboli od te bolesti. P
'''
uglavnom ce jednako dobra reprezentirati neku populaciju velicine
N..=_1000, kao i nekoliko-desetaka puta ve6u populaciju. Pozeljna velici-
- na uzorka ovisi o nekolikoiaktoraj to je razlog zasto statisticarvecinom
I
vezani rangovi Zajednicki iii prosjecni rangovi sto ih zauzimaju dva iii
-
ne maze odmah zainteresiranom pojedincu odgovoriti na pitanje kako
I vise jednakih rezultata. Zajednicki se rang dobiva taka da se zbroje
rangovi sto bi ih ti identicni rezultati imali kada ne hi hili identicni, i zhroj
velik uzorak da uzme za svoje istrazivanje. Io_su ovi faktori: ) se podijeli brojem "vezanih" rangova. Na primjer, aka su 7., 8., 9. i 10. re-
I'
a. zetjen.a preciznrut ctataka: sto veca reciznQstnaru je potreb- zultat identicni, ani ee dobiti zajednicki "vezani" rang, koji ce biti:
I!!!J.o..j notreban veCi uzo.r.ak.
-
b. _v~rijabilP!JSt poj~ve koju mjerimo: sto je_p_Qjaya ya(ij.abilnij..l.l, 7+8+9+10 = 8,5
. .
ako to proizvodac smatra nedovoljno preciznim, i zeli pogresku smanjiti visemodalna distribucija Distribucija rezultata s veCim brojem vrhova,
na polovicu (tj. na raspon od 2 em), onda treba uzeti 4 puta veci uzorak tj. s vise modalnih (dominantnih) vrijednosti, vrijednosti koje imaju
'I
I
I
•
I
I
230 VISEMODALNA DISTRIBUCIJA
(Iat.probabilitas), a krece se odO (nula) do l.P = 0 znaCi dane postoji ni- I'
se predznak "+" ili "-", vee prema tome u kojem je smjeru razlika. Ako
. kakva vjerojatnost za neki dogadaj (npr. da covjek vlastitim snagama I
I
se radi o razlikama do kojih je doslo slucajno, sume pozitivnih i negativ-
skoCi uvis 100m), P = 1 znaci da je nesto potpuno sigurno (npr. da svaki nih razlika trebale bi biti slicne. Ako nisu, tablicama, ili uz pomocz-vrije-
covjek mora umrijcti). U eksperimcntalnom radu najce!iee se koriste dnosti odreduje se moze li se razlika smatrati statisticki znacajnom.
vjerojatnosti 1/20 = 5% (0,05), iii 1/100 = 1 % (0,01), ito kod usvajanja Wilcoxonov test jace je "snage" od > testa predznaka, jer uzima u obzir
'I'
razlicitih > razina znacajnosti u obradi rezultata. Pri tome, znacenje tih ! velicinu razlike. Po svojoj efikasnosti gotovo je ravan parametrijskom
vjerojatnosti je ovo (u primjeru s tcstiranjem statisticke znacajnosti testu > metode diferencije. Kao i test predznaka, Wilcoxonov test moze
neke razlike izmedu dvije vrijednosti): ako zapravo (u populacijama) se koristiti i za testiranje jednog uzorka (npr. pri provjeravanju da lime-
nema razlike izmedu tih dviju vrijednosti, onda bi se razlika koju je is-
;
dijan neke simetricne distribucije odgovara nekoj specificnoj vrijed-
I nosti). P
trazivac dohio, mogla slucajno pojaviti samo jcdanput u 20 pokusa (P < I
0,05), ilijedanput u 100 pokusa (P < 0,01). P I
·- I
I
' Wilcoxonov T -test > test sume rangova
vjerojatnosti, teorija > teorija vjerojatnosti W koeficijent korelacije (koeficijent konkordancije) Kendall je razradio
metodu za izracunavanje stupnja slaganja izmcdu nekoliko rangova i
nazvao je koeficijentom konkordancije W. Logika racuna je veoma je-
I
. --. .
r
'
232 W KOEFICIJENT KORELACIJE \
!
'
'
I 'I
i'
'
I
l
'
'
i
I
I
I I
I
I I
'
I I
I
I
I
'
I
I
•
I ,
i
I
I
II
i
I
I
'
Yatesova korekcija Korektura koja se obavlja kod 2 x 2 hi-kvadrat zajednicka aritmeticka sredina > ponderirana aritmeticka sredina
tahlica, osim ako su frekvencije dosta vclikc. Sastoji se u tome da se do-
bivene razlike izmedu opazenih i ocekivanih frekvencij l smanje·za 0,1, i zajednicka vjerojatnost Vjerojatnost nekog zajednickog ishoda koji je
kk nakon toga provodi izracunavanjc. Yatcsova korekcija naziva sc i posljcdica kombiniranja vise vjcrojatnosti: ishod sume 12 kod bacanj a
t~k2re.kcij~,za kontinui~t", jer se hi-kvadrat test (koji predstavlja konti- dvije igrace kocke ima zajednicku vjerojatnost 1/6 x 1/6 = 1/36; ishod ave
- .• ~,i.....-J.IJt'j ••. ,,.. '.>...
"~ ---
nuiranu distdbuciju) koristi za procjenu distribucije > diskretne vari- kombinacije: "pismo" na novcicu, brojka 1 na igraeoj kocki, i broj 7 na
jable. Danas seta korekcija primjenjuje u manjoj mjeri nego prije, jer ruletu (koji ima 36 brojeva + 0), iznosi: 1/2 x 1/6 x 1/37 = 0,0022 ( dakle to
cini se da nije toliko korisna koliko se mislilo. '
bi se u prosjeku dogodilo nesto vise od 2 puta na 1000 pokusaja). p
oko 4 do 5 puta na 1000 pokusaja. P ma kratkih rad10valava u funkciji kalicine suncanih pjega).
U nekim slucajevima misljenje o tome sta predstavlja nezavisnu a
zakrivljena korelacija Takva povezanost izmedu dvije iii vise varijabli ' s~~ zavisnu v~rijablu ovisi o hipotezi koju pri istrazivanju relimo provje-
koja nije lineama, vee zakrivljena, tj. > crta regresije nije pravac. Postoje ~Jtt: ~~? npr. Jstrazujema pavezanost izmedu mladenacke delinkvencije
dvije glavne vrste zakrivljene povezanasti: ana u kajaj zakrivljenast pa- ~ kohcm~ gledanja nasilnickih televizijskih iii filmskih programa, pa
staji, ali crta regresije ne mijenja smjer (npr. adnas izmedu broja pa- 1~amo htpatezu da gledanje takvih program a manje ili vise uzrokuje de-
I•
navljanja neke vjeStine i radnog uspjeha u toj vjestini: u pocetkuje na- •
'
.hn~entno P<.masanj~, ~nda delinkventno ponasanje predstavlja zavisnu
predak brz, a kasnije sve spariji; u grafickam prikazu dobije se > krivulja van}a~:u: Ali ako mtshmo da "delinkventna licnost" tezi promatranju
~astlm_ckih pr~~ama, onda frekvencija gledanja tih programa predstav-
negativne akce/eracije), i ana u kajaj zakrivljenast mijenja smjer, tj. crta
lJa zav1snu vanJablu, dokje provjera stupnja delinkventnosti nezavisna
regresije ima oblik abrnutag slova U (npr. adnas izmedu d?bi i rezultata
I
I
varijabla.
•
II
)
i
I
I
I
238 ZAVISNA VARIJABLA ZLOUPOTREBASTATISTIKE 239
Zavisnom varijablom naziva se i ona vrijednost koju mozemo cije iz neke izricito asimetricne iii potpuno pravokutne distribucije ), a
predvidjeti iz vrijednosti neke druge varijable: npr. opseg kruga moze se kao primjer za drugo je kauzalna interpretacija neke postojece korela-
potpuno tocno predvidjeti iz podataka o velicini polumjera kruga. I cije, a da pri tome nacrt eksperimenta nije bio takav da bi dopustao
ovdjc, dakako, mozemo odnos okrenuti pa polumjer smatrati zavisnom,
II
I
I zakljuCivanje na uzrocnu vezu (npr. tvrdnja da korelacija izmedu visine
a opseg kruga nezavisnom varijablom. P
inteligencije i razine skolovanosti dokazuje da skolovanost razvija inte-
ligenciju). Jedan ad najpoznatijih primjera pogresne upotrebe stati-
zavisni uzorak Drugi izraz za uzorke u korelaciji ito uvijek kada nam
sticke metode (kojaje posljedica nedovoljnog znanja) jest povijest kori-
ista skupina ispitanika slu:Z.i kao eksperimentalna i kao kontrolna skupi-
stenja hi-kvadrat testa. Svojedobno je jedan statisticar provjerio sve do
na, odnosno kad se istovrsno mjerenje ponavlja na istim ispitanicima.
njegova doba objavljene istrazivacke radove jedne skupine casopisa u
Na primjer, aka na nekom uzorku ispitamo prosjecno vrijeme reagira-
nja svakog pojedinca u trijeznom stanju, a nakon toga pod utjecajem kojima je koristen hi-kvacL:at test, te je nasao veoma velik postotak ra-
alkohola, pa nas zanima je li dohivcna razlika u vrcmenu rcakcije > sta- dova s pogresnom primjenom: najcesce se radilo o tome da su umjesto
tisticki znacajna, imamo najcisCi oblik zavisnih uzoraka. Ako zbog ra- frekvencija u racun uzimani mjereni rezultati, ili pak o tome da su
zlicitih razloga nije moguce iste ispitanike koristiti kao kontrolnu skupi- umjesto realnih frekvencija u racun uzimane postotne frekvencije (sto
nu (npr. zato sto bi samo ponavljanje mjerenja dovelo do promjene re- potpuno mijenja rezultat, jer seN time svodi na 100). No, dakako, ima i
zultata ), onda mozemo za svakog ispitanika pronaCi njegov "par", tj. is- namjernih zloupotreba statistike, koje se koriste da bi se toboze
pitanika sa sto slicnijim onim karakteristikama koje bi mogle imati utje- "znanstvenim metodama" dokazala neka pojava: one mogu biti na pla-
caja na zavisnu varijahlu (npr. starost, spol, obrazovni status, sociocko- nu dcskriptivnc statistikc, kao sto su npr. neki oblici grafickog prikaziva-
nomski status itd.), pa u tom slucaju opet imamo priblizno zavisnc uzor- nja koji izazivaju drugaciji dojam od onoga koji proizlazi iz cistih cinje-
ke. Zbog toga se takvi pokusi cesto izvode na jednojajcanim, tj. "iden- ' nica: npr. ako se zeli umanjiti dojam nekog povecanja gubitaka (npr.
lI
ticnim" blizancima. U slucaju rada na zavisnim uzorcima koriste se po- povecanja inflacije), usporedivanjem dvaju razdoblja u trodimenzional-
nes to izmijenjeni statisticki postupci provjeravanja znacajnosti razlika nim crtezima 100-postotno povecanje neke vrijednosti nece graficki da-
medu njima, tj. u statistickim formulama mora se uzeti velicina korela- vati taj dojam (kocka dvostrukog volumena ne daje dojam dvostruko
r
cije koja postoji medu rezultatima mjerenja dobivenim u dva navrata (> vece kocke!). Takoder, zeli lise uvecati dojam o nekoj promjeni, rezul-
standardna pogreska razlik<! izmedu dvije aritmeticke sredine, > metoda tati sc prikazu u koordinatnom sustavu komc jc onlinata temcljito
diferencije). P skracena (tj. ne pocinje ad nule, ana to nije u crte:Z.u upozoreno!), pa i
male promjene u mjerenoj pojavi mogu- uz povecanu skalu vrijednosti-
zloupotreba statistike Kao sto se dogada is ostalim znanjima i vje8ti- !' stvoriti dojam da su velike. Jednako tako zloupotrebe mogu biti i na
nama, i statistika se moze zloupotrijebiti. Najeesce zloupotrebe statisti-
planu inferencijalne statistike (npr. namjerno tumacenje korelacijske
ke nisu namjerne, tj. one su posljedica nedovoljnog (ili nikakvog) sta-
veze kao dokaz za uzro~nu vezu ). RazliCite operacije s postocima cest su
tistickog znanja, ili posljedica neprimjerenog zakljucka iz dobivenih re-
primjer proizvoljnog i namjernog iskrivljavanja cinjenica u svrhu zava-
zultata. Kao primjer za prvi slucaj mozemo navesti obavijesti o pojefti- '
•
njenju neke robe za 150%, upotrebu nekog statistickog postupka koji za ravanja a nih kojima je informacija namijenjena. U podrucjupropagande
konkretnu situaciju ne dolazi u obzir (npr. racunanjc standardne dcvija- takvc su zloupotrehc mozda i najcdee. P
-----------------~----
'
I
240 ZNACAJNOST KOEFICIJENATA KORELACIJE I
I z- VRIJEDNOSTI 241
I
znacajnost koeficijenta korelacije Kao i sve druge izracunate statisticke I z-vrijednosti (standardne vrijednost! Oznacuju olozaj pojedinog re-
'
vrijednosti, tako sui korelacije vrlo rijetko izracunate na cijeloj > popu- I -
zultata u nekoj normalnoj raspodjeli, ito tako da seta vrijednost izrazi u
laciji, nego su dobivene na > uzorcima. To znaci da dobivene vrijedno- I
/ I dijelovima standardne devijacije; npr. ako aritmeticka sredina neke nor-
sti nisu "prave" vrijednosti, nego njihove "procjene" (> standardna po- -
I
I maine raspodjele iznosi 100, a standardna devijacija 10, onda rezultat
gre5ka). Stoga uzvecinu statistickih vrijednosti izracunavamo i pogresku
koja se uz tu vrijednost vezuje. Kod r koeficijenta korelacije iii nekih velicine 110, buduCi da pada tocno na 1 standardnu devijaciju iznad
I prosjeka, ima z-vrijednost + 1, rezultat 85 ima z-vrijednost -1,5 itd.
drugih koeficijenata korelacije (> Rho, > Tau, > multipla korelacija,
I itd.) pogreska se maze izracunati pomocu adekvatnih formula, ali j~ '' z-vrijednost se dakle izracunava po formuli:
I
cesto jednostavnije upotrijebiti tablice koje su izradene za neke koeft- I X-M
cijente korelacije. Iz tablice mozemo - vodeCi racuna o broju parova - I z=---
s
odmah odcitati kolik() mora najmanje iznositi neki koeficijent korela- I
cije da bismo ga mogli smatrati "statisticki znacajnim". Dakako i ovdje,
I pri cemu X znaCi pojedini rezultat, M aritmeticku sredinu, a s stan-
I dardnu devijaciju.
kao i kod svih drugih statistickih vrijednosti kod kojih izracunavamo I
jesu li "statisticki znacajne", zakljueak u velikoj mjeri ovisi o velicini z-vrijednostijcdan su od naj oznatijih naCina > baidarenja nckog
uzorka: i vrlo mala korelacija (npr. 0,05) moze biti "statisticki znacajna" testa. Buduci da se one krecu od -3 do +~_(s aritmetickom sredinom ,
ako je dobivena na vrlo velikom uzorku. Takvu korelaciju interpreti- katkada se, zbog prakticnosti, z-vrijednostima dodaje broj 5, pa se do-
ramo ovako: prakticki smo sigurni da ona nije slucajna, nego da postoji u biva skala od 2 do 8, s prosjekom 5, i u tom slucaju te se vrijednosti nazi-
populaciji, ali je toliko niska da nije gotovo ni od kakve prakticne vaju standardnim vrijednostima. Iz tablica z-vrijednosti moze se odcitati
v •
vaznosti.
I Najeesee se znacajnost > r koeficijenta korelacije, > Rho koefi-
koliki se dio povrsine normalne raspod'ele nalazi iznad iii isood nfu
z-vrijednosti; npr, ako u nekom testu koji daje normalnu raspodjelu s
cijenta korelacije i njima slicnih koeficijenata odreduje po formuli aritmetickom sredinom 50 i standardnom devijacijom 6, neki ispitanik
N-2
postigne 44 boda, to znaci da u skupini ima oko 84% ispitanika koji su
I
t= bolji od njega, a oko Hi% onih koji su slabiji. Tahlica z-vrijcdnosti i
1-r 2 •
I povrsina normalne krivuljc nalazi se u Dodatku A.
Umjestormoze biti p (rho) iii neki drugi koeficijent. U > t-tablici,
uz N-2 stupnja slobode (i odabranu razinu rizika), moze se utvrditi je li _Uz pomoc z-vrij~dnosti i slicnih vriiednosti koje se osnivaju na
I dobivena vrijednost t manja, jednaka iii veca od granicne u tablici ~tandardnoj devijaciji (> skale baidarenja, interpretacije c usporedivanja
•I
(tablica u Dodatku B). Kod koeficijenata korelacije koji se racunaju s rezultata), mogu sc ispravno usporediyati rczultati sto su ih i m ·1
pomocu > hi-kvadrat testa, znacajnost koeficijenta pokazuje x?: ako je I
I postigli u dva ih VISe testova; n r. kada bi tri testa imali ove ros ·eke i
standardne devijacije:
on znacajan, znacajan je i koeficijent korelacije. P,K
I
I
242 z-VRIJEDNOSTI I
I
a tri ispitanika postignu ove rezultate: I
lspitanik Test 1 Test 2 Test 3 Ukupno
A 50 112 10 172 Koristena literatura
B 65 88 12 165
c 46 100 15 161
•
Skolska knjiga.
A 0 +1 -2 -1
Castle, W.M., and North, P.M. Statistics in small doses. Edinburgh:
B +1,5 -1 0 +0,5 I Churchill Livingstone.
I
c -0 4
'
0 +3 +2,6 Chow, S.L. (1996). Statistical significance. London: SAGE Publications
Cohen, L, and ~olliday, M. (1979). Statistics for education. London:
pa vidimo da je po ukupnom rezultatu ispitanik C znatno najbolji, a ispi- Harper and Row.
tanik A najlosiji. I Cohen, S.S. (1988). Practical statistics. London: Edward Arnold.
Jos veca korist od z-vrijednosti vidi se u situacijama kada uo12ce I Corsini, R.J. (Ed.) (1994).Encyclopedia of Psychology. New York: John
.l nismo u mo 'UCllQ.sti da zhrajamo "sirovc" (hruto) postignute poene ili
ho · ckog_I2Qicdi~ca, jcrsc ra(h o posvc razlicitim podrucjima. Na
Wiley and Sons.
DuBois. P.H. (1965). An introduction to psychological statistics. New
- primjcr, u nckom pctoboju odrcdcni ispitanik u svakoj od 5 atlctskih dis-
York: Harper ::m d Row, Publ.
ciplina postigne rczultat koji se po vrsti razlikuje od drugih rezultata
(treanje 100m izrazeno je u sekundama, bacanje koplja u metrima, skok Dunn, O.J. (1964). Statistics. New York: John Wiley and Sons.
uvis u ccntimctrima, itd.). Prctvaranjem svakog rczultata uz-vrijednost Dowie, J., and Lefrere, P. (Eds.) (1980). Risk and Chance. Stony Stan-
dobiva se ukupni uspjeh svakog pojedinca. Tablice bodova na ovakvim ford: The Open Univ. Press.
natjecanjima izraduju se na slicnim principima, tj. na principimaz-vrije-
Everitt, B.S. (1996).Making sense ofstatistics in Psychology. Oxford, New
dnosti svakog rezultata. P
York, Tokyo: Oxford University Press.
Ferguson, G.A. (1966). Statirtical analysis in psychology and education.
r London: McGraw-Hill.
Frankfort-Nachmias, C. (1996). Social statistics for a diverse society.
Thousand Oaks: Pine Forge Press.