Sei sulla pagina 1di 10

Prosiding Semirata FMIPA Universitas Lampung, 2013

Hubungan Antara Validitas Butir, Reliabilitas, Tingkat


Kesukaran Dan Daya Pembeda Soal Ujian Semester Genap
Bidang Studi Biologi Kelas Xi Sma/Ma Negeri Di Kota Padang
Tahun Pelajaran 2010/2011*
Anizam Zein**, Muhyiatul Fadillah**, Rahma Novianti***
Abstract. Test is set question that requires an answer is right or wrong. A test is said to be
good as a measurement when it meets the test requirements, such as having validity,
reliability, objectivity, and economic practicalities. Thus the test as a measure of learning
outcomes should be in accordance with these standards. This study aims to determine the
relationship between the validity, reliability, level of difficulty, and the distinguishing power
of semester exam study field biology class XI SMA / MA State in Padang school year
2010/2011. This research is a descriptive study. The study population is a matter of the
answer sheet along with semester exams of class XI field of biology which amounts to about
1 set 1 set about SMA and MA State Padang academic year 2010/2011 which consists of 40
items and 35 items on the MA about SMA. In this study, all members of the population
sampled (total sampling). The data were processed with items useful analysis using SPSS
16.From the analysis of the data obtained that 1) difficulty level correlated with the validity
of (66.67%), 2) difficulty level correlated with the validity of (66.67%), 3) Power difference
correlated with the validity of (100%), 4 ) reliability value is different between the value of
all items with a value of r valid point only.furthermore, it can be concluded that 1) There was
no relationship between the level of difficulty by distinguishing the extent siginifikansi 1%,
2) there is a direct relationship and level of difficulty distinguishing the validity of the
significance level of 1%, 3) The relationship between reliability with validity described by
reliability tests that have valid points higher than the test that all grain o valid.

Keywords: test, reliability, validity, distinguishing

PENDAHULUAN hasil belajar perlu diadakan sebuah


evaluasi.
Perubahan kurikulum yang terlalu cepat Evaluasi merupakan cara yang dapat
membuat guru dan siswa menjadi dilakukan untuk mengetahui hasil belajar
kebingungan. Belum lagi jumlah mata dan efektifitas pelaksanaan proses
pelajaran yang terlalu banyak dan tidak pmbelajaran. Melalui kegiatan evaluasi ini
berfokus pada sasaran yang tepat. Selain dapat ditentukan tindak lanjut dari hasil
itu, kurangnya tindakan evaluasi membuat belajar siswa dan perbaikan pelaksanaan
dunia pendidikan tidak mengalami pengajaran oleh guru. Joesmani (1999)
perbaikan. mengemukakan bahwa evaluasi adalah
proses menentukan sampai berapa jauh
Perbaikan pada mutu penddikan harus kemampuan yang dapat dicapai siswa
dimulai dari hal yang paling penting yaitu dalam proses pembelajaran.
lingkungan sekolah. Pada lingkungan Evaluasi tes bertujuan untuk mengetahui
sekolah inilah terjadi proses`pembelajaran kualitas butir tes, agar berkualitias baik,
Dalam kegiatan proses pembelajaran, sebelum digunakan butir-butir tes dianalisis
terdapat berbagai unsur yang menjadi terlebih dahulu. (Depdiknas, 2002). Evaluai
bagian pembelajaran tersebut, mulai dari terdiri dari pengukuran dan penilaian
tujuan, pelaksanaan hingga pencapaian Kurniawan (2009) menyatakan bahwa
hasil belajar. Untuk mengetahui pencapaian pengukuran (measurement) merupakan

Semirata 2013 FMIPA Unila |39


Anizam Zein dkk: Hubungan Antara Validitas Butir, Reliabilitas, Tingkat Kesukaran Dan
Daya Pembeda Soal Ujian Semester Genap Bidang Studi Biologi Kelas Xi Sma/Ma Negeri
Di Kota Padang Tahun Pelajaran 2010/2011

proses pemberian angka atau usaha mewakili lebih banyak materi, ekonomis
memperoleh deskrispi numerik sejauh mana dan efisien, serta memudahkan penilaian
peserta didik telah mencapai suatu oleh guru.
tingkatan. Penilaian (assessment) Soal yang digunakan untuk
merupakan dasar untuk memperoleh mengevaluasi hasil belajar siswa ini
balikan dalam memperbaiki hendaknya sesuai dengan standar yang telah
proses`pembelajaran dan sistem ditentukan. Menurut Arikunto (2008),
pembelajaran secara keseluruhan yang sebuah tes yang dapat dikatakan baik
dilakukan secara berkesinambungan, baik sebagai alat pengukur harus memenuhi
terhadap proses itu sendiri maupun terhadap persyaratan tes, yaitu memiliki validitas,
hasil yang dicapai. Penilaian proses dapat reliabilitas, okjektifitas, praktikabilitas, dan
dilakukan melalui pengamatan terhadap ekonomis. Soal sebagai alat ukut hasil
kegiatan siswa dalam belajar dengan belajar siswa hendaknya sesuai dengan
menggunakan panduan pengamatan, standar tersebut. Begitu juga halnya dengan
sedangkan penilaian hasil belajar dapat soal-soal yang digunakan guru se Kota
dilakukan dengan teknik-teknik tertentu, Padang.
baik teknik tes maupun non tes. Berdasarkan pengamatan awal dan
Evaluasi memiliki tujuan, seperti yang wawancara dengan beberapa orang guru
dkemukakan Tayibnapis (2008) SMA/MA Negeri di Kota Padang pada
menyatakan bahwa evaluasi memiliki dua bulan Juli tahun 2011 diketahui ternyata
fungsi yaitu fungsi formatif dan fungsi sedikit dari guru tersebut yang melakukan
sumatif. Fungsi formatif mencakup analisis awal untuk mengetahui kualitas
perbaikan dan pengembangan kegiatan soal ujian. Seyogyanya soal ujian
yang sedang berjalan, sedangkan fungsi merupakan instrumen bagi seorang guru
sumatif mencakup pertanggungjawaban, untuk mengetahui hasil belajar siswanya.
keterangan, seleksi atau lanjutan. Jadi Jika hasil belajar siswa rendah berarti
evaluasi hendaknya dapat membantu seorang guru harus mampu menganalisis
pengembangan, implementasi, kebutuhan bagian mana dari rencana pembelajarannya
atau program, perbaikan program, yang masih memerlukan perbaikan,
pertanggungjawaban, seleksi, motivasi, termasuk instrumen penilaian, Menurut
menambah pengetahuan dan dukungan dari Arifin (2009) rencana pelaksanaan
mereka yang terlibat. pembelajaran merupakan bagian integral
Salah satu cara melakukan evaluasi dari tugas guru sebagai pelaksana dan
adalah dengan soal ujian atau tes. baik itu pengelola pembelajaran.
soal objektif, maupun essay. Tujuan tes
antara lain untuk : 1) mengetahui Menurut Gronlund (1985) dalam Arifin
pengetahuan awal siswa, 2) Tingkat (2009), ada beberapa langkah yang harus
pencapaian standar kompetensi, 3) ditempuh dalam perencanaan penilaian
mengetahui perkembangan kemampuan hasil belajar yaitu merumuskan tujuan
siswa, 4) mendiagnosis kesulitan belajar penilaian, mengidentifikasi kompetensi dan
siswa, 5) mengetahui hasil suatu poses hasil belajar, menyusun kisi-kisi atau
pembelajaran, 6) memotivasi siswa belajar, blueprint, mengembangkan draft
dan 7) memberi umpan balik kerja guru instrumen, uji coba dan analisis instrumen,
untuk mengetahui program revisi, dan merakit instrument baru.
pembelajarannya (Depdiknas, 2002).Soal Depdiknas (2002) menambahkan langkah-
yang dominan digunakan di sekolah adalah langkah penyusunan tes antara lain,
soal objektif, terutama pilihan ganda menetapkan spesifikasi tes, menulis butir
(multiple choisce). Soal pilihan ganda dapat soal tes, menelaah soal tes, meakukan uji

40|Semirata 2013 FMIPA Unila


Prosiding Semirata FMIPA Universitas Lampung, 2013

coba tes, menganalisis butir soal, yang dihasilkan langsung oleh testee setelah
memperbaiki soal tes, merakittes, instrumen tersebut dipakaikan.
melaksanakan tes, dan menganalisis hasil Namun analisis kuantitatif ini jarang
tes Akan tetapi seringkali seorang guru dilakukan oleh guru. Fakta dilapangan
tidak melakukan langkah uji coba, analisis menunjukkan terdapat beberapa hal yang
instrumen, revisi, dan merakit instrumen menyebabkan guru tidak melalukan analisis
baru. Hal ini terjadi karena kurangnya soal, antar lain : 1) guru merasa terbebani
panduan dan keinginan guru untuk oleh proses analisis soal sehingga enggan
melaksanakan analisis soal. melalukan dan cendrung mengabaikan, 2)
Analisis soal dilakukan untuk guru tidak menyadari bias ketidak vakid-an
mengetahui berfungsi atau tidaknya suatu hasil evaluasi hasil belajar yang
soal. Menurut Surapranata (2005) Analisis ditimbulkan oleh soal tes yang tidak baik,
soal dilakukan melalui dua cara, yaitu 3) guru merasa yakin dengan kualitas soal
analisis kualitatif (validitas logis) dan tes yang dibuat sehingga merasa tidak perlu
analisis kuantitatif (validitas emperis). melakukan penelaahan lebih lanjut. Padahal
Analisis kualitatif dapat dilakukan sebelum soal tes yang tidak baik dapat
soal diujikan sedangkan analisis kuantitatif mencerminkan gambaran hasil belajar yang
dilakukan sesudah soal diujikan pada keliru.
sampel yang representative..Masrun (1982)
menambahkan tujuan analisis item adalah Selain beberapa masalah yang telah
untuk menentukan apakah item-item itu disebutkan mengenai analisis soal, masih
merupakan item yang baik atau tem yang terdapat permasalahan lain yang ditemukan
jelek. Lebih lanjut Surapranata (2005) oleh peneliti, yaitu penentuan tindakan
menambahkan bahwa analisis kualitatif lajutan terhadap soal-soal yang telah
disebut juga validitas logis yang diujikan. Secara umum, tindakan yang bisa
dimaksudkan untuk menganalisis soal dari diambil ada tiga, yaitu memakai butir soal,
segi teknis, isi, dan editorial. Analisisi memperbaiki.. atau tidak, memakai butir
teknis berkaitan dengan prinsip pengukuran soal tersebut. Namun, disinilah letak
dan teknik penulisan soal. Analisis ini kesulitannya. Sampai saat ini peneliti belum
berkaitan dengan kalayakan pengetahuan menemukan sebuah acuan yang pasti dalam
yang ditanyakan. Analisis editorial menentukan syarat sebuah soal dapat
berkaitan dengan penggunaan bahasa dipakai, diperbaiki, atau tidak dipakai
Indonesia yang baik dan benar menutut dengan mempertimbangkan faktor validitas,
EYD. reliabilitas, tingkat kesukaran, dan daya
pembeda soal secara bersamaan
Analsis kuantitatif adalah penelaahan Untuk itu peneliti merasa perlu
butir soal berdasarkan pada karakteristik menemukan hubungan dan
internal tes melalui data yang diperoleh mendeskripsikan bentuk hubunan yang
secara emperis. Karakteristik internal yang terdapat antara keempat faktor dalam
dimaksud meliputi parameter soal tingkat fungsinya sebagai penentu kualitas soal
lesukaran, daya pembeda, validitas butir yang biasa dipakai. Dengan diperolehnya
dan reliabilitas. Analisis kuantitatif ini bentuk hubungan tersebut, maka pada
dilakukan setelah soal diujikan (Kurniawan, tindakan lanjutnya bentuk hubungan
2009). Dua jenis analisis yang telah tersebut dapat dkaai ebagai riteria nentuan
dijabarkan di atas, analisis kuantitatif keterkapaian butir soal. Penelitian in
menjadi fokus dalam penelitian ini. Analisis memfokuskan pada penentuan hubungan
kuantitatif dilakukan dengan menelaah data dan bentuk hubungan antara faktor analisis.

Semirata 2013 FMIPA Unila |41


Anizam Zein dkk: Hubungan Antara Validitas Butir, Reliabilitas, Tingkat Kesukaran Dan
Daya Pembeda Soal Ujian Semester Genap Bidang Studi Biologi Kelas Xi Sma/Ma Negeri
Di Kota Padang Tahun Pelajaran 2010/2011

Penelitian ini bertujuan untuk Hubungan antara korelasi antara tingkat


mengetahui hubungan yang terdapat antara kesukaran dengan daya pembeda diperoleh
validitas butir, reliabilitas, tingkat dua dari tiga kelompok data (66,67%)
kesukaran, dan daya pembeda soal ujian menunjukkan tingkat kesukaran tidak
semester genap bidang Studi Biologi kelas berkorelasi dengan daya pembeda pada
XI SMA/MA Negeri Kota Padang tahun taraf sigifikansi 1%. Data yang tidak
pelajaran 2010/2011. berkorelasi terdapat pada set soal SMA
paket A dan SMA`paket B, sedangkan set
METODE PENELITIAN soal MA data berkorelasi sebesar 0,431.

Penelitian ini adalah penelitian Hasil analisis hubugan antara tingkat


deskriptif. Populasi dari penelitian adalah kesukaran dengan validitas butir diperoleh
seluruh set soal beserta lembar jawaban dari tiga kelompok (88,67%) data
ujian semester genap bidang studi biologi menunjukkan tingkat kesukaran berkorelasi
kelas XI yang berjumah 2 set soal SMA ( dengan validitas butir pada taraf
paket A dan Pekat B) dan 1 set soal MA signifikansi 1%. Data yang berkorelasi
Negeri di Kota Padang tahun pelajaran terdapat pada set soal MA sebesar 0,508
2120/2011. Bentuk tes yang dianalisis dan SMA paket A sebesar 0,526, sedangkan
adalah tes pilihan ganda atau multiple soal SMA pada paket B data tidak
choice. Sedangkan sampel dalam penelitian berkorelasi.
ini adalah keseluruhan anggota populasi
atau total sampling, dengan rincian SMAN Hasil uji korelasi antara daya pembeda
15 dua set soal dan jumlah lembar jawaban dengan validitas butir menunjukkan bahwa
adalah 99, MAN I satu set soal dengan terdapat korelasi antara daya pembeda
jumlah lembar jawaban adalah 62. Variabal degan validitas butir pada taraf
dalam penelitian adalah validitas butir soal, signifikansi1% disemua kelompok data
reliabilitas, tingkat kesukaran, dan daya (100%). Pada paket MA terdapat korelasi
pembeda/Analisis data dilakukan dengan sebesar 0,831, SMA paket A berkorelasi
menggunakan program SPSS 16.. Ada sebesar 0,796, dan SMA paket B sebesar
tidaknya hubungan antara faktor analisis 0,895.
menggunakan analisis korelasi bivariate
. Nilai koefisien realibilitas tes
Hasil uji reliabilitas menunjukkan nilai
HASIL DAN PEMBAHASAN koefisien reliabilitas (r) berbeda antara
semua butiur dengan butir yang valid saja.
Soal ujian semester genap bidang studi Perbedaan nilai koefisien reliabilitias dapat
biologi kelas XI SMA.MA I Padang tahun dilihat pada tabel berikut
pelajaran 2010/2011 jumlah soal yang
dianalisis adalah SMA Paket A 31 butir, Tabel :1. Nilai koefisien reliablitias soal
SMA Paket B 31 butir dan MA 40 butir.
Pada data yang diolah dengan program Set soal Nilai r Nilai r
SPSS 16, nomor soal yang tidak lengkap semua butir yang
tidak ada, namun nomor soal tersebut valid
diganti dengan nomor soal yang berada MAN 0.390 0,673
SMA 0.635 0,647
dinomor berikutnya yaitu nomor 6 dengan
paket A
soal nomor 7 dan seterusnya sehingga soal
SMA 0,438 0,647
objekif yang dianalisis berjumlah 31 butir. paket B

42|Semirata 2013 FMIPA Unila


Prosiding Semirata FMIPA Universitas Lampung, 2013

Hasil uji reliabilitas menunjukkan nilai r 2. 31 0,918 mudah -0,003 tidak


baik
untuk semua butir lebih rendah dari pada 3. 6 0,837 mudah 0,075 jelek
nilai r butir yan valid. Akan tetapi, 4. 23 0,816 mudah 0,115 jelek
koefisien reliabilitas masih lebih kecil dari 5. 29 0,776 mudah 0,358 cukup
pada 0.700 yang berarti soal belum 6. 5 0,735 mudah 0,030 jelek
7. 9 0,735 mudah -0,052 tidak
memiliki reliabilitas yang tinggi. baik
8. 22 0,735 sedang 0,357 cukup
Hubungan antara tingkat Kesukaran 9. 19 0,673 sedang 0,558 baik
dengan daya pembeda 10. 10 0,633 sedang 0,312 cukup
11. 16 0,512 sedang 0,197 jelek
Tingkat kesukaran menunjukkan derajat 12. 12 0,592 sedang 0,065 jelek
kesulitan item tes. Tingkat keukaran 13. 27 0,571 sedang 0,178 jelek
diwakili oleh satu indeks. Indeks setiap 14. 8 0,490 sedang 0,020 jelek
item diperoleh dari jumlah skor siswa 15. 13 0,490 sedang 0,183 jelek
16. 3 0,469 sedang 0,142 jelek
terhadap item tersebut dibandigkan dengan 17. 28 0,388 sedang 0,138 jelek
jumlah siswa yang menjawab item tersebut. 18. 30 0,388 sedang 0,138 jelek
Indeks tingkat kesukaran pada penelitian 19. 25 0,367 sedang -0,148 tidak
ini diperoleh dari jumlah skor benar baik
20. 24 0,347 sedang 0,218 cukup
dibandingkan dengan jumlah tester. 21. 26 0,327 sedang 0,340 cukup
Semakin sedikit jumlah skor benar 22. 18 0,306 sedang 0,380 cukup
menunjukkan semakin kecil tester yang 23. 7 0,286 sukar 0,257 cukup
mampu menjawab dengan benar item 24. 15 0,286 sukar 0,093 jelek
25. 14 0,245 sukar 0,173 jelek
tersebut. Inilah yang memberi makna 26. 21 0,224 sukar 0,295 cukup
bahwa item tersebut sukar. Semakin kecil 27. 20 0,184 sukar 0,212 cukup
jumah skor benar, semakin kecil indes 28. 1 0,163 sukar 0,088 jelek
kesukaran yang diperoleh. 29. 2 0,163 sukar 0,170 jelek
30. 4 0,122 sukar 0,168 jelek
Daya pembeda menunjukkan 31. 11 0,102 sukar 0,208 cukup
kemampuan suatu item membedakan
kemampuan tester. Indeks daya pembeda
Item-item dengan kategori sukar bisa
diperoleh dari selisih skor benar tester
saja memiliki daya pembeda jelek atau
kelompok atas dan tester kelompok bawah.
cukup. Item-item yang memiliki katogori
Semakin besar skor benar tester kelompok
sedang pun bisa memiliki daya pembeda
atas, semakin besar indeks daya pembeda.
jelek, cukup, atau baik. Jadi dapat
Berdasarkan hasi analisis data diketahui
disimpulkan bahwa tidak terdapat
bahwa satu indeks kesukaran pada satu
hubungan antara tingkat kesukaran dan
butir soal berpeluang memiliki beberapa
daya pembeda pada taraf signifikansi 1%.
indeks daya pembeda. Suatu soal yang
memiliki tingkat kesukaran dengan kategori
Hubungan antara Tingkat Kesukaran
sukar, belum dapat dipastikan memiliki
dengan Validitas Butir
suatu item dengan tingkat kesukaran
Hasil analisis korelasi menginformasikan
tertentu dapat diamati pada tabel berikut :
bahwa 66,67% sampai menunjukkan
adanya korelasi antara tingkat kesukaran
Tabel 2. Indek tingkat kesukaran dan indeks
daya pembeda dengan validitas butir pada taraf
signifikansi 1 %. Sisanya sebesar 33,33%
No Nomor Indeks Makna Indeks Makna sampai tidak menunjukkan adanya korelasi
Butir tingkat daya pada taraf signifikansi 1%.
Soal Kesukaran pembeda
1 2 3 4 5 6
Tingkat kesukaran menunjukkan derajat
1. 17 0,918 mudah -0,003 tidak kesulitan item tes yang diwakili suatu
baik jndeks. Indeks setiap item diperoleh dari

Semirata 2013 FMIPA Unila |43


Anizam Zein dkk: Hubungan Antara Validitas Butir, Reliabilitas, Tingkat Kesukaran Dan
Daya Pembeda Soal Ujian Semester Genap Bidang Studi Biologi Kelas Xi Sma/Ma Negeri
Di Kota Padang Tahun Pelajaran 2010/2011

jumlah skor siswa terhadap item tersebut Tabel 3. Distribusi indeks tingkat kesukaran
dibandingkan dengan jumlah siswa yang dan koefisien validitas butir pada
menjawab item tersebut. Ariyono (2012) soal MA
menyatakan bahwa suatu item yang No Nomor Indeks Tingkat Koefisien
memiliki tiga kesukaran dan kualitas soal Butir Kesukaran Validitas
yang baik dapat ditunjukkan dari satu Soal butir
koefisien yang dikenal dengan koefisien 1 2 3 4
korelasi poin biserial. Koefisien poin 1. 29 0,968 0,300
biserial pada dasarnya digunakan untuk 2. 20 0,887 0,370
melihat hubungan antar skor atau hasil 3. 7 0,839 0,340
jawaban pada masing-masing item. Nilai 4.. 5 0,806 0,477
koefisien yang besar menunjukkan testee 5.. 31 0,758 0,261
dapat menjawab dengan baik satu item, 6. 10 0,726 0,423
sebaliknya nilai koefisien yang kecil 7. 15 0,694 0,319
menujukkan bahwa item pertanyaan tidak 8. 8 0,677 0,377
dapat dijawab dengan baik oleh testee. Nilai 9. 28 0,661 0,203
koefisen poin biserrial yang semakin besar 10. 37 0,661 0,323
menunjukkan bahwa suatu item memiliki 11. 24 0,645 0,113
tingkat kesukaran dan kualitas soal yang 12. 23 0,597 -0,021
semakin baik. 13. 16 0,565 0,327
Koefisien validitas butir menunjukkan 14. 26 0,565 0,277
seberapa kuat skor total satu item 1 2 3 4
mendukung terhadap skor total seluruh 15. 21 0,516 0,278
item. Besarnya koefisien validitas butir ini 16. 33 0,500 0,118
juga dapat ditentukan dengan menggunakan 17. 2 0,468 0,528
teknik korelasi biserial dan pint biserial. 18. 34 0,468 -0,031
Korelsi biserial maupun korelasi poin 19. 40 0,435 0,257
biserial adalah korelasi product moment 20. 9 0,419 0,508
yang diterapkan pada data, dimana variable- 21. 12 0,419 0,183
variabel yang dikorelasikan sifatnya 22. 36 0,403 0,252
masing-masing berbeda satu sama lain. 23. 38 0,387 -0,114
Variabel butir soal bersifat dikotom, 24. 39 0,339 0,046
sedangkan variable skor total berifat 25. 4 0,274 0,181
kontinum (Surapranata, 2005). 26. 3 0,258 0,348
Berdasarkan hasil analisis diperoleh nilai 27. 6 0,242 0,478
poin biseral yang cukup tinggi, yaitu 0,0508 28. 11 0,242 0,125
pada soal MA da ,526 pada soal SMA 29. 27 0,242 -0,030
paket A. Dengan demikian, diketahui 30. 14 0,226 0,265
bahwa terdapat korelasi antara tingkat 31. 25 0,210 0,018
kesukaran dengan validitas butir pada taraf 32. 17 0,149 -0,184
signifikansi 1%. Bentuk korelasi yang 33. 32 0,194 0,103
terlibat adalah korelasi searah, dimana 34. 1 0,194 -0,040
semakin besar indeks tingkat kesukaran, 35. 35 0,145 0,107
maka semakin besar pada koefisien 36. 30 0,129 0,199
validitas butir. Namun bila indeks tingkat 37. 13 0,065 0,184
kesukaran dan koefisien validitas butit 38. 18 0,048 0,-0,118
dimasukkan dalam tabel, terlihat seperti 39. 22 0,032 0,101
berikut : 40. 19 0,016 0,033

44|Semirata 2013 FMIPA Unila


Prosiding Semirata FMIPA Universitas Lampung, 2013

Pada tabel di atas, nilai indeks tingkat korelasi yang ditunjukkan adalah korelasi
kesukaran yang benar tidak menunjukkan searah, dimana semakin besar indeks daya
keofisien validitas butir yang semakin besar pembeda, maka semakin besar pula
pula. Hal ini sesuai dengan penelitian Hal koefisien validitas butir. Bentuk korelasi
ini sesuai dengan penelitian Muhyiatul searah ini data dilihat pada tabel berikut.
Fadillah (2011), menyatakan bahwa tidak
terdapat korelasi antara tingkat kesukaran Tabel 4. Distribusi indeks daya pembeda
dengan validitas butir pada taraf dan validitas butir pada soal MA
signifikansi 1 % dengan jumlah sampel
yang lebih besar dan luas ditemukan 92,8% No Nomor Indeks Daya Koefisien
sampel yang tidak berkorelasi. Butir Soal Pembeda Validitas
Butir
Ditambahkan juga bahwa validitas butir
1 2 3 4
tidak tergantung dari banyaknya jumlah 1. 9 0,452 0,508
jawaban benar. Validitas butir berasal dari 2. 2 0,355 0,528
koefisien yang menunjukkan seberapa kuat 3. 3 0,323 0,384
skor total satu butir mendukung terhadap 4. 21 0,323 0,278
skor total seluruh butir. Suatu butir yang 5. 6 0,290 0,478
dijawab benar atau salah oleh semua testeee 6. 10 0,290 0,423
7. 5 0,258 0,447
belum tentu menghasilkan nilai koefisien 8. 8 0,258 0,377
yang semakin besar atau kecil. Sabaliknya 9. 15 0,226 0,319
pada tingkat kesukaran jika semakin banyak 10. 16 0,226 0,372
jumlah jawaban benar, maka butir tersebut 11. 26 0,226 0,277
akan semakin mudah. 12. 28 0,226 0,203
13. 33 0,226 0,118
14. 36 0,226 0,252
Hubungan antara daya Pembeda dengan
15. 37 0,226 0,323
Validitas Butir 16. 4 0,161 0,181
Indeks daya pembeda diperoleh dari 17. 20 0,161 0,370
selisih akar benar testee kelompok atas dan 18. 40 0,161 0,257
testee kelompok bawah dibandingkan 19. 12 0,129 0,183
dengan jumlah testee kelompok atas dan 20. 24 0,129 0,113
jumlah testee kelompok bawah. Daya 21. 11 0,097 0,125
22. 23 0,097 -0,021
pembeda juga dapat dihitung secara statistik
23. 31 0,097 0,261
dengan menghitung nilai korelasi poin 24. 34 0,097 -0,031
biserial. Korelasi poin biserial dapat 25. 7 0,065 0,394
digunakan untuk melihat hubungan antara 26. 13 0,065 0,184
skor atau hasil jawaban pada masing- 27. 14 0,065 0,265
masing item dan pola jawaban testee seperti 28. 29 0,065 0,300
yang telah dijabarkan sebelumnya. Pola 29. 30 0,065 0,199
jawaban testee ini dapat mengidenifikasikan 30. 19 0,032 0,033
31. 25 0,032 0,018
tingkat kesukaran dan daya pembeda dari 32. 27 0,032 -0,030
satu item (Ariyoso, 2012). 33. 39 0,032 0,046
34. 22 0,000 0,101
Penentuan nilai daya pembeda dan 1 2 3 4
validitas butir memiliki proedur yang sama, 35. 32 0,000 0,103
yaitu menggunakan prinsip korelasi. Hal ini 36. 18 -0,032 -0,118
37. 35 -0,032 0,107
yang menjelaskan terdapatnya hubungan
38. 1 -0,129 -0,040
antara daya pembeda dengan validias butir 39. 17 -0,129 -0,184
pada tingkat signifikansi 1%. Bentuk 40. 18 -0,129 -0,114

Semirata 2013 FMIPA Unila |45


Anizam Zein dkk: Hubungan Antara Validitas Butir, Reliabilitas, Tingkat Kesukaran Dan
Daya Pembeda Soal Ujian Semester Genap Bidang Studi Biologi Kelas Xi Sma/Ma Negeri
Di Kota Padang Tahun Pelajaran 2010/2011

Dari tabel diatas terlihat bahwa semakin Tabel 5. Perbandingan nilai r semua butir
besar ideks daya pembeda, maka semakin dengan butir yang valid
besar pula koefisien validitas butir. Dengan
demikian dapat disimpulkan bahwa antara Sampel Nilai r semua Nilai r butir
daya pembeda dengan validitas butir butir yang valid
MAN 0,390 0,673
terdapat korelasi searah pada taraf
SMA paket 0,635 0,547
signifikansi 1 %.
A
SMA paket 0,439 0,642
Hubungan antara Validitas Butir dengan B
Reabilitas
Hubungan antara validitas butir dengan Penentuan indeks tingkat kesukaran dan
reabilitas dianalisis dengan cara yang daya pembeda sangat dipengaruhi oleh
berbeda dari analisis korelasi sebelumnya. kondisi siswa saat melakukan tes. Jika soal
Analisis korelasi antara tingkat kesukaran- diujikan pada dua kelomok siswa yang
daya pembeda, tingkat kesukaran validitas memiliki kemampuan yang berbeda, maka
butir, dan daya pembeda-validitas butir dapat menunjukkan indeks yang berbeda
dilakukan dengan memasangkan data antara pula. Akan teapi, tidak demikian halnya
masing-masing faktor. Hasil perhitungan pada validitas butir dan reliabilitas. Kondisi
reabilitas hanya memberikan satu nilai siswa tidak berpengaruh terhadap nilai
untuk semua butir dalam satu tes. Untuk koefisien yang dihasilkan pada suatu tes.
mengetahui ada atau tidaknya hubungan Secara umum validitas butir memiliki
antara validitas butir dengan reabilitas hubungan timbal balik dengan tiga faktor
dilakukan degan membandingan koefisien lainnya yaitu tingkat kesukaran, daya
reabilitas antara semua item dengan item pembeda, dan reliabilitas. Dua faktor yang
yang valid saja. Menurut Scarvin Anderson tidak memiliki hubungan adalah tingkat
dalam Arikunto (2008) persyaratan bagi tes kesukaran dengan daya pembeda. Dengan
yaitu validitas dan reliabilitas ini penting. demikian kriteria validitas pada suatu butir
Dalam hal ini validitas lebih penting dan diprediksi sebagai kriteria penentu suatu
reliabilitas ini perlu karena menyokong item yang baik.hanya saja besarnya
terbentuknya dengan butir yang valid kontribusi masing-masing tidak dikaji
validitas. Sebuah tes mungkin reliabel secara mendalam pada penelitian ini,. Perlu
tetapi tidak valid. Sebaliknya sebuah tes penelitian lebih lanjut mengenai hubungan
yang valid bisanya reliabel. Berdasarkan uji antara tingkat kesukaran dengan validitas
reliabilitas semua butir dengan reliabilitias butir karena diperoleh temuan yang berbeda
butir yang valid saja, diperoleh bahwa nilai dengan literatur dari penelitian sebelumnya.
r yang valid lebih besar dibanding dengan
nilai r semua butir. Hasil uji validitas butir SIMPULAN DAN SARAN
dengan reliabilitas dapat dilihat pada tabel
berikut : Dari tabel 5 dapat diketahui bahwa Berdasarkan hasil penelitian dapat
koefisien reliabilitas (nilai r) yang disimpulkan bahwa tingkat kesukaran
disumbangkan oleh butir-butir yang valid sebagian besar tidak berkorelasi signifikan
lebih besar dari pada koefisien reliabilitas dengan daya pembeda pada taraf
semua butir. Dengan demikian dapat signifikansi 1%. Tingkat kesukaran
disimpulkan bahwa validitas butir memiliki sebagian besar berkorelasi signifikan
hubungan dengan reliabilitas, dimana dengan validitas butir pada taraf
semakin banyak jumlah butir yang valid, signifikansi 1%. Daya pembeda berkorelasi
semakin besar pula koefisien signifikan dengan validitas butir pada taraf
reliabilitas`suatu tes. signifikansi 1%. Reliabilitas suatu soal

46|Semirata 2013 FMIPA Unila


Prosiding Semirata FMIPA Universitas Lampung, 2013

lebih tinggi jika soal tersebut memiliki Joesmani. 1998. Pengukuran dan Evaluasi
item-item yang lebih valid.Disarankan dalam Pengajaran. Jakarta. Rajawali
penelitian lanjutan untuk hubungan (multi Press.
variabel) faktor analisis soal secara
kuanititafif dan fakor kualitas option Kuniawan, Endang dan Endah Mutagimah.
sebagai salah satu aspek dalam analisis 2009. Penilaian, Jakarta Depdiknas.
kuantitatif dan semua faktor secara
komprehensif. Nurkancana, Wayan. 1986. Evaluasi
Pendidikan. Surabaya. Usaha National.
DAFTAR PUSTAKA Masrun. 1982. Analisis Item. Yogyakarta.
Fakultas Psikologi.
Arifin, Zainal. 2009. Evaluasi
Pembelajaran. Bandung. PT. Remaja Purwanto, Ngalim. 1994.Prinsip-Prinsip
Rosdakarya. dan Teknik Evauasi Pengajaran.
Bandung. Remajs Rodakarya.
Arikunto, Suharsimi. 2008. Dasar dasar
Evaluasi Pendidikan. Jakarta. Bumi Sudjionon, Anas. 2009. Pengantar Evaluasi
Aksara. Pendidikan. Jakarta. Raja Grafindo
Arikunto, Suharsimi. 2006. Prosedur Persada.
Penelitian Suatu Pendekatan Praktik.
Sudjana, nana. 2004. Penilaian hasil dan
Jakarta. PT Asdi Mahasatya.
Proses Belajara Mengajar. Bandung.
Ariyoso. 2011. Korelasi Biserial. Remaja Risdakarya.
http://aroyoso.wprdpress.com/.2011/07/0
7/krelasi-biserial/ diaksses. Tanggal 14 Surappranta, Sumarna. 2005. Analisis,
Maret 2012. Validitas, Reliabilitas dan Interprestasi
Darsono. 2002. Belajar dan Pembelajaran. Hasil tes. Bandung. Pt Remaja Rsda
Semarang. IKIP Semarang Press. Karya
Daryanto. 2005. Evalasi Penddikan. Tayibnapis, Farda Yusuf. 2008. Evaluasi
Jakarta. PT Rineka Cipta. Program dan Instrumen Evaluasi untuk
Depdiknas. 2002. Pedoman Khusus Pola Program Pendidikan dan Penelitian.
Induk Pengembangan Silabus Berbasis Jakarta. Rineka Cipta.
Keterampilan Dasar Sekolah Menengah
Umum (SMU). Jakarta. Dirjen Thoha, Chabib. 2003. Teknik Evaluasi
Dikdasmen. Pendidikan. Jakarta. PT Raja Grafindo
Persada.

Semirata 2013 FMIPA Unila |47

Potrebbero piacerti anche