Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
proses pemberian angka atau usaha mewakili lebih banyak materi, ekonomis
memperoleh deskrispi numerik sejauh mana dan efisien, serta memudahkan penilaian
peserta didik telah mencapai suatu oleh guru.
tingkatan. Penilaian (assessment) Soal yang digunakan untuk
merupakan dasar untuk memperoleh mengevaluasi hasil belajar siswa ini
balikan dalam memperbaiki hendaknya sesuai dengan standar yang telah
proses`pembelajaran dan sistem ditentukan. Menurut Arikunto (2008),
pembelajaran secara keseluruhan yang sebuah tes yang dapat dikatakan baik
dilakukan secara berkesinambungan, baik sebagai alat pengukur harus memenuhi
terhadap proses itu sendiri maupun terhadap persyaratan tes, yaitu memiliki validitas,
hasil yang dicapai. Penilaian proses dapat reliabilitas, okjektifitas, praktikabilitas, dan
dilakukan melalui pengamatan terhadap ekonomis. Soal sebagai alat ukut hasil
kegiatan siswa dalam belajar dengan belajar siswa hendaknya sesuai dengan
menggunakan panduan pengamatan, standar tersebut. Begitu juga halnya dengan
sedangkan penilaian hasil belajar dapat soal-soal yang digunakan guru se Kota
dilakukan dengan teknik-teknik tertentu, Padang.
baik teknik tes maupun non tes. Berdasarkan pengamatan awal dan
Evaluasi memiliki tujuan, seperti yang wawancara dengan beberapa orang guru
dkemukakan Tayibnapis (2008) SMA/MA Negeri di Kota Padang pada
menyatakan bahwa evaluasi memiliki dua bulan Juli tahun 2011 diketahui ternyata
fungsi yaitu fungsi formatif dan fungsi sedikit dari guru tersebut yang melakukan
sumatif. Fungsi formatif mencakup analisis awal untuk mengetahui kualitas
perbaikan dan pengembangan kegiatan soal ujian. Seyogyanya soal ujian
yang sedang berjalan, sedangkan fungsi merupakan instrumen bagi seorang guru
sumatif mencakup pertanggungjawaban, untuk mengetahui hasil belajar siswanya.
keterangan, seleksi atau lanjutan. Jadi Jika hasil belajar siswa rendah berarti
evaluasi hendaknya dapat membantu seorang guru harus mampu menganalisis
pengembangan, implementasi, kebutuhan bagian mana dari rencana pembelajarannya
atau program, perbaikan program, yang masih memerlukan perbaikan,
pertanggungjawaban, seleksi, motivasi, termasuk instrumen penilaian, Menurut
menambah pengetahuan dan dukungan dari Arifin (2009) rencana pelaksanaan
mereka yang terlibat. pembelajaran merupakan bagian integral
Salah satu cara melakukan evaluasi dari tugas guru sebagai pelaksana dan
adalah dengan soal ujian atau tes. baik itu pengelola pembelajaran.
soal objektif, maupun essay. Tujuan tes
antara lain untuk : 1) mengetahui Menurut Gronlund (1985) dalam Arifin
pengetahuan awal siswa, 2) Tingkat (2009), ada beberapa langkah yang harus
pencapaian standar kompetensi, 3) ditempuh dalam perencanaan penilaian
mengetahui perkembangan kemampuan hasil belajar yaitu merumuskan tujuan
siswa, 4) mendiagnosis kesulitan belajar penilaian, mengidentifikasi kompetensi dan
siswa, 5) mengetahui hasil suatu poses hasil belajar, menyusun kisi-kisi atau
pembelajaran, 6) memotivasi siswa belajar, blueprint, mengembangkan draft
dan 7) memberi umpan balik kerja guru instrumen, uji coba dan analisis instrumen,
untuk mengetahui program revisi, dan merakit instrument baru.
pembelajarannya (Depdiknas, 2002).Soal Depdiknas (2002) menambahkan langkah-
yang dominan digunakan di sekolah adalah langkah penyusunan tes antara lain,
soal objektif, terutama pilihan ganda menetapkan spesifikasi tes, menulis butir
(multiple choisce). Soal pilihan ganda dapat soal tes, menelaah soal tes, meakukan uji
coba tes, menganalisis butir soal, yang dihasilkan langsung oleh testee setelah
memperbaiki soal tes, merakittes, instrumen tersebut dipakaikan.
melaksanakan tes, dan menganalisis hasil Namun analisis kuantitatif ini jarang
tes Akan tetapi seringkali seorang guru dilakukan oleh guru. Fakta dilapangan
tidak melakukan langkah uji coba, analisis menunjukkan terdapat beberapa hal yang
instrumen, revisi, dan merakit instrumen menyebabkan guru tidak melalukan analisis
baru. Hal ini terjadi karena kurangnya soal, antar lain : 1) guru merasa terbebani
panduan dan keinginan guru untuk oleh proses analisis soal sehingga enggan
melaksanakan analisis soal. melalukan dan cendrung mengabaikan, 2)
Analisis soal dilakukan untuk guru tidak menyadari bias ketidak vakid-an
mengetahui berfungsi atau tidaknya suatu hasil evaluasi hasil belajar yang
soal. Menurut Surapranata (2005) Analisis ditimbulkan oleh soal tes yang tidak baik,
soal dilakukan melalui dua cara, yaitu 3) guru merasa yakin dengan kualitas soal
analisis kualitatif (validitas logis) dan tes yang dibuat sehingga merasa tidak perlu
analisis kuantitatif (validitas emperis). melakukan penelaahan lebih lanjut. Padahal
Analisis kualitatif dapat dilakukan sebelum soal tes yang tidak baik dapat
soal diujikan sedangkan analisis kuantitatif mencerminkan gambaran hasil belajar yang
dilakukan sesudah soal diujikan pada keliru.
sampel yang representative..Masrun (1982)
menambahkan tujuan analisis item adalah Selain beberapa masalah yang telah
untuk menentukan apakah item-item itu disebutkan mengenai analisis soal, masih
merupakan item yang baik atau tem yang terdapat permasalahan lain yang ditemukan
jelek. Lebih lanjut Surapranata (2005) oleh peneliti, yaitu penentuan tindakan
menambahkan bahwa analisis kualitatif lajutan terhadap soal-soal yang telah
disebut juga validitas logis yang diujikan. Secara umum, tindakan yang bisa
dimaksudkan untuk menganalisis soal dari diambil ada tiga, yaitu memakai butir soal,
segi teknis, isi, dan editorial. Analisisi memperbaiki.. atau tidak, memakai butir
teknis berkaitan dengan prinsip pengukuran soal tersebut. Namun, disinilah letak
dan teknik penulisan soal. Analisis ini kesulitannya. Sampai saat ini peneliti belum
berkaitan dengan kalayakan pengetahuan menemukan sebuah acuan yang pasti dalam
yang ditanyakan. Analisis editorial menentukan syarat sebuah soal dapat
berkaitan dengan penggunaan bahasa dipakai, diperbaiki, atau tidak dipakai
Indonesia yang baik dan benar menutut dengan mempertimbangkan faktor validitas,
EYD. reliabilitas, tingkat kesukaran, dan daya
pembeda soal secara bersamaan
Analsis kuantitatif adalah penelaahan Untuk itu peneliti merasa perlu
butir soal berdasarkan pada karakteristik menemukan hubungan dan
internal tes melalui data yang diperoleh mendeskripsikan bentuk hubunan yang
secara emperis. Karakteristik internal yang terdapat antara keempat faktor dalam
dimaksud meliputi parameter soal tingkat fungsinya sebagai penentu kualitas soal
lesukaran, daya pembeda, validitas butir yang biasa dipakai. Dengan diperolehnya
dan reliabilitas. Analisis kuantitatif ini bentuk hubungan tersebut, maka pada
dilakukan setelah soal diujikan (Kurniawan, tindakan lanjutnya bentuk hubungan
2009). Dua jenis analisis yang telah tersebut dapat dkaai ebagai riteria nentuan
dijabarkan di atas, analisis kuantitatif keterkapaian butir soal. Penelitian in
menjadi fokus dalam penelitian ini. Analisis memfokuskan pada penentuan hubungan
kuantitatif dilakukan dengan menelaah data dan bentuk hubungan antara faktor analisis.
jumlah skor siswa terhadap item tersebut Tabel 3. Distribusi indeks tingkat kesukaran
dibandingkan dengan jumlah siswa yang dan koefisien validitas butir pada
menjawab item tersebut. Ariyono (2012) soal MA
menyatakan bahwa suatu item yang No Nomor Indeks Tingkat Koefisien
memiliki tiga kesukaran dan kualitas soal Butir Kesukaran Validitas
yang baik dapat ditunjukkan dari satu Soal butir
koefisien yang dikenal dengan koefisien 1 2 3 4
korelasi poin biserial. Koefisien poin 1. 29 0,968 0,300
biserial pada dasarnya digunakan untuk 2. 20 0,887 0,370
melihat hubungan antar skor atau hasil 3. 7 0,839 0,340
jawaban pada masing-masing item. Nilai 4.. 5 0,806 0,477
koefisien yang besar menunjukkan testee 5.. 31 0,758 0,261
dapat menjawab dengan baik satu item, 6. 10 0,726 0,423
sebaliknya nilai koefisien yang kecil 7. 15 0,694 0,319
menujukkan bahwa item pertanyaan tidak 8. 8 0,677 0,377
dapat dijawab dengan baik oleh testee. Nilai 9. 28 0,661 0,203
koefisen poin biserrial yang semakin besar 10. 37 0,661 0,323
menunjukkan bahwa suatu item memiliki 11. 24 0,645 0,113
tingkat kesukaran dan kualitas soal yang 12. 23 0,597 -0,021
semakin baik. 13. 16 0,565 0,327
Koefisien validitas butir menunjukkan 14. 26 0,565 0,277
seberapa kuat skor total satu item 1 2 3 4
mendukung terhadap skor total seluruh 15. 21 0,516 0,278
item. Besarnya koefisien validitas butir ini 16. 33 0,500 0,118
juga dapat ditentukan dengan menggunakan 17. 2 0,468 0,528
teknik korelasi biserial dan pint biserial. 18. 34 0,468 -0,031
Korelsi biserial maupun korelasi poin 19. 40 0,435 0,257
biserial adalah korelasi product moment 20. 9 0,419 0,508
yang diterapkan pada data, dimana variable- 21. 12 0,419 0,183
variabel yang dikorelasikan sifatnya 22. 36 0,403 0,252
masing-masing berbeda satu sama lain. 23. 38 0,387 -0,114
Variabel butir soal bersifat dikotom, 24. 39 0,339 0,046
sedangkan variable skor total berifat 25. 4 0,274 0,181
kontinum (Surapranata, 2005). 26. 3 0,258 0,348
Berdasarkan hasil analisis diperoleh nilai 27. 6 0,242 0,478
poin biseral yang cukup tinggi, yaitu 0,0508 28. 11 0,242 0,125
pada soal MA da ,526 pada soal SMA 29. 27 0,242 -0,030
paket A. Dengan demikian, diketahui 30. 14 0,226 0,265
bahwa terdapat korelasi antara tingkat 31. 25 0,210 0,018
kesukaran dengan validitas butir pada taraf 32. 17 0,149 -0,184
signifikansi 1%. Bentuk korelasi yang 33. 32 0,194 0,103
terlibat adalah korelasi searah, dimana 34. 1 0,194 -0,040
semakin besar indeks tingkat kesukaran, 35. 35 0,145 0,107
maka semakin besar pada koefisien 36. 30 0,129 0,199
validitas butir. Namun bila indeks tingkat 37. 13 0,065 0,184
kesukaran dan koefisien validitas butit 38. 18 0,048 0,-0,118
dimasukkan dalam tabel, terlihat seperti 39. 22 0,032 0,101
berikut : 40. 19 0,016 0,033
Pada tabel di atas, nilai indeks tingkat korelasi yang ditunjukkan adalah korelasi
kesukaran yang benar tidak menunjukkan searah, dimana semakin besar indeks daya
keofisien validitas butir yang semakin besar pembeda, maka semakin besar pula
pula. Hal ini sesuai dengan penelitian Hal koefisien validitas butir. Bentuk korelasi
ini sesuai dengan penelitian Muhyiatul searah ini data dilihat pada tabel berikut.
Fadillah (2011), menyatakan bahwa tidak
terdapat korelasi antara tingkat kesukaran Tabel 4. Distribusi indeks daya pembeda
dengan validitas butir pada taraf dan validitas butir pada soal MA
signifikansi 1 % dengan jumlah sampel
yang lebih besar dan luas ditemukan 92,8% No Nomor Indeks Daya Koefisien
sampel yang tidak berkorelasi. Butir Soal Pembeda Validitas
Butir
Ditambahkan juga bahwa validitas butir
1 2 3 4
tidak tergantung dari banyaknya jumlah 1. 9 0,452 0,508
jawaban benar. Validitas butir berasal dari 2. 2 0,355 0,528
koefisien yang menunjukkan seberapa kuat 3. 3 0,323 0,384
skor total satu butir mendukung terhadap 4. 21 0,323 0,278
skor total seluruh butir. Suatu butir yang 5. 6 0,290 0,478
dijawab benar atau salah oleh semua testeee 6. 10 0,290 0,423
7. 5 0,258 0,447
belum tentu menghasilkan nilai koefisien 8. 8 0,258 0,377
yang semakin besar atau kecil. Sabaliknya 9. 15 0,226 0,319
pada tingkat kesukaran jika semakin banyak 10. 16 0,226 0,372
jumlah jawaban benar, maka butir tersebut 11. 26 0,226 0,277
akan semakin mudah. 12. 28 0,226 0,203
13. 33 0,226 0,118
14. 36 0,226 0,252
Hubungan antara daya Pembeda dengan
15. 37 0,226 0,323
Validitas Butir 16. 4 0,161 0,181
Indeks daya pembeda diperoleh dari 17. 20 0,161 0,370
selisih akar benar testee kelompok atas dan 18. 40 0,161 0,257
testee kelompok bawah dibandingkan 19. 12 0,129 0,183
dengan jumlah testee kelompok atas dan 20. 24 0,129 0,113
jumlah testee kelompok bawah. Daya 21. 11 0,097 0,125
22. 23 0,097 -0,021
pembeda juga dapat dihitung secara statistik
23. 31 0,097 0,261
dengan menghitung nilai korelasi poin 24. 34 0,097 -0,031
biserial. Korelasi poin biserial dapat 25. 7 0,065 0,394
digunakan untuk melihat hubungan antara 26. 13 0,065 0,184
skor atau hasil jawaban pada masing- 27. 14 0,065 0,265
masing item dan pola jawaban testee seperti 28. 29 0,065 0,300
yang telah dijabarkan sebelumnya. Pola 29. 30 0,065 0,199
jawaban testee ini dapat mengidenifikasikan 30. 19 0,032 0,033
31. 25 0,032 0,018
tingkat kesukaran dan daya pembeda dari 32. 27 0,032 -0,030
satu item (Ariyoso, 2012). 33. 39 0,032 0,046
34. 22 0,000 0,101
Penentuan nilai daya pembeda dan 1 2 3 4
validitas butir memiliki proedur yang sama, 35. 32 0,000 0,103
yaitu menggunakan prinsip korelasi. Hal ini 36. 18 -0,032 -0,118
37. 35 -0,032 0,107
yang menjelaskan terdapatnya hubungan
38. 1 -0,129 -0,040
antara daya pembeda dengan validias butir 39. 17 -0,129 -0,184
pada tingkat signifikansi 1%. Bentuk 40. 18 -0,129 -0,114
Dari tabel diatas terlihat bahwa semakin Tabel 5. Perbandingan nilai r semua butir
besar ideks daya pembeda, maka semakin dengan butir yang valid
besar pula koefisien validitas butir. Dengan
demikian dapat disimpulkan bahwa antara Sampel Nilai r semua Nilai r butir
daya pembeda dengan validitas butir butir yang valid
MAN 0,390 0,673
terdapat korelasi searah pada taraf
SMA paket 0,635 0,547
signifikansi 1 %.
A
SMA paket 0,439 0,642
Hubungan antara Validitas Butir dengan B
Reabilitas
Hubungan antara validitas butir dengan Penentuan indeks tingkat kesukaran dan
reabilitas dianalisis dengan cara yang daya pembeda sangat dipengaruhi oleh
berbeda dari analisis korelasi sebelumnya. kondisi siswa saat melakukan tes. Jika soal
Analisis korelasi antara tingkat kesukaran- diujikan pada dua kelomok siswa yang
daya pembeda, tingkat kesukaran validitas memiliki kemampuan yang berbeda, maka
butir, dan daya pembeda-validitas butir dapat menunjukkan indeks yang berbeda
dilakukan dengan memasangkan data antara pula. Akan teapi, tidak demikian halnya
masing-masing faktor. Hasil perhitungan pada validitas butir dan reliabilitas. Kondisi
reabilitas hanya memberikan satu nilai siswa tidak berpengaruh terhadap nilai
untuk semua butir dalam satu tes. Untuk koefisien yang dihasilkan pada suatu tes.
mengetahui ada atau tidaknya hubungan Secara umum validitas butir memiliki
antara validitas butir dengan reabilitas hubungan timbal balik dengan tiga faktor
dilakukan degan membandingan koefisien lainnya yaitu tingkat kesukaran, daya
reabilitas antara semua item dengan item pembeda, dan reliabilitas. Dua faktor yang
yang valid saja. Menurut Scarvin Anderson tidak memiliki hubungan adalah tingkat
dalam Arikunto (2008) persyaratan bagi tes kesukaran dengan daya pembeda. Dengan
yaitu validitas dan reliabilitas ini penting. demikian kriteria validitas pada suatu butir
Dalam hal ini validitas lebih penting dan diprediksi sebagai kriteria penentu suatu
reliabilitas ini perlu karena menyokong item yang baik.hanya saja besarnya
terbentuknya dengan butir yang valid kontribusi masing-masing tidak dikaji
validitas. Sebuah tes mungkin reliabel secara mendalam pada penelitian ini,. Perlu
tetapi tidak valid. Sebaliknya sebuah tes penelitian lebih lanjut mengenai hubungan
yang valid bisanya reliabel. Berdasarkan uji antara tingkat kesukaran dengan validitas
reliabilitas semua butir dengan reliabilitias butir karena diperoleh temuan yang berbeda
butir yang valid saja, diperoleh bahwa nilai dengan literatur dari penelitian sebelumnya.
r yang valid lebih besar dibanding dengan
nilai r semua butir. Hasil uji validitas butir SIMPULAN DAN SARAN
dengan reliabilitas dapat dilihat pada tabel
berikut : Dari tabel 5 dapat diketahui bahwa Berdasarkan hasil penelitian dapat
koefisien reliabilitas (nilai r) yang disimpulkan bahwa tingkat kesukaran
disumbangkan oleh butir-butir yang valid sebagian besar tidak berkorelasi signifikan
lebih besar dari pada koefisien reliabilitas dengan daya pembeda pada taraf
semua butir. Dengan demikian dapat signifikansi 1%. Tingkat kesukaran
disimpulkan bahwa validitas butir memiliki sebagian besar berkorelasi signifikan
hubungan dengan reliabilitas, dimana dengan validitas butir pada taraf
semakin banyak jumlah butir yang valid, signifikansi 1%. Daya pembeda berkorelasi
semakin besar pula koefisien signifikan dengan validitas butir pada taraf
reliabilitas`suatu tes. signifikansi 1%. Reliabilitas suatu soal
lebih tinggi jika soal tersebut memiliki Joesmani. 1998. Pengukuran dan Evaluasi
item-item yang lebih valid.Disarankan dalam Pengajaran. Jakarta. Rajawali
penelitian lanjutan untuk hubungan (multi Press.
variabel) faktor analisis soal secara
kuanititafif dan fakor kualitas option Kuniawan, Endang dan Endah Mutagimah.
sebagai salah satu aspek dalam analisis 2009. Penilaian, Jakarta Depdiknas.
kuantitatif dan semua faktor secara
komprehensif. Nurkancana, Wayan. 1986. Evaluasi
Pendidikan. Surabaya. Usaha National.
DAFTAR PUSTAKA Masrun. 1982. Analisis Item. Yogyakarta.
Fakultas Psikologi.
Arifin, Zainal. 2009. Evaluasi
Pembelajaran. Bandung. PT. Remaja Purwanto, Ngalim. 1994.Prinsip-Prinsip
Rosdakarya. dan Teknik Evauasi Pengajaran.
Bandung. Remajs Rodakarya.
Arikunto, Suharsimi. 2008. Dasar dasar
Evaluasi Pendidikan. Jakarta. Bumi Sudjionon, Anas. 2009. Pengantar Evaluasi
Aksara. Pendidikan. Jakarta. Raja Grafindo
Arikunto, Suharsimi. 2006. Prosedur Persada.
Penelitian Suatu Pendekatan Praktik.
Sudjana, nana. 2004. Penilaian hasil dan
Jakarta. PT Asdi Mahasatya.
Proses Belajara Mengajar. Bandung.
Ariyoso. 2011. Korelasi Biserial. Remaja Risdakarya.
http://aroyoso.wprdpress.com/.2011/07/0
7/krelasi-biserial/ diaksses. Tanggal 14 Surappranta, Sumarna. 2005. Analisis,
Maret 2012. Validitas, Reliabilitas dan Interprestasi
Darsono. 2002. Belajar dan Pembelajaran. Hasil tes. Bandung. Pt Remaja Rsda
Semarang. IKIP Semarang Press. Karya
Daryanto. 2005. Evalasi Penddikan. Tayibnapis, Farda Yusuf. 2008. Evaluasi
Jakarta. PT Rineka Cipta. Program dan Instrumen Evaluasi untuk
Depdiknas. 2002. Pedoman Khusus Pola Program Pendidikan dan Penelitian.
Induk Pengembangan Silabus Berbasis Jakarta. Rineka Cipta.
Keterampilan Dasar Sekolah Menengah
Umum (SMU). Jakarta. Dirjen Thoha, Chabib. 2003. Teknik Evaluasi
Dikdasmen. Pendidikan. Jakarta. PT Raja Grafindo
Persada.