Ibu, Bapak Guru, Peneliti Pendidikan, dan Sahabat blogger. Penulisan artikel ini berpijak kepada keprihatinan saya akan pengukuran tingkat kesukaran soal uraian yang terjadi selama ini. Biasanya, peneliti telah menjustifikasi suatu nilai tertentu yang menjadi pijakan akan keberhasilan sebuah soal. Dengan berpijak kepada nilai tersebut, peneliti kemudian melakukan justifikasi dengan menganggap benar sempurna jika skor yang diperoleh responden lebih dari nilai pijakan, dan menganggap gagal keseluruhan jika nilai responden kurang dari nilai pijakan. Contoh sederhana berikut: Saya akan menganalisis soal uraian, dan saya telah menetapkan nilai ketuntasan satu soal adalah 63%, artinya jika siswa telah memperoleh skor 70% dari bobot nilai butir, maka siswa dianggap mengerjakan soal tersebut dengan benar 100%. Andaikan siswa mengerjakan 10 butir soal, dan kemudian hanya memperoleh skor 70% di 4 nomer, sedangkan 6 nomor lainnya hanya memperoleh skor 60%, maka siswa tersebut dianggap tidak memenuhi ketuntasan. Hitung saja, (0,7 x 4) + (0,6 x 6) = 0,64. Artinya lebih dari nilai ketuntasan sebesar 63. Terjadi kontradiksi bukan? Penjelasan lebih lanjut silahkan saja lanjut membaca.
Referensi:
- Aiken, Lewis R. (1994). Psychological Testing and Assessment,(Eight Edition). Boston: Allyn and Bacon.
- Nitko, Anthony J. (1996). Educational Assessment of Students, Second Edition. Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs.
- Nunally, Jum C. (1981). Psychometric Theory, Second Edition. New Delhi: Tata McGraw Hill Publishing Company Limited.
- Haladyna, Thomas M. (1994). Developing and Validating Multiple-Choice Test Items. New Jersey: Lawrence Erlbaum Associates, Publishers.
Artikel Tingkat Kesukaran
(Jangan jadikan blog ini sebagai referensi, saya akan mencarikan referensi untuk anda)
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 – 1,00 (Aiken (1994: 66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif. Rumusnya adalah seperti berikut ini (Nitko, 1996: 310).
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah/mudah.
Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus berikut ini.
Kemudian dilanjutkan dengan proses berikut:
0,00 – 0,30 soal tergolong sukar
0,31 – 0,70 soal tergolong sedang
0,71 – 1,00 soal tergolong mudah
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes yang sangat sukar (TK<0,25) distribusinya berbentuk positif skewed, sedangkan tes yang mudah (TK>0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-313). Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar mereka, (2) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki ketepatan data soal.
Di samping kedua kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antarsoal), (2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi antarsoal, semakin tinggi reliabilitas (Nunnally, 1981: 270-271).
Tingkat kesukaran butir soal juga dapat digunakan untuk mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk kategori mudah, maka prediksi terhadap informasi ini adalah seperti berikut.
- Pengecoh butir soal itu tidak berfungsi.
- Sebagian besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap informasi ini adalah seperti berikut.
- Butir soal itu “mungkin” salah kunci jawaban.
- Butir soal itu mempunyai 2 atau lebih jawaban yang benar.
- Materi yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga kompetensi minimum yang harus dikuasai siswa belum tercapai.
- Materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk pilihan ganda).
- Pernyataan atau kalimat soal terlalu kompleks dan panjang.
Namun, analisis secara klasik ini memang memiliki keterbatasan, yaitu bahwa tingkat kesukaran sangat sulit untuk mengestimasi secara tepat karena estimasi tingkat kesukaran dibiaskan oleh sampel (Haladyna, 1994: 145). Jika sampel berkemampuan tinggi, maka soal akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka soal akan sangat sulit (TK = < 0,40). Oleh karena itu memang merupakan kelebihan analisis secara IRT, karena 1RT dapat mengestimasi tingkat kesukaran soal tanpa menentukan siapa peserta tesnya (invariance). Dalam IRT, komposisi sampel dapat mengestimasi parameter dan tingkat kesukaran soal tanpa bias.