Jenis-jenis Validitas dan Reliabilitas Instrumen Tes
Eureka Pendidikan – Dalam upaya peningkatan kualitas pembelajaran, perlu diikuti oleh peningkatan kualitas seluruh aspek yang berkaitan dengan pembelajaran. Salah satu upaya yang dapat dilakukan untuk meningkatkan kualitas pembelajaran adalah memperhatikan penilaian hasil belajar siswa. Penilaian hasil belajar siswa menjadi penting untuk diperhatikan karena pada dasarnya penilian yang berkualitas akan mampu meningkatkan pembelajaran.
Secara mendasar, agar penilaian yang dikembangkan dapat menggambarkan kemampuan siswa yang sesungguhnya, maka hal yang perlu diperhatikan adalah validitas dan reliabilitas instrumen. Validitas dan reliabilitas menjadi hal yang penting karena validitas berkaitan dengan ketepatan isi dari instrumen dengan tujuan pengembangan instrumen. Sedangkan reliabilitas berkaitan dengan keajegan atau kestabilan instrumen apabila digunakan berkali-kali. Beberapa ahli mengemukakan pengertian validitas dan reliabilitas, sebagai berikut:
Secara sederhana, validitas merupakan bukti yang menunjukan bahwa instrumen yang digunakan dapat memberikan gambaran secara akurat mengenai variabel yang hendak diketahui sesuai dengan tujuan penelitian. Sedangkan, Saifuddin Azwar (2015: 8) menjelaskan bahwa,
A. Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauhmana akurasi suatu tes atau skala dalam menjalankan fungsi pengukurannya. Pengukuran dikatakan mempunyai validitas yang tinggi apabila menghasilkan data yang secara akurat memberikan gambaran mengenai variabel yang diukur seperti dikehendaki oleh tujuan pengukuran tersebut.
Kemudian, Djemari Mardapi (2012: 38) menjelaskan bahwa, validitas merupakan dukungan bukti dan teori terhadap penafsiran skor tes sesuai dengan tujuan penggunaan tes. Oleh karena itu, validitas merupakan fundamen paling dasar dalam mengembangkan dan mengevaluasi suatu tes. Proses validasi meliputi pengumpulan bukti-bukti untuk menunjukan dasar saintifik penafsiran skor seperti yang direncanakan.
Heri Retnawati (2016: 16) mengemukakan bahwa, validitas akan menunjukkan dukungan fakta empiris dan alasan teoretis terhadap interpretasi skor tes atau skor suatu instrumen, dan terkait dengan kecermatan suatu instrumen. Serupa dengan pendapat yang dikemukakan oleh Heri Retnawati, Bambang Sumintono (2015: 8) menegaskan bahwa, validitas adalah masalah proses pembuktian yang berkelanjutan, mengacu pada sejauh mana bukti dan teori mendukung interpretasi terhadap skor tes sesuai tujuan tes. Proses validasi melibatkan proses pengumpulan bukti untuk memberikan dasar ilmiah untuk interpretasi skor tes. Validitas adalah masalah interpretasi terhadap nilai tes, bukan tes itu sendiri, karena validitas tidak seberapa terkait dengan bentuk atau jenis tes, tetapi interpretasi terhadap skor tes.
Validitas sendiri terbagi ke dalam tiga kategori besar, yaitu validitas isi (content validity), validitas konstrak (construct validity), dan validitas yang berdasar kriteria (criterion-related validity). Berikut ini penjelasan mengenai ketiga validitas tersebut:
a. Validitas Isi (Content Validity)
Saifuddin Azwar (2015: 42) menjelaskan bahwa validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap kelayakan atau relevansi isi tes melalui analisis rasional oleh panel yang berkompeten atau melalui expert judgment. Kemudian, Heri Retnawati (2016: 17) menjelaskan bahwa validitas isi terkait dengan analisis rasional terhadap domain yang hendak diukur untuk mengetahui keterwakilan instrumen dengan kemampuan yang hendak diukur.
Djemari Mardapi (2008: 16), menambahkan, kesahihan isi dapat dilihat dari kisi-kisi tes, yaitu matrik yang menunjukkan bahan tes serta tingkat berpikir yang terlibat dalam mengerjakan tes. Kesahihan ini ditelaah sebelum tes digunakan. Selanjutnya Saifuddin Azwar (2015: 42) menjelaskan bahwa validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap kelayakan atau relevansi isi tes melalui analisis rasional oleh panel yang berkompeten atau melalui expert judgment.
Melalui hal tersebut dapat dipahami bahwa, validitas isi lebih berkaitan dengan kesesuaian item tes dengan materi yang akan diukur. Keterkaitan antara item tes dengan materi ini memang hanya dapat diuji kelayakannya oleh pakar yang berkompeten pada materi tersebut. Walaupun akan bersifat subyektif, namun judgment dari pakar tetap diperlukan untuk meninjau apakah tes telah mencakup keseluruhan isi kawasan kemampuan yang akan diukur menurut sudut pandang dari materi tersebut, atau dalam kata lain judgment pakar tetap diperlukan dalam hal ini karena judgment tersebut dapat dipertanggung jawabkan.
Selain berkaitan dengan upaya mengetahui kesesuaian antara isi item dengan materi yang akan diukur, Saifuddin Azwar (2015: 42) menjelaskan bahwa, “validitas isi juga berkaitan dengan item-item yang harus relevan dengan tujuan yang hendak diukur, yakni item-item yang tidak keluar dari batasan tujuan ukur”. Walaupun isinya komprehensif, tetapi bila tes tersebut mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas tes tersebut tidaklah dapat dikatakan memenuhi ciri validitas yang seungguhnya.
Validitas isi sendiri dibagi menjadi dua, yakni validitas tampang (face vaidity) dan validitas logis (logical validity). Validitas tampang bersifat kualitatif dan judgmental karena berasal dari expert judgment. Sedangkan, validitas logis bersifat kuantitatif, yang dilakukan dengan menghitung seberapa tinggi kesepakatan para expert. Hal ini dapat dilakukan dengan mencari koefisien validitas isi-Aiken’V atau rasio validitas isi-Lawshe’s CVR.
Dengan demikian, dapat dipahami bahwa validitas isi berkaitan dengan ketepatan isi suatu instrumen dengan materi yang hendak diungkap dan tujuan dari penilian. Validitas tampang ini dapat dilakukan dengan mengkonsultasikan isi instrumen dengan pakar/ahli/ expert judgment. Hasil dari telaah pada tampang beberapa ahli tersebut kemudian diolah untuk mencari koefisien validitas isi, untuk memenuhi validitas logis, sehingga validitas isi terpenuhi secara keseluruhan.
b. Validitas Konstruk (Construct Validity)
Saifuddin Azwar (116) menjelaskan bahwa validasi konstruk membuktikan apakah hasil pengukuran yang diperoleh melalui item-item tes berkorelasi tinggi dengan konstruk teoritik yang mendasari penyusunan tes tersebut.
Selanjutnya, Bambang Subali (2012: 43) mengemukakan bahwa, “persoalan yang dihadapi dalam pemenuhan validitas konstruk dalam ranah kognitif bukan hanya teerbatas pada kesesuaian item dengan indikator dengan pencapaian kompetensi. Persoalan yang mendasar adalah apakah sejumlah kompetensi yang diukur berada pada satu dimensi”. Berdasarkan pengertian tersebut, dapat dipahami bahwa validasi konstruk berkaitan konstruk dari item yang dikembangkan, yang disesuaikan dengan kompetensi yang hendak diketahui. Agar dapat mengetahui validitas konstruk ini tentu yang dilakukan adalah menjabarkan apa yang hendak diukur. Bambang Subali (2012: 43) menjelaskan bahwa.
Cara untuk memenuhi validitas konstruk adalah dengan membuat definisi operasional variabel yang akan diukur. Jika akan mengukur minat, maka dibuat terlebih dahulu apa yang dimaksud dengan minat secara operasional. Dari definisi operasional yang sudah dirumuskan selanjutnya dicari indikator-indikatornya. Dengan cara demikian, pemenuhan unidimensionalitas variabel yang akan diukur berpeluang dapat dipenuhi. Setelah variabel yang akan diukur dijabarkan ke dalam indikator-indikatornya barulah disusun pertanyaan-pertanyaan yang mencerminkan masing-masing indikator tersebut. Dengan demikian, alat uji akan memiliki kesahihan konstruk jika item-itemnya mencerminkan indikator-indikator dari variabel yang diukur.
Maka, untuk dapat memenuhi validitas konstruk ini dapat dilakukan melalui penelaahan definisi operasional variabel yang akan diukur, indikator yang dikembangkan dan pertanyaan-pertanyaan yang disusun.
Kemudian, untuk mendapatkan ketepatan konstruk, tidak hanya diperlukan penelaahan namun juga pengujian secara empiris. Sebagaimana yang dikemukakan oleh Djemari Mardapi (2008: 16) yang menyatakan bahwa, bukti kesahihan konstruk diperoleh validitas dari hasil penggunaan tes, yaitu data empirik. Djemari Mardapi (2008: 20-21) menjelaskan bahwa,validasi bisa mencakup studi empiris bagaimana catatan pengamat atau judge dan evaluasi data bersamaan dengan analisis ketepatan proses dengan penafsiran definisi konstruk. Bukti berdasarkan pola respons mencakup konstruk validiti, yaitu sejauh mana hasil pengukuran dapat ditafsirkan sesuai dengan definisi yang digunakan. Definisi atau konsep yang diukur berasal dari teori yang digunakan. Oleh karena itu harus ada pembahasan teori yang menjadi penentuan konstruk suatu instrumen atau tes.
Selanjutnya, Saifudin Azwar (2015: 45) juga mengemukakan bahwa validitas konstruk merupakan validitas yang menunjukkan sejauh mana hasil tes mampu mengungkap suatu trait atau suatu konstrak teoritik yang hendak diukurnya. Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Hasil dari uji empiris ini, dapat diketahui validitasnya baik melalui teori tes klasik maupun teori respon butir.
c. Validitas Berdasarkan Kriteria
Saifuddin Azwar menjelaskan (2015: 131) dalam prosedur validasi berdasar kriteria (criterion-related validity), tes yang akan diestimasi validitas hasil ukurnya disebut sebagai predictor. Statistik yang digunakan dalam pendekatan validasi ini adalah statistik korelasi antara distribusi skor tes sebagai prediktor
B. Reliabilitas Tes
Secara sederhana relibilitas dipahami sebagai keajegan atau konsistensi suatu alat ukur. Pengertian realibilitas berkaitan dengan konsistensi. Bambang Subali (2012: 47) menjelaskan bahwa, suatu alat ukur yang dinyatakan reliabel/andal jika memberikan hasil yang sama pada berkali-kali pengulangan pengukuran. Lebih jelas lagi Djemari Mardapi (2012: 51) menjelaskan bahwa reliabilitas atau keandalan merupakan koefisien yang menunjukkan tingkat keajegan atau konsistensi hasil pengukuran suatu tes. Konsistensi berkaitan dengan tingkat kesalahan hasil suatu tes yang berupa skor. Tes yang digunakan di berbagai tempat dengan tujuan yang sama, seperti tes hasil belajar, hasilnya yang berupa skor harus dapat dibandingkan antar tempat. Hasil tes ini juga harus dapat dibandingkan antar waktu untuk mengetahui perkembangan hasil belajar yang dicapai.
Selanjutnya, Frisbie dalam (Bambang Subali, 2012: 47-48) menyatakan bahwa reliabilitas tes hasil belajar diinterpretasikan dengan mengacu pada kriteria (criterion-reference) sehingga item-itemnya memiliki tingkat kesulitan item bervariasi dari mudah sampai sukar (sebagai cerminan tingkat keberhasilan belajar) dan tidak boleh memiliki indeks daya pembeda yang negatif (sebagai cerminan tidak ada/peserta ujian yang cerdas menjawab salah). Oleh karena itu, estimasi error didasarkan pada tingginya indeks konsistensi (indeks yang tinggi menunjukkan semua testi/peserta ujian yang sudah belajar pasti dapat mengerjakan dengan benar, sementara semua testi/peserta ujian yang belum belajar pasti tidak dapat mengerjakan dengan benar).