Skip to content Skip to sidebar Skip to footer

Uji Coba Instrumen Tes Dalam Penelitian Ilmiah

Di dalam bagian lain sudah disinggung sedikit tentang bermacam-macam tes : ada tes bakat atau tes pembawaan (aptitude test). tes sikap (attitude test), dan tes pencapaian (achievement test). Tujuan tes pada umumnya seperti yang sudah dikemukakan yaitu untuk mencari pengalaman pengelolaan dan untuk menguji kualitas instrumen itu sendiri. Untuk tes pencapaian (achievement test) tujuan uji coba juga meliputi dua hal yang telah disebutkan. Untuk tes pencapaian, tujuan uji coba paling tidak adalah agar dari kegiatan tersebut dapat diketahui.

a. Validitas tes (test validity)
b. Reliabilitas tes (test reliability)
c. Taraf kesukaran (difficulty index)
d. Daya pembeda (discriminating power)
e. Pola jawaban, hanya untuk soal bentuk pilihan ganda

Berikut ini akan dijelaskan masing-masing kegiatan.

a. Validitas tes

Validitas tes adalah tingkat sesuatu tes mampu mengukur apa yang hendak diukur. Uraian mengenai bagaimana memperoleh validitas tes sudah ada di dalam penjelasan di atas. Tes adalah instrumen yang disusun secara khusus karena mengukur sesuatu yang sifatnya penting dan pasti. Dikatakan demikian karena tes digunakan untuk menentukan sesuatu mengenai kedudukan atau predikat seseorang. pengerjaannya jg\uga khusus : cara menjawab, situasi tertentu, waktu, dan prosedur juga tertentu pula. Apabila aturan-aturan tersebut dipenihi diharapkan validitas yang dikehendaki oleh peneliti diharapkan tercapai.

b. Reliabilitas tes

Penjelasan tentang reliabilitas serta teknik-teknik yang dapat digunakan sudah dijelaskan secara panjang lebar. Dengan memahami teknik-teknik yang telah dikemukakan tersebut tentunya peneliti sudah dapat mempertimbangkan kebaikan dan keburukannya. Demikian juga peneliti dapat memperkirakan kesulitan-kesulitan apa yang akan dijumpai jika memilih satu di antara teknik yang ada. Teknik-teknik tersebut sangat cocok diterapkan pada tes. Teknik paralel digunakan jika peneliti memang mempunyai cakup waktu dan kecakapan untuk menyusun dua perangkat instrumen dan melaksanakan uji cobanya.

Prosedur menyusun instrumen yang sudah dijelaskan :

1.      Menjabarkan variabel menjadi sub variabel, indikator, dan deskriptor, sampai membuat kisi-kisi yang menunjukkan banyaknya butir untuk setiap butir pada setiap variabel.
2.      Merumuskan butir pertama dari instrumen A kisi-kisi dan sekaligus merumuskan butir pertama instrumen B yang ekuivalen.
3.      Merumuskan butir-butir berikutnya untuk instrumen A, sekaligus diikuti dengan merumuskan butir-butir ekuivalennya untuk instrumen B.
4.      Melengkapi sikap instrumen dengan petunjuk untuk mengerjakan.

Sesudah instrumen selesai disusun lalu diujicobakan masing-masing satu kali, responden yang sama. Hasil ada sekor dari kedua instrumen untuk tiap-tiap subjek dipasangkan kemudian dihitung dengan korelasi product moment. Adapun rumus Pearson dimaksud adalah sebagai berikut :
dengan keterangan :

X       = sekor dari tes pertama (instrumen A)
Y       = sekor dari tes kedua (instrumen B)
XY    = hasil kali sekor X dengan Y untuk setiap respomden
X2       = kuadrat sekor instrumen A
Y2     = kuadrat sekor instrumen B

Teknik ulangan digunakan jika peneliti diberi kesempatan yang cukup oleh responden (atau orang yang bertanggung jawab tentang responden). Waktu yang disediakan digunakan untuk mencobakan instrumen sebanyak dua kali, tentu dengan responden yang sama. Hasil atau sekor dipasangkan kemudian dihitung korelasinya dengan rumus korelasi Product moment. Dalam hal ini perlu diketahui oleh para peneliti bahwa subjek yang dipasangkan sekornya memang harus sama. Jika di dalam pelaksanaan ditemukan ada subjek yang hanya ikut satu kali coba, sebaiknya subjek tersebut disingkirkan saja dari analisis.

Teknik belah dua digunakan jika peneliti berhasil menyusun instrumen yang memenuhi persyaratan yakni jumlah butirnya genap dan butir-butirnya homogen. Kebanyakan peneliti berpendapat bahwa teknik ini dipilih sebagai pelarian karena mereka kurang mempunyai waktu dan kesempatan untuk melakukan uji coba sebanyak dua kali. Dengan hanya mencobakan satu kali saja mereka dapat menemukan indeks reliabiltas dengan mengelompokkan sekor butir-butir belahan dengan belahan kedua.

Langkah-langkah yang dilalui oleh peneliti dalam menggunakan teknik belah dua adalah :

1.      Mengujicobakan instrumen kepada responden.
2.      Memberikan sekor kepada setiap responden untuk semua butir soal atau butir pertanyaan.
3.      Mengelompokkan sekor untuk butir-butir belahan pertama dan belahan kedua (boleh dengan belah dua ganjil genap, awal akhir atau dengan undian)
4.      Memberikan kode X untuk sekor belahan pertama dan kode Y untuk belahan kedua.
5.      Mencari korelasi antara sekor-sekor belahan pertama (X) dengan sekor-sekor belahan kedua (Y) yang dimiliki oleh setiap individu.
Hasil perhitungan korelasi Pearson ini baru merupakan reliabilitas separo tes.
6.      Untuk memperoleh indeks reliabilitas seluruh tes digunakan rumus Spearman-Brown.

Selain menggunakan tiga teknik tersebut di atas, masih ada cara-cara lain yang dapat digunakan untuk mengetahui reliabilitas tes, antara lain : dengan rumus Flanagan, rumus Rulon, rumus K-R20, K-R21, rumus Hoyt. Rumus-rumus tersebut dapat digunakan apabila sekor untuk setiap butir soal hanya berupa dikotomi yaitu 1 dan 0. Sekor untuk angket atau skala biasanyabukan 1 dan 0 tetapi bertingkat dari 0 atau 1 sampai 3, 5, atau berapa saja menurut kemauan dan pertimbangan peneliti. Untuk instrumen yang sekor butirnya bukan 1 dan 0 dalam mencari indeks reliabilitas digunakan rumus Alpha.

Untuk melengkapi kemampuan peneliti dengan berbagai cara mencari reliabilitas instrumen, berikut ini disampaikan rumus-rumus yang sudah disebutkan di atas terutama yang sesuai digunakan untuk tes. Rumus Alpha akan diberikan pada penjelasan uji coba instrumen bukan tes.

1. Rumus Flanagan

Peneliti yang ingin menggunakan rumus Flanagan dipersyaratkan memiliki butir soal berjumlah genap dan memenuhi ketentuan dapat dibelah atas belahan ganjil dan belahan genap jika peneliti sidah memperoleh belahan pertama (sekor butir soal genap) dan belahan kedua (sekor butir soal ganjil) atau sebaliknya, maka lalu dimasukkan ke dalam rumus yang ada.
r11        = reliabilitas instrumen
V1       = varians belahan pertama (varians sekor butir-butir ganjil)
V2       = varians belahan kedua (varians sekor butir-butir genap)
Vt      = varians sekor total

Untuk rumus varian total :

2. Rumus Rulon

Mirip dengan rumus Flanagan adalah rumus Rulon. Rumus ini juga mensyaratkan jumlah butir soal genap tetapi berbeda persyaratan dalam pembelahan analisis terhadap sekornya. Jika rumus Flanagan diterapkan pada belahan ganjil-genap maka rumus Rulon diterapkan pada belahan akhir. Adapun rumus Rulon dimaksud adalah sebagai berikut :
Rumus :

dengan keterangan :

r11        = reliabilitas instrumen
Vt        = varians total atau varians sekor total
Vd       = varians beda (variance difference)
d       = sekor pada belahan awal dikurangi dengan sekor pada belahan akhir

3. Rumus K-R20

Di dalam menggunakan rumus korelasi product moment  yang diikuti rmus. Spearman-Borwn, rumus Flanagan, dan rumus Rulon, peneliti disyaratkan mempunyai jumlah butir soal yang genap, dan masih harus memenuhi persyaratan lain tentang keseimbangan butir-butir yang membentuk tes tersebut. Persyaratan seperti ini kadang-kadang dirasakan berat oleh peneliti. Dalam hal peneliti tidak dapat memenuhi persayaratan tersebut, mereka dapat menggunakan teknik lain untuk mencari reliabilitas tes, yaitu rumus K-R 20, K-R 21 atau rumus Hoyt. Untuk menggunakan rumus-rumus tersebut peneliti dapat memiliki jumlah butir tidak genap. Satu hal yang masih harus diingat oleh peneliti adalah bahwa : semakin banyak butir soal tes maka reliabilitas tes akan semakin tinggi.

Dalam bagian ini disampaikan rumus K-R 20 yang banyak disukai oleh peneliti karena cenderung memberi hasil yang tinggi. K-R sendiri merupakan singkatan dari dua nama penemunya yaitu Kuder dan Richaderson. Rumus matematika telah banyak dihasilkan oleh pasangan ahli tersebut dan rumus mencari reliabilitas adalah K-R 20 dan K-R 21.

Adapun rumus K-R 20 dimaksud adalah sebagai berikut :
Rumus :

dengan keterangan :

r11        = reliabilitas instrumen
k        = banyaknya butir pertanyaan
Vt        = varians total
p        = proporsi subjek yang menjawab butir dengan betul (proposal subjek yang mempunyai sekor 1)
q        = Proporsi subjek yang mendapat sekor 0 (q = 1 – p)

4. Rumus K-R 21

Di dalam menggunakan rumus K-R 20 peneliti harus melalui prosedur yang agak panjang dengan label yang cukup panjang (terutama jika butir soalnya cukup banyak). Dengan rumus K-R 21 peneliti tidak perlu membuat tabel persiapan dan dapat langsung memasukkan data ke rumus. Adapun rumus K-R 21 dimaksud adalah sebagai berikut :

dengan keterangan :

r11        = reliabilitas instrumen
k        = banyaknya butir soal atau butir pertanyaan
M      = rerata sekor seluruh butir (pertanyaan)
Vt        = varians total

c. Taraf Kesukaran

Yang dimaksud dengan taraf kesukaran tes adalah kemampuan tes tersebut dalam menjaring banyaknya subjek peserta tes yang dapat mengerjakan dengan betul. Jika banyaknya subjek peserta tes yang dapat menjawab dengan benar maka taraf kesukaran tes tersebut tinggi. Sebaliknya jika hanya sedikit dari subjek yang dapat menjawab dengan benar maka taraf kesukarannya rendah. Taraf kesukaran tes dinyatakan dalam indeks kesukaran (difficulty index). Taraf kesukaran dinyatakan dengan P dan dicari dengan rumus :

dengan keterangan :

B       = subjek yang menjawab betul
J        = banyaknya subjek yang ikut mengerjakan tes

contoh :
Subjek peserta tes ada 20 orang.
Jika yang dapat mengerjakan butir dengan betul ada 12 orang maka taraf kesukaran butir soal (P) adalah 12/20=0,60.
Jika yang dapat mengerjakan butir dengan betul ada 18 orang maka taraf kesukaran butir soal (P) adalah 18/20=0,90.
Jika yang dapat mengerjakan dengan betul hanya 2 orang maka taraf kesukaran butir soal (P) adalah 2/20=0,10.

Dengan tiga contoh ini dapat diambil kesimpulan bahwa semakin banyak subjek peserta yang dapat mengerjakan sesuatu butir soal maka P-nya semakin tinggi. Butir soal tersebut mudah. Sebaliknya jika subjek peserta tes yang betul hanya sedikit (butir tersebut sukar), maka P-nya rendah. Dalam hal ini tampak adanya kebalikan yakni semakin mudah butir tersebut maka taraf kesukarannya semakin tinggi. Jadi sebenarnya lebih cocok jika P tersebut disebut sebagai taraf kemudahan. Namun karena sudah ada kesepakatan demikian itu penggunanya maka istilah dan lambang atau kodenya tetap seperti yang telah dikemukakan. Di dalam buku-buku bahasa inggris pengertian tersebut tidak kelihatan terbalik karena P digunakan sebagai facility index dapat diartikan sebagai taraf kemudahan. Rumusnya sama dengan yang sidah ditulikan di atas.

d. Daya Pembeda (discriminating power)

Yang dimaksud dengan daya pembeda tes adalah kemampuan tes tersebut dalam memisahkan antara seubjek yang pandai dengan subjek yang kurang pandai. Oleh karena dasar pikiran dari daya pembeda adalah adanya kelompok pandai dengan kelompok kurang pandai maka dalam mencari daya beda subjek peserta tes dipisahkan menjadi dua sama besar berdasarkan atas sekor total yang mereka peroleh. Apabila banyaknya subjek peserta tidak genap sehingga tidak dapat dibagi dua sama banyak maka sebelum dibagi dua harus disisihkan salah seorang (secara lotre), kemudian dibagi dua. Rumus yang digunakan untuk mengetahui daya pembeda setiap butir tes adalah :

dengan keterangan :
D       = daya pembeda butir
BA       = banyaknya kelompok atas yang menjawab betul
JA        = banyaknya subjek kelompok atas
BB       = banyaknya seubjek kelompok bawah yang menjawab betul
JB        = banyaknya subjek kelompok bawah

e. Pola Jawaban

Pola jawaban adalah gambaran tentang penyebaran jawaban responden terhadap alternatif jawaban yang disediakan oleh penyusun tes. Menurut teori, setiap alternatif jawaban di dalam butir tes harus efektif dan berfungsi sebagai laternatif. Itulah sebabnya penyusun harus mengujicobakan tes agar diketahui efektivitas alternatif-alternatif tersebut.

Untuk sekedar diingat, aturan tentang butir yang baik ditinjau dari rumusan soalnya adalah sebagai berikut :

1. Setiap alternatif dipilih oleh sekurang-kurangnya 10% dari peserta tes. Jika pemilihan alternatif tersebut tidak mencapai 10% dari responden maka berarti alternatif tersebut kurang menarik perhatian peserta tes. Hal ini mungkin disebabkan karena alternatif ini tampak salah sehingga tidak memiliki daya tarik. Sebaliknya kalau alternatif tersebut bukan merupakan jawaban yang benar tetapi dipilih oleh banyak responden maka mungkin memang penyusun soal yang melakukan kesalahan memilih kunci jawaban.
2. Menurut teori, jika penyusun soal telah merumuskan butir soal dengan baik maka semua responden tentu memilih satu di antara alternatif yang ada. Apabila ternyata banyak atau ada beberapa responden yang tidak menentukan pilihan maka kemungkinan analisisnya adalah :
(a)    Responden mengerjakan soal belum sampai pada nomor tersebut karena mereka bekerja dengan lambat.
(b)   Responden bingung menentukan pilihan alternatif kemudian melewatkan butir tersebut dan langsung mengerjakan soal berikutnya. Apabila alasannya seperti yang disebutkan pada (b) penyusun soal perlu mawas diri karena rumusan soalnya membingungkan.

Dengan du kemungkinan alasan ini maka apabila dalam analisis butir dijumpai banyak butir soal yang tidak dijawab perlu dilihat lebih lanjut di mana letak butir-butir tersebut : ditengah soal-soal yang dikerjakan ataukah pada akhir-akhir pengerjaan.


Effi Aswita dan Thamrin