Just another WordPress.com site

Kriteria Tes

Untuk mengukur (mengumpulkan data) hasil belajar siswa dalam pendidikan jasmani diperlukan berbagai macam teknik pengukuran dan instrumen tes yang memenuhi kriteria instrumen penilaian yang baik.

Teknik pengumpulan data yang dapat digunakan untuk mengukur hasil belajar siswa antara lain teknik tes dan teknik nontes. Teknik tes dapat berupa berbagai macam instrumen tes keterampilan olahraga dan instrumen tes pengetahuan. Sedangkan teknik nontes (teknik pengumpuldata bukan tes) yang dapat di-gunakan antara lain instrumen angket (questioner), pengamatan (observation), wawancara (interview), skala penilaian (rating  scale), daftar cek (ceck list), anekdota, sosiometri, studi  kasus dan  catatan kumulatif (cumulative record).

Kriteria tes dan instrumen yang baik pada umumnya harus memenuhi tingkat kesahihan (validitas), keterandalan  (reliabilitas), dan obyektifitas. (Kirkendal, Gruber dan Johnson: 1980).

Pemilihan tes dan instrumen yang digunakan untuk mengumpul-kan  data  tentang hasil belajar siswa harus disesuaikan dengan tujuan penilaian dan tujuan pengajaran yang telah ditetapkan. (Budiwanto: 2001).

Dalam  melaksanakan evaluasi  hasil belajar pendidikan jasmani diperlukan kemampuan tenaga pengajar, antara lain kemampuan menyusun tes hasil  belajar mahasiswa. Secara umum kemampuan menyusun tes tersebut  meliputi beberapa hal:

1)      Penyusun tes harus  memiliki  kemampuan dalam hal penguasaan materi pengajaran. Terutama materi pengajaran yang akan dituangkan  dalam item-item  tes  yang akan disusun. Hal ini berkaitan dengan tuntutan validitas kurikuler,

2)      Penyusun tes harus menguasai teknik-teknik  penyusunan tes, baik tes tertulis maupun tes keterampilan; dengan tujuan agar tes yang disusun mampu mengungkap informasi yang mendekati kenyataan,

3)      Penyusun tes harus memiliki kemampuan merumuskan kalimat pertanyaan dalam  item tes dengan baik dan benar.

Evaluasi yang dilakukan harus berorientasi pada tujuan-tujuan instruksional (instrucsional  effect) yang  telah ditetapkan dan juga  tujuan-tujuan pengiring (nurturent effect) lainnya. (Rakajoni: 1981).

Berdasarkan tujuan-tujuan  tersebut maka evaluasi hasil belajar siswa mempunyai beberapa tujuan dan fungsi. Perlu diketahui bahwa tidak semua tingkatan sekolah telah memiliki berbagai jenis tes yang valid dan reliabel untuk mengkur keterampilan siswa dalam berbagai cabang olahraga. Jika belum ada, maka tes keterampilan  olahraga  tersebut perlu  dibuat. Berikut ini dibahas tentang kriteria tes yang baik dan langkah-langkah pembuatan tes ketrampilan olahraga (Rakajoni:1984).

Dalam melaksanakan kegiatan penilaian diawali dengan kegiatan pengukuran menggunakan alat ukur atau tes. Alat ukur atau tes yang digunakan harus memenuhi kriteria tes yang baik. Secara umum, kriteria alat ukur atau tes yang  baik antara lain harus mempunyai tingkat validitas dan reliabilitas yang meyakinkan.

Validitas diartikan sebagai tingkat ketepatan mengukur sesuatu yang seharusnya diukur. Reliabilitas diartikan tingkat keterandalan alat ukur atau tes. Bukti tentang tingkat validitas dan reliabilitas suatu alat ukur atau tes sangat penting dalam proses penilaian hasil belajar siswa. Sehingga proses penilaian yang dilakukan dapat diyakini ketepatan dan keterandalannya, karena  menggunakan alat ukur atau tes yang tepat dan dapat diandalkan. Selain itu, obyektifitas dari alat ukur yang akan digunakan untuk melakukan pengukuran adalah kriteria yang harus menjadi perhatian berikutnya (Budiwanto: 2001).

Menurut Pudjiono (1989), ada beberapa syarat tentang alat evaluasi yang baik, yang digunakan dalam pendidikan jasmani:

1)      Harus dapat menunjukkan dengan jelas apa yang akan dievaluasi,

2)      Hasil evaluasi harus representatif dalam menggambarkan keadaan mahasiswa,

3)      Menggunakan alat ukur atau tes yang memenuhi syarat validitas (kesahihan), reliabilitas (keterandalan) dan obyektifitas,

4)      Hasil pengukuran karakteristik yang akan dievaluasi  diolah  secermat-cermatnya,

5)      Berdasarkan pada suatu kriteria atau norma tertentu

Validitas.

Validitas atau kesahihan alat ukur berhubungan dengan ketepatan  mengukur sesuatu  yang seharusnya  diukur. Selain itu, validitas menunjukkan tingkat kevalidan  atau kesahihan  suatu alat ukur  atau instrumen.  Suatu alat  ukur yang valid atau sahih  berarti alat  ukur tersebut tepat  untuk mengukur sesuatu  yang seharusnya diukur. (Kirkendal, Gruber dan Johnson: 1980).

Suatu instrumen pengumpul data yang valid berarti instrumen tersebut dapat mengungkap informasi suatu variabel yang sedang dikumpulkan.  Tujuan penggunaan suatu alat ukur merupakan faktor yang menentukan validitas alat ukur. Tes yang sudah baku (terstandar) digunakan untuk mengukur hasil belajar keterampilan olahraga siswa di sekolah mungkin tidak valid untuk mengukur keterampilan atlit yang akan mengikuti kejuaraan atau perlombaan. Perbedaan tujuan penggunaan  tes tentu memerlukan validitas yang berbeda pula.

Validitas Isi

Penggunaan tes atau alat ukur dalam proses belajar mengajar biasanya  untuk menaksir  pencapaian hasil belajar siswa tentang kemampuan  pengetahuan atau keterampilan siswa. Yang paling baik, keseluruhan isi topik atau materi bahasan dituangkan ke dalam tes tersebut. Tetapi hal tersebut mungkin akan sulit dilakukan.

Pada umumnya cara menaksir pencapaian hasil belajar siswa adalah  mengambil sampel dari keseluruhan isi topik atau materi bahasan. Oleh karena itu sampel tersebut harus  mewakili keseluruhan isi. Dengan  kata lain, hasil yang diperoleh berdasarkan sampel tersebut  harus mencerminkan keseluruhan isi yang dikehendaki, sehingga sampel harus valid. Hal ini merupakan masalah validitas isi.

Prosedur tersebut diawali dengan menyusun suatu kerangka atau kisi-kisi topik atau materi bahasan. Dalam kisi-kisi mencakup keseluruhan isi bidang  studi dan  aspek-aspek yang akan diukur dilengkapi dengan katagori pentingnya setiap topik. Berdasarkan kisi-kisi tersebut dikembangkan butir-butir materi tes. Selanjutnya secara acak diambil sampel butir-butir tes dalam jumlah yang sesuai dengan bobot katagori setiap topik dari keseluruhan isi (Kirkendal, Gruber dan Johnson: 1980).

Pada dasarnya validitas isi diperoleh berdasarkan pertimbangan subyektif, secara teliti dan kritis terhadap butir-butir tes yang secara logis dapat mewakili keseluruhan isi tes yang dikehendaki dan diperkirakan sesuai dengan tujuan pengukuran.  Maka suatu alat ukur atau tes harus memiliki validitas logis. Selain itu, pertimbangan isi dan tujuan yang akan diukur, suatu  tes harus  mencerminkan dan sesuai  dengan materi pengajaran dan tujuan pengajaran yang dinyatakan dalam pedoman kurikulum atau silabus. Dengan demikian suatu alat ukur atau tes harus memenuhi validitas kurikulum.

Dalam menyusun tes keterampilan olahraga dalam pendidikan jasmani, validitas isi diperoleh  melalui analisis keterampilan-keterampilan yang akan di ukur dan dijadikan butir tes. Butir tes tunggal atau tes berangkai keterampilan olahraga dalam pendidikan jasmani biasanya digunakan untuk menentukan keterampilan umum dalam suatu cabang olahraga. Untuk  menentukan butir-butir tes keterampilan olahraga yang akan diukur harus dilakukan secara cermat, teliti, dan kritis dengan berdasar pada pertimbangan-pertimbangan yang logis. Selain itu, tes keterampilan olahraga tersebut harus sesuai dengan materi dan tujuan pendidikan yang dinyatakan  dalam pedoman  kurikulum  pendidikan jasmani.

 

Validitas Konstruk

Konstruk adalah kerangka dari suatu konsep. Untuk mengukur suatu konsep, maka harus dilakukan identifikasi lebih dahulu kerangka yang membentuk konsep tersebut. Dengan mengetahui kerangka tersebut maka dapat disusun suatu tolok ukur secara operasional konsep tersebut.

Thomas dan Nelson (1990) menjelaskan bahwa banyak karakter manusia yang tidak diamati secara langsung. Sebaiknya, dibentuk hipotesis yang memuat sejumlah pengertian yang berkaitan bagaimana sifat seseorang pada kelompok tingkat tinggi dibanding dengan sifat seseorang pada kelompok yang rendah. Kecemasan, intelegensi, sportmanship, kreatifitas dan sikap adalah sedikit dari hipotetik konstruk. Validitas konstruk adalah tingkatan suatu tes mengukur konstruk secara hipotetis dan biasanya ditetapkan dengan menghubungkan hasil tes dengan beberapa perilaku.

Kirkendal, Gruber dan Johnson (1980) menjelaskan bahwa secara umum ada tiga teknik yang digunakan untuk menentukan validitas konstruk, yaitu analisis faktor, regresi ganda dari tes berangkai, dan menguji perbedaan dengan kelompok lain. Untuk menentukan validitas konstruk digunakan analisis faktor, ditetapkan suatu konstruk atau struktur teoritis tentang fenomena diacu. Biasanya dengan melakukan penjabaran fenomena menjadi berbagai komponen. Beberapa butir tes disiapkan untuk masing-masing komponen dan dilakukan tes terhadap kelompok subyek. Suatu waktu butir-butir tes berangkai diarahkan untuk mengukur kemampuan yang rumit. Berikutnya ditetapkan kriterion yang sesuai, kemudian teknik regresi ganda digunakan untuk menentukan rangkaian konstruk yang cocok untuk mengukur fenomena. Cara berikutnya untuk menentukan validitas  konstruk yang juga mengacu pada concurrent validity. Diberikan dua tes yang berbeda terhadap kelompok yang berbeda. Beberapa tes olahraga ditentukan validitas konstruknya melalui pem-bandingan dua kelompok.

Verducci (1980) mengemukakan bahwa suatu kunstruk adalah suatu gagasan teoritis yang menerangkan dan mengatur beberapa aspek keberadaan pengetahuan. Di bidang lain, konstruk meliputi gagasan seperti inteligensi, sikap, kesiapan, dan kecemasan; dalam pendidikan jasmani istilah kesegaran jasmani diklasifikasi sebagai suatu konstruk. Validitas konstruk dapat ditentukan dengan pertimbangan secara luas berdasarkan logika dan stitistika data yang mendukung konstruk.

 

Validitas Kriteria

Validitas kriteria diperoleh dengan cara  menghubungkan antara alat ukur  atau tes sebagai prediktor dengan suatu kriteria luar. Perhatian yang utama untuk jenis validitas ini adalah  kriterianya, bukan  pada alat  ukur atau  tes itu sendiri.   Pendekatan empiris digunakan  untuk  menganalisis hubungan antara  alat ukur atau tes dengan kriteria. Meng-identifikasi kriteria yang akan digunakan  merupakan  hal yang penting. Suatu kriteria yang akan digunakan harus memenuhi syarat dan memiliki  ciri-ciri yang dapat diyakini  mengukur sesuatu  yang seharusnya akan diukur. Ciri yang penting adalah kriteria tersebut harus mempunyai relevansi dan mencerminkan dengan tepat sesuatu yang akan diukur. Ciri kedua, suatu kriteria harus dapat diandalkan dan dapat dipercaya. Ciri yang lainnya, suatu kriteria diharapkan bebas dari bias. Skor pada suatu ukuran kriteria hendaknya tidak di-pengaruhi oleh aspek-aspek selain kemampuan atau penampilan yang sesungguhnya pada kriteria tersebut (Safrit: 1981).

Menurut Rakajoni (1975), ditinjau dari cara memperoleh kriteria pembanding, dibedakan menjadi validitas acuan kriteria (criterion referenced validity) dan validitas acuan kelompok (group referenced validity). Pada validitas acuan kriteria, kriteria ditetapkan lebih dahulu yang ditetapkan berdasarkan tujuan pengajaran. Sedangkan validitas acuan kelompok, kriteria ditentukan berdasarkan prestasi kelompok.

Dilihat dari segi waktu diperolehnya kriteria pembanding, dibedakan validitas ramalan (predictive validity) dan validitas pembanding bersamaan (concurrent validity). Nurkancana dan Sumartana (1986) menjelaskan bahwa validitas ramalan adalah ketepatan suatu tes ditinjau dari kemampuan  meramalkan prestasi yang dicapai pada waktu yang akan datang. Dengan demikian, kriteria pembanding diperoleh beberapa waktu berselang setelah tes dilaksanakan. Sedangkan validitas pembanding bersamaan adalah ketepatan suatu tes dilihat dari korelasinya dengan kemampuan yang telah dimiliki saat bersamaan secara riil. Jadi kriteria pembanding diperoleh pada waktu yang sama atau hampir bersamaan.

Teknik analisis untuk menghubungkan skor kriteria dengan skor tes  predik-tor digunakan teknik  statistik korelasional. Oleh karena dalam proses analisis  untuk memperoleh validitas kriteria ini menggunakan teknik-teknik statistik  maka disebut validitas statistik. Satuan tingkat hubungan akan dinyatakan dengan koefisien validitas.  Rentangan  koefisien validitas antara -1 sampai dengan +1. Tentang besarnya koefisien validitas suatu tes agar dapat digunakan sesuai dengan tujuan, Kirkendal, Gruber dan Johnson (1980) memberikan petunjuk sebagai berikut:

Excellent 0,80 – 1.00

High 0,70 – 0,79

Average or Fair 0,50 – 0,69

Unacceptable 0,00 – 0,49

 

Dalam penyusunan suatu tes keterampilan olahraga, ada tiga cara memperoleh validitas yang dihubungkan dengan kriteria. Cara pertama,  menggunakan hasil tes standard atau tes yang sudah dibakukan sebagai kriterion.  Validitas kriteria diperoleh dengan cara mengkorelasikan antara skor hasil tes menggunakan  tes eksperimen (prediktor) dengan skor hasil tes menggunakan tes standard (kriterion).  Jika hasil analisis diperoleh koefisien korelasi yang tinggi maka berarti ada hubungan antara tes eksperimen (prediktor) dengan tes standard. Berarti pula bahwa testi yang mempunyai skor yang baik dari hasil tes kriterion, akan diduga memperoleh skor yang baik pula pada hasil tes prediktor. Contoh:  Brady Volley Test merupakan tes standar bola voli digunakan sebagai kriterion untuk memperoleh validitas kriteria suatu tes keterampilan eksperimen bola voli (Budiwanto: 2001). Cara kedua, sebagai kriterion adalah hasil penilaian para juri (judges rating). Tiga sampai dengan lima juri melakukan  pengamatan dan memberikan penilaian menggunakan skala penilaian pada waktu testi melakukan permainan. Kemudian skor hasil penilaian juri dikorelasikan dengan skor tes prediktor. Diharapkan, pemain yang baik akan mendapatkan skor yang baik dari penilaian para juri dan  mendapat skor baik pula dalam tes prediktor (Kirkendal, Gruber dan Johnson: 1980). Cara ketiga, menggunakan hasil pertandingan kompetisi sebagai kriteria. Pertandingan kompetisi dilakukan antar testi dalam kelompok sampel. Jumlah nilai menang setiap testi dari seluruh pertandingan merupakan kriterion  yang dikorelasikan dengan skor  tes prediktor. Testi yang banyak menang akan mendapat skor tinggi, diharapkan memperoleh  skor yang  tinggi pula  pada tes prediktor (Kirkendal, Gruber dan Johnson: 1980).

Reliabilitas

Tes dikatakan reliabel jika pengukuran menggunakan tes tersebut  diperoleh hasil yang tetap. Kirkendal, Gruber dan Johnson (1980) menjelaskan bahwa reliabilitas adalah tingkat ketetapan suatu tes mengukur apa yang seharusnya diukur. Lebih lanjut, reliabilitas mempunyai pengertian bahwa suatu  tes dapat diandalkan untuk mengumpulkan data. Dapat diandalkan berarti tes tersebut baik, sehingga dapat menghasilkan data yang benar sesuai dengan kenyataan.

Panjang  tes  mempunyai pengaruh  terhadap  reliabilitas. Yang dimaksud  panjang tes adalah jumlah pengetahuan, kemampuan atau keterampilan yang harus diukur, selain itu juga lama waktu  pelaksanaan.  Semakin  panjang  tes ada  kecenderungan semakin reliabel.

Derajad reliabilitas ditunjukkan dengan koefisien korelasi, rentangannya adalah antara -1 sampai dengan +1. Reliabilitas suatu tes ditentukan dengan menghitung koefisien korelasi. Tentang besarnya koefisien reliabilitas suatu tes agar dapat digunakan sesuai dengan tujuan, Kirkendal, Gruber dan Johnson (1980) memberikan petunjuk sebagai berikut:

Excellent 0,90 – 1.00

High 0,80 – 0,89

Average 0,60 – 0,79

Unacceptable 0,00 – 0,59

 

Ada beberapa teknik untuk menaksir reliabilitas suatu tes, yaitu teknik ulangan (test-retest), teknik setara dan teknik belah dua (Verducci: 1980). Jika reliabilitas tes diperoleh dengan  teknik ulangan (test-retest), maka hanya digunakan satu perangkat tes. Pelaksanaannya adalah dilakukan pengukuran pertama kemudian menyusul dilakukan  pengukuran kedua menggunakan tes yang  sama. Selanjutnya menghitung korelasi antara data hasil pengukuran pertama dengan data hasil pengukuran kedua. Hasil korelasi antara data pengukuran pertama dan kedua seringkali disebut juga  koefisien stabilitas.

Reliabilitas yang diperoleh dengan teknik setara harus dibuat dua perangkat tes. Kemudian dilakukan pengukuran menggunakan dua instrumen secara bergantian.. Selanjutnya menghitung korelasi antara hasil dua bentuk tes tersebut. Hasil korelasi antara dua bentuk tes tersebut pada dasarnya mempunyai tingkat  kesetaraan  (koefisien  ekuivalen). Menurut Thomas dan Nelson (1990) teknik ini disebut juga metode paralel atau metode bergantian.

Teknik yang lain untuk menaksir reliabilitas tes adalah teknik belah dua. Reliabilitas tes dengan cara belah dua diperoleh dari dalam test itu sendiri. Suatu tes diberikan kepada sekelompok test, kemudian skor-skor  tersebut dapat dikelompokkan menjadi dua. Cara membelah dua  biasanya dilakukan dengan cara acak atau dengan cara mengelompokkan skor-skor percobaan nomor ganjil dan skor-skor percobaan nomor genap. Koefisien reliabilitas dengan cara belah dua diperoleh dengan melakukan analisis menggunakan teknik statistik  korelasi product moment. Setelah diperoleh koefisien reliabilitas separuh tes dilanjutkan menghitung koefisien reliabilitas tes seutuhnya menggunakan rumus Spearman-Brown Prophecy. Koefisien korelasi yang diperoleh merupakan koefisien reliabilitas yang mengukur konsistensi internal (Verducci: 1980).

Untuk memperoleh reliabilitas  tes keterampilan olahraga dengan cara belah  dua hanya digunakan jika jumlah percobaan tes terdiri dari beberapa kali yang memungkinkan untuk dibelah (dikelompokkan) menjadi dua kelompok.

Contoh: tes servis bola voli dilakulan sepuluh kali percobaan. Maka, ada sepuluh skor percobaan, dari percobaan pertama sampai dengan percobaan kesepuluh. Skor-skor tersebut dikelompokkan menjadi dua dilanjutkan menghitung  korelasi  antara belah pertama dan belah kedua. Kemudian dilanjutkan dengan  menghitung koefisien korelasi tes keseluruhan menggunakan rumus dari Spearman-Brown (Abdoellah: 1975).

Cara membelah menjadi dua kelompok dapat dilakukan dengan cara acak (random) yaitu menggunakan bilangan random atau cara undian. Dapat pula dilakukan dengan mengelompokkan skor-skor percobaan nomor ganjil dan nomor genap.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

Awan Tag

%d blogger menyukai ini: