Senin, 20 Mei 2013

INSTRUMEN TES


A.    INSTRUMEN TES
1.      Pengertian Tes
Nitko (2007: 5) mendefinisikan tes sebagai suatu instrument atau prosedur sistematik untuk mengobservasi atau mendeskripsikan satu atau lebih karakteristik siswa dengan menggunakan skala numerik atau skema pengklasifikasian sedangkan menurut Ebel (1986:16) tes adalah sekumpulan pertanyaan-pertanyaan yang memiliki jawaban benar, dimana peserta tes biasanya menjawabnya dengan lisan atau tulisan.
Tujuan utama tes dan asesmen kelas adalah untuk mendapatkan kevalidan, reliabilitas, dan kebergunaan informasi yang menyangkut prestasi siswa. Hal ini membutuhkan penentuan dalam hal apakah yang dapat diukur dan kemudian mendefinisikan hal tersebut secara tepat sehingga tugas tersebut dapat dikonstruksi yang membutuhkan pengetahuan yang diharapkan, keterampilan, dan pemahaman dengan meminimalisir pengaruh yang tidak relevan atau keterampilan tambahan. (Miller et al, 2009: 139)

2.      Tujuan Tes dan Assesmen Kelas
Pemberian tes dapat dilakukan berdasarkan tujuan pembelajaran dan penilaian yang berbeda-beda, antara lain yaitu:
a.       Sebelum Pengujian (Pretest)
Tes dan asesmen yang diberikan diawal suatu pembelajaran bertujuan untuk menentukan (a) apakah siswa memiliki keterampilan prasyarat yang dibutuhkan untuk pembelajaran, atau (b) untuk mengetahui tingkat kesiapan siswa untuk mencapai tujuan pembelajaran yang direncanakan (untuk menentukan posisi siswa atau modifikasi pembelajaran). (Miller et al, 2009:140)
Pretest diberikan kepada siswa sebelum guru memulai pembelajaran tentang suatu unit tertentu. Hasil dari pretest tersebut tidak digunakan untuk menilai prestasi siswa. Lebih lanjut, hasil pretest tersebut digunakan untuk mengetahui sikap siswa, pengetahuan awal, keyakinan (belief) dan pengalaman siswa tentang materi terkait sehingga guru dapat melaksanakan pembelajaran suatu materi tertentu dengan baik (Nitko, 2007: 111-112).
b.      Pengujian dan Penilaian selama Pembelajaran (Penilaian Formative)
Tes dan asesmen diberikan selama pembelajaran menyediakan basis untuk asesmen formatif. Hal ini digunakan untuk memonitorng kemajuan pembelajaran, mendeteksi miskonsepsi, menyemangati siswa untuk belajar, dan menyediakan umpan balik untuk siswa dan guru (Miller et al, 2009:141). Penilaian formatif dilakukan saat masih dalam proses pelaksanaan pembelajaran. Dengan demikian, penilaian formatif membantu guru untuk memantau proses belajar siswa ketika pembelajaran masih berlangsung (Nitko, 2007:106). Penilaian formatif yang berkualitas tinggi dan feedback untuk siswa akan sangat membantu siswa selama proses pembelajaran. Beberapa tujuan dari penilaian formatif antara lain (Nitko, 2007: 107):
·      Sizing up, berguna untuk membantu guru dalam membentuk kesan tentang kekuatan, kelemahan, karakteristik, dan kepribadian siswa.
·      Mendiagnosa kebutuhan belajar masing-masing siswa, yang membantu guru dan siswa mengidentifikasi apa yang sudah siswa pelajari, yang masih  diperlukan untuk dipelajari, menentukan bagaimana pengajaran yang diperlukan, dan memutuskan umpan balik apa yang diperlukan.
·      Mendiagnosa kebutuhan belajar kelompok yang membantu guru mengidentifikasi perkembangan  belajar di dalam kelas secara keseluruhan, apa yang perlu diperkuat atau diajarkan kembali, dan kapan kelompok siap berpindah ke pelajaran baru.
·      Menggunakan prosedur penilaian sebagai teaching tools adalah cara dimana guru menggunakan proses penilaian sebagai strategi pembelajaran. Misalnya guru memberikan latihan soal-soal untuk membantu siswa memahami tipe-tipe tugas atau pertanyaan yang akan digunakan dalam penilaian, membatu siswa untuk latihan menjawab dan mengingat cara memperoleh jawaban atau membantu siswa untuk meningkatkan kecepatan siswa untuk memberikan respon dalam penilaian.
·      Menyediakan umpan balik khusus yang memberikan informasi kepada siswa mengenai bagaimana cara untuk berkembang.
·      Meningkatkan penilaian terhadap diri siswa sendiri sehingga memungkinkan siswa untuk dapat memantau proses belajar siswa itu sendiri, tujuan belajarnya, serta aksi siswa utnuk dapat mencapai tujuan tersebut.
·      Perencanaan pengajaran membantu guru mendesain dan menerapkan pendekatan belajar dan aktivitas pengajaran, materi apa yang diperlukan dan mengorganisasi dan mengatur kelas sebagai lingkungan belajar.
c.       Pengujian dan Penilaian pada Akhir Pembelajaran (Penilaian Sumative)
Pada akhir pembelajaran (seperti unit atau kursus), ketertarikan utama kita adalah mengukur keluasan outcome pembelajaran yang diharapkan dan tindakan-tindakan standar yang telah dicapai. Meskipun tes dan asesmen pada akhir pembelajaran ini umumnya telah menggunakan asesmen sumatif (seperti, untuk menyatakan prestasi atau kenaikan kelas), mereka juga memberikan fungsi lain. Tes pada akhir pembelajaran dapat digunakan sebagai umpan balik terhadap siswa, menyemangati siswa untuk maju dan mengerjakan yang lebih menantang, menentukan kerja remedial, dan menilai pembelajaran (Miller et al, 2009:141-142). Penilaian sumatif membantu guru mengevaluasi belajar siswa setelah mengajar satu atau lebih bab dari suatu mata pelajaran (Nitko, 2007: 107). Tes untuk kegunaaan ini diberikan diakhir suatu pelajaran, atau akhir semester. Beberapa contoh kegunaan sumatif dari hasil tes, yaitu (Nitko, 2007: 107):
·      Penentuan tingkat sebagai kartu laporan yaitu suatu cara dimana guru mencatat evaluasi kemajuan belajar setiap siswa untuk dikomunikasikan kepada siswa, orangtua siswa, dan wewenang pendidikan yang bertanggungjawab.
·      Penempatan siswa dalam posisi mengulang atau melanjutkan pelajaran yaitu suatu cara dimana guru berusaha untuk menyesuaikan pengajaran dengan kebutuhan individu.
·      Mengevaluasi pengajaran diperlukan guru untuk meninjau pengajaran yang telah membuat siswa mampu mendemonstrasikan setelah pelajaran selesai, mengidentifikasi pelajaran yang telah dikuasai oleh siswa tertentu, dan menentukan strategi pengajaran yang dapat meningkatkan kemampuan siswa pada pelajaran berikutnya.


Tipe Dasar Tes dan Penilaian Kelas
Fungsi
Waktu
Sebelum Pembelajaran
Selama Pembelajaran
Akhir Pembelajaran
Kesiapan
Penempatan
Formative
Diagnosa
Summative
Fokus pengukuran
Keterampilan Prasarat
Tujuan rangkaian pembelajaran atau unit
Sebelum mendefinisikan segmen pembelajaran
Sebagian besar kesalahan umum pembelajaran
Tujuan rangkaian pembelajaran atau unit
Keaslian contoh
Keterbatasan sample pada keterampilan yang dipilih
Sampel luas terhadap semua tujuan
Sampel yang terbatas pada tugas pembelajaran
Sample yang terbatas pada kesalahan spesifik
Sampel luas pada semua tujuan
Kesulitan Item
Biasanya pada tingkat kesulitan yang rendah
Biasanya pada jangkauan kesulitan yang luas
Berubah sesuai dengan segmen pembelajaran
Biasanya pada tingkat kesulitan yang rendah
Biasanya memiliki jangkauan kesulitan yang luas
Waktu pelaksanaan
Awal rangkaian pembelajaran atau unit
Awal rangkaian pembelajaran atau unit
Secara periodik selama pembelajaran
Dibutuhkan selama pembelajaran
Akhir rangkaian pembelajaran atau unit
Penggunaan hasil
Remedi terhadap kekurangan yang masuk atau penempatan kelompok belajar
Perencanaan pembelajaran dan penempatan kemajuan
Meningkatkan dan pembelajaran langsung melalui umpan balik sambil jalan
Memperbaiki kesalahan yang berkaitan dengan kesulitan pembelajaran yang terus-menerus
Kenaikan kelas, menyatakan prestasi, atau evaluasi pengajaran

3.      Mengembangkan Spesifikasi Tes dan Penilaian
a.       Membangun Suatu Tabel Spesifikasi
Membangun suatu tabel spesifikasi meliputi: (a) menyiapkan suatu daftar mengenai tujuan pembelajaran (b) menguraikan konten dari kursus tersebut, dan (c) menyiapkan the two-way chart.
Menyiapkan daftar tujuan pembelajaran. Menggunakan prosedur untuk menyatakan tujuan pembelajaran, selanjutnya daftar tujuan umum dan spesifik outcome pembelajaran yang telah disiapkan. Daftar tujuan yang dibatasi untuk outcome tersebut dapt diukur dengan suatu asesmen kelas. Bentuk pertanyaan tes atau tugas asesmen mungkin berubah sebagai suatu fungsi terhadap outcome. Outcome meliputi kata kerja seperti mengidentifikasi, membedakan, atau mencocokkan secara efektif dan efisien, diukur dengan menggunakan pilihan ganda atau jenis lain tujuan item tes.
Menguraikan konten pembelajaran. Langkah kedua dalam menyiapkan suatu tabel spesifikasi adalah dengan membuat suatu uraian mengenai konten pembelajaran. Tujuan pembelajaran memaparkan suatu indikasi area yang menunjukkan setiap jenis tindakan. Banyaknya detail untuk dilibatkan dalam menguraikan konten adalah agak semau-maunya, tetapi suatu gambaran sebaiknya bisa lebih didetailkan untuk memastikan suatu sample yang cukup pada konten dan sebaiknya mampu menterjemahkan hasil.
Menyiapkan the Two-Way Chart. Langkah terakhir dalam membuat suatu tabel spesifikasi adalah dengan menyiapkan a two-way chart yang mengaitkan tujuan pembelajaran dengan konten pembelajaran, kemudian menspesifikasikan sampel item tes dan asesmen.
b.      Contoh Spesifikasi yang Lain
Disebabkan karena hal ini adalah pembahasan yang cukup luas, suatu tabel spesifikasi dirasa sangat berguna dalam mengkonstruksi suatu tes atau asesmen akhir dari suatu pembelajaran. Dalam hal ini, tabel tersebut memastikan bahwa setiap tipe outcome pembelajaran akan menerima perhatian yang tepat dalam suatu tes. Apakah tabel spesifikasi tersebut berguna dalam mengkonstruksi suatu tes akhir pada area yang lebih dibatasi, bagaimanapun, bergantung pada ruang lingkup outcome pembelajaran yang termuat dalam tes tersebut. Jika domain penugasan adalah sangat terbatas, suatu tabel spesifikasi mungkin tidak dibutuhkan. Namun jika suatu tes matematika telah memuat suatu domain prestasi yang lebih besar, maka tabel spesifikasi cukup berguna.
c.       Menggunakan a One-Way Classification System
Untuk tes-tes dalam beberapa area, a one-way classification of items mungkin dibutuhkan untuk kesemua area tersebut. Sebagai contoh, dalam perencanaan suatu tes membaca, suatu daftar keterampilan membaca dan banyaknya item tes untuk mengukur setiap keterampilan mungkin cukup untuk menspesifikasikan, apakah yang diukur oleh tes tersebut. Kontennya mungkin berubah dari waktu ke waktu tetapi keterampilan yang dihasilkan relatif tetap. Sehingga, suatu daftar baku (master) keterampilan dapat disiapkan untuk digunakan.

4.      Memilih Jenis Item yang Tepat
Tes kelas terdiri dari item tes obyektif dan performance assessment (penilaian kinerja) yang memungkinkan siswa untuk membentuk respon atau melakukan tugas tertentu. Item tes objektif sangat terstruktur dan siswa perlu untuk mengisikan satu atau dua kata atau untuk memilih jawaban yang benar dari alternatif jawaban yang diberikan. Tugas tersebut disebut obyektif karena memiliki hak tunggal atau jawaban terbaik yang dapat ditentukan.
Tugas penilaian kinerja, seperti pertanyaan esai, memungkinkan siswa untuk mengatur dan membangun jawaban dalam bentuk esai. Jenis lain dari tugas penilaian kinerja mungkin siswa perlu untuk menggunakan peralatan, menghasilkan hipotesis, melakukan pengamatan, membangun sesuatu atau tampil untuk audiens. Untuk tugas penilaian kinerja, tidak ada hak tunggal atau mungkin ada berbagai tanggapan yang dianggap sangat baik. Penilaian ahli diperlukan untuk menilai kinerja siswa. Untuk beberapa tujuan instruksional, item obyektif mungkin paling efisien, sedangkan untuk yang lain, penilaian kinerja dapat dianggap paling memuaskan.



a.       Item Tes Objektif
Jenis item tes objektif yang sangat dikenal dapat digolongkan dalam; siswa mengisikan jawaban mereka, dan siswa memilih jawaban dari sejumlah alternatif jawaban yang diberikan. Keduanya tersebut biasanya menjadi tipe dasar dari item tes objektif.
Contoh:
Short Answer (Jawaban Singkat)
Berapa nilai dari x dalam persamaan 2x + 5 = 9?
Completion  (Penyempurnaan )
Dalam persamaan 2x+ 5 = 9, x = ____
Matching (Pencocokan)
       (C)       1. And             A. Adjective
       (D)       2. Dog             B. Adverb
       (G)       3. Jump            C. Conjuction
       (F)       4. She              D. Noun
       (B)       5. Quickly       E. Preposition
                                           F. Pronoun
                                           G. Verb
True-False atau Alternatif Jawaban
            Yes            No             Persamaan 2x + 5 = 9, nilai x = 3.
            Yes            No             Asam merubah kertas lakmus menjadi merah

Multiple Choice
Persamaan 2x + 5 = 9, 2x artinya....
a.       2 ditambah x
b.      2 dikurangi x
c.       2 dibagi dengan x
d.      2 dikali dengan x
Item tes objektif memberikan tugas yang sangat terstruktur kepada siswa, yang membatasi jenis respon yang dapat mereka buat. Penataan masalah dan pembatasan pada metode respon yang diberikan oleh siswa akan berkontribusi pada penilaian obyektif yang cepat, mudah, dan akurat. Sisi negatifnya, penataan yang sama membuat item tes objektif tidak pantas untuk mengukur kemampuan untuk merumuskan masalah, kemampuan untuk memilih, mengatur, dan mengintegrasikan ide-ide.
b.      Tugas Penilaian Kinerja
Tugas penilaian kinerja (performance assessment tasks) juga diperlukan untuk mengukur kemampuan siswa untuk terlibat dalam kegiatan tangan, seperti melakukan percobaan, merancang dan melakukan survei, atau menciptakan sebuah benda. Esai adalah bentuk yang paling umum digunakan dalam tugas penilaian kinerja. Klasifikasi esai didasarkan pada jumlah kebebasan respon siswa yang diperbolehkan, yaitu esai respon-diperpanjang (extended-response essay questions) di mana siswa diberi kebebasan sampai selesai dalam membuat tanggapan mereka, dan pertanyaan esai respon-terbatas (restricted-response essay question), di mana sifat, panjang, atau organisasi dari respon terbatas.
Tiga kelemahan dari tes tugas penilaian kerja, yaitu:
·         Tidak efisien untuk mengukur pengetahuan tentang materi faktual karena pertanyaan yang begitu luas.
·         Kriteria penilaian yang tidak jelas kepada siswa karena tidak terdaftar dengan item.
·         Penilaian sulit dan cenderung tidak dapat diandalkan karena respon termasuk berbagai informasi faktual dari berbagai tingkat ketepatan, diselenggarakan dengan berbagai tingkat koherensi, dan dinyatakan dengan berbagai tingkat keterbacaan dan keringkasan.
Oleh karena itu, pertanyaan esai respon-diperpanjang paling baik digunakan untuk menilai tujuan kognitif yang lebih kompleks yang melibatkan aplikasi, evaluasi, atau kemampuan untuk mengekspresikan ide-ide koheren, cara persuasif.

c.       Memilih Jenis Paling Tepat dari Item-item dan Tugas-tugas
Sebuah prinsip dasar dalam memilih jenis item tes dan penilaian tugas untuk digunakan adalah memilih jenis item yang menyediakan ukuran yang paling mengukur dari hasil pembelajaran yang diharapkan. Misalnya, jika hasil belajar yang dimaksud adalah menulis, penamaan, mendaftar, atau berbicara, tugas harus memerlukan siswa untuk mengisikan jawabannya. Jika hasilnya melibatkan penggunaan peralatan laboratorium untuk memecahkan masalah, tugas kinerja laboratorium yang sebenarnya akan cukup. Di sisi lain, jika tugas untuk mengidentifikasi jawaban yang benar, suatu item pilihan-jawaban harus digunakan.
Dalam memutuskan pilihan-jenis item untuk digunakan, pada umumnya adalah dengan menggunakan item multiple-choice. Penggunaan item benar-salah biasanya paling berguna dalam contoh-contoh khusus di mana hanya ada dua alternatif yang mungkin (misalnya, membedakan antara prosedur yang benar dan salah). Matching item adalah bentuk khusus dari item pilihan ganda dan harus digunakan hanya di mana serangkaian hal homogen yang berhubungan (misalnya, tanggal dan peristiwa atau penulis dan buku). Item pilihan ganda lebih disukai karena penggunaan empat atau lima alternatif mengurangi kemungkinan menebak jawaban dan memberikan petunjuk untuk kesalahpahaman siswa,

B.     TES PILIHAN GANDA
1.      Format Item Pilihan Ganda (Multiple Choice Items)
Butir tes pilihan ganda terdiri atas satu atau lebih kalimat pengantar dan disertai oleh dua atau lebih pilihan jawaban. Siswa harus memilih jawaban yang benar diantara pilihan jawaban yang diberikan. Format dari Multiple Choice Item terdiri atas (Nitko, 2007:166):
a.       Stem
Stem merupakan bagian dari butir soal pilihan ganda yang menetapkan apa yang harus dilakukan oleh siswa atau menyatakan suatu pertanyaan atau masalah yang harus diselesaikan oleh siswa. Stem yang disusun harus mudah dipahami, artinya siswa mengerti apa yang harus dilakukan atau pertanyaan apa yang harus dijawab.
b.      Pilihan jawaban (alternatives, choice, options)
Pilihan jawaban pada soal pilihan ganda disebut juga alternatives, responses, choices, dan options. Alternatif jawaban yang disediakan harus bermakna (logically, numerik, alfabet, dan sebagainya). Tujuan dari penyusunan pilihan jawaban yang bermakna yaitu agar tidak memberikan pola/ letak jawaban yang tetap, sehingga siswa yang tidak mengetahui jawabannya tidak dapat menebak posisi dari jawaban benar, serta dengan aturan ini akan menjaga efektifitas waktu siswa.
c.       Jawaban dan pengecoh (Keyed alternative and Distractors)
Kunci jawaban adalah pilihan jawaban yang benar atau yang paling benar untuk menjawab pertanyaan yang diberikan, sedangkan pilihan jawaban yang tidak benar dinamakan pengecoh (distraktor atau foil). Tujuan dari pemberian distraktor adalah untuk menyediakan jawaban-jawaban yang masuk akal (namun tidak benar) dari suatu pertanyaan atau pernyataan pada stem. Pilihan jawaban ini harus masuk akal bagi siswa  yang level pemahaman terhadap apa yang ditanyakan kurang.
Text Box: Contoh item pilihan ganda:

Himpunan semua faktor dari 20 adalah…       Stem
a.	{1,2,4,5,10,20}		  keyed alternative (kunci jawaban)
b.	(1,2,4,10,20}							Alternatives 
c.	1,2,4,5,20}		  distracters (pengecoh) 			(Pilihan Jawaban)
d.	{2,4,5,10,20}

d.      Penjelasan/informasi (Intepretative Material)
Pada beberapa kasus, informasi tambahan diperlukan untuk menjadikan sebuah pertanyaan lebih jelas. Informasi tambahan tersebut disebut interpretive material.  Butir soal yang memuat informasi tambahan disebut context independent items, interpretative exercises, atau  linked items. Perhatikan butir soal berikut ini:
Interpretative Material
 

Berdasarkan grafik diatas, notasi pembentuk himpunan untuk tempat kedudukan titik-titik yang berada di daerah yang diarsir adalah…
A.  { (x,y) çx > -2, y > 3, x,y Î R}
B.  { (x,y) çx > -2, y > 3, x,y  ÎR}
C.  { (x,y) çx < -2, y > 3, x,y  ÎR}
D.  { (x,y) çx < -2, y > 3, x,y  ÎR}

2.      Pengembangan item pilihan ganda
a.       Hal-hal yang harus diperhatikan sebelum menyusun soal pilihan ganda.
1)      Kemiripan pengecoh
Pemikiran siswa terletak pada suatu titik tertentu di sekitar learning continuum. Guru dapat membuat tes untuk siswa pada level yang spesifik pada learning continuum. Siswa yang berada pada level ini (atau di atasnya) seharusnya mampu untuk menjawab soal tersebut dengan benar, namun tidak untuk siswa yang berada pada level di bawahnya. Alternatif jawaban yang mirip atau seragam akan meningkatkan level kesulitan butir.
Contoh:
1.      Jika parabola p (lihat gambar) dinyatakan dengan , maka syarat yang harus dipenuhi adalah …
A.    *
B.    
C.    
D.   
E.    

2.      Jika parabola p (lihat gambar) dinyatakan dengan , maka syarat yang harus dipenuhi adalah …
A.    ,   dan *
B.     ,   dan
C.     ,   dan
D.   
E.      
Butir nomor 1 dan 2 menanyakan pertanyaan yang sama, tetapi diperlukan pengetahuan yang lebih spesifik untuk dapat menjawab pertanyaan kedua. Berdasarkan contoh tersebut, dapat diketahui bagaimana pilihan jawaban (alternatives) dapat membuat butir pertanyaan menjadi mudah atau sulit.
2)      Tujuan Dasar Penilaian (The Basic Purpose of an Assessment Task)
Suatu tes jarang yang mampu membedakan siswa secara terstruktur. Artinya tes itu tidak mampu benar-benar membedakan siswa yang telah mencapai kompetensi tertentu dengan siswa yang belum mencapai kompetensi. Beberapa siswa dengan kemampuan rendah mungkin akan mampu menjawab benar suatu butir soal, sedangkan siswa yang lebih tinggi kemampuannya malah tidak bisa mengerjakan tugas tersebut dengan benar. Tujuan dasar suatu penilaian baik penilaian melalui tes pilihan ganda atau bukan adalah untuk mengidentifikasi siswa yang telah mencapai tingkat pengetahuan atau kompetensi dari tujuan pembelajaran yang ditentukan.

3)      Ragam (jenis-jenis) tes pilihan ganda
Guru-guru dan para pengembang tes menggunakan berbagai jenis tes pilihan ganda. Adapun jenis-jenis butir pilihan ganda yaitu
·         The correct answer variety
Contoh:
Keliling sebuah segitiga sama kaki 36 cm. Jika panjang alasnya 10 cm, maka luas segitiga itu adalah...
A.  360 cm2
B.  180 cm2
C.  120 cm2
D.  60 cm2*
·         The negative variety
Contoh:
Diketahui nilai rapor A : 7, 7, 7, 7, 7, 7, 7
Nilai rapor B : 4, 5, 6, 7, 8, 9, 10
Nilai rapor C : 4, 7,7, 7, 7, 7, 10
maka pernyataan berikut yang TIDAK tepat adalah …
A.    Rata-rata hitung nilai ketiga rapor sama
B.     Median ketiga rapor sama
C.     Jangkauan nilai ketiga rapor sama*
D.    Simpangan kuartil ketiga rapor sama
·         The incomplete statement variety
Contoh:
Untuk , gradient garis singgung kurva
A.    dapat positif atau negative
B.     dapat sama dengan nol
C.     selalu positif*
D.    selalu negative
E.     sama dengan nol
·         The combined response variety
Contoh:
Perhatikan pernyataan-pernyataan di bawah ini !
I.     Sisi-sisi yang berhadapan sama  panjang dan sejajar
II.    Empat sudutnya sama besar dan siku-siku
III.  Diagonal-diagonalnya saling membagi dua sama panjang
IV.  Dapat dimasukkan ke dalam bingkainya dengan 2 cara
Dari pernyataan-pernyataan di atas yang merupakan sifat persegi panjang adalah…
A.  I, II, dan IV*
B.  II, III, dan IV
C.  I, II, dan III
D.  I, III, dan IV


b.      Prosedur penyusunan butir pilihan ganda
Beberapa hal dasar yang harus dilakukan untuk menyusun butir pilihan ganda, antara lain (Nitko, 2007:171):
·         Fokuskan butir untuk mencapai tujuan pembelajaran yang spesifik.
·         Siapkan stem sebagai pertanyaan atau masalah untuk dipecahkan
·         Tulis pilihan jawaban yang ringkas dan benar
·         Tulis pengecoh yang masuk akal (logis)
·         Periksa butir untuk menghilangkan petunjuk yang tidak relevan dengan jawaban yang benar.
Hal-hal yang perlu diperhatikan dalam penulisan butir pilihan ganda, yaitu:
1)      Penyusunan Stem
Mengenai  hal-hal yang harus dilakukan untuk menyusun stem yang baik, antara lain yaitu:
·         Pertanyaan yang Langsung Diajukan atau Tersirat
Setelah membaca stem, siswa seharusnya memahami maksud utama dari butir dan jenis jawaban yang diharapkan. Stem seharusnya mengajukan pertanyaan langsung atau seharusnya menunjukkan permasalahan yang jelas untuk diselesaikan siswa.
Cara sederhana untuk memeriksa kekurangan stem adalah dengan menutup pilihan jawaban kemudian membaca stem. Berdasarkan stem yang berdiri sendiri, dapatkah kita menentukan apa yang diharapkan dari siswa? Jika tidak, stem tersebut tidak lengkap dan kita harus menulis ulang stem tersebut.
·         Letakkan Pilihan Jawaban di Akhir Stem
Jika kita tidak mengikuti aturan ini, kita akan mengalami masalah serupa yang dihadapi pada butir melengkapi ketika kosong (blank) tidak ditempatkan di akhir kalimat yang tidak lengkap.
·         Pemilihan  Kosakata dan Struktur Kalimat
Ketika pengujian materi pelajaran, pastikan bahwa frase/kalimat yang digunakan pada butir soal cocok untuk siswa. Kita tidak perlu menggunakan kalimat yang panjang, kosakata yang sulit, dan struktur kalimat lengkap yang tak perlu karena mengganggu kemampuan siswa untuk menjawab butir.
Mengenai hal-hal yang harus dihindari dalam menyusun stem yang baik, antara lain yaitu:
·         Window dressing
Pada bahasan sebelumnya,  kata-kata asing tidak perlu digunakan karena dapat mempersulit butir. Penggunaan kata yang kurang jelas yaitu penggunaan kata-kata yang cenderung "memperindah"  stem untuk membuat seolah-olah itu menguji sesuatu yang penting (Ebel, 1965). Window dressing seringkali berada pada butir ketika kita sedang menguji kemampuan kognitif pada tingkat yang lebih tinggi, seperti aplikasi. Window dressing membuat butir muncul untuk mengukur aplikasi. Butir pilihan ganda yang baik adalah butir yang menghindari “window dressing”. Setiap kata yang digunakan dalam butir harus memiliki tujuan. Kadang-kadang nama, tempat, dan "fakta" lain tentang situasi adalah bagian penting dari informasi yaitu mereka dapat memberikan pengetahuan siswa untuk menentukan jawaban yang benar.
Contoh:
( Menggunakan window dressing )
Terdapat 10 mahasiswa jurusan pendidikan matematika (terdiri dari 3 pria dan 7 wanita) yang mengikuti program penurunan berat badan. Pada awal program, rata-rata berat badan kesepuluh mahasiswa tersebut adalah 70 kg. Jika diketahui bahwa rata-rata tiga orang mahasiswa yang mengikuti program tersebut adalah 90 kg. Berapakah rata-rata berat badan 8 orang wanita pada awal program tersebut?
A.    70 kg
B.     68 kg
C.     65 kg
D.    61 kg*
(Menghindari window Dressing)
Diketahui rata-rata berat badan 10 orang adalah 70 kg. Jika rata-rata berat badan 3 orang laki-laki diantaranya adalah 90 kg, maka rata-rata berat badan ketujuh orang yang lainnya adalah …
A.    70 kg
B.     68 kg
C.     65 kg
D.    61 kg*
·         Kata Negatif pada Stem, jika memungkinkan gunakan frase positif.
Kata negatif pada stem, seperti  “dari berikut ini mana yang tidak ...," cenderung membingungkan siswa, terutama siswa yang kurang hati-hati. Butir dengan kata positif lebih mudah bagi siswa daripada butir dengan kata penghubung negatif. Jika frase negatif harus digunakan maka gunakan kata negatif hanya dalam stem atau hanya dalam pilihan (bukan kedua-duanya), dan gunakan garis bawah atau huruf  kapital pada kata negatif.
·         Memberikan pertanyaan yang menyebabkan adanya pendapat pribadi dari siswa.
Jangan menanyakan pilihan pribadi siswa dalam konteks tes pilihan ganda dimana siswa ingin memilih satu pilihan yang benar. Setiap orang berhak untuk memilih. Jika Anda meminta siswa untuk memilih dalam butir pilihan ganda, setiap pilihan mungkin benar.
·      Kata-kata textbook
Seperti dengan butir benar-salah, ketika kita menyalin kalimat kata demi kata dari teks, maka butir tidak baik karena
(a)   Seringkali, kalimat kehilangan makna ketika anda keluar dari konteks.
(b)   Kita mendorong hafalan materi dari buku teks bukannya pemahaman.
(c)    Kita akan cenderung untuk menghasilkan butir yang kaku dengan pengecoh yang tidak masuk akal.
(d)   Siswa yang hanya memiliki pemahaman sedikit tentang konsep dasar atau prinsip dapat memperoleh petunjuk untuk jawaban yang benar dengan hanya mengingat kata-kata yang ada di buku.
Kita harus menggunakan kata-kata stem yang baru, mungkin kurang dikenal, dan pilihan yang benar untuk menguji pemahaman yang lebih mendalam tentang suatu konsep atau prinsip. Kita harus menghindari kalimat textbook. Hal yang harus dilakukan adalah menyatakan gagasan utama bagian buku teks dengan kata-kata kita sendiri dan mengulang sebagai sebuah pertanyaan adalah salah satu cara untuk menghindari kalimat textbook.
·         Linking items.
Linking items berarti bahwa jawaban butir yang selanjutnya atau yang lainnya ditentukkan oleh jawaban yang benar pada butir sebelumnya. Dengan kemungkinan pengecualian butir tergantung pada konteks, setiap butir harus menilai kemampuan yang berbeda, dan jawaban yang benar untuk butir tidak boleh memberi petunjuk untuk butir yang lain. Dua kekurangan yang harus dihindari adalah menghubungkan dan memberi petunjuk. Menghubungkan berarti jawaban untuk butir satu atau lebih tergantung pada jawaban benar yang didapat dari butir sebelumnya. Butir yang terhubung (linking items) sering mengakibatkan kesalahan ganda bagi siswa jika jawaban yang sebelumnya salah. Clueing berarti petunjuk jawaban yang benar dari satu butir diperoleh dalam butir lainnya pada tes.
Butir pilihan ganda yang sering digunakan adalah untuk menempatkan definisi istilah dalam stem dan menggunakan daftar kata-kata sebagai pilihan jawaban. Ketidaksempurnaan pendekatan ini adalah bahwa hal itu meningkatkan kemungkinan siswa akan mendapatkan jawaban dengan hanya menggunakan sekilas pengetahuan definisi yang dinilai. Siswa dapat memperoleh jawaban yang benar hanya dengan mengetahui bahwa kata-kata dalam definisi "terlihat seperti" (tampaknya sama dengan) sebuah kata dalam pilihan jawaban. Untuk menilai apakah siswa memiliki pengetahuan yang mendalam tentang istilah, masukkan istilah dalam stem dan tulis berbagai definisi dalam pilihan jawaban. Butir ini dapat dibuat lebih mudah atau sulit tergantung pada seberapa mirip pilihan jawaban.
Contoh:
1.      Keliling persegi panjang adalah 350 cm. Jika panjang persegi panjang tersebut adalah 3 cm lebih panjang dari pada lebarnya, maka lebar persegi panjang tersebut adalah …
A.    18,7 cm
B.     86,0 cm*
C.     89,0 cm
D.    116,7 cm
2.      Berapakah luas persegi panjang pada pertanyaan nomor 1?
A.    1.050 cm2
B.     7.396 cm2
C.     7.654 cm2*
D.    8.188 cm2
3.      Diketahui lebar persegi panjang adalah 3 cm, dan panjangnya 4 cm. Luas persegi panjang adalah …
A.    9 cm2
B.     12 cm2*
C.     16 cm2
D.    17 cm2
Pada contoh diatas, butir kedua mengandung linking items, dimana jawaban butir nomor 2 sangat ditentukan oleh jawaban pada butir 1. Sedangkan butir ketiga tidak mengandung linking items.
·         Menggunakan deskripsi atau definisi pada pilihan jawaban.
Pada butir pilihan ganda definisi istilah sering diletakkan pada stem dan menggunakan daftar kata-kata sebagai pilihan jawaban. Namun untuk dapat menilai apakah siswa memiliki pengetahuan yang mendalam, masukkan istilah dalam stem dan tulis berbagai definisi dalam pilihan jawaban.

2)      Penyusunan Alternative Jawaban/ Options/ Choices  atau Distractor/Foils.
Penyusunan pilihan jawaban perlu memperhatikan beberapa hal. Berikut beberapa poin penting yang perlu dilakukan dalam menyusun pilihan jawaban butir pilihan ganda:
·         Pilihan jawaban yang berfungsi dan masuk akal
Pengecoh yang masuk akal (plausible distractor) adalah pilihan jawaban salah yang terlihat benar bagi siswa yang tidak memahami dengan baik materi yang diujikan. Alternatif jawaban yang diberikan harus masuk akal sehingga siswa dengan pengetahuan yang kurang tidak mampu menjawab pertanyaan tersebut.
Sebuah pilihan jawaban fungsional mencakup tujuan yang ditulis. Ini berarti pilihan jawaban pengecoh yang menarik setidaknya ada salah satu siswa yang tidak memiliki pengetahuan yang kita harapkan memilihnya. Dan suatu pilihan jawaban merupakan kunci jawaban adalah fungsional jika semua siswa yang memiliki tingkat pengetahuan yang kita harapkan memilihnya.
Sebagai contoh, butir mungkin mempunyai lima pilihan jawaban. Jika siswa dengan pengetahuan rendah dapat menghilangkan dua pengecoh, namun hanya sisanya yaitu tiga yang dianggap jawaban masuk akal. Pada kenyataannya, kemudian, butir tersebut hanya memiliki tiga pilihan jawaban fungsional. Untuk tujuan praktis, lebih baik menghapus dua alternatif yang tidak berfungsi. Pengecoh yang tidak berfungsi disebut "deadwood" atau pengisi pilihan jawaban.
·         Pilihan Jawaban yang Homogen
Kurangnya homogenitas adalah alasan utama mengapa pengecoh tidak berfungsi. Butir dikatakan memiliki pilihan jawaban yang homogen ketika setiap pilihan jawaban termasuk dalam "hal" yang sama dan setiap pilihan jawaban sesuai dengan pertanyaan yang ditanyakan atau masalah yang ada pada stem. Butir dikatakan memiliki pilihan jawaban heterogen ketika satu atau lebih pilihan jawaban tidak termasuk dalam hal yang sama.
·         Masukkan Kata yang Berulang di Stem pada alternative jawaban
Secara umum, akan lebih baik jika terdapat kata-kata atau frase pada stem yang diulang di setiap pilihan jawaban. Dengan demikian akan membantu siswa untuk lebih jelas memahami tugas atau pertanyaan yang harus dijawab siswa.
·         Tanda Baca yang Konsisten dan Benar
Jika stem mengajukan pertanyaan langsung (yaitu,  diakhiri dengan tanda tanya), pilihan dapat berupa (a) kalimat lengkap, (b) kata-kata tunggal, istilah, nama, atau frase, atau (c) kalimat tidak lengkap lainnya. Melengkapi kalimat dimulai dengan huruf kapital dan diakhiri dengan tanda baca yang tepat, jangan menggunakan titik koma atau tanda baca penghubung lain yang tidak sesuai. Jika pilihan adalah kata tunggal atau kalimat yang tidak lengkap, jangan gunakan tanda baca penghubung. Namun demikian, gunakan aturan yang konsisten untuk awal kata dalam setiap opsi: pada saat melakukan tes, baik setiap awal kata atau tidak pada awal kata (kecuali kata benda).
Suatu incomplete stem berisi kalimat yang tidak lengkap dimana siswa harus menyelesaikan kalimat tersebut dengan memilih pilihan jawaban yang benar. Dengan demikian, saat menulis jenis butir, setiap pilihan jawaban diawali dengan huruf kecil (kecuali awal kata pada pilihan jawaban adalah kata benda) dan diakhiri dengan tanda baca penghubung yang sesuai.
·         Susunan pilihan jawaban harus bermakna.
Pilihan jawaban seharusnya disusun dalam urutan yang bermakna, misalnya berdasarkan urutan ukuran, kualitas atau bahkan secara alphabetically.
·         Hubungan Tata Bahasa (Grammar) yang konsisten dengan Stem
Butir yang berisi petunjuk secara grammatical untuk jawaban yang benar akan menjadikan butir menjadi lebih mudah dan sedikit reliabel daripada tanpa petunjuk (Haladyna et al dalam Nitko, 2007:). Jangan berikan petunjuk jawaban yang benar atau membolehkan pengecoh untuk dihilangkan secara sepintas. Contoh petunjuk  tatabahasa yang tidak sesuai meliputi kekurangan dari kesesuaian katakerja subyek, artikel tak tentu tidak sesuai, dan kebingungan bentuk tunggal / jamak.  Contoh:
1.      A 90o angle is called a
A.     acute angles
B.     obtuse angles
C.     right angle*
Penggunaan artikel “a” pada akhir stem  dan penggunakan kata jamak “angles” pada alternative memberikan pertunjuk yang jelas (clue) bagi jawaban yang benar.
2.      What are 90o angles called?
A.     acute angle
B.     obtuse angle
C.     right angle*
Pada butir nomor 2 diatas, stem ditulis dalam bentuk pertanyaan langsung sehingga mengurangi adanya kemungkinan grammatical clue.
Berikut beberapa poin penting yang perlu dihindari dalam menyusun pilihan jawaban butir pilihan ganda:
·         Pilihan jawaban yang overlapping (tumpang tindih)
Setiap pilihan jawaban harus berbeda dan bukan merupakan subset logis dari pilihan jawaban lain. Pilihan jawaban yang mencakup beberapa atau semua yang sama antar alternatifnya disebut pilihan jawaban yang tumpang tindih (overlapping). Jika kita menulis butir yang mengandung pilihan jawaban yang tumpang tindih, kita memberikan sedikit pengetahuan, tapi memberikan petunjuk untuk jawaban yang benar bagi siswa.
·         Kata-kata "Tidak ada satu pun di atas" pada alternatives
Penelitian pada frase "Tidak ada satu pun di atas" sebagai pilihan jawaban dari butir pilihan ganda menunjukkan hasil yang sedikit reliabel, butir lebih sulit (Haladyna et al dalam Nitko, 2007:). Dengan demikian, "Tidak ada satu pun di atas" tidak boleh digunakan sebagai filler /pengisi untuk menambah banyaknya distractors.
Contoh:
Berapakah selisih dari 106 dan 21?
A.    81
B.     89
C.     101
D.    Tidak ada satupun diatas yang benar.
·         Frase "Semua yang di atas"
Penelitian tentang penggunaan dari "semua yang di atas"  tidak memberikan kesimpulan yang pasti. Terdapat dua kekurangan lebih lanjut dari penggunaan frase "Semua yang di atas" yaitu (a) jika siswa memilih salah satu jawaban, maka siswa akan memilihnya tanpa mengkaji lebih lanjut pilihan jawaban lainnya, (b) Siswa yang tahu dua dari empat pilihan jawaban adalah benar maka siswa dapat memilih “Semua pernyataan benar”. Kata-kata ini juga dapat membingungkan siswa SD dan SMP. . Secara umum kita harus menghindari "semua hal di atas" dengan menuliskan kembali butir dengan butir jawaban dua atau lebih untuk menghindari masalah ini. Tuliskan kembali butir dengan jawaban dua atau lebih untuk menghindari masalah ini. Pilihan lain, menulis ulang butir sebagai butir benar-salah berganda.
·         Hindari Petunjuk verbal
Petunjuk verbal pada pada pilihan jawaban dapat membantu siswa yang memiliki pengetahuan yang kurang, namun siswa yang memiliki kemampuan verbal yang cukup baik mampu untuk menentukan jawaban yang tepat (mengarahkan siswa ke jawaban yang benar).
·         Hindari Kata-kata Asing dan Teknis
Guru terkadang menulis butir pilihan ganda menggunakan kata-kata yang sangat teknis atau asing sebagai pengecoh. Kata-kata di luar pengetahuan siswa menyebabkan siswa membutuhkan kemampuan yang lebnih untuk menolak jawaban yang salah daripada memilih jawaban yang benar. Beberapa studi menunjukkan, jika pilihan jawaban berisi kata-kata teknis/asing maka hal itu kurang masuk akal, sehingga membuat pilihan jawaban tidak berfungsi. Dalam suatu penelitian, ketika mahasiswa diminta memilih jawaban dalam butir yang tidak mereka ketahui, tidak ada jawaban nyata, siswa hanya memilih jawaban yang familiar (sepengetahuan mereka).

3)      Penyusunan Kunci Jawaban
Pada penyusunan item pilihan ganda, pilihan jawaban/alternatives harus disusun sedemikian rupa sehingga butir tersebut tidak memberikan petunjuk jawaban yang benar bagi siswa yang tidak memiliki pengetahuan yang dimaksudkan, sebaliknya dengan pilihan jawaban yang baik maka siswa yang memiliki cukup pengetahuan mampu untuk menjawab dengan benar. Beberapa hal yang harus diperhatikan dalam penyusunan alternatives/pilihan jawaban yaitu (Nitko, 2007:181):
  • Secara umum, hanya ada satu jawaban yang benar atau terbaik pada butir pilihan ganda.
Sangat mungkin untuk menulis butir yang memiliki lebih dari satu pilihan jawaban yang tepat. Namun, butir tersebut mungkin tidak valid seperti yang kita maksud, terutama di  SD dan SMP. Siswa mungkin dapat memilih jawaban benar yang mereka temui pertama dan melanjutkan ke butir berikutnya tanpa mempertimbangkan semua pilihan jawaban. Beberapa penulis butir berusaha mempertimbangkan hal ini  dengan menggunakan kombinasi dari beberapa pilihan jawaban butir atau dengan menggunakan “semua yang diatas”.
·         Pastikan bahwa pihak ahli menyetujui bahwa kunci jawaban adalah benar atau memang yang terbaik.
Jika kita melanggar aturan ini, kita dapat mengalami perbedaan  dengan siswa yang mempunyai kemampuan lebih (atau orangtua siswa). Selanjutnya, jika kita bersikeras hanya ada satu jawaban yang benar dan siswa pun juga melihat jawaban lain yang benar, maka siswa akan melihat kita sebagai guru sewenang-wenang.  Untuk menghindari akibat negatif hal tersebut, mintalah  rekan yang berpengetahuan untuk meneliti kunci jawaban dan pengecoh sebelum kita menggunakan butir tersebut. Cara terbaik adalah meminta rekan kita untuk menguji butir dengan kunci jawaban yang tidak ditandai. Jika rekan kita memilih bukan jawaban yang benar, mungkin ada kesalahan pada kebenaran kunci kita.
·         Kunci jawaban memiliki grammar yang benar dan merupakan respon yang sesuai dari stem.
Banyak siswa mengalami kesulitan menyelesaikan suatu masalah jika materi yang diketik benar, tetapi tata bahasanya salah.
·         Periksa seluruh tes untuk memastikan bahwa pilihan jawaban yang benar tidak mengikuti pola tertentu yang mudah dipelajari.
Gunakan kunci jawaban kita dan tabulasikan jumlah A, B, C dan seterusnya sebagai kunci jawaban yang benar. Kadang-kadang guru mendukung satu atau dua posisi (misalnya, B dan C) untuk jawaban yang benar. Siswa akan cepat mengerti pola kunci jawaban, hal ini menurunkan validitas penilaian guru. Selain itu, hindari perulangan, pola mudah dipelajari, seperti AABBCCDD atau ABCDABCD. Jika kita menyusun pilihan jawaban dalam urutan logis, numerik, atau abjad, maka kita tidak akan mengalami masalah.
·         Hindari frase pilihan jawaban yang benar secara texbook atau stereotip.
Untuk menilai pengertian dan pemahaman, setidaknya kita uraikan kembali suatu buku teks. Siswa belajar dengan cepat dimana kita meniru ide-ide atau frase tertentu yang ada dalam buku. Jika pengujian butir kita mencerminkan hal tersebut, kita akan mendorong siswa untuk memilih jawaban yang "benar"  tetapi mereka tidak memahaminya. Untuk siswa memiliki kemampuan lebih, bagaimanapun, frase stereotip yang memiliki  "lingkaran kebenaran" dalam pengecoh dapat berfungsi untuk membedakan siswa yang telah memahami konsep seluruhnya atau yang belum memahami. Strategi ini awalnya digunakan  di SMA dan Perguruan Tinggi, tapi sekarang digunakan SD dan SMP.
·         Pilihan jawaban yang benar harus memiliki panjang kalimat yang hampir sama dengan semua distraktor (pengecoh).
Guru terkadang membuat pilihan yang benar lebih lama dari pilihan yang salah dengan cara membuat kalimat lebih lengkap atau lebih berkualitas. Siswa dapat memilih jawaban yang terpanjang atau paling lengkap sebagai kunci jawaban tanpa memiliki pengetahuan yang diperlukan.Penelitian mendukung jika kita tidak membuat jawaban yang benar disekitar pengecoh maka akan membuat butir lebih mudah.

4)      Daftar Periksa untuk Mengevaluasi Butir Pilihan Ganda
Sebelum menggunakan butir pilihan ganda, gunakan daftar periksa untuk memeriksa setiap butir. Revisi setiap butir yang tidak lulus (reliabel) dalam daftar periksa kita menggunakannya. Daftar periksa merupakan sebuah daftar pertanyaan-pertanyaan dari setiap butir yang kita tulis. Jika kita menjawab "tidak" untuk satu atau lebih pertanyaan, maka kita harus merevisi butir.
·         Apakah butir menilai satu aspek penting dari tujuan pembelajaran?
·         Apakah butir tersebut cocok dengan rencana penilaian kita dalam hal kinerja, penekanan, dan jumlah poin?
·         Apakah stem mengajukan pertanyaan langsung atau memberikan masalah tertentu?
·         Apakah butir berdasarkan pengulangan kata daripada kata-kata mengangkat langsung dari sebuah buku teks (textbookish)?
·         Apakah kosakata dan struktur kalimat pada tingkat yang relatif rendah dan non-teknis?
·         Apakah setiap pilihan jawaban (pengecoh) masuk akal sehingga siswa yang tidak memiliki pengetahuan tentang jawaban yang benar tidak dapat melihatnya sebagai pengecoh?
·         Jika mungkin, Apakah pilihan jawaban yang salah berdasarkan pada kesalahan umum siswa atau kesalahpahaman konsep?
·         Apakah jawaban benar dari suatu butir tidak berkaitan dengan jawaban yang benar dari butir lain?
·         Apakah semua pilihan jawaban homogen dan sesuai dengan isi stem??
·         Apakah kita menghindari menggunakan "semua yang di atas" atau "tidak  ada satu pun yang di atas" sebanyak mungkin?
·         Apakah hanya ada satu jawaban yang benar atau terbaik dari butir?

5)      Membuat Kombinasi Pilihan Jawaban dari Butir Pilihan Ganda (bentuk-bentuk pilihan ganda)
Ada empat kegunaan format butir pilihan ganda yaitu sesuai dengan tujuan pembelajaran yang kita inginkan, format dinilai secara objektif, waktu tes dari butir relafif singkat sehingga penilaian dapat mencakup sebagian besar materi, dan format ini lebih mudah untuk dibuat. Dalam bagian ini dibahas empat format butir yaitu lebih-kurang-sama (greater-less-same), jawaban paling benar (best-answer), interpretasi percobaan butir (experiment-interpretation items), dan pernyataan dan komentar butir (statement and comment items).

a)      Butir yang lebih-kurang-sama (greater-less-same items)
Format
Format butir lebih-kurang-sama terdiri dari sepasang konsep, frase, jumlah, dan sebagainya yang memiliki hubungan lebih dari, sama dengan, dan kurang dari. Format butir lebih-kurang-sama digunakan untuk menilai hubungan kualitatif, kuantitatif, atau periode antara dua konsep. Tugas siswa adalah untuk mengidentifikasi hubungan antara konsep. Kita dapat menggunakan singkatan huruf  G, L, dan S untuk Great-Less-Same.
Kelebihan
Format lebih-sama-kurang secara khusus menilai apakah siswa memahami urutan atau hubungan antara dua konsep, peristiwa, atau hasil. Ketika siswa mempelajari hubungan (keterkaitan) di kelas atau ketika siswa mempelajari hubungan (keterkaitan) dari buku, butir ini memberikan penilaian ingatan dan pemahaman siswa. Siswa kemudian dapat menerapkan prinsip atau kriteria yang kita ajarkan untuk menyimpulkan hubungan antara pasangan konsep. Hal ini dapat meningkatkan  butir, sehingga memerlukan tingkat berpikir yang lebih tinggi daripada hanya mengingat.
Kekurangan
Kekurangan dari butir lebih-kurang-sama adalah sama dengan butir menjodohkan dan benar-salah. Artinya, guru sering menggunakannya untuk menilai keterkaitan hafalan dan pengetahuan yang tidak berhubungan. Selain itu, format ini membatasi penilaian terhadap hubungan antar pasang konsep.
Saran
·         Mulailah dengan mengidentifikasi tujuan pembelajaran yang ingin dinilai. Format butir menilai tujuan pembelajaran yang mencakup kemampuan untuk mengidentifikasi hubungan antara dua ide, konsep, atau situasi. kita harus membuat daftar pasangan konsep yang terkait. Tulis ulang anggota masing-masing pasangan sehingga dapat dinyatakan dengan jelas dan sesuai dengan format butir. Ketika mengatur pasangan, pastikan bahwa kita tidak menggunakan  “lebih dari” hanya di satu sisi dari pasangan.
·         Tulis petunjuk pasangan untuk siswa yang menjelaskan dasar mereka untuk memilih lebih-sama-kurang. Biasanya, pasangan butir harus mengacu pada topik umum yang sama.
·         Jika kita pertama kali menggunakan format ini, maka kita harus menjelaskan apa yang harus dilakukan siswa dengan memberikan beberapa contoh soal.
·         Atur semua butir format ini menjadi satu bagian dari penilaian kita. Letakkan petunjuk dan contoh butir pada awalbagian. Pastikan jawaban tidak mengikuti pola tertentu (GSLGSLGSL atau GGSSLL). Periksa ulang butir sehingga tidak memuat kata asing, tugas yang jelas, dan hubungan yang tidak ambigu.
·         Gunakan daftar periksa yang memuat saran membuat format ini.

b)      Butir dengan Jawaban Paling Benar (Best-Answer Butir)
Format
Butir dengan jawaban paling benar adalah jawaban butir pilihan ganda yang setidaknya sebagian jawaban yang benar. Tugas siswa memilih jawaban yang paling benar. Pilihan jawaban yang dipilih hanya ada satu yang paling benar sehingga kita tidak boleh menggunakan “semua yang diatas” atau “tidak ada satu pun yang diatas” pada format ini.
Kelebihan
Butir jawaban paling benar menilai kemampuan siswa untuk membuat perbedaan yang relatif benar di antara pilihan. Mereka harus memahami pertanyaan dan kriteria yang digunakan untuk menilai pilihan yang "paling benar". Jadi, butir jawaban paling benar  menilai kemampuan penalaran yang relatif sulit.
Kekurangan
Membuat format butir jawaban paling benar merupakan hal yang sulit. Guru harus tahu permasalahan yang ada pada pola pikir siswa.
·         Kita membuat pengecoh yang benar secara parsial, namun kurang dapat dipertahankan karena ada kunci jawaban paling benar.
·         Format ini mungkin tidak sesuai untuk beberapa siswa karena tingkat perkembangan pendidikan mereka tidak cukup tinggi untuk membuat perbedaan yang baik untuk memilih jawaban paling benar.
·         Guru yang berbeda tidak dapat mengajar secara konsisten di seluruh bagian dari program yang sama. Jadi, apa yang merupakan jawaban paling benar di satu guru kelas bukanlah jawaban paling benar di guru kelas lain.
·         Ada beberapa kriteria yang mana siswa tidak mungkin diajarkan atau mungkin gagal untuk pemahaman. Tidak ada jawaban paling benar kecuali dievaluasi dengan menggunakan kriteria tersebut. Siswa kita harus memahami sendiri kriteria untuk menerapkannya. Juga, pengetahuan kita sendiri mengenai mata pelajaran mungkin terbatas. Akibatnya, apa yang kita anggap jawaban paling benar mungkin sebenarnya bukan yang paling benar, karena kita tidak mengerti kriteria lain dengan yang pilihan yang mungkin dievaluasi.
·         Seorang guru dapat dengan mudah menulis butir rumit yaitu, butir dimana kebenaran pilihan tergantung pada fakta tidak berarti, ciri standar, atau kata yang mudah diabaikan atau frase.
Saran
Seperti biasa, pertama mengidentifikasi tujuan pembelajaran. Tujuan pembelajaran yang mengharuskan siswa untuk memilih diantara beberapa pilihan jawaban yang sebagian benar dapat dinilai menggunakan format ini. Sebelum menggunakan jenis butir, pastikan kita telah mengajarkan siswa untuk menggunakan kriteria memilih yang paling benar di antara beberapa penjelasan, deskripsi, dan ide yang sebagian benar. Ini adalah kemampuan berpikir tingkat tinggi (sering disebut keterampilan berpikir kritis) yang mana siswa harus menggunakan kriteria (seperti "kelengkapan respon" dan "tidak ada informasi yang salah") untuk mengevaluasi pilihan jawaban.
Mulailah menulis dengan terlebih dahulu menyusun pertanyaan untuk stem. Kedua, menulis beberapa cara dimana respon siswa terhadap pertanyaan biasanya sebagian benar. Ini menjadi dasar untuk membuat pengecoh. Kita juga bisa memberikan siswa pertanyaan terbuka dengan jawaban singkat sebagai PR. Kemudian, pilih respon dari beberapa siswa yang mewakili jawaban-jawaban yang sangat baik, baik, dan tidak baik. Hal ini dapat diperbaiki sebagai dasar untuk membuat pilihan. (Kita tidak harus menggunakan respon siswa secara bertahap sebagai pilihan jawaban. Ketika banyak kesalahan dari siswa maka dapat dijadikan sebagai pilihan jawaban selain kunci jawaban/pengecoh.)
Karena format jawaban yang paling benar adalah format pilihan ganda, kita harus mengikuti aturan dasar menulis butir pilihan ganda yang telah dibahas sebelumnya. Kita harus meninjau daftar untuk mengevaluasi kualitas beberapa butir pilihan untuk memastikan kita memahami aturan dasarnya. Sebuah kelemahan yang khusus bahwa jawaban paling benar atau kunci jawaban adalah satu dari kata-kata terpanjang karena mengandung informasi yang paling lengkap. Hindari pilihan jawaban dengan  jumlah kata-kata yang sama.
Gunakan daftar periksa untuk menilai kualitas pilihan jawaban paling benar. Gunakan juga, sebagai panduan evaluasi sebagai meninjau dan mengedit butir yang sudah dibuat.
Daftar Periksa
Sebuah daftar periksa untuk menganalisis kualitas butir jawaban paling benar.
Ajukan pertanyaan-pertanyaan dari setiap butir yang
kita tulis. Jika kita menjawab "tidak" untuk satu atau lebih pertanyaan, maka kita harus merevisi butir yang sesuai.
·         Apakah setiap butir jawaban paling benar menilai aspek penting dari satuan tujuan pembelajaran?
·         Apakah setiap butir jawaban paling benar cocok dengan rencana penilaian kita dalam hal kinerja, penekanan, dan jumlah poin?
·         Apakah setiap butir jawaban paling benar mengharuskan siswa untuk mengaplikasikan pengetahuan dan keterampilan dalam beberapa cara untuk situasi baru, contoh, atau kejadian?
·         Apakah arah kita jelas dan lengkap menjelaskan dasar siswa yang ingin kita gunakan ketika menilai "paling benar"? (Mintalah siswa kita untuk berlatih  dalam menggunakan kriteria yang tepat untuk menilai "paling benar"?)
·         Apakah semua pilihan, benar untuk beberapa tingkat?
·         Apakah kunci jawaban adalah  satu-satunya yang dapat dipertahankan sebagai "yang paling benar" dengan menerapkan kriteria yang kita tentukan?
·         Apakah setiap pengecoh berdasarkan kesalahan konsep yang penting, kesalahpahaman, atau cara yang menyebabkan jawaban tidak lengkap? (Apakah kita menghindari cara-cara rumit atau tidak berarti ketika membuat sebuah pengecoh sebagian benar atau berisi informasi yang salah?)
·         Apakah semua opsi dengan panjang yang sama (dalam lima kata satu sama lain)?
·         Apakah kita menghindari (a) mmempunyai jawaban “paling benar”lebih dari satu dan (b) menggunakan "semua yang diatas" atau "tidak ada satu pun yang diatas?
·         Apakah kita menerapkan semua panduan penulisan butir pilihan ganda yang dijelaskan di daftar pilihan ganda?

c)      Butir Interpretasi-Percobaan (Experiment-Interpretation Items)
Format
Butir interpretasi-percobaan terdiri dari deskripsi percobaan diikuti dengan butir pilihan ganda yang memerlukan siswa untuk mengenali interpretasi terbaik  dari hasil percobaan. Format butir interpretasi-percobaan dapat menggunakan butir pilihan ganda semua atau menggunakan butir-pilihan ganda dengan butir jawaban singkat, butir-jawaban singkat semua. Butir pilihan ganda mengukur kemampuan  siswa dalam mengevaluasi atau menginterpretasi apa yang diberikan dan memilih satu jawaban paling benar. Butir-pilihan ganda dengan butir jawaban singkat mengukur kemampuan siswa untuk menjelaskan atau membenarkan alasan dari pilihan jawaban pada butir pilihan ganda. Butir isian singkat semua mengukur kemampuan menginterpretasikan hasil percobaan dan menjelaskan alasannya.
Kelebihan
Kita dapat menggunakan format interpretasi-percobaan untuk menilai kemampuan siswa mengevaluasi penjelasan, interpretasi, dan kesimpulan dari data. Jenis pilihan ganda hanya memungkinkan kita untuk mencetak butir lebih cepat dan lebih objektif daripada jenis lain. Karena siswa diwajibkan hanya untuk memilih jawaban yang benar, waktu mengerjakan lebih singkat. Karena itu, kita dapat menggunakan butir dan materi lebih banyak dengan periode penilaian lebih singkat dibandingkan dengan butir jawaban singkat.
Jika percobaan dan temuan kita ada dalam butir baru untuk para siswa, kita akan menilai kemampuan siswa untuk menerapkan prinsip-prinsip dan kriteria dari mata pelajaran yang dbutirpuh. Kita menggunakan percobaan dan data baru untuk siswa dalam tugas-tugas penilaian untuk mengajar siswa bagaimana menerapkan kriteria dan prinsip-prinsip dalam berbagai situasi. Kita perlu memberikan siswa latihan yang cukup dalam menerapkan kriteria dan prinsip-prinsip sebelum menilai mereka untuk tujuan evaluasi sumatif. Ini akan mengubah pengajaran kita jauh dari pengajaran fakta-fakta dan hasil, dan terhadap pengajaran untuk aktif menerapkan pengetahuan dan keterampilan.
Jika kita memerlukan siswa untuk membenarkan jawaban pilihan ganda mereka, kita akan memiliki beberapa informasi tentang proses penalaran mereka. Siswa sering membuat pilihan yang benar dari interpretasi yang mungkin kita berikan, tetapi mereka tidak dapat menjelaskan mengapa mereka membuat pilihan tersebut, atau mereka memberikan penjelasan yang salah. Jika kita memerlukan siswa baik untuk memberikan interpretasi dan untuk membenarkan itu, kita dapat menilai apakah siswa dapat menghasilkan dan menjelaskan interpretasi percobaan mereka.
Kekurangan
Seperti format butir-jawaban paling benar, format interpretasi-percobaan tidak mudah untuk membuatnya. Kita harus tahu materi pelajaran dan pola siswa kita dalam berpikir cukup baik untuk membuat butir yang memungkinkan kita untuk mengidentifikasi berpikir salah serta jawaban yang benar. Berpikir yang salah harus mencerminkan dalam pengecoh pilihan ganda. Ini berarti kita harus dapat membuat sebagian interpretasi yang benar dan interpretasi yang salah agar orang-orang biasa untuk membuatnya.
Kekurangan yang ditujukan pada guru menggunakan format ini untuk menilai apakah seorang siswa dapat mengingat "benar" interpretasi hasil percobaan tertentu yang diajarkan guru. Guru tidak menilai kemampuan berpikir tingkat tinggi. Menggunakan format butir untuk menilai mengingat mendorong siswa untuk melihat ke guru atau teks sebagai sumber pengetahuan tetap. Hal ini menghambat siswa keterampilan belajar yang diperlukan untuk menginterpretasikan hasil percobaan sebenarnya.
Saran
Pertama, identifikasi tujuan pembelajaran yang kita inginkan untuk menilai. Format penilaian interpretasi-percobaan tepat ketika suatu tujuan pembelajaran menuntut siswa untuk memahami dan menginterpretasikan hasil penelitian yang sebenarnya. Sebelum menggunakan format ini untuk evaluasi sumatif siswa, pastikan kita telah mengajarkan dan telah memberikan latihan dalam menafsirkan temuan dari studi penelitian sebenarnya.
Tuliskan butir untuk menilai kemampuan siswa untuk menerapkan prinsip-prinsip tertentu. Ini berarti bahwa kita pertama kali mengidentifikasi prinsip-prinsip atau aturan yang kita terapkan untuk siswa, lalu membuat butir tersebut mengharuskan siswa untuk menggunakan prinsip tersebut dalam situasi yang baru.
Setelah mengidentifikasi prinsip, kita membuat butir sedemikian sehingga menuntut siswa untuk menggunakan atau menerapkan prinsip tersebut. Biasanya dengan menuliskan deskripsi studi hasil eksperimen atau penelitian kemudian dapat menafsirkan dengan menggunakan prinsip.
Selanjutnya, rancanglah stem yang meminta siswa untuk menafsirkan atau menjelaskan hasil percobaan. Kita kemudian bisa daftar interpretasi yang benar atau sebagian benar. Kita juga bisa mendaftar salah interpretasi yang dihasilkan dari penalaran yang tidak lengkap atau salah. Hindari penggunaan interpretasi sebagai pengecoh yang sama sekali tidak berhubungan dengan eksperimen kita. Seperti dalam format butir jawaban paling benar, pengecoh untuk format ini harus berisi interpretasi atau penjelasan yang mengandung kesalahpahaman khusus siswa kita.
Jika kita menggunakan butir pilihan ganda, kita harus mengikuti aturan dasar penulisan beberapa butir pilihan yang telah kita bahas sebelumnya dan diringkas dalam daftar pilihan ganda. Jika kita menggunakan salah satu butir jawaban singkat dari format ini, kita harus mengikuti aturan dasar penulisan butir-jawaban singkat. Gunakan daftar periksa untuk mengevaluasi.
Daftar Periksa
Sebuah daftar periksa untuk mengkaji kualitas produk interpretasi percobaan. Ajukan pertanyaan-pertanyaan dari setiap butir yang kita tulis. Jika kita menjawab "tidak" untuk satu atau lebih pertanyaan, kita harus merevisi butir yang sesuai.
·         Apakah masing-masing butir menilai suatu aspek penting dari tujuan satuan pembelajaran?
·         Apakah setiap butir interpretasi-percobaan cocok dengan rencana penilaian kita dalam hal kinerja, penekanan, dan jumlah poin?
·         Apakah setiap fokus butir memerlukan siswa untuk menerapkan satu atau lebih prinsip penting atau kriteria untuk situasi baru, contoh, atau kejadian?
·         Apakah kita memberikan kesempatan siswa untuk berlatih menerapkan kriteria yang tepat atau prinsip-prinsip untuk menilai "paling benar" atau "paling sah" dalam interpretasi?
·         Apakah kita menggambarkan sebuah studi eksperimen atau penelitian secara terperinci dan singkat tetapi cukup bagi siswa dapat menggunakan kriteria yang sesuai atau prinsip-prinsip untuk menginterpretasikan hasilnya?
·         Apakah kunci jawaban satu-satunya yang dapat dipertahankan sebagai "paling benar" atau interpretasi "yang paling valid"?
·         Apakah setiap pengecoh berdasarkan kesalahan konsep yang penting, kesalahpahaman, atau kesalahan dari suatu kriteria atau prinsip? (Apakah kita menghindari cara-cara rumit atau kurang berarti membuat sebuah pengecoh sebagian benar atau berisi informasi yang salah?)
·         Apakah kita menghindari mempunyai jawaban “paling benar” lebih dari satu dan (b) menggunakan "semua yang diatas" atau "tidak ada satupun diatas"?
·         Apakah kita menerapkan semua panduan yang tepat dalam menulis butir yang dijelaskan di daftar periksa pilihan ganda?
·         Jika kita menggunakan butir jawaban singkat, apakah kita menerapkan semua panduan butir untuk menulis yang tepat dijelaskan dalam daftar jawaban singkat?

d)     Butir Pendapat dan Pernyataan (Statement-And-Comment Items)
Format
Sebuah butir pendapat dan pernyataan menyajikan pernyataan tentang beberapa materi yang relevan dan membutuhkan siswa untuk menulis komentar yang baik untuk pernyataan atau memilih komentar yang paling tepat dari daftar yang kita berikan.
Kelebihan
Format butir pernyataan-dan-komentar menilai kemampuan siswa untuk mengevaluasi interpretasi dari sebuah pernyataan yang diberikan. Jenis pilihan ganda menilai apakah siswa dapat mengidentifikasi interpretasi paling benar atau penjelasan dari beberapa sumber. Penjelasan tidak harus menggunakan kata-kata yang sama digunakan dalam kelas. Sebaliknya, pendapat siswa diungkapkan dengan bahasanya sendiri. Dengan cara ini, siswa harus mengandalkan pemahaman sendiri tentang kalimat yang diambil.
Jenis open-ended menilai kemampuan siswa untuk mengingat dan menulis tentang arti dari pernyataan yang diberikan. Walaupun ada keuntungan  karena siswa mengkonstruksi (mengembangkan) pendapat mereka sendiri, namun ada sisi negatifnya. Siswa mungkin hanya menulis sebuah penjelasan atau pendapat yang mereka hafalkan dari diskusi kelas atau dari buku teks.
Jenis jawaban singkat dapat menilai kemampuan berfikir tingkat tinggi jika pernyataan itu diambil dari luar (internet, koran, majalah, dll) dan dapat diberi tanggapan atau dievaluasi menggunakan pengetahuan dan keterampilan diajarkan pada mata pelajaran. Misalnya, kutipan yang diambil dari pernyataan seorang pejabat publik di koran. Tugas siswa untuk mengevaluasi atau mengkritik pernyataan dengan menggunakan prinsip tertentu.
Kekurangan
Format butir pernyataan-dan-komentar memiliki aplikasi yang terbatas. Kita harus mengidentifikasi laporan yang tepat sehingga siswa mampu menafsirkannya. Jenis pertanyaan jawaban-singkat memberikan kesempatan bagi siswa untuk menguraikan pemahaman mereka terhadap pernyataan yang diambil. Namun, siswa mungkin hanya dapat mengulang ungkapan yang mereka pelajari di kelas.
Saran
Pertama, identifikasi tujuan pembelajaran ingin kita nilai. Format penilaian ini sesuai ketika suatu tujuan pembelajaran diperlukan untuk memahami laporan dan tema.
Jika kita memberikan jenis jawaban singkat sebagai pekerjaan rumah bagi siswa, kita dapat menggunakan respon siswa yang sangat baik, baik, dan tidak baik sebagai dasar membuat pilihan jawaban dari jenis pilihan ganda. Karena jenis pilihan ganda dari komentar-dan-pernyataan adalah jenis butir-jawaban paling benar, ikuti panduan yang disarankan dalam daftar periksa butir jawaban paling benar.

3.      Kekurangan dan Kelebihan Tes Pilihan Ganda
Berikut adalah kelebihan penggunaan tes pilihan ganda (Nitko, 2007:169):
·         Tes pilihan ganda dapat digunakan untuk menilai keragaman tujuan pembelajaran yang lebih banyak daripada bentuk penilaian yang lain.
·         Tes pilihan ganda tidak mewajibkan siswa untuk menulis dan mengelaborasi jawaban mereka sehingga memperkecil kemungkinan siswa yang memiliki pengetahuan kurang untuk “memperindah” jawaban. Untuk sebagian orang, hal ini merupakan kelemahan.
·         Tes pilihan ganda memfokuskan pada kemampuan membaca dan berfikir. Tes ini tidak mensyaratkan siswa untuk menggunakan kemampuan menulis.
·         Melalui tes pilihan ganda, siswa memiliki kesempatan kecil untuk menerka jawaban yang benar dibandingkan tes benar-salah.
·         Pengecoh yang dipilih siswa mungkin dapat memberi informasi bahwa pada kompetensi itu siswa masih kesulitan.

Berikut adalah kelemahan tes pilihan ganda menurut Nitko (2007:169):
·         Siswa harus memilih dari beberapa pilihan yang disediakan. Mereka tidak diberi kesempatan untuk membuat atau mengekspresikan ide atau solusi mereka.
·         Tes pilihan ganda bisa jadi tidak berbobot, tidak signifikan, dan terbatas pada pengetahuan faktual.
·         Karena biasanya hanya satu butir yang menjadi kunci jawaban, siswa yang cerdas mungkin terhukum untuk tidak memilihnya.
·         Tes pilihan ganda cenderung berdasar pada pengetahuan yang terstandar, kasar, atau sudah diakui.
·         Penggunaan tes pilihan ganda tidak cocok untuk penilaian kemampuan berfikir tingkat tinggi.

C.    TES ESAI
1.      Pengertian
Tes esai adalah suatu bentuk tes yang terdiri dari pertanyaan atau pernyataan yang menghendaki jawaban yang berupa uraian-uraian yang relatif panjang. Bentuk-bentuk pertanyaan atau pernyataan tersebut menuntut murid-murid (examinee) untuk menjelaskan, membandingkan, menginterpretasikan dan mencari perbedaan. Semua bentuk pertanyaan tersebut mengharapkan agar murid-murid menunjukkan pemahaman mereka terhadap materi yang dipelajari. Tes dengan format esai biasanya digolongkan menjadi dua kelompok: butir respon yang dibatasi (restricted response item) dan butir respon yang tidak dibatasi (extended response item). Kedua jenis tes tersebut kegunaannya sama, namun memiliki tujuan yang berbeda.
Tes esai digunakan apabila:
·         Jika kelompok yang dites kecil dan tes tersebut tidak diulang.
·         Intruktur ingin mendorong kemampuan siswa daam mengekspresikan gagasan melalui tulisan
·         Instruktur lebih tertarik untuk menjajaki sikap siswa daripada mengukur prestasi
·         Instruktur lebih yakin  terhadap keahlian atau kecakapannya dalam memberi kritik daripada sebagai penulis imaginatif pada soal objektif.
·         Waktu untuk penyusunan tes lebih singkat daripada penilaian

2.      Jenis-jenis Tes Esai
Tes esai dikelompokkan menjadi dua jenis, yaitu butir respon yang dibatasi (restricted response item) dan butir respon yang tidak dibatasi (extended response item). (Nitko, 2007:204).
a.       Tes esai terbatas (Restricted-Response Essay Questions)
Pengertian
Tes uraian terbatas merupakan bentuk tes uraian yang memberikan batasan-batasan atau rambu-rambu tertentu kepada peserta tes dalam menjawab soal tes. Batasan atau rambu tersebut mencakup format, isi, dan ruang lingkup jawaban. Tes esai terbatas membatasi baik isi jawaban examinee (siswa), maupun bentuk tanggapan tertulis mereka. Pada soal esai terbatas jawaban siswa bersifat konvergen berikut:
·         Menulis esai singkat tentang perbandingan pengukuran dan penilaian yang berkaitan dengan (a) derajat kuantifikasi kualitas respon siswa, (b) proses untuk mendapatkan informasi, dan (c) cara di mana tanggapan siswa dicatat.
·         Daftar lima saran untuk menulis pertanyaan-pertanyaan esai terhadap teks yang Anda disajikan. Untuk setiap saran yang Anda daftar, tulislah sebuah pernyataan singkat yang menjelaskan mengapa saran tersebut berguna untuk meningkatkan validitas penilaian esai Anda.
Contoh :
Nilai dari  dari persamaan  adalah....
Jawabannya : 3
Keuntungan penilaian menggunakan tes esai terbatas
Butir respon terbatas seharusnya mengharuskan siswa untuk menerapkan keterampilan mereka untuk memecahkan masalah baru atau untuk menganalisis situasi baru. Salah satu cara untuk melakukannya adalah dengan menyertakan bahan interpretif dan penilaiannya. Bahan interpretif dapat berupa paragraf atau penjelasan tentang masalah khusus atau situasi sosial, inti dari suatu karya sastra, atau deskripsi atau percobaan ilmiah atau penemuan.
Jenis tes ini menuntut siswa untuk membaca, mendengarkan, menganalisis, atau menafsirkan suatu materi kemudian menyelesaikan satu atau lebih butir didasarkan keterangan tersebut.
Keuntungan penilaian menggunakan tes esai terbatas
Menggunakan format ini mempersempit fokus penilaian terhadap kinerja yang spesifik dan terdefinisi dengan baik. Sifat butir ini membuatnya lebih memungkinkan siswa menafsirkan setiap pertanyaan yang dirancang. Penilaian terhadap kebenaran jawaban siswa akan lebih baik ketika pertanyaannya terfokus dan semua siswa menafsirkannya dengan cara yang sama.

b.      Tes esai tak terbatas (Extended-Response Essay Questions)
Pengertian
Tes uraian bebas merupakan bentuk tes uraian yang memberi kebebasan kepada peserta tes untuk mengorganisasikan dan mengekspresikan pikiran dan gagasannya dalam menjawab soal tes. Jawaban peserta tes bersifat terbuka fleksibel dan tidak terstruktur.
Tes esai bebas mengharuskan examinee untuk menulis esai dimana mereka bebas untuk mengekspresikan ide mereka sendiri. Examinee bebas menjawab dengan cara mereka sendiri. Jawaban siswa bersifat divergen. Biasanya tidak ada satu jawaban yang dianggap benar. Seorang siswa bebas memilih cara untuk menjawab pertanyaan yang diberikan.



Contoh :
Jelaskan apa yang dapat kalian ketahui dari grafik di bawah ini!
Dari pertanyaan di atas, siswa yang menjawab tentunya akan mempunyai beberapa jawaban yang berbeda, karena para siswa tidak diberikan batasan mengenai jawaban yang harus mereka buat. Jawaban mereka dapat berupa: ,  atau
Tujuan
Dua tujuan penggunaan format esai respon tak terbatas adalah untuk menilai (a) kemampuan menulis umum dan (b) pengetahuan materi pelajaran.
Jika tujuan tes hanya untuk menilai kemampuan menulis, tes esai yang disusun harus menyajikan atau mempresentasikan siswa dengan sebuah prompt. Sebuah prompt adalah pernyataan singkat yang menyarankan sebuah topik untuk ditulis, memberikan panduan umum untuk siswa, memotivasi siswa untuk menulis, dan membangkitkan kinerja terbaik siswa. Anda mengevaluasi kinerja siswa dengan menggunakan rubrik penilaian yang mendefinisikan berbagai karakteristik atau kualitas penulisan.
Penilaian Menulis
Jika tujuan tes hanya untuk menilai kemampuan menulis, tes esai yang disusun harus menyajikan atau mempresentasikan siswa dengan sebuah prompt. Sebuah prompt adalah pernyataan singkat yang menyarankan sebuah topik untuk ditulis, memberikan panduan umum untuk siswa, memotivasi siswa untuk menulis, dan membangkitkan kinerja terbaik siswa. Anda mengevaluasi kinerja siswa dengan menggunakan rubrik penilaian yang mendefinisikan berbagai karakteristik atau kualitas penulisan.
Keuntungan dan kelemahan penilaian menggunakan tes esai tidak terbatas
Beberapa tujuan pembelajaran diantaranya untuk mengorganisasikan ide-ide, mengembangkan argumen logis, membahas evaluasi posisi tertentu atau data, berkomunikasi pikiran dan perasaan, atau menunjukkan pemikiran asli. Format respon esai terbatas tidak digunakan untuk menilai jenis target belajar tersebut. Siswa membutuhkan kesempatan atau kebebasan yang lebih untuk mendemonstrasikan keterampilan dan kemampuan mereka. Esai respon tak terbatas cocok digunakan untuk menilai target belajar yang mengharuskan examinee untuk menggunakan kombinasi kemampuan seperti menafsirkan bahan pemecahan masalah, dan menjelaskan masalah dan solusinya.
Kelemahan pertama butir esai tak terbatas adalah keandalan penilaian yang rendah. Hal ini sulit untuk menilai soal esai tak terbatas secara obyektif. Masalah umum adalah bahwa tanpa pelatihan khusus, guru-guru yang berbeda akan memberi nilai yang berbeda pada esai yang sama. Masalah lain adalah bahwa mereka mengevaluasi siswa yang berbeda dengan kriteria yang berbeda.
Kelemahan kedua adalah bahwa penilaian esai tidak terbatas sering memakan waktu, terutama jika guru (examiner) ingin memberikan umpan balik kepada siswa untuk meningkatkan hasil belajar mereka. Jika hasil pekerjaan siswa yang akan dinilai cukup banyak, hanya ada sedikit waktu untuk memberikan komentar rinci tentang bagaimana cara meningkatkan hasil belajar mereka.

3.      Kegunaan Penilaian dengan Tes Esai
Terdapat beberapa kemampuan dan keterampilan yang dapat dinilai melalui tes tertentu, seperti telihat pada tabel berikut:

Berbagai jenis keluaran pembelajaran yang dapat dinilai menggunakan tes objektif dan tes esai
1.      Tes Objektif
Kemampuan untuk :
a.       Mengidentifikasi hubungan sebab akibat
b.      Mengidentifikasi prinsip penggunaan
c.       Mengidentifikasi pendapat relevan
d.      Mengidentifikasi hipotesis yang dapat dipertahankan
e.       Mengidentifikasi kesimpulan yang logis
f.       Mengidentifikasi anggapan yang tidak logis
g.      Mengidentifikasi pembatasan data
Mengidentifikasi langkah-langkah yang efisien
2.      Tes Esai Terbatas

Kemampuan untuk :
a.       Menjelaskan hubungan sebab akibat
b.      Menguraikan prinsip kegunaan
c.       Menyampaikan pendapat yang relevan
d.      Merumuskan hipotesis yang dapat dipertahankan
e.       Merumuskan kesimpulan yang valid
f.       Menjelaskan anggapan yang penting
g.      Menguraikan pembatasan data
h.      Menjelaskan metode dan langkah-langkah
3.      Tes Esai Tidak Terbatas

Kemampuan untuk:
a.       Menghasilkan, mengorganisasi dan menyampaikan ide
b.      Mengintegrasikan pembelajaran dalam area yang berbeda
c.       Mengkreasi bentuk asli (Desain eksperimen)
d.      Mengevaluasi nilai dari ide-ide
Hal yang menarik dari format esai adalah bahwa format ini memberi kesempatan kepada siswa untuk menampilkan kemampuan mereka dalam menuliskan, mengorganisasi, mengungkapkan, dan menjelaskan keterkaitan antara ide-ide. Anda dapat menilai memori, mengingat, dan pemahaman lebih mudah dengan jawaban pendek dan tes pilihan ganda. Kesimpulannya: Pilih format penilaian yang akan menilai persis target pembelajaran siswa yang ingin dicapai.

4.      Pertimbangan dalam Penyusunan Tes Esai
Untuk menyusun tes esai ada beberapa hal yang harus diperhatikan (Ebel, 1986: 132), yaitu:
·         Ajukan pertanyaan yang akan menuntut siswa untuk mendemonstrasikan suatu pengetahuan (konsep)
·         Ajukan pertanyaan yang determinan, artinya seorang pakar dapat menyepakati bahwa jawaban tertentu lebih baik dari jawaban yang lain.
·         Tentukan pekerjaan siswa (examinee) dengan lengkap tanpa mencampuri pengukuran pencapaian yang dimaksud.
·         Secara umum, berilah pilihan untuk pertanyaan-pertanyaan yang lebih spesifik yang dapat dijawab dengan lebih singkat.
·         Hindari pemberian pilihan pada examinee diantara pertanyaan-pertanyaan pilihan kecuali jika keadaan khusus
·         Ujilah pertanyaan yang disusun dengan menuliskan jawaban yang ideal.
Sementara itu, Miller et al. (2009: 243-248) mendeskripsikan beberapa hal yang harus diperhatikan dalam penyusunan tes esai, antara lain yaitu:
·         Tentukan/batasi kegunaan dari tes esai, sehingga tujuan pembelajaran yang akan dicapai hanya benar-benar dapat diperoleh melalui tes esai.
·         Buatlah pertanyaan yang benar-benar dapat memunculkan kemampuan pembelajaran yang terstandar atau yang telah ditentukan.
·         Gunakan frase yang baik dan jelas pada pertanyaan esai, sehingga siswa mampu memahami tugasnya dengan baik.
·         Indikasikan perkiraan batas waktu untuk pengerjaan setiap soalnya.
·         Hindari pemberian pertanyaan pilihan. Misalnya dalam suatu tes esai disediakan 6 pertanyaan, namun siswa diberikan kebebasan untuk memilih 3 pertanyaan untuk dikerjakan. Pertanyaan yang demikian akan menyebabkan siswa cenderung mengerjakan soal yang mereka ketahui.

5.      Menyusun Penilaian Esai pada Materi Pembelajaran
Penilaian Daftar periksa merupakan sarana untuk meningkatkan soal esai. Kita akan melihat sebuah butir esai yang kurang baik yang telah dibuat dan menerapkan checklist (daftar isian pemeriksaan) untuk butir tersebut. Hal ini akan memberi gambaran mengenai bagaimana butir tersebut harus diperbaiki.
Daftar Periksa (Checklist) untuk Mengevaluasi Kualitas Penilaian Esai Materi Pelajaran.
Untuk mengembangkan soal esai, dapat digunakan checklist. Ajukan pertanyaan dibawah ini pada setiap butir. Jika terdapat satu pertanyaan yang dijawab "tidak", maka butir tersebut perlu direvisi.
1)      Apakah esai menilai suatu aspek penting dari target instruksional unit?
2)      Apakah esai cocok dengan rencana penilaian dalam hal kinerja, penekanan, dan jumlah poin?
3)      Apakah esai mensyaratkan siswa untuk menerapkan pengetahuan mereka ke situasi baru?
4)      Bila dilihat dalam kaitannya dengan butir lainnya pada tes, apakah butir berkontribusi mencakup berbagai konten dan keterampilan berpikir tertentu dalam rencana penilaian Anda?
5)      Apakah prompt/dialog terfokus? Apakah hal tersebut mendefinisikan tugas dengan petunjuk tertentu?
6)      Apakah tugas mendefinisikan dengan prompt dalam tingkat kompleksitas yang sesuai dengan kematangan pendidikan siswa?
7)      Untuk mendapatkan nilai yang baik pada butir tersebut apakah siswa disyaratkan untuk menunjukkan kemampuan mengingat fakta, definisi, daftar, ide, generalisasi, dll?
8)      Apakah worded prompt mengarahkan semua siswa untuk menafsirkan tugas dengan cara yang Anda inginkan?
9)      Apakah kata-kata prompt memperjelas siswa terhadap hal berikut:
a)      Besaran atau panjang tulisan yang dibutuhkan?
b)      Tujuan yang mereka tulis?
c)      Jumlah waktu yang dibutuhkan untuk menjawab butir ini?
d)     Dasar yang mana jawaban mereka akan dievaluasi?
10)  Jika esai prompt meminta siswa untuk mendukung pendapat mereka tentang hal-hal kontroversial, apakah kata-kata yang membuat jelas bahwa penilaian siswa akan didasarkan pada logika dan buktinya mendukung argumen mereka, bukan pada posisi yang sebenarnya diambil atau pendapat lain?

6.      Penyekoran Tes Esai
Hasil pekerjaan examinee/siswa diskor dengan menggunakan kunci jawaban terlebih dahulu. Setiap langkah yang penting sebaiknya diberi skor. Bobot skor dari masing-masing butir juga perlu diperhatikan. Pertanyaan esai sebaiknya diskor dengan menggunakan skala penskoran yang cocok dengan point yang direncanakan akan dinilai.
Berikut adalah beberapa hal yang perlu diperhatikan dalam melakukan penskoran soal esai (Nitko, 2007:217):
a.       Rubrik penskoran
Rubrik penskoran dapat meningkatkan konsistensi penskoran. Sebuah rubrik penskoran dapat meningkatkan keandalan (konsistensi) dan validitas penilaian esai. Penggunaan rubrik penskoran juga dapat mengurangi waktu dalam penilaian,sehingga waktu yang digunakan lebih efektif.
Contoh:
No
Standar Penskoran
Penilaian
1
2
3
4
1.
Menunjukkan pemahaman terhadap konsep




2.
Menggunakan strategi-strategi dalam pemecahan masalah




3.
Komputasinya benar




4.
Tulisan penjelasannya tepat





b.      Menskor satu pertanyaan pada satu waktu
Jika lebih dari satu pertanyaan esai, skorlah semua siswa pada pertanyaan pertama sebelum berlanjut ke pertanyaan selanjutnya. Metode ini meningkatkan keseragaman dengan dimana anda menerapkan standar-standar penskoran untuk setiap siswa. Metode ini juga akan membuat anda lebih familier dengan petunjuk penskoran untuk setiap pertanyaan. Keuntungannya, kita bisa terhindar dari carryover error dengan fokus menyelesaikan penskoran pada soal tertentu sebelum berlanjut ke nomor soal selanjutnya.
c.       Skorlah hasil pekerjaan siswa terpisah dari faktor lain.
Ketika menilai suatu materi/bahan pada tes esai, faktor lain selain konten dari jawaban sering mempengaruhi evaluasi yang anda lakukan. Faktor-faktor tersebut meliputi pengejaan, gaya tulisan tangan, kerapihan, dan penggunaan bahasa.
d.      Skorlah soal esai tanpa memperhatikan nama
Pensekoran akan lebih valid ketika anda melakukan pensekoran tanpa melihat nama siswa. Cara ini mencegah halo error. Lebih jauh, jika siswa mengetahui anda mensekor tanpa memperhatikan nama, mereka sepertinya mempersepsikan proses pengrade-an terlaksana secara fair. Cara yang dapat dilakukan adalah meminta siswa untuk menuliskan identitasnya di balik lembar jawaban. Cara lain adalah dengan tidak menuliskan nama siswa, artinya identitas siswa hanya berupa kode saja.
e.       Memberi Siswa Tanggapan/umpan balik
Penilaian dengan menggunakan tes esai akan memberi kesempatan kepada siswa untuk belajar lebih jauh. Guru dapat memberikan umpan balik ketika dia menilai jawaban siswa dengan menuliskannya di lembar jawaban siswa.
f.       Penskoran yang independen
Guru yang individual sangat mempengaruhi penilaian esai.  Orang Cina kuno menyadari bahwa untuk mengambil keputusan penting terhadap skor dari esai dibutuhkan dua atau lebih pembaca (Kracke, dalam Nitko, 2007).

7.      Reliabilitas Skor
Tes esai memiliki reliabilitas yang rendah. Ada beberapa faktor yang mejadi penyebab rendahnya reliabilitas tes esai. Faktor-faktor tersebut akan menurunkan pengukuran kesalahan pada evaluasi hasil pekerjaan siswa. Untuk meningkatkan reliabilitas soal esai dapat digunakan rubrik. Berikut adalah alasan mengapa reliabilitas tes esai rendah:
a.       Tidak ada standar yang konsisten
Jawaban seorang siswa mungkin akan dinilai berbeda antara pembaca yang satu dengan yang lain. Selain itu, guru yang sama mungkin menilai berbeda pekerjaan yang sama pada hari yang berbeda. Solusi dari permasalahan ini, pengoreksi sebaiknya menggunakan panduan penskoran/rubrik.
b.      Penentuan nilainya tidak jelas
Ketika kriteria penskoran sudah ditentukan, penentuan nilai dipengaruhi oleh konsistensi penyekor dalam menggunakan rubrik atau untuk mengintepretasikannya berbeda dari waktu sebelumnya. Kecenderungan untuk mengganti kriteria penskoran dan diaplikasikan berlangsung dengan lambat dinamakan rater drift. Solusinya penyekor sebaiknya berhenti secara periodik dan menentukan apakah dia menyekor sesuai kriteria atau tidak.
c.       Merubah topik dan prompt
Skor seorang siswa mungkin bermacam-macam, bahkan ketika dinilai orang yang sama sekalipun. Hal tersebut dikarenakan topik, prompt, atau pertanyaan. Hal ini jadi permasalahan serius: jika anda mendasarkan evaluasi seorang siswa melalui pertanyaan esai, anda tidak akan mampu untuk membuat pernyataan yang general tentang performa siswa pada topik yang berbeda. Intinya, anda harus mempunyai rencana penilaian untuk melakukan penilaian yang mengidentifikasikan perbedaan format penilaian yang anda gunakan.

d.      Halo Effect
Halo effect error terjadi ketika keputusan anda tentang karakteristik seseorang merefleksikan keputusan anda tentang karakteristik  yang lain atau kesan umum anda tentang orang tersebut. Guru biasanya menilai siswa yang ia senangi dengan hati-hati. Begitu juga sebaliknya, guru mungkin memberi nilai yang rendah pada siswa yang mereka anggap kurang pandai. Solusi dari permasalahan ini adalah hanya menilai esai setelah menutup namanya pada lembar jawaban.
e.       Carryover Effect
Carryover effect terjadi ketika anda memutuskan respon siswa pada pertanyaan 1 mempengaruhi penilian anda terhada respon siswa pada pertanyaan 2. Misalnya, seorang siswa mampu menjawab dengan baik pertanyaan pada soal nomor 1 tetapi biasa saja ketika menjawab soal nomor 2. Carryover effect terjadi ketika anda menilai soal 2 lebih baik setelah anda menilai soal nomor 1. Anda menilai pertanyaan nomor 2 lebih menguntungkan karena anda “carried over” kesan yang menyenangkan dari jawaban siswa pada soal nomor 1.

8.      Perbandingan Tes Esai dan Tes Objektif
Berikut adalah persamaan dan perbedaan antara tes esai dan tes objektif, (Ebel, 1986: 130):
·         Keduanya dapat digunakan mengukur prestasi belajar
·         Keduanya dapat digunakan untuk mendorong siswa untuk memahami suatu prinsip, organisasi dan mengintegtasikan ide-ide dan penerapan pengetahuan untuk menyelesaikan pemasalahan.
·         Kegunaan keduanya semestinya mencakup latihan penyampaian pendapat yang subjektif
·         Skor keduanya tergantung pada objektivitas dan reliabilitas
·         Pertanyaan esai mensyaratkan siswa utuk merencanakan jawaban mereka dan mengekspresikannya sesuai dengan bahasa mereka. Tes objektif mensyaratkan peserta tes untuk memilih diantara beberapa alternatif jawaban.
·         Tes esai memuat pertanyaan yang lebih sedikit namun bersifat umum. Tes subjektif memuat pertanyaan yang banyak dengan jawaban yang singkat
·         Siswa memerlukan waktu yang relatif lama untuk berfikir dan menulis ketika mereka mengerjkan tes esai. Pada tes objektif, siswa memerlukan waktu yang lama untuk membaca dan berfikir.
·         Kualitas tes objektif ditentukan oleh kemampuan penyusun tes. Kualitas tes esai ditentukan oleh skor tes.
·         Tes esai relatif mudah disiapkan namun sulit untuk menulainya secara akurat. Tes objektif sulit dalam menyiapkannya namun mudah dalam melakukan penilaiannya.
·         Tes esai memberi kesempatan yang luas kepada siswa untuk mengekspresikan segala kompetensi yang dimilikinya untuk menjawab pertanyaan. Tes objektif memberi kesempatan kepada penyusun tes untuk mengekspresikan pengetahuan dan nilai personal namun membiarkan siswa hanya untuk memilih dari jawaban yang telah disediakan. Tes objektif membatasi kompetensi siswa.
·         Pada tes objektif, hasil pekerjaan siswa dinilai lebih jelas daripada tes esai.
·         Tes objektif memunculkan kecenderungan untuk menebak (guessing). Tes esai memunculkan intimidasi.
·         Distribusi skor pada tes esai dapat dikontrol kebermutuannya oleh penilai, sedangkan pada tes objektif tergantung sepenuhnya pada ujiannya.

9.      Penggunaan Tes Esai
Tes esai digunakan apabila:
·         Jika kelompok yang dites kecil dan tes tersebut tidak diulang.
·         Intruktur ingin mendorong kemampuan siswa daam mengekspresikan gagasan melalui tulisan
·         Instruktur lebih tertarik untuk menjajaki sikap siswa daripada mengukur prestasi
·         Instruktur lebih yakin  terhadap keahlian atau kecakapannya dalam memberi kritik daripada sebagai penulis imaginatif pada soal objektif.
·         Waktu untuk penyusunan tes lebih singkat daripada penilaian


DAFTAR PUSTAKA

Ebel, Robert L. 1986. Essentials Of Educational Measurement. New Jersey: Prentice Hall Inc.
Miller, M.D., Linn, R.L., & Gronlund, N.E. 2009. Measurement and Assessment in Teaching. Upper Saddle River, N.J. : Pearson
Nitko, Anthony J. & Susan M. Brookhart. 2007. Educational Assesment of Students. Upper Saddle River, NJ: Pearson Education, Inc.







Tidak ada komentar:

Poskan Komentar