Secara global validitas dibagi menjadi dua bagian yaitu validitas logis dan validitas empiris.
Validitas logis
Validitas ini meliputi:
1. Validitas Isi (Content Validity)
Suatu tes dikatakan memiliki validitas isi bila mengukur tujuan khusus tertentu yang sejajar dengan materi pelajaran yang diberikan. Validitas ini dapat diusahakan tercapai sejak saat penyusunan (melihat materi dlm kurikulum).
2. Validitas Konstruksi (Construct Validity)
Suatu tes dikatakan memiliki validitas konstruksi bila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Pembelajaran Khusus (Standar Kompetensi).
Validitas Empiris
Validitas ini meliputi:
1. Validitas “Ada Sekarang” (Concurrent Validity)
Suatu tes dikatakan memiliki validitas ini jika hasilnya sesuai dengan pengalaman (data pengalaman sudah ada).
Misal seorang guru ingin mengetahui apakah soal tes sumatif yang disusun valid, maka untuk hal ini diperlukan suatu kriteria masa lalu (nilai ulangan harian).
2. Validitas Prediksi (Predictive Validity)
Suatu tes dikatakan memiliki validitas prediksi bila mampu merperkirakan apa yang akan terjadi pada masa yang akan datang. Misal tes masuk Perguruan Tinggi adalah suatu tes yang mampu memperkirakan keberhasilan peserta didik dalam mengikuti perkuliahan sesuai dengan alokasi waktu.
Catatan:
Suatu tes dikatakan valid apabila tes tersebut tepat untuk mengukur apa yang hendak diukur.
Minggu, 06 Juli 2008
Validitas
Reliabilitas
Secara sederhana reliabilitas dapat dinyatakan sebagai tingkat keajegan atau kemantapan hasil dari dua pengukuran terhadap hal yang sama.
Untuk menentukan reliabilitas terhadap hasil pengukuran dapat dilakukan dengan beberapa metode, yaitu:
A. Metode Tes Ulang
1. Metode tes ulang (test-retest method) merupakan pendekatan yang paling tua untuk mengestimasi reliabilitas.
2. Metode ini dinamakan juga single-test-double-trial method.
3. Metode ini sangat berguna untuk mengukur kesetabilan pengukuran.
B. Metode Ekuivalen
1. Metode ekuivalen dinamakan pula alternate-forms methods atau double test-double-trial method.
2. Metode ini berkaitan dengan penggunaan dua buah tes yang relatif sama kepada peserta didik yang sama.
3. Kesamaan yang dimaksud pada tes adalah kesamaan tujuan, tingkat kesukaran dan susunan.
C. Metode Belah Dua
1. Metode ini sering disebut single-test-single-trial method.
2. Metode ini sangat sederhana, (i). Menyelenggarakan satu kali tes,
(ii). Membagi soal tes menjadi dua bagian yang sama banyak. (iii). Mengkorelasikan skor kedua belahan untuk mengestimasi reliabilitas tes.
Statistika Sederhana
Pilih salah satu jawaban yang paling tepat dari beberapa alternatif jawaban yang disediakan!
Gunakan data berikut untuk menjawab pertanyaan di bawah ini!
No | Nama | Hasil Tes Formatif | Hasil Tes Sumatif |
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. | Bandi Adi Dina Zakaria Nuri Nina Anda Sita Siti Budi Delta Charles Gultom Mawar Parmadi Mahmudah Sulaeman Darti Surti Warti | 87 85 83 80 80 76 73 70 64 60 60 60 57 56 54 50 47 45 41 40 | 76 84 81 75 76 80 76 73 67 70 67 65 60 53 60 50 50 51 50 50 |
1. Rentang data tes sumatif adalah….
A. 26
B.34
C. 37
D. 47
2. Jika data tes formatif akan disajikan dalam tabel frekwensi distribusi maka banyak kelas interval yang harus dibuat adalah….
A. 4
B. 5
C. 7
D. 8
3. Jika data tes formatif akan disajikan dlam tabel frekwensi distribusi maka panjang kelas interval yang harus dibuat adalah….
A. 5
B. 7
C. 9
D. 12
4. Berapa harga rata-rata untuk data tes formatif?
A. 59,1
B. 60,4
C. 61,4
D. 63,4
5. Median untuk data tes sumatif adalah….
A. 60
B. 65
C. 67
D. 73
6. Modus untuk data tes sumatif adalah….
A. 50
B. 53
C. 67
D. 76
7. Besarnya simpangan
A. 15,05
B. 13,02
C. 9,50
D. 7.98
8. Jika dilihat sebaran datanya maka data tes sumatif….
A. lebih heterogen
B. lebih homogen
C. mempunyai modus lebih dari satu
D. harga rata-rata lebih rendah dari tes formatif
9. Besarnya harga koefisien korelasi antara hasil tes formatif dan tes sumatif adalah….
A. 0,56
B. 0,76
C. 0,94
D. 1,0
10. Kesimpulan yang dapat ditarik dari hubungan antara hasil tes formatif dan tes sumatif adalah….
- tidak ada korelasi antara hasil tes formatif dengan tes sumatif
- terdapat korelasi negatif antara hasil tes formatif dengan tes sumatif
- terdapat korelasi positif antara hasil tes formatif dengan tes sumatif
- terdapat korelasi positif sempurna antara hasil tes formatif dengan tes sumatif
Analisis Perbaikan Butir Soal
A. Mengapa Analisis Butir Soal Penting?
Dengan melakukan analisis butir soal dapat diperoleh banyak informasi yang bermanfaat, baik untuk guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakukan dengan harapan dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir-butir soal, terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut penggunaan analisis butir soal adalah sebagai berikut:
1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut:
- Apakah soal-soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan pembelajaran khusus?
- Apakah tingkat kesukaran soal sudah diperhitungkan?
- Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang pandai?
- Apakah kunci soal sudah sesuai dengan maksud soal?
- Jika digunakan tes pilihan ganda, apakah pengecoh (distractor) yang dipilih sudah berfungsi dengan baik?
- Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak?
2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi.
3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam memahami suatu materi.
4. Sebagai acuan untuk merevisi soal.
5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal.
B. Kapan Analisis Butir Soal Dilakukan?
Pada saat guru mengujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajar siswa, maka idealnya guru harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba. Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal.
1. Tingkat Kesukaran (P)
Tingkat kesukaran suatu butir soal merupakan salah satu yang dapat menunjukkan kualitas butir soal tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar. Besarnya tingkat kesukaran butir soal dapat dihitung dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap setiap butir soal, dalam hal ini dapat dihitung dengan menggunakan rumus:
P = B / N
Keterangan:
P adalah indeks tingkat kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah seluruh peserta tes
Contoh:
Jika butir soal nomor 1 yang Anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa, maka indeks tingkat kesukaran butir soal tersebut adalah:
P = 10 / 40 = 0,25
Indeks tingkat kesukaran butir soal bergerak antara 0,00 sampai dengan 1,00. Indeks tingkat kesukaran suatu butir soal (P) = 0,00 akan tercapai apabila seluruh peserta tes tidak ada yang menjawab dengan benar dan indeks tingkat kesukaran suatu butir soal (P) = 1,00 akan tercapai apabila seluruh peserta tes dapat menjawab dengan benar. Jadi butir soal yang mudah akan mempunyai P mendekati 1,00 dan butir soal yang sukar akan mempunyai P mendekati 0,00.
Menurut Fernandes (1984) kategori indeks tingkat kesukaran butir soal adalah sebagai berikut:
P >= 0,76 : mudah
0,25 <= P <= 0,75 : sedang
P <= 0,24 : sukar
Butir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai indeks tingkat kesukaran dalam kategori sedang.
2. Daya Pembeda (D)
Daya pembeda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta tes. Butir soal yang didukung oleh potensi daya pembeda yang baik akan mampu membedakan peserta tes (peserta didik) yang memiliki kemampuan tinggi (pandai) dengan peserta didik yang memiliki kemampuan rendah (kurang pandai).
Indeks daya pembeda butir soal dapat dihitung dengan menggunakan rumus:
D = PA – PB
Keterangan:
D adalah indeks daya pembeda butir soal
PA adalah proporsi kelompok atas yang menjawab benar
PB adalah proporsi kelompok bawah yang menjawab benar
Contoh:
Dalam menjawab butir soal nomor 2, diperoleh 6 dari 10 siswa yang termasuk dalam kelompok atas dapat menjawab benar dan 2 dari 10 siswa yang termasuk kelompok bawah dapat menjawab benar, maka indeks daya pembeda butir soal tersebut adalah:
D = (6/10) – (2/10) = 4/10 = 0,4
Yang dimaksud siswa kelompok atas adalah kelompok siswa yang memperoleh skor tinggi sedangkan yang dimaksud dengan siswa kelompok bawah adalah kelompok siswa yang memperoleh skor rendah setelah mengerjakan satu set suatu mata pelajaran.
Nilai indeks daya pembeda butir soal bergerak dari –1 sampai 1. Semakin tinggi indeks daya pembeda menunjukkan bahwa butir soal tersebut semakin dapat membedakan antara siswa yang pandai dengan siswa yang kurang pandai.
Secara teoritis indeks daya pembeda soal (D) = 1 akan tercapai apabila semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah menjawab salah. Indeks daya pembeda soal (D) = – 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab salah dan semua siswa kelompok bawah dapat menjawab benar.
Sedangkan indeks daya pembeda soal (D) = 0 tercapai apabila proporsi siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama.
Butir soal yang mempunyai indeks daya pembeda negatif adalah butir soal yang kurang baik karena soal tersebut tidak bisa membedakan siswa yang pandai dengan siswa yang kurang pandai, di mana siswa yang kurang pandai justru lebih banyak menjawab benar daripada siswa yang pandai.
Butir soal mempunyai daya pembeda yang baik jika kunci (jawaban soal) mempunyai daya pembeda positif dan pengecohnya mempunyai daya pembeda negatif. Menurut Fernandes (1984) kategori indeks daya pembeda butir soal adalah sebagai berikut:
D >= 0,40 : sangat baik
0,30 <= D <= 0,39 : baik
0,20 <= D <= 0,29 : sedang
D <= 0,19 : tidak baik
C. Bagaimana Cara Melakukan Analisis Secara Sederhana?
Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan langkah-langkah yang diperlukan:
1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa.
2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai skor tertinggi ke skor terendah.
3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan siswa dalam kelompok bawah. Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan berapa persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut:
- Jika jumlah siswa <= 20, maka jumlah kelompok atas dan kelompok bawah masing-masing 50%.
- Jika jumlah siswa 21 – 40 , maka jumlah kelompok atas dan kelompok bawah masing-masing 33,3%.
- Jika jumlah siswa >= 41, maka jumlah kelompok atas dan kelompok bawah masing-masing 27%.
4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban yang disediakan.
5. Dengan cara yang sama hitunglah jumlah siswa dalam kelompok bawah yang memilih tiap-tiap alternatif jawaban yang disediakan.
6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, bawah) yang menjawab benar.
7. Tentukanlah tingkat kesukaran dan daya pembeda butir soal dengan menggunakan rumus yang telah disediakan.
Contoh:
Perhatikan jawaban 100 siswa terhadap butir soal nomor 1 berikut:
Kelompok | Alternatif Jawaban | Jumlah | ||||
A | B* | C | D | E | ||
Atas Tengah Bawah | 5 3 | 15 25 7 | 0 12 | 0 0 | 7 5 | 27 27 |
Catatan: * (kunci jawaban)
Indeks tingkat kesukaran butir soal di atas adalah:
P = B / N = (15 + 25 + 7)/100 = 47/100 = 0,47
Indeks daya pembeda butir soal di atas adalah :
D = PA – PB = (15/27) – (7/27) = 0,30
D. Bagaimana Memperbaiki Butir Tes?
Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut:
1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai indeks tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut.
2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal) mempunyai indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks daya pembeda negatif.
3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan peserta ujian untuk menentukan jawabannya.
Penilaian PAN dan PAP
A. Penilaian Acuan Normatif (PAN)
Nilai sekelompok peserta didik (siswa) dalam suatu proses pembelajaran didasarkan pada tingkat penguasaan di kelompok itu. Artinya pemberian nilai mengacu pada perolehan nilai di kelompok itu.
Contoh:
1. Suatu kelompok peserta didik (siswa) terdiri dari 9 orang mendapat skor (nilai mentah):
50, 45, 45, 40, 40, 40, 35, 35, 30
Dari skor mentah ini dapat dibaca bahwa perolehan tertinggi adalah 50 dan perolehan terendah adalah 30. Dengan demikian nilai tertinggi diberikan terhadap skor tertinggi, misalnya 10. Secara proporsional skor di atas dapat diberi nilai 10, 9, 9, 8, 8, 8, 7, 7, 6.
Cara lain ialah dengan menghitung persentase jawaban benar yang dijawab oleh setiap siswa. Kemudian kepada siswa yang memperoleh persentase tertinggi diberikan nilai tertinggi. Jika skor (nilai mentah) di atas didapat dari 60 butir pertanyaan atau skor maksimalnya 60, maka (perhatikan tabel di bawah ini)!
Tabel. 1
Menghitung Nilai dari Skor (Nilai Mentah)
Nilai mentah | 50 | 45 | 45 | 40 | 40 | 40 | 35 | 35 | 30 |
Persentase jawaban yang benar | 83,3 | 75,0 | 75,0 | 66,7 | 66,7 | 66,7 | 58,5 | 58,5 | 50,0 |
Nilai (1-10) | 10 | 9 | 9 | 8 | 8 | 8 | 7 | 7 | 6 |
Untuk mengubah persentase menjadi nilai (1-10) dengan cara bahwa persentase tertinggi diberi nilai 10, ini berarti bahwa 83,3% dihargai 10, maka 75,0% harganya adalah (75,0%/83,3%) x 10 = 9,0.
Dapat juga dicari faktor pengali terlebih dahulu, yaitu:
83,3% adalah 10 atau (83,3/100) x n = 10 atau n = 12. Jadi faktor pengalinya adalah 12, sehingga 66,7% pada nilai (1-10) adalah 66,7% x 12 = 7,9 atau 8.
2. Sekelompok siswa terdiri dari 40 orang dalam satu ujian memperoleh nilai mentah sebagai berikut:
55 | 43 | 39 | 38 | 37 | 35 | 34 | 32 |
52 | 43 | 40 | 37 | 36 | 35 | 34 | 30 |
49 | 43 | 40 | 37 | 36 | 35 | 33 | 28 |
48 | 42 | 40 | 37 | 36 | 34 | 33 | 22 |
46 | 39 | 38 | 37 | 36 | 34 | 32 | 21 |
Penyebaran nilai mentah di atas dapat ditulis seperti tabel berikut:
Tabel. 2
Pengolahan Nilai Mentah Menjadi (1-10)
No. | Nilai Mentah | Jumlah Siswa | Jika 55 diberi 10 maka | Jika skor maks. 75 maka % yg benar | Persentase diubah menjadi (1-10) |
1 | 2 | 3 | 4 | 5 | 6 |
1 | 55 | 1 | 10,0 | 73,3 | 10,0 |
2 | 52 | 1 | 9,5 | 69,3 | 9,5 |
3 | 49 | 1 | 9,0 | 65,3 | 9,0 |
4 | 48 | 1 | 8,7 | 64,0 | 8,7 |
5 | 46 | 1 | 8,4 | 61,3 | 8,4 |
6 | 43 | 3 | 7,8 | 57,3 | 7,8 |
7 | 42 | 1 | 7,6 | 56,0 | 7,6 |
8 | 40 | 3 | 7,3 | 53,3 | 7,3 |
9 | 39 | 2 | 7,1 | 52,0 | 7,1 |
10 | 38 | 2 | 6,9 | 50,7 | 6,9 |
11 | 37 | 5 | 6,7 | 49,3 | 6,7 |
12 | 36 | 4 | 6,5 | 48,0 | 6,5 |
13 | 35 | 3 | 6,4 | 46,7 | 6,4 |
14 | 34 | 4 | 6,2 | 45,3 | 6,2 |
15 | 33 | 2 | 6,0 | 44,9 | 6,0 |
16 | 32 | 2 | 5,8 | 42,7 | 5,8 |
17 | 30 | 1 | 5,5 | 40,0 | 5,5 |
18 | 28 | 1 | 5,1 | 37,3 | 5,1 |
19 | 22 | 1 | 4,0 | 29,3 | 4,0 |
20 | 21 | 1 | 3,8 | 28,0 | 3,8 |
Jumlah siswa: 40 |
Jika nilai mentah yang paling tinggi 55, diberi nilai 10 maka nilai untuk: 52 adalah (52/55) x 10 = 9,5.
Misalnya dalam ujian tersebut nilai maksimalnya 75, maka besar presentase dihitung sebagai berikut: (55/75) x 100% = 73,3%.
Nilai akhir yang dihitung berdasarkan perubahan nilai mentah menjadi nilai (1-10) atau nilai mentah menjadi persentase kemudian menjadi nilai (1-10) hasilnya sama, sebagaimana terlihat pada kolom 4 dan kolom 6 pada tabel 2 di atas.
Bilamana jumlah anggota kelompok tidak hanya satu kelas tetapi beberapa kelas sehingga banyaknya peserta didik (siswa) ratusan jumlahnya maka untuk memberi nilai kepada setiap anggota kelompok digunakan statistik sederhana dengan menentukan besarnya skor rata-rata kelompok dan simpangan
Jumlah anggota kelompok yang besar, distribusi (penyebaran) kemampuannya mulai dari yang paling pandai, pandai, sedang, kurang dan sangat kurang.
Dalam hal ini penyebaran kemampuan anggota kelompok biasanya digambarkan menurut kurva normal.
Menurut distribusi kurva normal kalau sekelompok peserta didik (siswa) yang memiliki skor rata-rata 60, maka jumlah siswa yang mendapat skor 60 ke atas adalah:
60 sampai dengan (60 + 1.SD) adalah 34,13%
(60 + 1.SD) sampai dengan (60 + 2.SD) adalah 13,59%
(60 + 2.SD) sampai dengan (60 + 3.SD) adalah 2,14%
Begitu pula siswa yang mendapat skor 60 ke bawah adalah:
60 sampai dengan (60 – 1.SD) adalah 34,13%
(60 – 1.SD) sampai dengan (60 – 2.SD) adalah 13,59%
(60 – 2.SD) sampai dengan (60 – 3.SD) adalah 2,14%
Dengan kata lain jumlah siswa yang memperoleh skor antara (+ 1.SD sampai dengan – 1.SD) adalah 68,26%, yang memperoleh skor antara (+ 2.SD sampai dengan – 2.SD) adalah 95,44%.
Tabel. 3
Konversi Skor Mentah ke dalam Nilai (1-10)
Skor Mentah | Nilai (1-10) | Contoh |
Skor Rata-rata + 2,25SD | 10 | Perhatikan table. 2, peserta dengan skor mentah 49 mendapat nilai: 37,4 + 6,8n = 49 ( n = besar penyimpangan antara + 2,25 sampai dengan – 2,25, maka didapat n = 1, 71. Dengan demikian peserta dengan skor mentah 49 mendapat nilai 8,5. |
Skor Rata-rata + 1,75SD | 9 | |
Skor Rata-rata + 1,25SD | 8 | |
Skor Rata-rata + 0,75SD | 7 | |
Skor Rata-rata + 0,25SD | 5 | |
Skor Rata-rata – 0,25SD | 6 | |
Skor Rata-rata – 0,75SD | 4 | |
Skor Rata-rata – 1,25SD | 3 | |
Skor Rata-rata – 1,75SD | 2 | |
Skor Rata-rata – 2,25SD | 1 |
B. Pengembangan Butir Soal untuk PAN
Di atas telah disebutkan bahwa dasar penentuan nilai akhir adalah kurva normal, artinya peserta ujian dianggap mengikuti kurva normal, yaitu 68,3% dari mereka memiliki kemampuan akademis yang sedang, 13,6% memiliki kemampuan akademis baik, dan 2,3% memiliki kemampuan akademis baik sekali, sebaliknya 13,6% kemampuannya kurang dan 2,3% kemampuannya kurang sekali. Dengan demikian kalau membuat soal yang semuanya sukar akan berakibat hanya sebagian kecil yang lulus, sebaliknya kalau membuat soal yang semuanya mudah maka kebanyakan atau hampir semuanya akan lulus. Dengan kata lain soal yang semuanya sukar atau soal yang semuanya mudah tidak akan memenuhi kondisi kurva normal. Susunlah soal yang sebagian besar tingkat kesukarannya sedang, sebagian kecil ada yang mudah dan ada yang sukar. Dengan penyusunan perangkat soal seperti ini akan dapat diharapkan bahwa peserta yang pintar akan dapat menjawab semua butir soal, sehingga mereka akan ada yang memperoleh nilai tertinggi pada skala (1-10), namun kebanyakan peserta akan dapat menjawab butir-butir pertanyaan yang mudah dan yang sedang, dan sebagian kecil peserta ujian hanya menjawab dengan tepat butir-butir soal yang mudah ditambah sebagian kecil dari butir soal yang sedang, mereka inilah calon peserta yang tidak lulus.
Dengan kata lain, mencantumkan butir soal pada saat satu perangkat soal ditentukan oleh kemampuan kelompok yang akan mengikuti ujian, bukan ditentukan konsep-konsep yang harus dikuasai oleh peserta ujian. Dampak pengukuran PAN pada masing-masing individu adalah alat ukur yang digunakan belum pasti dapat mengukur kemampuan maksimal yang dimiliki seseorang (peserta ujian).
C. Penilaian Acuan Patokan (PAP)
Penilaian Acuan Patokan (PAP) didasarkan pada adanya tujuan instruksional yang dapat diukur. Tujuan inilah yang dipedomani untuk melaksanakan pembelajaran dan untuk mengembangkan (menulis) alat ukur. Dengan kata lain apa yang direncanakan, maka dilaksanakan dalam proses pembelajaran dan diukur untuk menentukan apakah proses pembelajaran sudah mencapai tujuan.
Dengan PAP setiap individu dapat diketahui apa yang telah dan belum dikuasainya. Bimbingan individual untuk meningkatkan penguasaan siswa terhadap materi pelajaran dapat dirancang, demikian pula untuk memantapkan apa yang telah dikuasainya dapat dikembangkan. Guru dan setiap peserta didik (siswa) mendapat manfaat dari adanya PAP.
Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran dengan melaksanakan tes awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir dengan test awal merupakan petunjuk tentang kualitas proses pembelajaran.
Pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana diharapkan dan termuat pada kurikulum saat ini, PAP merupakan cara pandang yang harus diterapkan.
PAP juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya kurang terkontrolnya penguasaan materi, terdapat siswa yang diuntungkan atau dirugikan, dan tidak dipenuhinya nilai-nilai kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar tuntas (mastery learning).
Pada cara ini hanya mereka yang telah menguasai paling sedikit sekian persen soal-soal yang ditanyakan, siswa yang dianggap menguasai materi yang ditanyakan itu. Batas kelulusan itu misalnya dapat menjawab pertanyaan-pertanyaan sebanyak 75%. Bila hendak dikonversi terhadap nilai A, B, C, D atau E, dapat menggunakan pedoman berikut:
Tabel. 4
Konversi Angka terhadap Nilai
Angka | Nilai (Huruf) |
95 – 100 87 – 94 75 – 86 60 – 74 <> | A B C D E (Gagal) |
Pengelompokan nilai-nilai mentah kedalam huruf-huruf tersebut tanpa adanya alasan ilmiah, hanya rasional saja.
D. Pengembangan Butir Soal untuk PAP
Pengembangan butir soal untuk PAP tingkat kesukarannya tidak diperhatikan karena maksud soal ini bukan membedakan siswa yang pandai dari siswa yang kurang, tetapi melihat penguasaan seseorang terhadap bahan atau tujuan instruksional. Juga daya pembeda tidak diperhatikan dalam PAP, tetapi yang menjadi perhatian ialah daya serap siswa.
PAN dan PAP, keduanya digunakan dalam penilaian kognitif (pengetahuan). Kedua pendekatan ini akhirnya dapat menggunakan angka (1-10) atau (1-100) atau A, B, C, D, E. Sedangkan penilaian untuk yang non kognitif (sikap, keberhasilan, disiplin misalnya) dinyatakan secara verbal seperti baik sekali, baik, sedang, kurang, atau kurang sekali.
E. Perbandingan PAP dan PAN
No. | Penilaian Acuan Patokan (PAP) | Penilaian Acuan Normatif (PAN) |
1. | PAP digunakan untuk menentukan status setiap peserta terhadap tujuan yang direncanakan | PAN digunakan untuk menentukan status setiap peserta terhadap kemampuan peserta lain |
2. | Tidak memperdulikan perbedaan individual | Perbedaan individual mendapat penekanan dalam PAN |
3. | Keragaman bukan menjadi faktor penentu dalam PAP, walaupun pada akhirnya tes-tes akan membedakan peserta yang telah menguasai dan belum menguasai | Pengembang PAN berupaya untuk menghasilkan tes-tes yang menghasilkan keragaman yang cukup berarti |
4. | PAP secara khusus menekankan pada ranah (kawasan ) tertentu yang harus dipelajari peserta didik | PAN mengukur kompetensi umum peserta didik |
5. | Butir-butir soal ditulis berdasarkan pengelompokkan, setiap kelompok terpusat pada tujuan tertentu | PAN menghasilkan penguasaan peserta didik secara umum dalam bidang pembelajaran tertentu |
6. | PAP memberikan indikator yang lebih meyakinkan bahwa tujuan telah tercapai | PAN memberikan hasil pengukuran yang meyakinkan terhadap penguasaan secara umum mengenai pembelajaran |
7. | PAP memiliki standar penguasaan untuk semua peserta yaitu berhasil atau gagal | PAN memiliki kecendrungan untuk menggunakan rentangan tingkat penguasaan seseorang terhadap kelompoknya, mulai dari yang sangat istimewa sampai dengan yang mengalami kesulitan yang serius |
8. | PAP memberikan penjelasan tentang penguasaan kelompok terhadap satu atau sejumlah tujuan | PAN memberikan skor yang menggambarkan penguasaan kelompok |
9. | Mudah menentukan materi yang belum dikuasai peserta didik dan mudah memberikan bantuan untuk menguasainya | Sukar menentukan dan memberi bantuan materi yang belum dikuasai peserta didik |
10 | Baik PAP maupun PAN diperlukan dalam pengukuran, karena keputusan yang tepat untuk memilih alat ukur yang digunakan akan sangat menentukan, misal alat ukur untuk UN berbeda dengan alat ukur untuk UMPT |