Melibatkan
penilai lain untuk memverifikasi atau membantu penilaian dalam menilai tes
siswa dapat mengurangi damfak bias dalam penilaian (Kane, 2006)(Popham, 2013).
Pada waktu diterapkan Ujian Nasional, ketika menilai hasil tes siswa hasil penilaian
akan diverifikasi oleh dua guru/penilai fungsinya untuk mengantisipasi adanya
bias dan mengurangi subjektiitas dalam menilai terutama soal uraian. Setelah UN
dihilangkan dan adanya tes sumatif atau penilaian akhir semester maka kegiatan
tersebut jarang dilakukan karena sekolah atau guru diberikan kewenangan untuk
membuat kisi-kisi dan soal sendiri serta memeriksa hasilnya. Namun hal tersebut
masih dilakukan ketika menjadi penilai/juri dalam suatu kompetensi , ada
penilai 1 dan 2 tujuannya sama untuk mengurangi damfak bias atau subjektivitas
penilai dalam menilai peserta lomba. Selain itu harus ada rubrik penilaian karena
dapat memberikan pedoman dalam
mendeskripsiskan kompetensi/kinerja yang diharapkan.
Selain cara di
atas ada metode lain yang dapat digunakan untuk mengantisipasi
bias dalam penilaian yaitu melalui metode statistik oleh Multifacet Rasch Model
(MFRM). MRFM adalah sebuah metode
statistik yang digunakan untuk mengukur dan mengantisipasi bias dalam penilaian,
sehingga memungkinkan penilai untuk menilai
lebih objektif dan adil dengan mengidentifikasi dan mengurangi
faktor-faktor bias yang dapat mempengaruhi penilaian. MPRM lebih banyak digunakan dalam penelitian oleh mahasiswa atau dosen, untuk kalangan guru di sekolah tidak familiar
dengan metode tersebut. MFRM termasuk pengukuran modern dengan menggunakan
sofware facet, cara menginfut data hasil penilaian sedikit rumit namun hasil
deskripsinya termasuk lengkap dalam menafsirkan hasil penilaian.
MFRM bekerja
dengan memperhatikan beberapa komponen atau "fasets" yang dapat
mempengaruhi hasil penilaian. Fasets ini dapat mencakup karakteristik siswa,
soal tes, dan penilai/guru. Dengan menganalisis respons siswa pada setiap
fasets, MFRM memungkinkan penilai/guru untuk memperoleh informasi yang lebih
rinci tentang kinerja siswa dan mengidentifikasi kemungkinan adanya bias dalam
penilaian dan dapat menghasilkan skor yang lebih obyektif serta dapat mengidentifikasi faktor-faktor
yang dapat memengaruhi penilaian, sehingga memungkinkan guru/penilai untuk
melakukan perbaikan dan penyesuaian yang diperlukan untuk mengurangi atau
menghilangkan bias dalam penilaian (Linacre, 1989) (Wright, & Linacre, 1994).
MFRM ini jika dipraktekkan dalam penilaian kinerja siswa oleh guru akan
menghasilkan data yang signifikan untuk tindak lanjut dan refleksinya.
Dalam Multifacet Rasch Model (MFRM),
bias mengacu pada adanya ketidaksesuaian atau penyimpangan dalam estimasi kemampuan
individu atau karakteristik item yang disebabkan oleh faktor-faktor tertentu
yang tidak relevan dengan kemampuan sebenarnya atau karakteristik item yang
diukur. Ada
beberapa jenis bias yang perlu diperhatikan yaitu Bias item/soal, hal ini terjadi ketika item/soal dalam tes memiliki pengaruh yang
tidak proporsional terhadap kemampuan individu yang diukur, contohnya ada item/soal tes yang cenderung memberikan hasil yang
lebih tinggi kepada satu kelompok siswa daripada kelompok lainnya, walaupun keduanya memiliki kemampuan yang
sama. Bias respon maksudnya
ketika faktor-faktor
non-kemampuan individu mempengaruhi respons siswa terhadap item/soal,
contohnya bias ini dapat
terjadi apabila siswa terpengaruh oleh faktor kecemasan, persepsi sosial, atau bias
budaya ketika memberikan respons terhadap item/mengisi instrumen. Bias grup terjadi ketika hasil
penilaian cenderung memiliki perbedaan sistematis antara kelompok siswa
tertentu, misalnya karena ada perbedaan dalam perlakuan, akses terhadap sumber daya, atau
pengalaman pendidikan antara kelompok siswa (Wright & Masters, 1982)(Hambleton, Swaminathan & Rogers, 1991).
Hal yang penting untuk dilakukan adalah
mengidentifikasi dan
mengurangi bias dalam MFRM, tujuannya untuk memastikan penilaian yang
akurat dan adil. Langkah-langkah yang dapat diambil yaitu melakukan analisis item, memeriksa
kinerja item, dan mengidentifikasi item yang cenderung memunculkan bias serta
menganalisis perbedaan
item plus analisis DIF
(Differential Item Functioning) dapat digunakan untuk mengidentifikasi item
yang dapat menyebabkan bias antara kelompok siswa tertentu (ibid., et.al).
.
Referensi:
Linacre, J.
M. (1989). Many-Facet Rasch Measurement. Chicago, IL: MESA Press.
Wright, B.
D., & Linacre, J. M. (1994). Reasonable mean-square fit values. Rasch
Measurement Transactions, 8(3), 370.
Wright, B. D., & Masters, G. N.
(1982). Rating scale analysis. MESA Press.
Hambleton, R. K., Swaminathan, H., &
Rogers, H. J. (1991). Fundamentals of item response theory (Vol. 3). Sage
Publications.
0 komentar:
Posting Komentar