Sunday, May 23, 2010

MODUL 4: PENGUJIAN, PENGUKURAN DAN PENILAIAN
Modul 4A Konsep Pengujian, Pengukuran dan Penilaian

JUMLAH JAM: 2 JAM (BERSEMUKA)
1 JAM (TUGASAN DAN PEMBELAJARAN KENDIRI)

1. SINOPSIS
Modul ini memperkenalkan konsep dan kaedah pengujian, pengukuran dan penilaian di institusi pengajian tinggi. Modul ini juga meliputi ciri-ciri utama ujian, bentuk-bentuk penilaian dan membezakan di antara penilaian berasaskan norma dan kriteria.

2. HASIL PEMBELAJARAN
Pada akhir modul ini, peserta kursus akan dapat;
i. Menjelaskan konsep dan matlamat pengujian, pengukuran dan penilaian dalam pendidikan;
ii. Menjelaskan konsep kesahan, kebolehpercayaan, keobjektifan, kebolehtadbiran dan kemudahtafsiran;
iii. Membezakan bentuk penilaian formatif, sumatif, pra kelayakan dan diagnostik serta penilaian alternatif;
iv. Membezakan penilaian berasaskan norma dan kriteria.

3. PEMBAHAGIAN TOPIK DAN MASA
Topik Jam
1. Pengertian dan Tujuan Pengajaran dan Penilaian

2. Ciri Utama Ujian

3. Jenis-Jenis Penilaian

4. Ujian Rujukan Norma dan Kriteria


2 JAM
Jumlah 2 JAM

4. PENILAIAN
Ujian bertulis 100%
Ujian bertulis mengenai konsep-konsep yang terkandung dalam modul.

5. RUJUKAN

Gronlund, N.E. (1997). Constructing Achievement Test. London: Prentice-Hall.

Kubiszyn, T. & Borich, G. (1996). Educational Testing and Measurement:
Classroom Application and Practice, (5thEd). New York: HarperCollins.

Lembaga Peperiksaan Malaysia. (2004). Pembinaan Skema. Kuala Lumpur:
Lembaga Peperiksaan Malaysia.

Mohamad Sahari Nordin. (2002). Pengujian dan Penaksiran di Bilik kuliah dan
makmal. Gombak: Universiti Islam Antarabangsa Malaysia.

Mohd. Najib Abdul Ghafar. (1997). Pembinaan dan Analisis Ujian Bilik kuliah dan
makmal. Skudai: Universiti Teknologi Malaysia.

Mokhtar Ismail. (1995). Penilaian di Bilik kuliah dan makmal. Kuala Lumpur:
Dewan Bahasa dan Pustaka.

Siti Rahayah Ariffin. (2003). Teori, Konsep dan Amalan Dalam Pengukuran dan
Penilaian. Pusat Pembangunan Akademik Bangi: Penerbit Universiti Kebangsaan Malaysia.












HURAIAN KANDUNGAN

1 Pengertian dan Tujuan Pengajaran dan Penilaian

Penilaian memainkan peranan penting dalam pendidikan. Penilaian dilakukan dalam semua aspek pendidikan bagi mengenal pasti status semasa dan seterusnya bagi tujuan perancangan program penambahbaikan pendidikan. Dalam pengajaran dan pembelajaran di bilik kuliah dan makmal, penilaian dilakukan bagi mengetahui sama ada pensyarah ‘mengajar’ dan pelajar ‘belajar’.

Justeru itu, penilaian pengajaran dan pembelajaran perlu dilakukan dengan sempurna dan berkesan. Bukti-bukti empirikal tentang sesuatu pengajaran dan pembelajaran yang diperoleh menggunakan pengukuran perlu dianalisis. Memandangkan pengukuran di bilik kuliah dan makmal sering menggunakan ujian, pengujian merupakan salah satu aspek utama dalam bidang penilaian pengajaran.

Seseorang pensyarah biasanya merangka objektif dan kandungan kursus yang hendak diajar sebelum merancang strategi dan kaedah pengajaran kursus berkenaan. Kemudian, beliau akan menyediakan soalan sama ada untuk kuiz, ujian atau peperiksaan. Dalam merancang dan membina soalan, adalah penting agar soalan-soalan tersebut relevan, sesuai dan menepati objektif kursus yang dirancang dan kandungan yang diajar. Seterusnya, kertas jawapan pelajar perlu diperiksa, diskor, dianalisis dan ditafsir bukan sahaja untuk membuat penilaian yang adil terhadap penguasaan pelajar dalam kursus yang diajar, malah bagi mengenal pasti kekuatan dan kelemahan soalan dan seterusnya pengajaran pensyarah. Justeru pemahaman terhadap konsep penilaian, pengukuran dan pengujian, ciri-ciri utama soalan ujian, matlamat mereka bentuk soalan formatif, sumatif, pra kelayakan dan diagnostik serta norma dan kriteria sangat penting bagi seseorang pensyarah bagi memastikan pengajaran dan penilaiannya bermutu dan adil.

1.1 Pengertian Penilaian

Apakah itu penilaian pendidikan? Menurut Stufflebeam (1971), penilaian adalah proses mengenalpasti, memperoleh dan menyediakan maklumat berguna bagi keputusan mempertimbangkan pilihan-pilihan yang ada pada kita. Penilaian menentukan jurang perbezaan antara “apa yang dihasilkan” dengan “apa yang dihasratkan” dari sesuatu program pendidikan. Penilaian merupakan pertimbangan profesional iaitu proses yang membolehkan seseorang membuat keputusan.

Meskipun banyak definisi penilaian pendidikan dikemukakan oleh pakar-pakar seperti Stufflebeam (1971), Thorndike dan Hagen (1977) dan Kubiszyn dan Borich (1996), pada asasnya penilaian merupakan suatu proses membuat keputusan yang sistematik melibatkan pengenalpastian, pemerolehan dan pentafsiran maklumat yang berguna bagi pertimbangan pilihan-pilihan keputusan berasaskan kepada sesuatu objektif pendidikan. Dari segi pengajaran dan pembelajaran di universiti, penilaian boleh didefinisikan secara ringkas sebagai satu proses sistematik untuk menentukan sejauh mana objektif pengajaran dan pembelajaran di dewan kuliah dan makmal dicapai.

Definisi penilaian ini membawa maksud objektif pengajaran perlu dikenal pasti terlebih dahulu sebelum penentuan pencapaian objektif tersebut dibuat berasaskan pertimbangan terhadap bukti empirikal. Bukti empirikal pencapaian biasanya diperoleh secara pengukuran terhadap penguasaan pelajar dengan menggunakan alat ukur yang dinamakan ujian. Namun, perkembangan dalam bidang penilaian menunjukkan banyak cara kita boleh menilai pengajaran pensyarah. Antara pelbagai jenis penilaian yang sering dilakukan di universiti adalah penilaian terhadap disertasi, projek, kajian kes, portfolio, bengkel, seminar, oral pelajar. Bukti empirikal dikumpul secara sistematik berasaskan maklumat sahih, tekal, telus dan boleh dipertahankan. Tanpa bukti empirikal, pertimbangan terhadap pencapaian objektif pengajaran dan pembelajaran mungkin dibuat berasaskan pendapat iaitu pertimbangan nilai bersifat subjektif, pincang dan rapuh.

Kuantifikasi dan Kualifikasi Dalam Penilaian

Penilaian pendidikan membabitkan dua unsur utama iaitu kuantifikasi dan kualifikasi. Kuantifikasi menggunakan ujian bagi mengukur kewujudan bukti empirikal penguasaan pelajar dalam sesuatu kursus yang diajar. Kualifikasi menggunakan pertimbangan nilai terhadap bukti empirikal penguasaan pelajar bagi membuat keputusan sama ada objektif pengajaran dan pembelajaran dicapai atau tidak.

Bukti empirikal penguasaan pelajar dalam bentuk skor yang sahih dan boleh dipercayai sangat diperlukan bagi membuat penilaian. Keperluan ini adalah kerana setiap keputusan yang dibuat melibatkan risiko. Bukti empirikal membantu kita membuat keputusan dengan risiko yang kecil. Semakin tepat pensyarah mengukur pencapaian pelajar, semakin tepat penilaian pensyarah terhadap keberkesanan pengajarannya.

Aktiviti 1
a. Cuba fikirkan apakah matlamat pensyarah mengajar sesuatu kursus di bilik kuliah dan makmal.
b. Apakah peranan penilaian dalam memastikan bahawa matlamat pengajarannya dicapai?
c. Apakah aspek-aspek penilaian yang perlu diperhatikan oleh pensyarah bagi memastikan matlamat pengajarannya dicapai?
d. Apakah langkah-langkah yang perlu diambil oleh pensyarah bagi memastikan matlamat pengajarannya tercapai?
e. Senaraikan risiko yang berkait dengan keputusan pensyarah untuk membuat keputusan sama ada pengajarannya berkesan atau tidak berkesan.

1.2 Pengertian Pentaksiran dan Pengukuran

Kesahan bukti empirikal yang digunakan bagi penilaian sangat bergantung kepada sejauh mana pensyarah berupaya mengkuantifikasikan dengan tepat kewujudan atribut atau ciri penguasaan pelajar yang digunakan sebagai asas penilaian. Pentaksiran adalah suatu proses yang meliputi pelbagai kaedah untuk menentukan tahap sesuatu ciri atau atribut yang diperolehi seseorang individu. Pengukuran merupakan suatu proses kuantifikasi dengan memberi nilai angka kepada kewujudan sesuatu ciri dan atribut. Dalam pengajaran dan pembelajaran di universiti, kewujudan ciri “penguasaan” sesuatu isi kursus yang diajar oleh pensyarah pada pelajar dikuantifikasikan dengan memberi skor ujian.

Aktiviti 2
a. Cuba fikirkan yang mana lebih berkesan: meyakinkan seseorang dengan pendapat atau dengan angka? Berikan alasan mengapa anda berfikiran sedemikian?
b. Perkembangan sains selalu dikaitkan dengan angka. Cuba fikirkan bagaimanakah pengukuran membantu membangunkan bidang sains.
c. Sejauh mana kebenaran kata-kata Edward Thorndike (1914): “Jika sesuatu perkara itu wujud, ia wujud pada jumlah tertentu. Jika ia wujud pada jumlah tertentu, maka kita boleh mengukurnya”.

1.3 Pengertian Pengujian

Pengujian merupakan proses mengaturkan satu siri tugasan untuk diselesaikan supaya pemerhatian tepat dibuat tentang penguasaan pelajar dalam sesuatu kursus di universiti. Ujian adalah alat ukur. Ujian digunakan bagi mengukur ‘penguasaan’ pelajar dalam sesuatu kursus. Ujian mengandungi satu set tugasan (dalam bentuk tugasan) yang berdasarkan sesuatu kursus bagi merangsang pelajar untuk ‘menunjukkan’ tahap penguasaan mereka dalam kursus berkenaan. Tahap penguasaan pelajar biasanya dikuantifikasikan dengan memberi skor kepada jawapan yang diberi.

Memandangkan ujian merupakan alat ukur yang sering digunakan untuk mendapatkan bukti empirik bagi tujuan penilaian pengajaran dan pembelajaran di universiti, tumpuan perlu diberi bagi membina ujian yang bermutu, mentadbir ujian berkenaan dengan betul dan mentafsir dapatannya dengan tepat. Kita perlu memastikan penilaian terhadap keberkesanan pengajaran dan pembelajaran dapat dilakukan dengan sempurna dan boleh dipertahankan. Satu daripada cara-cara memastikan ini berlaku ialah dengan menjalankan pengujian yang berkualiti.

Aktiviti 3
a. Cuba fikirkan apakah cara lain untuk mendapatkan bukti penguasaan pelajar dalam sesuatu kursus selain daripada pengujian?
b. Senaraikan apakah ciri-ciri ujian sebagai alat ukur yang sahih?
c. Fikirkan bagaimanakah ujian yang baik boleh dibina?
d. Terangkan bagaimanakah pengujian boleh dilaksanakan dengan berkesan?

1.4 Tujuan Pengujian Pengajaran dan Pembelajaran

Tujuan utama pengujian ialah untuk menghasilkan bukti yang boleh digunakan bagi membuat penilaian terhadap pengajaran dan pembelajaran di universiti. Penilaian di bilik kuliah dan makmal boleh membantu para pensyarah menambah baik pengajaran mereka dan pembelajaran pelajar. Selain matlamat diagnosis pengajaran dan pembelajaran, skor ujian digunakan sebagai asas bagi pengredan, pemilihan, penempatan, kaunseling dan bimbingan pelajar.

Diagnosis

Satu daripada tujuan pengujian ialah untuk mendiagnos kesukaran yang dihadapi dalam pengajaran dan pembelajaran. Diagnosis pengajaran diperlukan bagi mengesan sejauhmana pengajaran pensyarah berkesan. Sekiranya berkesan, pensyarah akan lebih yakin untuk meneruskan strategi dan kaedah pengajarannya. Sekiranya tidak berkesan, pensyarah boleh menganalisis dan mengesan kelemahan yang ada supaya strategi dan kaedah pengajaran pensyarah boleh diubahsuai, diperbaiki dan dipertingkatkan.

Diagnosis terhadap pembelajaran pelajar pula diperlukan bagi mengesan sejauhmana pembelajaran berlaku. Sekiranya berkesan, kita boleh meneruskan strategi dan gaya pembelajaran sedia ada. Sekiranya tidak berkesan, kita perlu menganalisis dan mengenal pasti apakah kelemahan yang berlaku supaya strategi dan gaya pembelajaran pelajar boleh diubahsuai, diperbaiki dan dipertingkatkan.

Pengredan

Pengujian juga dilakukan bagi tujuan pengredan pelajar. Pensyarah boleh mengred pencapaian pelajar kepada kategori ‘lulus’ atau ‘gagal’, ‘lemah’, ‘sederhana’ atau ‘cemerlang’ atau gred ‘A’, ‘B’ ‘C’, ‘D’ atau ‘E’. Melalui pengredan pelajar, kita boleh memberitahu ibu bapa dan pihak berkaitan tentang prestasi akademik pelajar khususnya berbanding dengan prestasi pelajar lain.

Dengan adanya maklumat gred, pensyarah dan ibu bapa boleh memainkan peranan membantu dan seterusnya melibatkan diri dalam proses pendidikan pelajar. Rangsangan luaran seperti penghargaan, nasihat, sokongan, bantuan dan kerjasama dari pihak-pihak yang terbabit dengan pendidikan pelajar khususnya ibu bapa sangat penting bagi meransang kemajuan dan pembangunan pelajar di universiti.

Pemilihan dan Penempatan

Seringkali juga skor dan keputusan ujian digunakan sebagai asas bagi pemilihan dan penempatan pelajar. Sebagai contoh pelajar yang cemerlang dalam sesuatu kursus sains mungkin dipilih untuk mewakili fakulti atau universiti. Skor dan keputusan ujian juga digunakan bagi pemilihan pelajar untuk mengikuti kursus tumpuan bidang tertentu. Malah, keputusan ujian di universiti digunapakai oleh bakal majikan sebagai kriteria pemilihan dan penempatan graduan ke dalam pekerjaan yang sesuai.

Kaunseling dan Bimbingan

Keputusan dan skor ujian boleh digunakan untuk membantu pelajar supaya berdaya maju. Berasaskan keputusan ujian, para pensyarah dan kaunselor boleh membantu pelajar mengenal pasti kelemahan dan kekuatan masing-masing supaya program dan tindakan intervensi dilakukan bagi memperbaiki keadaan pelajar. Keputusan ujian juga membantu para pensyarah dan kaunselor untuk memberi khidmat bimbingan misalnya bagi memandu pelajar menceburi bidang kerjaya yang diminati apabila pelajar bergraduat.

Aktiviti 4
a. Cuba fikirkan adakah cara lain kita boleh mengesan kekuatan dan kelemahan pengajaran dan pembelajaran di bilik kuliah dan makmal selain daripada pengujian?
b. Bandingkan sejauh manakah pengujian mencapai matlamat diagnosis pengajaran dan pembelajaran berbanding dengan matlamat pengredan, pemilihan, penempatan, kaunseling dan bimbingan?
c. Keputusan ujian dan peperiksaan sering menjadi isu sensitif di kalangan ibu bapa dan masyarakat. Pada pendapat anda mengapakah keputusan ujian dan peperiksaan menjadi isu sensitif?

2 Ciri Utama Ujian

Bagi memastikan sesuatu ujian mengumpul bukti dengan berkesan, ujian berkenaan mestilah sah, boleh dipercayai, objektif, boleh ditadbir dan mudah ditafsir.
2.1 Kesahan Ujian

Soalan ujian mestilah relevan dan menguji apa yang hendak diuji. Soalan juga mestilah seimbang dari segi bilangan berdasarkan tajuk dan sub-tajuk kandungan yang diajar. Justeru, soalan yang dibina mestilah menepati objektif dan kandungan sesuatu kursus.

Kesahan merujuk kepada sejauh mana ujian mengukur apa yang hendak diukur. Sebagai contoh, jika pensyarah memberi satu ujian kepada pelajar bagi menentukan tahap kefahaman membaca berasaskan petikan rencana, ujian tersebut mestilah dengan sebenarnya mengukur kefahaman membaca. Isu kesahan boleh dilihat daripada tiga aspek iaitu kesahan kandungan, kesahan gagasan dan kesahan berkaitan kriteria.

Kesahan Kandungan

Kesahan kandungan merujuk sejauh mana sesuatu ujian merangkumi domain kandungan yang hendak dinilai. Kandungan sesuatu ujian perlu merupakan sampel ‘representative’ kandungan bidang yang ingin diukur. Untuk menentukan ujian yang digunakan meliputi kandungan bidang yang diuji, pensyarah perlu menakrifkan kurikulum dan isi pelajaran kursus yang diajar.

Kandungan kursus biasanya luas. Oleh itu, pensyarah boleh menggunakan teknik persampelan kandungan bagi mewakili kandungan kursus. Pensyarah boleh merangka Jadual Spesifikasi Ujian (JSU) bagi menggambarkan kadar tingkah laku yang perlu diuji bagi mewakili kandungan kursus. Pendapat pakar, misalnya profesor dalam bidang berkaitan boleh digunakan bagi memastikan ujian yang dibina mempunyai kesahan kandungan yang tinggi.




Kesahan Gagasan

Gagasan merupakan sekumpulan konsep yang ada pada fikiran tetapi kita tidak dapat dilihat objeknya secara langsung seperti pencapaian, kecerdasan dan kreativiti. Setiap gagasan pendidikan mengandungi konsep-konsep yang rumit yang terdiri daripada banyak faktor yang saling berkait dan sukar dicerakinkan. Setiap gagasan mungkin diperlihatkan dalam suatu situasi tetapi tidak pada situasi lain. Sebab itu, tidak ada satu ujian yang boleh mengukur sesuatu gagasan dengan tepat.

Oleh kerana gagasan tidak dapat dilihat, pengukuran ke atasnya juga tidak dapat dilakukan secara langsung. Bagaimanapun terdapat ciri-ciri atau kesan yang dapat dicerap daripada sesuatu gagasan. Misalnya, gagasan penguasaan pelajar dalam kursus Bahasa Inggeris. Pensyarah boleh mencerap kesan gagasan penguasaan pelajar tersebut yang ditunjukkan oleh ciri-ciri seperti bilangan perbendaharaan kata Bahasa Inggeris yang dikuasai, kebolehan pelajar membina ayat mudah dalam Bahasa Inggeris dan kebolehan pelajar membincangkan sesuatu isu dalam Bahasa Inggeris Oleh itu, gagasan boleh diukur dan diuji secara tidak langsung berasaskan kesan-kesan atau ciri-ciri yang terhasil dari kewujudannya. Dengan itu, kesahan gagasan bagi ujian penguasaan Bahasa Inggeris boleh ditentukan dengan menghitung pertalian antara skor ujian itu dengan pencapaian dalam ujian perbendaharaan kata Bahasa Inggeris dan pembinaan ayat dalam Bahasa Inggeris.

Kesahan Berkaitan Dengan Kriteria

Kesahan berkaitan dengan kriteria merujuk kepada sejauh mana kaitan antara pencapaian dalam sesuatu ujian dengan kriteria luaran yang berkecuali. Kesahan berkaitan dengan kriteria mempersoalkan sama ada ujian sah mengukur kriteria yang hendak diukur. Sekiranya kriteria luaran yang berkecuali sebenarnya sah bagi mengukur kriteria yang hendak diukur, maka kaitan yang bererti antara ujian dengan kriteria luaran tersebut menunjukkan kesahan berkaitan dengan kriteria.

Terdapat dua jenis kriteria yang boleh digunakan. Kriteria serentak ialah kriteria yang ditunjukkan pada masa yang sama atau hampir sama dengan pengukuran yang dikenakan ke atas kriteria tersebut. Kriteria jangkaan ialah kriteria yang ditunjukkan pada satu selang masa selepas pengukuran dikenakan ke atas ujian tersebut. Sebagai contoh, ujian Matematik di universiti dikatakan mempunyai kesahan serentak yang tinggi sekiranya pencapaian pelajar dalam ujian tersebut konsisten dengan pencapaian cemerlang dalam satu lagi ujian Matematik lain yang menguji kemahiran Matematik yang sama, yang ditadbirkan serentak. Ujian tersebut juga dikatakan mempunyai kriteria jangkaan yang tinggi sekiranya pencapaian pelajar dalam ujian konsisten dengan prestasi dalam Matematik sepanjang karier selepas pelajar bergraduat nanti.

Aktiviti 5
Senaraikan objektif pengajaran dan pembelajaran bagi satu topik kursus yang anda minati. Jelaskan apakah konsep dan gagasan yang ingin diukur bagi setiap objektif pengajaran yang anda nyatakan. Bagaimanakah anda boleh memastikan bahawa soalan ujian anda mempunyai kesahan kandungan, gagasan dan kriteria yang tinggi?

2.2 Kebolehpercayaan Ujian

Kebolehpercayaan merujuk kepada ketekalan ujian dalam mengukur apa yang hendak diukur. Ujian yang mengukur sesuatu gagasan dengan skor yang tekal dikatakan mempunyai kebolehpercayaan yang tinggi. Sebaliknya, ujian yang menghasilkan skor yang berubah-ubah mempunyai kebolehpercayaan yang rendah. Sesuatu ujian yang mempunyai kebolehpercayaan yang tinggi tidak semestinya sah. Bagaimanapun, sesuatu ujian yang sah biasanya boleh dipercayai. Jika faktor-faktor lain serupa, sesuatu ujian yang mempunyai pekali kebolehpercayaan yang tinggi perlu dipilih kerana ujian tersebut mempunyai ketekalan pemeringkatan individu dalam kumpulannya.

Kebolehpercayaan ujian dipengaruhi oleh faktor yang tidak sistematik. Faktor tidak sistematik adalah faktor yang menghasilkan perubahan atau variasi yang tidak dijangka yang dikenali sebagai perubahan rawak. Ujian yang mengukur dengan pincang sesuatu konsep boleh menghasilkan perubahan rawak. Ujian yang mengandungi arahan, soalan, butiran dan pernyataan yang tidak jelas dan mengelirukan juga boleh menghasilkan perubahan tidak sistematik.

Terdapat tiga sumber faktor tidak sistematik. Pertama, variasi individu. Individu berubah disebabkan minat, kecergasan fizikal dan kestabilan emosi yang berbeza pada dua situasi ujian. Kedua, variasi perubahan tugasan. Menulis jawapan ke dalam kertas jawapan pada ujian pertama dan menghitamkan kertas OMR pada ujian kedua akan menghasilkan perubahan rawak disebabkan kedua-dua tugasan menjawab memerlukan kemahiran yang berbeza. Ketiga, variasi persampelan gagasan yang terhad. Soalan ujian biasanya dibina berasaskan kepada sampel kandungan yang diajar. Sampel tingkah laku yang terhad lebih terdedah kepada faktor peluang.

Indeks Kebolehpercayaan

Indeks kebolehpercayaan digunakan bagi menunjukkan ketekalan sesuatu ujian. Indeks ini ditentukan dengan menggunakan kaedah korelasi antara dua set skor ujian. Dua set skor boleh diperoleh dengan menggunakan kaedah uji dan uji kembali, kaedah bentuk setara atau kaedah bahagi dua. Uji dan uji kembali dibuat apabila pensyarah memperoleh dua set skor dari ujian yang sama yang ditadbirkan kepada pelajar yang sama pada dua masa berlainan. Kaedah bentuk setara dibuat apabila pensyarah memperoleh dua set skor dari dua set ujian yang setara yang ditadbirkan pada pelajar pada masa yang sama. Kaedah bahagi dua dibuat apabila pensyarah memperoleh dua set skor dari jawapan pelajar terhadap soalan bernombor ganjil dan soalan bernombor genap dari satu set ujian yang ditadbirkan pada pelajar. Sekurang-kurangnya indeks kebolehpercayaan 0.75 diperlukan bagi memastikan ujian yang dibina boleh dipercayai.

Mempertingkatkan Kebolehpercayaan

Berikut adalah cara bagaimana pensyarah boleh meningkatkan kebolehpercayaan sesuatu ujian yang dibina.
a. Arahan hendaklah jelas dan tepat.
b. Pernyataan soalan mestilah jelas dan tepat.
c. Soalan hendaklah seragam (homogen).
d. Situasi dan masa ujian dijalankan hendaklah piawai, serupa dan terkawal.
e. Elak ganguan kepada pelajar disebabkan arahan dan soalan tidak jelas.
f. Elak kebimbangan pelajar semasa mereka menjawab soalan.

Aktiviti 6
Anda membina 60 soalan objektif berdasarkan objektif pengajaran dan kandungan yang anda ajar dan mengasingkan gerak balas pelajar terhadap soalan bernombor ganjil dengan soalan bernombor genap. Apakah kesan pembahagian bilangan gerak balas pelajar terhadap aspek kebolehpercayaan ujian?

2.3 Keobjektifan Ujian

Keobjektifan ujian berkait dengan sejauh mana perskoran sesuatu jawapan ujian bebas daripada pertimbangan pemeriksa. Jawapan yang sama mestilah mendapat skor yang sama walaupun diperiksa oleh dua orang pemeriksa. Sekiranya dua atau lebih pemeriksa memberi skor yang sama kepada jawapan yang sama, maka ujian mempunyai keobjektifan yang tinggi. Sebab itu, soalan aneka pilihan dikenali sebagai soalan objektif kerana mempunyai keobjektifan penskoran yang tinggi.

Bagi memastikan ujian mempunyai keobjektifan yang tinggi, skema penskoran perlu disediakan. Skema penskoran perlu dibuat lebih awal sebelum ujian ditadbirkan kepada pelajar. Seboleh mungkin skema penskoran disemak oleh beberapa pensyarah yang pakar dalam bidang yang diuji. Selain mengelak dari dipengaruhi oleh jawapan pelajar, penyediaan skema jawapan sebelum pentadbiran ujian boleh mengesan kelemahan-kelemahan yang mungkin berlaku pada soalan supaya langkah pembetulan dapat dilakukan. Penyelarasan semakan perskoran antara pemeriksa juga perlu dibuat bagi memastikan proses penskoran mempunyai keobjektifan yang tinggi.

Aktiviti 7
Bina satu set 5 soalan subjektif bagi menguji satu topik kursus yang anda minati. Sediakan skema jawapan dan penskoran bagi setiap soalan yang anda bina.

2.4 Kebolehtadbiran

Sesuatu ujian mestilah boleh ditadbirkan dengan sempurna. Pentadbiran ujian yang sempurna sangat penting supaya semua pelajar mempunyai suasana yang sesuai untuk memberi jawapan yang terbaik. Dengan adanya suasana yang sesuai, kita lebih yakin bahawa jawapan diberi adalah berasaskan penguasaan pelajar dalam bidang yang diuji dan bukannya sumbangan faktor-faktor gangguan.

Berikut adalah panduan bagi memastikan pentadbiran ujian dijalankan dengan sempurna.
- Arahan terutama cara menjawab soalan ujian mestilah diberi dengan tepat, jelas dan ringkas.
- Soalan mestilah disusun dari mudah kepada sukar.
- Pensyarah perlu memadankan bilangan dan kesukaran soalan dengan masa yang diperuntukan untuk menjawab.
- Dicadangkan agar soalan jawapan dipilih yang mengandungi 5 pilihan diperuntukan 45 saat untuk pelajar menjawab.
- Dewan di mana ujian dijalankan haruslah selamat, ceria dan sempurna dengan kerusi meja yang berkeadaan baik dan sesuai, jarak yang sesuai, pencahayaan yang terang, suhu yang sederhana, sistem siar raya yang sempurna dan tidak berdekatan dengan punca kebisingan seperti dekat jalan raya atau alat pendingin udara.
- Ujian boleh ditadbirkan oleh sesiapa sahaja.
- Sekiranya tersangat perlu, pemberitahuan tersebut mestilah ringkas, jelas dan difahami oleh semua pelajar.
- Masa perlu ditambah bagi mengganti masa ganguan yang berlaku.


Aktiviti 8
Berdasarkan pengalaman anda mengambil ujian, jelaskan apakah perkara-perkara berkaitan dengan pentadbiran ujian yang anda tidak sukai? Bagi setiap perkara yang anda senaraikan, bagaimanakah pentadbir ujian boleh memperbaikinya?

2.5 Kemudahtafsiran

Penilaian pengajaran dan pembelajaran di bilik kuliah dan makmal memerlukan skor ujian sebagai asas untuk membuat keputusan. Sesuatu ujian mestilah boleh diskor dengan cekap. Skor yang diperoleh hendaklah mudah ditafsir.

Penskoran Ujian

Pemberatan markah dan kaedah yang digunakan bagi penskoran jawapan sesuatu soalan perlu diberitahu kepada pelajar terlebih dahulu. Maklumat penskoran boleh disertakan pada arahan menjawab setiap soalan. Maklumat ini sangat perlu supaya pelajar dapat menjawab dengan tepat sebagaimana yang diharapkan oleh pembina dan pemeriksa ujian.

Kriteria penskoran jawapan dipilih biasanya telah ditentukan dan diketahui oleh pelajar semasa mereka menduduki ujian. Misalnya, sekiranya terdapat 50 soalan aneka pilihan dan jumlah markah yang diperuntukkan ialah 100, maka setiap soalan yang dijawab dengan betul akan mendapat 2 markah.

Penskoran jawapan dibina terutamanya yang memerlukan jawapan panjang tidak terhad lebih mencabar. Seringkali, pemeriksa sukar untuk mengelakkan diri daripada melakukan penskoran subjektif terhadap jawapan dibina. Sebab itu soalan esei biasanya dikenali sebagai ujian subjektif. Pemeriksa boleh mengurangkan kepincangan penskoran dengan memeriksa satu soalan bagi semua pelajar, sebelum berpindah kepada soalan berikutnya. Pemeriksa perlu mengelakkan diri dari mengenali identiti pelajar seperti nama dan nombor matrik pelajar. Pemeriksa sebagai ahli profesional perlu sentiasa ingat bahawa penskoran perlu dilakukan dengan bijaksana dan amanah. Kepincangan penskoran disebabkan kelemahan pemeriksa akan mendatangkan kesan yang serius kepada masa depan pelajar, masyarakat dan negara.

Penilaian jawapan dibina haruslah berasaskan kepada kriteria berikut:

a. Kandungan. Adakah pelajar mengemukakan semua isi atau kandungan bagi sesuatu soalan pokok?
b. Susunan atau organisasi. Adakah susunan atau organisasi jawapan teratur, kemas dan logik?
c. Proses. Adakah proses penggunaan, analisis, sintesis dan penilaian dilakukan dengan teratur dan sistematik?
d. Ketepatan dan kemunasabahan. Adakah isi jawapan tepat dan munasabah?
e. Keaslian dan kreativiti. Adakah jawapan yang diberi asli berasaskan kepada kreativiti pelajar sendiri?
f. Kesempurnaan dan ketekalan dalaman. Adakah isi jawapan yang dibentangkan sempurna dan mempunyai ketekalan dalaman yang tinggi?

Pentafsiran Skor Ujian

Skor ujian tidak mendatangkan apa-apa makna kecuali pensyarah berupaya membuat tafsiran yang tepat dan sesuai. Skor 60 yang diperoleh oleh seseorang pelajar dalam ujian matematik tidak memberi makna kecuali kita boleh mentafsirkannya sebagai penguasaan yang lemah, sederhana atau cemerlang. Tafsiran terhadap skor ujian adalah sangat penting bagi menentukan sejauh mana objektif pengajaran dan pembelajaran di universiti dicapai. Tafsiran perlu dilakukan dengan objektif bagi mengelakkan pertimbangan peribadi penilai.

Justeru itu, skor ujian perlu dianalisis bagi menentukan ciri yang tepat yang ada pada set skor. Di antara ciri yang biasanya diperlukan bagi membuat tafsiran yang tepat ialah ciri kecenderungan memusat dan serakan skor-skor ujian. Skor-skor ujian perlu juga dipiawaikan bagi membolehkan perbandingan dibuat antara pencapaian seseorang pelajar dengan pelajar lain.

Aktiviti 9
Bina satu soalan esei bagi menguji sejauh mana pelajar menguasai isi pelajaran yang anda ajar. Sediakan satu set skema jawapan bagi soalan berkenaan beserta dengan pemberatan markahnya.




3 Jenis-Jenis Penilaian

Banyak cara kita boleh mengkelaskan penilaian. Penilaian yang dibuat berasaskan tujuan dan masa boleh dikelaskan kepada penilaian formatif, sumatif, pra kelayakan dan diagnostik dan alternatif. Penilaian pengajaran juga boleh dilakukan melalui pelbagai hasil pembelajaran pelajar seperti disertasi, projek, kajian kes, portfolio, bengkel, seminar dan oral pelajar. Justeru ujian yang dibina perlu mencerminkan tujuan dan masa sesuatu penilaian dilakukan. Terdapat dua jenis penilaian berdasarkan kepada masa dan tujuan pelaksanaan penilaian iaitu penilaian formatif dan sumatif.

3.1 Penilaian Formatif

Penilaian formatif digunakan untuk mengesan kemajuan yang dicapai oleh pelajar dalam unit-unit pelajaran yang diajar. Penilaian formatif dilakukan bagi memastikan pelajar telah menguasai setiap unit pelajaran sebelum mereka diperkenalkan dengan unit pelajaran baru seterusnya. Penilaian formatif sangat berguna bagi tujuan diagnosis. Dengannya punca-punca kelemahan pelajar dapat dikesan. Penilaian formatif dapat menentukan samada pelajar telah bersedia untuk mengikuti pelajaran berikutnya yang lebih tinggi dan rumit. Penilaian formatif juga boleh meningkatkan motivasi pelajar untuk belajar. Penggunaan penilaian formatif sangat ditekankan di universiti.

Memandangkan laporan penilaian formatif adalah untuk tujuan diagnosis kelemahan pelajar dalam unit-unit pelajaran, pelaporan penilaian formatif amat sesuai dirumuskan sebagai “menguasai” atau “tidak menguasai” sesuatu isi unit pelajaran. Pencapaian ujian formatif tidak sesuai digred.




3.2 Penilaian Sumatif

Penilaian sumatif pula digunakan bagi menentukan tahap penguasaan pelajar dalam keseluruhan kursus. Penilaian sumatif biasanya dilakukan pada akhir sesi kursus. Contoh penilaian sumatif ialah ujian akhir semester. Memandangkan penilaian sumatif dibuat pada akhir kursus, skor-skor dari penilaian sumatif biasanya lebih berguna untuk tujuan melaporkan kemajuan pelajar daripada memperbaiki kelemahan awal pengajaran pensyarah dan pembelajaran pelajar. Skor penilaian sumatif banyak digunakan bagi tujuan pemilihan dan penempatan graduan ke alam pekerjaan.

Aktiviti 10
Cuba kenal pasti perbezaan antara penilaian formatif dengan penilaian sumatif. Pada pendapat anda, apakah kekuatan dan kelemahan penilaian formatif berbanding dengan penilaian sumatif?

3.3 Penilaian Pra Kelayakan dan Diagnostik

Penilaian pra kelayakan digunakan sebagai petunjuk sama ada pelajar berpontensi, bersedia dan mempunyai kecerdasan, bakat dan minat terhadap sesuatu bidang yang ingin beliau ceburi. Penilaian diagnostik pula dilakukan sebagai cara untuk mengesan sama ada pelajar sudah bersedia untuk mengikuti pelajaran seterusnya. Sekiranya beliau belum bersedia, pensyarah dapat mengesan kelemahan dan kekuatan pelajar agar pembetulan serta penambahbaikan yang berkaitan boleh lakukan.

Ujian Pencapaian

Ujian pencapaian mengukur secara khusus sejauh mana pelajar telah menguasai isi sesuatu kursus yang diajar. Ujian pencapaian mempersoalkan apa yang pelajar telah belajar? Seringkali ujian pencapaian merujuk kepada ujian bagi mengukur tingkah laku pengajaran dan pembelajaran kognitif, afektif dan psikomotor.

Ujian Kecerdasan

Ujian kecerdasan adalah ujian yang direka khusus untuk mensampel secara luas pelbagai fungsi mental (pemikiran) supaya dapat menganggarkan tahap intelektual am seseorang individu.

Ujian Prestasi

Ujian prestasi adalah ujian yang memerlukan pelajar menunjukkan pemahaman dan kemahiran mereka dalam melakukan aktiviti atau siri aktiviti seharian. Ujian prestasi memberi rangsangan kepada pelajar untuk memperkenal dan mengembangkan aktiviti pemikiran dan taakulan mereka berasaskan kepada kurikulum yang diajar. Di antara teknik yang digunakan dalam ujian prestasi ialah menghendaki pelajar merakam sebahagian aktiviti, menemubual pelajar bagi mengesahkan kebolehan, kefahaman dan pemikiran mereka. Teknik portfolio juga sering digunakan bagi memeriksa hasil kerja pelajar. Melalui teknik portfolio guru boleh menentukan sama ada kerja yang dilakukan memenuhi kehendak soalan ujian.

3.4 Penilaian Alternatif

Penilaian prestasi yang menegaskan bahawa kaedah penilaian ini memberi satu alternatif kepada pengujian kertas dan pensil tradisional. Penilaian pengajaran di universiti sering melibatkan penilaian berdasarkan hasil pembelajaran yang ditunjukkan oleh pelajar. Antara penilaian alternatif ini adalah penilaian terhadap disertasi, projek, kajian kes, portfolio, seminar, bengkel dan oral pelajar. Sebagai contoh, pensyarah boleh menilai keberkesanan pengajarannya dalam sesuatu kursus melalui portfolio yang disediakan oleh pelajar. Penilaian alternatif ini memerlukan pengetahuan dan kemahiran khusus dan tidak dibincangkan dalam modul ini.

Aktiviti 11
Berdasarkan kepada pengalaman anda, cuba kenalpasti satu contoh ujian pencapaian, ujian kecerdasan, ujian prestasi, dan ujian alternatif.


4 Ujian Rujukan Norma dan Kriteria

Selain berasaskan tujuan dan masa pelaksanaan, ujian juga boleh dikategorikan berasaskan kegunaan hasil ujian iaitu rujukan norma dan kriteria.

4.1 Ujian Rujukan Norma

Rujukan berasaskan norma digunakan sekiranya pensyarah ingin membandingkan prestasi pencapaian individu pelajar dengan prestasi pencapaian pelajar lain sama ada dalam kumpulan yang sama atau kumpulan yang berbeza mengikut kelas atau kumpulan. Apa yang ditekankan adalah apakah pelajar A lebih mahir dari pelajar B? Keputusan rujukan norma sesuai digunakan bagi tujuan pemilihan dan penempatan pelajar ke dalam sesuatu program pendidikan.

Ujian rujukan norma tidak memberi maklumat sama ada pelajar sudah menguasai sesuatu isi pelajaran dan kemahiran yang diajar. Soalan ujian rujukan norma biasanya bersifat umum dengan matlamat untuk memaksimumkan perbezaan pencapaian antara seorang pelajar dengan pelajar lain. Soalan ujian rujukan norma mengambil berat aspek kesukaran ujian agar soalan-soalan mempunyai kepelbagaian aras kesukaran serta tidak terlalu sukar dan terlalu mudah dengan jangkaan jawapan betul 50 peratus. Soalan ujian rujukan norma juga mempunyai indeks diskriminasi antara pelajar pandai dan pelajar lemah yang tinggi. Dalam pelaporannya, ujian rujukan norma kadang-kadang menggunakan kelok normal sebagai asas perbandingan pencapaian antara pelajar.

4.2 Ujian Berasaskan Kriteria

Rujukan kriteria pula digunakan sekiranya pensyarah ingin membandingkan prestasi pencapaian seseorang pelajar dengan kriteria yang ditetapkan. Ujian rujukan kriteria memberi penekanan sama ada seseorang pelajar telah menguasai sesuatu isi pelajaran dan kemahiran yang diajar. Ujian rujukan kriteria tidak mengambil kira kedudukan seseorang pelajar berbanding dengan pelajar lain.
Meskipun ujian rujukan kriteria sesuai untuk kursus berbentuk kumulatif iaitu pelajar perlu menguasai setiap unit sebelum unit berikutnya, kriteria yang digunakan dalam ujian rujukan ini tidak semestinya berbentuk akhiran atau sumatif. Maksudnya kriteria yang digunakan tidak semestinya isi sesuatu kursus yang hanya diperoleh pada akhir kursus. Para pensyarah boleh menggunakan kriteria berbentuk formatif iaitu ciri-ciri setiap unit pelajaran. Justeru itu, para pensyarah perlu membina banyak ujian rujukan kriteria bagi membuat penilaian sama ada seseorang pelajar telah menguasai sesuatu kemahiran yang diuji. Soalan-soalan ujian rujukan kriteria perlu mempunyai tahap padanan yang tinggi dengan objektif pembelajaran.
Rajah berikut menjelaskan perbandingan antara ciri-ciri rujukan norma dengan ciri-ciri rujukan kriteria.

Dimensi Ciri Rujukan Norma Rujukan Kriteria
1. Matlamat Membandingkan prestasi seseorang pelajar dengan pelajar lain Membandingkan prestasi seorang pelajar dengan kriteria piawai yang ditetapkan.

2. Pembinaan Soalan Soalan menggalakkan kepelbagaian. Soalan menggunakan pengacau terbaik Soalan memberi tumpuan kepada kriteria tingkah laku yang diuji. Menumpukan kepada pengenalpastian tingkah laku.

3. Kandungan Ujian Cetek, kebiasaannya 1 atau 2 soalan setiap objektif Mendalam, banyak soalan bagi setiap objektif.

4. Kepelbagaian Kandungan Semakin pelbagai soalan ujian semakin baik Kepelbagaian soalan ujian adalah minimum.

5. Pelaporan dan Pentafsiran Persentil dan skor piawai Bilangan lulus atau gagal serta julat prestasi yang boleh diterima.

Berikut diberikan contoh soalan ujian bagi rujukan norma (Contoh 1) dengan soalan rujukan kriteria (Contoh 2). Adakah anda berupaya untuk membezakannya?

Contoh 1:
Semasa Perang Iraq yang dilakukan oleh Amerika Syarikat pada tahun 2004, senjata berikut yang mana paling banyak digunakan oleh Amerika Syarikat?
A. Senjata Biologi
B. Senjata Nuklear
C. Missile Scud
D. Pengebuman udara

Contoh 2:
Semasa Perang Iraq yang dilakukan oleh Amerika Syarikat pada tahun 2004, senjata berikut lebih banyak mendatangkan kemusnahan berbanding dengan senjata yang lain.
A. F14 Tomcat
B. F16 Hornet
C. A6 Intruder
D. A10 Thunderbolt


Aktiviti 12
Jelaskan mengapa Contoh 1 dikatakan lebih mirip kepada soalan ujian norma berbanding dengan Contoh 2 yang dikatakan lebih mirip kepada soalan ujian rujukan kriteria?

No comments:

Post a Comment