Pendidikan dan Keilmuan: Mengembangkan Materi Test

CHAPTER RAPORT

MENGEMBANGKAN MATERI TEST YANG DISESUAIKAN

OLEH : M A H U R I

DOSEN PENGAMPU : DR. TURDJA, I, M.Pd

A.LATAR BELAKANG

Pada umumnya kebanyakan instruktur membuat test yang digunakan untuk memperoleh data nilai siswa. Test sering ini ditulis setelah intruksi disajikan, dan dibuat lebih sulit tergantung kemampuan pelajar di dalam kelas atau persepsi instrutor tentang topik tertentu yang telah diajarkan. Format test jenis ini kadang-kadang ditentukan oleh minat dan kemampuan instruktur dibanding oleh sifat alami isi yang telah diajar.

Merancang test adalah untuk mengukur sesuatu dalam mencapai hasil pengukuran yang disesuaikan pada test. Pengujian jenis ini adalah:

( 1) menguji dan mengevaluasi kemajuan para siswa,

( 2) untuk menyediakan informasi tentang efektivitas instruksi.

Hasil pengukuran test ditujukan kepada instruktur yang persisnya bagaimana siswa bisa mencapai masing-masing sasaran, dan menunjukkan kepada perancang yang persisnya komponen instruksi yang bekerja dengan baik, dan revisi kebutuhan. Materi test yang dibangun bersesuaian pada satu sasaran yang telah dikembangkan.

B. KONSEP

Ukuran test yang sesuai adalah terdiri atas materi yang secara langsung mengukur perilaku yang ditentukan satuan sasaran hasil tingkah laku. Istilah ukuran digunakan sebab materi test bertindak sebagai sesuatu yang menentukan ketercukupan seorang dalam menemui sasaran hasil. Tujuannya untuk lebih menandakan hubungan antara materi test dan sasaran hasil perilaku. Materi Test disesuaikan secara langsung kepada capaian uraikan sasaran untuk material intervi.

Ada dua istilah ukuran yang digunakan pada materi test.

Pertama hubungan antara sasaran capaian dan materi test. Siswa cukup melaksanakan perilaku sasaran, kemudian mereka diharapkan sudah mencapai ukuran atau penguasaan pada sasaran,

CHAFTER TGS 2: File@Mahuri 2010

Kedua berhubungan dengan spesifikasi ketercukupan capaian yang diperlukan untuk penguasaan, Beberapa materi test ditulis untuk satu sasaran, atau beberapa materi test ditulis untuk banyak sasaran hasil. Kejelasan di dalam menetapkan sasaran hasil dan ukuran-ukuran yang cukup pada sasaran tingkah laku tertentu dan menetapkan ukuran-ukurannya, suatu posttest boleh memerlukan satu item test atau lebih.

Oleh karena itu dalam rangka menentukan apakah suatu item test sungguh-sungguh mengacu pada ukuran intructor;.

Pertama apakah untuk menentukan capaian suatu item test, memerlukan sasaran tingkah laku

Kedua, apakah ukurannya sudah mapan untuk menetapkan seorang siswa harus melaksanakan ketrampilan dalam rangka menguasai sasaran itu.

C. TIGA JENIS UKURAN TEST DAN PENGGUNAANNYA

1. PRETEST

Pretest berisi materi yang mengukur perilaku masukan prasyarat dan materi yang mengujikan ketrampilan yang akan diajarkan di dalam intruksi itu. Materi Perilaku untuk pretest didasarkan pada sasaran hasil ketrampilan yang nampak. Siswa harus mempunyai ketrampilan untuk memulai instruksi. Materi tes harus dikembangkan dan menggunakan siswa sepanjang perkembangan evaluasi. Mungkin saja ditemukan bahwa, ketika teori menyarankan, siswa yang kurang ketrampilannya akan mengalami kesulitan dengan instruksi yang dibuat.

Pretest juga mengukur ketrampilan yang.secara khas meliputi satu atau lebih materi untuk masing-masing ketrampilan mengarah pada analisa dan keberhasilan pertanyaan.

Fungsi dari pretest adalah untuk menentukan berapa banyak pelajar mempunyai pengetahuan utama dari apa yang diharapkan untuk diajarkan,

2. TEST YANG DITEMPELKAN

Adalah suatu materi test ditempelkan seperti suatu materi praktek dengan tidak ada umpan balik. Item ini hanya demi kepentingan perancang digunakan untuk jawaban pertanyaan "siswa mengetahui bagaimana cara melakukan ketrampilan dengan seketika setelah diajarkan". tempelkannya materi berlaku eklusif ke ketrampilan intelektual, sebab perancang harus bisa menggunakan suatu item yang baru kepada siswa, suatu kejadian yang tidak ditemui aplikasi ketrampilan. Masalahnya adalah perancang tidak mengetahui jika siswa melakukan dengan sesungguhnya, mengingat materi yang ditempelkan pada umumnya tidaklah menggunakan ketrampilan psychomotor, tetapi mungkin saja penting untuk jenis instruksi tertentu siswa berhenti melakukan ketrampilan atau lebih ditujukan kepada instruktur untuk memverifikasi prosedur dengan tepat. Ini berlaku bagi situasi yang berbahaya..

3. POSTTEST

CHAFTER TGS 2: File@Mahuri 2010

Posttest akan menempatkan penilaian beberapa jenis intruksi. Posttest perlu menilai semua sasaran hasil, terutama terfokus pada sasaran materi. seperti pada pretest, Tujuan posttest adalah untuk membantu perancang mengidentifikasi area instruksi materi yang tidak tercapai. Jika waktu adalah suatu faktor dalam suatu test maka test harus dikembangkan lebih ringkas, kemudian sasaran materi pokok dan subskiil harus diujikan. Materi yang mengujikan subskill itu hampir bisa dipastikan untuk memberi permasalahan siswa pada pokok materi sasaran yang harus digunakan. posttest hanya untuk mengukur sasaran pusat. Pada pokoknya sangat sedikit waktu digunakan pada saat mengujikan intruksi menjadi operasional.

D. PERANCANG SUATU TEST

Bagaimana caranya mengembangkan rancangan suatu ukuran test yang disesuaikan? Merancang satu atau lebih materi test untuk masing-masing sasaran hasil perilaku. Faktor yang penting adalah adanya pertanyakan pada test yang bersesuaian secara langsung bagi masing-masing sasaran capaian.

Sasaran hasil didalam ketrampilan intelektual biasanya memerlukan catatan materi, atau materi yang memerlukan suatu capaian atau produk spesifik. Relatif mudah untuk menentukan prestasi dari suatu sasaran ketrampilan intelektual; yang mana para siswa" mengetahui" tanggapan yang sesuai atau tidak. Pada tingkat yang lebih tinggi untuk ketrampilan intelektual diperlukan penetapkan satu set ukuran yang dapat dikonversi untuk suatu daftar nama atau ratting skala yang dapat digunakan untuk menilai produk siswa.

1. Menentukan Tingkatan Penguasaan

Sasaran tingkah laku yang ditulis harus ada suatu tingkatan menetapkan ukuran, yang menandai adanya siswa harus melaksanakan ketrampilan dengan baik, pada materi test yang disediakan. Pada pokoknya ukuran menandai adanya tingkatan penguasaan itu memerlukan siswa. Konsep tingkatan penguasaan sebagai lawan tingkatan ukuran, lebih sering diberlakukan bagi suatu test untuk suatu keseluruhan unit instruksi atau suatu keseluruhan kursus. Instruktur boleh menyatakan bahwa dalam urutan menguasai unit ini, siswa harus mencapai suatu tingkatan capaian tertentu sesuai pertanyaan.

Sebagai penguasaan prinsip umum mengukur capaian harus dipertimbangkan berkenaan dengan mengevaluasi capaian yang mengarah pada waktu dan penambahan pelajaran ketrampilan.

2. Menulis Materi test

CHAFTER TGS 2: File@Mahuri 2010

Dengan mengabaikan jenis pelajaran yang melibatkan sasaran, penulisan item test harus sesuai teknik diberlakukan pengembangan ukuran test yang standar. Ada beberapa hal yang perlu diingat intruktur selagi penulisan ukuran materi test yang standar. Materi perlu memenuhi perilaku dan kondisi menetapkan sasaran, dan perlu menyediakan materi untuk para siswa dengan memberikan kesempatan untuk menemukan ukuran-ukuran yang diperlukan

Pengujian Lingkungan adalah suatu faktor penting di dalam pemilihan format item. Apakah peralatan dan fasilitas tersedia untuk situasi test? Dapatkah siswa benar-benar melaksanakan suatu ketrampilan dalam kondisi penetapkan sasaran? Multiple-choice memberikan mempertanyakan dengan tiga, empat, atau lebih tanggapan, dan memberi kesempatan siswa untuk memilih jawaban yang benar. Jika instruktur ingin menghadapi tantangan atau mengevaluasi kemajuan siswa, mereka perlu membangun materi test pada tingkat kesulitan yang lebih tinggi.

3. Materi Peruntunan

Metode materi peruntunan yang tradisional pada suatu test ke materi seikat berdasar pada format item. Pada penggunaan strategi ini, materi penyelesaian ditempatkan bersama-sama, banyak materi pilihan bersama-sama, materi esei adalah pengelompokan bersama-sama, dan sebagainya. Metode ini mengakibatkan suatu test nampak menarik yang diorganisir dengan baik dan memerlukan suatu jumlah minimum. Kendati pengaturan strategi ini mempunyai kekurangan, siapa yang harus meneliti penguasaan siswa tentang mengukur hasil sasaran. Setelah membuat nilai masing-masing item dan sebelum menentukan hasil penguasaan sasaran siswa, data harus diatur kembali oleh hasil sasaran untuk dianalisa. Ini suatu langkah yang tak perlu dan memakan waktu.

Suatu strategi peruntunan digunakan untuk perancang, siapa yang harus membangun dan meneliti tanggapan di dalam sasaran hasil, untuk materi seikat satu sasaran bersama-sama, dengan mengabaikan format item. Satu-satunya jenis item perkecualian pada strategi ini adalah esei yang panjang pertanyaannya. Seperti pertanyaan yang secara khusus ditempatkan pada ujung suatu test untuk membantu siswa di dalam mengatur waktu mereka selama test.

E. ARAH MENULIS/PETUNJUK TEST

Arah Menulis Test meliputi jelas, bersih, arahnya ringkas. Awal suatu test pada umumnya menyebabkan ketertarikan siswa yang akan dinilai. Didalam pikiran mereka tidak merasa ragu tentang apa yang mereka lakukan untuk melaksanakan test. Pada umumnya pengantarkan kearah keseluruhan test

Apakah siswa perlu memilih jika mereka tak percaya dengan jawabannya; apakah para siswa perlu menggunakan nama mereka atau hanya mengidentifikasi diri mereka sebagai anggota suatu kelompok? apakah ada batas waktu, atau suatu ruang yang membatasi tanggapan? dan apakah mereka memerlukan yang khusus untuk bereaksi terhadap test? seperti nomor, jumlah pensil, lembar jawaban mesin, suatu teks khusus, atau peralatan khusus seperti kalkulator atau peta. Tulis dan meninjau ulang secara hati-hati untuk memastikan bahwa siswa memahami semua informasi untuk menjawab dengan tepat

CHAFTER TGS 2: File@Mahuri 2010

F. MENGEVALUASI MATERI TEST

untuk tes-tes objektif perlu mengalami percobaan perkembangan evaluasi sebelum mereka benar-benar digunakan untuk menilai capaian siswa. Suatu materi test boleh kelihatan sempurna Banyak hal dapat menyimpang dengan suatu soal, Instruktur perlu memastikan bahwa ( 1) arah test harus jelas, sederhana, dan mudah untuk mengerti ( 2) masing-masing item test harus jelas dan dapat menyampaikan ke para siswa informasi yang diharapkan; ( 3) kondisi-kondisi tanggapan yang dibuat realistis; ( 4) metoda tanggapan harus jelas bagi siswa; ( 5) sesuai ruang, waktu, dan peralatan tersedia untuk para siswa menjawab sewajarnya.

Bahkan setelah ujian benar-benar diberikan, instruktur perlu menilai hasil untuk kejelasan item. Materi Test yang kebanyakan hilang dari siswa harus dianalisa. Materi yang kurang relevan harus dianalisa dan mungkin ditinjau kembali sebelum test diatur lagi.

Masalah pengujian praktis untuk instruktur siapa yang harus menguji kelompok siswa yang berbeda dengan sasaran hasil yang sama pada waktu yang sama dalam jangka waktu singkat. Untuk menjamin integritas dari jawaban siswa, instruktur harus membangun beberapa versi yang berbeda dengan posttest. Sebagai tambahan terhadap pretest dan materi test yang ditempelkan, sebanyak lima atau enam versi posttest yang mungkin diperlukan.

Ketika membangun materi test dan menguji secara umum instruktur perlu mengingat-ingat ukuran ketercapaian test ( 1) Test dirinya sendiri, ( 2) Membentuk tanggapan, ( 3) Materi pertanyaan, ( 4) Lingkungan dan situasi, ( 5) prestasi para siswa.

G. MENGEMBANGKAN INSTRUMEN PENGUKURAN

CAPAIAN, PRODUK, DAN PERILAKU ( SIKAP)

Kembangkan dulu instrumen ukuran ketrampilan psychomotor, produk, atau perilaku dengan tidak melibatkan dirinya dalam menulis materi test. Sebagai pengganti, itu memerlukan petunjuk untuk memandu perilaku atau aktivitas siswa dan membangun suatu instrumen untuk memandu evaluasi capaian, produk, atau perilaku.

CHAFTER TGS 2: File@Mahuri 2010

ARAH MENULIS/PETUNJUK. Untuk siswa capaian dan produk perlu jelas menguraikannya, apa yang akan dilaksanakan dan bagaimana melaksanakannya. kondisi-kondisi khusus seperti sumber daya atau batas waktu harus diuraikan. Di dalam menulis petunjuk harus mempertimbangkan jumlah bimbingan yang harus disajikan Satu-satu, mungkin untuk mengingatkan siswa dalam melaksanakan langkah-langkah tertentu dan menginformasikan ukuran-ukuran yang akan digunakan dalam mengevaluasi pekerjaan mereka. Peserta ujian dapat diberi suatu salinan daftar evaluasi atau skala pengharkatan yang akan digunakan untuk menilai pekerjaan mereka sebagai bagian dari petunjuk itu. Peserta ujian diamati oleh seorang pengawas dan tidak boleh memperlihatkan perilaku yang mencerminkan sikap merugikan.

PENGEMBANGKAN INSTRUMEN Sebagai tambahan dalam menulis instruksi untuk pelajar, harus dikembangkan suatu instrumen yang memandu penilaian prestasi, produk, atau perilaku. Langkah-Langkah di dalam mengembangkan instrumen adalah:

1. untuk mengidentifikasi unsur-unsur untuk dievaluasi,

2. untuk menafsirkan masing-masing,

3. urutan unsur-unsur pada instrumen,

4. untuk memilih jenis pertimbangan untuk dibuat oleh tikus,

5. untuk menentukan bagaimana instrumen akan dicapai.

MENGEMBANGKAN FORMAT TANGGAPAN Aktivitas yang keempat di dalam mengembangkan suatu instrumen untuk mengukur capaian, produk, atau perilaku adalah menentukan tingkatan bagaimana membuat dan merekam pertimbangan itu. Sedikitnya ada tiga penilai menanggapi format yang mencakup suatu daftar nama (ya atau tidak); suatu skala pengharkatan yang memerlukan tingkatan atau pembedaan yang berkwalitas. ( lemah, cukup, dan baik);

DAFTAR NAMA Hal-Hal paling mendasar ke tiga format pertimbangan adalah daftar nama. Yaitu satu kolom pemeriksaan " ya" untuk menunjukkan bahwa unsur masing-masing hadir. Yang lain adalah untuk pemeriksaan " tidak" untuk menandai adanya ketidakhadiran maupun kekurangan dari suatu unsur. Manfaat daftar nama meliputi banyaknya unsur-unsur berbeda yang dapat diamati sejumlah waktu yang ditentukan, bertepatan dengan itu dapat diselesaikan oleh penilai, konsistensi atau keandalan dengan pertimbangan dapat dibuat, dan kesenangan dengan suatu keseluruhan score capaian dapat diperoleh. Satu pembatasan daftar nama adalah ketidakhadiran informasi yang disajikan ke peserta ujian tentang mengapa " tidak" dipertimbangan setelah dikerjakan.

SKALA PENGHARKATAN Adalah suatu daftar nama dapat dikonversi untuk suatu skala pengharkatan dengan pengeluaran banyaknya pertimbangan tingkatan berkwalitas untuk masing-masing unsur di mana kemungkinan pembedaan kwalitas. Sebagai ganti penggunaan dua kolom untuk menilai suatu unsur, sedikitnya digunakan tiga kolom. ( 1), dan baik ( 2); atau lemah ( 3) cukup. Serupa dengan daftar nama, skala pengharkatan mempunyai hal positif dan negatif. Pada sisi yang positif, mereka memungkinkan untuk evaluasi analitis subkomponen suatu capaian atau produk, dan mereka menyediakan umpan balik lebih baik kepada peserta ujian tentang mutu suatu capaian dibandingkan melalui suatu daftar nama. Pada sisi yang negatif, mereka memerlukan waktu untuk menggunakannya, sebab pembedaan sangat tipis sehingga harus dibuat peningkatan mutu dari tiap unsur mengevaluasi.

Contoh

		Umum (general)
		Yang Hilang	Lemah	Cukup	Baik
1	Topik Kalimat	0	1	2	3

CHAFTER TGS 2: File@Mahuri 2010

Strategi pengembangan yang kedua adalah untuk membatasi banyaknya tingkatan berkwalitas mencakup pada setiap skala. Tidak ada aturan yang menyatakan bahwa semua unsur-unsur yang dinilai perlu mengenal baik yang sama dari tingkatan berkwalitas. Banyaknya tingkatan yang dimasukkan harus ditentukan oleh kompleksitas unsur menilai dan waktunya tersedia untuk penilaian itu. Berikut dua unsur-unsur dari suatu contoh paragrap.

		Ya	Tidak			Yang hilang	lemah	cukup	baik
		(1)	(0)			Yang hilang	lemah	cukup	baik
1	Yg bertakik	------	-------	1	Yg bertakik	0	1	2	3
2	Topik Kalimat	------	-------	2	Topik Kalimat	0	1	2	3

MENGHITUNG FREKWENSI (The Frequency Count) Format Tanggapan penilai dapat menggunakan penilaian produk, capaian, dan perilaku adalah menghitung frekwensi. Suatu frekwensi diperlukan ketika suatu unsur untuk diamati, apakah hal positif atau hal negatif, dapat diulangi beberapa kali oleh peserta ujian sepanjang capaian di dalam produk. Sebagai contoh, Selama suatu capaian seperti pertandingan tenis, layanan diulangi berulang kali, kadang-kadang secara efektif dan kadang-kadang bukan. Di dalam menilai perilaku seperti mereka yang diperlihatkan oleh kasir bank, kasir dapat diamati transaksi dengan banyak orang pelanggan yang berbeda dan hari yang berbeda . Hal positif dan perilaku negatif yang diperlihatkan oleh kasir ke pelanggan setiap hari.

Menghitung frekwensi instrumen dapat diciptakan hanya menyediakan ruang yang cukup di samping unsur masing-masing dalam rangka perhitungan jumlah banyaknya kejadian yang terjadi.

MENGEVALUASI INTRUMEN Petunjuk Test dan Intrumen untuk mengevaluasi capaian, produk, dan perilaku diperlukan juga menurut bentuk evaluasi sebelum mereka benar-benar digunakan. Mengevaluasi kegunaan instrumen evaluasi harus dilakukan. Ukuran-Ukuran untuk penggunaan mengevaluasi unsur-unsur tercakup di instrumen adalah: ( 1) observabilas dari tiap unsur-unsur untuk dinilai, ( 2) kejelasan cara di mana mereka ditafsirkan, ( 3) efisiensi peruntunan., Perlu diperiksa apakah kategori tanggapan dan ukuran-ukuran adalah layak dalam kaitan dengan jumlah dan jenis pertimbangan yang harus dibuat waktunya tersedia untuk mengamati,

H. UKURAN STANDAR DAN NORMA TEST

CHAFTER TGS 2: File@Mahuri 2010

Perbedaan yang utama antara kreteria ukuran test dan norma test berada bagaimana capaian siswa pada test ditafsirkan. Di dalam ukuran standar, capaian dari semua siswa di dalam kelompok dibandingkan sebanyak ketrampilan bawahan atau sasaran hasil kelulusan. Sebagai contoh, jika menjawab 80 persen materi yang dengan tepat dibentuk seperti ukuran untuk disampaikan, kemudian masing-masing capaian para siswa ditinjau untuk memecahkan ukuran, 80 persen. Ini juga mungkin untuk semua siswa dalam kelompok yang melebihi ukuran yang ditetapkan.

penafsiran ukuran norma, pada sisi lain, dibandingkan capaian para siswa satu sama lain. Ranking siswa atau memposisikan kelompok adalah acuan untuk menentukan mutu capaian dibanding suatu proporsi yang ditetapkan sasaran hasil kelulusan

I. TEST MATERI UNTUK INFORMASI LISAN

Contoh

Sasaran hasil Capaian	Materi Test Parallel
1. dengan istilah Pokok, menggambarkan Definisi harus meliputi pokok materi menyebut suatu topik	1. Gambarkan pokok bagian materi dari suatu kalimat 2. apa pokok bagian materi dari suatu kalimat lakukan? 3. Pokok materi bagian dari suatu kalimat menyebut yang.....................
2. dengan istilah sebutan, menggambarkan Definisi harus meliputi sebutan kata tentang sesuatu pokok materi topik	1. Gambarkan sebutan bagian dari suatu kalimat. 2. apa sebutan bagian dari suatu kalimat lakukan? 3. Sebutan bagian dari suatu kalimat ceritakan kepada tentang sesuatu yang..............

J. DAFTAR UNTUK MENGEVALUASI KETRAMPILAN MOTOR

Didalam mengukur capaian ketrampilan motor, akan memerlukan instruksi untuk capaian dan suatu instrumen yang dapat digunakan untuk merekam evaluasi capaian.

Informasi disediakan juga untuk peserta ujian tentang bagaimana capaian akan dinilai. Instruksi ini diceritakan kepada peserta ujian bahwa dalam rangka menerima penjelasan, mereka harus (1) mengingat masing-masing langkah, (2) melaksanakannya menggunakan alat yang sesuai, (3) menggunakan alat masing-masing dengan baik, dan ( 4) selalu sadar keselamatan melakukan masing-masing langkah. dengan informasi.

K. RINGKASAN

Dalam rangka mengembangkan ukuran test yang standar, kita memerlukan daftar sasaran hasil tingkah laku, yang didasarkan pada analisa intervi. Kondisi-Kondisi, Perilaku, dan ukuran-ukuran berisi pada setiap sasaran akan membantu dalam menentukan format yang terbaik untuk test atau untuk materi.

CHAFTER TGS 2: File@Mahuri 2010

Suatu sasaran format penguji akan jadi yang terbaik untuk banyak informasi yang lisan dan sasaran hasil ketrampilan intelektual. Bagaimanapun, kita harus memutuskan item sasaran format apa yang akan sama dan sebangun dengan perilaku dan kondisi-kondisi yang ditentukan. Sasaran Materi harus tertulis untuk memperkecil kemungkinan dengan tepat menebak jawaban, dan soal harus tertulis dengan jelas sehingga semua stimuli atau isyarat menentukan sasaran hadir didalam item atau instruksi. Kita harus pula memutuskan berapa banyak materi yang harus mengukur capaian yang cukup pada sasaran masing-masing. Didalam menentukan banyaknya materi untuk menghasilkan, kita harus mempertimbangkan berapa kali informasi atau ketrampilan akan diujikan. Cukup materi untuk mendukung konstruksi pretests, test yang ditempelkan, dan posttests harus diproduksi. Kapan saja mungkin, para siswa harus diberikan suatu item berbeda setiap kali suatu sasaran dirukur.

Beberapa ketrampilan intelektual tidak bisa dirukur materi test sasaran penggunaannya. Contoh yang dimasukkan penulisan adalah suatu paragrap, membuat suatu penelitian dan membandingkan corak tertentu. Ketrampilan intelektual mengakibatkan suatu produk atau suatu capaian, ketrampilan psychomotor, dan perilaku berhubungan dengan sikap harus dirukur menggunakan test yang terdiri dari instruksi untuk pelajar dan suatu instrumen pengamatan untuk penilai. Didalam menciptakan instrumen ini kita harus mengidentifikasi, menafsirkan, dan urutan unsur-unsur yang tampak produk capaian, atau perilaku. Kita juga harus memilih suatu format pertimbangan layak untuk penilai dan menentukan bagaimana instrumen akan dicapai.

Adalah penting untuk mengevaluasi dan memilih sasaran materi test, arah ke pelajar, dan instrumen untuk menilai produk, capaian, atau perilaku sebelum mereka benar-benar digunakan untuk mengevaluasi kemajuan pelajar atau mutu material intervi. Materi Test Dan Instrumen Evaluasi sepertinya adalah yang diatur oleh Hukum Murphy's: Meskipun terdapat perbedaan dan penympangan. Ukuran yang paling utama untuk menilai mutu dari suatu materi dan instrumen sama dan sebangunnya dengan kondisi-kondisi, perilaku, dan ukuran-ukuran menentukan sasaran. Pertimbangan ini berhubungan dengan kebenaran isi item. Apakah item mengukur, apa itu mengira untuk mengukur? Ukuran paling utama yang kedua adalah kepantasan bahasa, konteks, kondisi-kondisi, dan ukuran-ukuran menggunakan kemampuan tingkat para siswa. Ukuran penting yang lain adalah kelayakan mengatur test didalam lingkungan yang diberi dan waktunya tersedia. Jika tidak mempunyai materi atau instrumen yang menghasilkan score test dapat dipercaya sah, kita tidak membiasakan mereka untuk penguasaan siswa dari sasaran hasil atau mutu intervi.

Tentu saja, mutu dari instrumen dan materi tergantung pada mutu dari sasaran hasil, yang pada gilirannya tergantung pada mutu dari statemen keberhasilan dan analisa intervi

CHAFTER TGS 2: File@Mahuri 2010

DAFTAR PUSTAKA

Carey, L.M (1988). Measuring and evaluating school learning. Boston: Allyn and Bacon, Excellent source on deriving test items. Terminology is consistent with this text

Dick,W. (1986). The function of the pretest in the instructional design process. Performance and Instruction, 25(4), 6-7. Discusses various issues related to the design and use of a pretest as part of the instructional design process.

Gagne, R.M., Briggs, L.J., & Wager, W. W. (1988). Principles of instructional design (3rd ed). New York: Holt, Rinehart and winston. The chapter on assesing student performance includes not only the development of objective referenced as signments, but also the consept of mastery and norm referenced measures.

Gronlund, N.E. (1981). Measurement and evaluation in teaching. New York: Macmillan. Principles of item and test contruction as well as methods for evaluating items are described.

Haladyna, T.M., & Roid, G.H. (1983). Reviewing criterion referenced test items. Educational Technology, 23(8), 35-39. The authors provide a data based procedure for reviewing criterion referenced test items.

Hopkins,C. D., & Antes, R.L. (1978). Classrom measurement and evaluation. Itasca, IL: F.E. Peacock. Present principles of item and test contruction as well as methods for item and test analysis.

Kibler,R.J., Cegala, D.J., Barker, L.L., & Miles, D.T. (1974). Objectives for instruction and evaluation. Boston: Allyn and Bacon, 114-142. Kibler et al. Include a discussion of norm versus criterion referenced assessment and the use of mastery learning strateges.

Lathrop, R.L. (1983). The number of performance assessment necessary to determine comperence. Journal of Intructional Development, 6,3. 26-31. Lathrop presents a statistical methodology for determining which student are master and which are not through the use of sequential testing procedures.

Millman , J. (1974). Criterion referenced measurement. In Popham, W.J. (Ed) Evaluation in education: Current application. Berkeley, CA: Mc Cutchan Puplishing. 309-398. The discussing of the criterion referenced and domain referenced testing is extensive and includes some of the quantitative, as well as qualitative, issues associated with them.

Payne,D.A. (1974)The assessment of learning: Cognitive and affective. Lexington, MA:D.C. Heath. This is an excellent text that relates various types of test items to the varieties of instructional objectives. It emphasizes tecniques for writing effective test items.

Dick,W.,&Carey,L. (1978). The Systematic Design of Instruction. Third Edition. The chapter 7, Developing Crriterion Referenced Test Item, 122-156. Harper Collins Publisher

CHAFTER TGS 2: File@Mahuri 2010

Pendidikan dan Keilmuan

Selasa, 23 November 2010

Mengembangkan Materi Test

MENGEMBANGKAN MATERI TEST YANG DISESUAIKAN

OLEH : M A H U R I

DOSEN PENGAMPU : DR. TURDJA, I, M.Pd

1. untuk mengidentifikasi unsur-unsur untuk dievaluasi,

2. untuk menafsirkan masing-masing,

3. urutan unsur-unsur pada instrumen,

4. untuk memilih jenis pertimbangan untuk dibuat oleh tikus,

5. untuk menentukan bagaimana instrumen akan dicapai.

K. RINGKASAN

Tidak ada komentar:

Posting Komentar