Selasa, 23 November 2010

Mengembangkan Materi Test


CHAPTER RAPORT

MENGEMBANGKAN MATERI TEST YANG DISESUAIKAN

 

OLEH : M A H U R I

DOSEN PENGAMPU : DR. TURDJA, I, M.Pd

 


A.LATAR BELAKANG
Pada umumnya kebanyakan instruktur membuat test yang digunakan untuk memperoleh data nilai siswa. Test sering ini ditulis setelah intruksi  disajikan, dan dibuat  lebih sulit tergantung kemampuan pelajar  di dalam  kelas atau persepsi instrutor tentang topik tertentu yang telah diajarkan. Format test jenis ini kadang-kadang ditentukan oleh minat dan kemampuan instruktur dibanding oleh sifat alami isi yang telah diajar.
Merancang test adalah untuk mengukur sesuatu dalam mencapai hasil  pengukuran yang disesuaikan pada test. Pengujian jenis ini  adalah:
( 1) menguji dan mengevaluasi kemajuan para siswa,  
( 2) untuk menyediakan informasi tentang efektivitas instruksi.

Hasil pengukuran test ditujukan kepada instruktur  yang  persisnya bagaimana siswa  bisa mencapai masing-masing  sasaran, dan menunjukkan kepada perancang yang persisnya komponen instruksi  yang  bekerja dengan baik, dan revisi kebutuhan. Materi test yang dibangun bersesuaian pada satu sasaran yang telah dikembangkan.
B. KONSEP
Ukuran test yang sesuai adalah terdiri atas materi yang secara langsung mengukur perilaku  yang ditentukan satuan sasaran hasil tingkah laku. Istilah ukuran digunakan sebab materi test bertindak sebagai sesuatu yang menentukan ketercukupan seorang dalam menemui sasaran hasil. Tujuannya untuk lebih menandakan hubungan antara materi test dan sasaran hasil perilaku. Materi Test disesuaikan secara langsung kepada capaian uraikan sasaran untuk material intervi.
Ada dua  istilah ukuran yang digunakan pada materi test.
Pertama hubungan antara sasaran capaian dan materi test. Siswa cukup melaksanakan perilaku  sasaran, kemudian mereka diharapkan sudah mencapai ukuran atau penguasaan pada  sasaran,


CHAFTER TGS 2: File@Mahuri 2010

Kedua  berhubungan dengan spesifikasi ketercukupan capaian yang diperlukan untuk penguasaan, Beberapa materi test ditulis untuk satu sasaran, atau beberapa materi test ditulis untuk banyak sasaran hasil. Kejelasan di dalam menetapkan sasaran hasil dan ukuran-ukuran yang cukup pada sasaran tingkah laku tertentu  dan menetapkan ukuran-ukurannya, suatu posttest boleh memerlukan  satu item test atau lebih.
Oleh karena itu dalam rangka menentukan apakah suatu item test sungguh-sungguh mengacu pada ukuran intructor;.
Pertama apakah untuk menentukan capaian suatu item test, memerlukan  sasaran  tingkah laku
Kedua, apakah ukurannya sudah mapan untuk menetapkan seorang siswa harus melaksanakan ketrampilan dalam rangka menguasai sasaran itu.
C.  TIGA JENIS UKURAN TEST  DAN  PENGGUNAANNYA
1.      PRETEST
Pretest berisi materi yang mengukur perilaku masukan  prasyarat dan materi yang mengujikan ketrampilan yang akan  diajarkan di dalam intruksi itu. Materi Perilaku untuk pretest didasarkan pada sasaran hasil ketrampilan yang nampak. Siswa   harus mempunyai ketrampilan untuk memulai instruksi. Materi tes harus dikembangkan dan menggunakan  siswa sepanjang perkembangan evaluasi.  Mungkin saja ditemukan bahwa, ketika teori menyarankan, siswa yang kurang ketrampilannya akan mengalami kesulitan dengan instruksi yang dibuat.
Pretest juga mengukur ketrampilan yang.secara khas meliputi satu atau lebih materi untuk masing-masing ketrampilan mengarah pada analisa dan keberhasilan pertanyaan.
Fungsi dari pretest  adalah untuk menentukan berapa banyak pelajar mempunyai pengetahuan utama dari apa yang diharapkan untuk diajarkan,
2.      TEST YANG DITEMPELKAN
Adalah suatu materi test ditempelkan seperti suatu materi praktek dengan tidak ada umpan balik. Item ini hanya demi kepentingan perancang  digunakan untuk jawaban pertanyaan "siswa mengetahui bagaimana cara melakukan ketrampilan dengan seketika setelah  diajarkan". tempelkannya materi berlaku  eklusif ke ketrampilan intelektual, sebab perancang harus bisa menggunakan suatu item yang baru kepada siswa, suatu kejadian yang  tidak ditemui aplikasi ketrampilan. Masalahnya adalah  perancang tidak mengetahui jika siswa melakukan dengan sesungguhnya, mengingat materi yang ditempelkan pada umumnya tidaklah menggunakan ketrampilan psychomotor, tetapi mungkin saja penting untuk jenis instruksi tertentu siswa berhenti melakukan ketrampilan atau lebih ditujukan kepada instruktur untuk memverifikasi  prosedur  dengan tepat. Ini berlaku  bagi situasi yang berbahaya..
3.      POSTTEST


CHAFTER TGS 2: File@Mahuri 2010

Posttest akan menempatkan penilaian beberapa jenis  intruksi. Posttest perlu menilai semua sasaran hasil, terutama terfokus pada  sasaran materi.  seperti pada pretest, Tujuan posttest adalah untuk membantu perancang mengidentifikasi area instruksi materi yang tidak tercapai. Jika waktu adalah suatu faktor dalam suatu test maka test harus dikembangkan lebih ringkas, kemudian sasaran materi pokok dan subskiil  harus diujikan. Materi yang mengujikan subskill itu  hampir bisa dipastikan untuk memberi permasalahan siswa pada pokok materi sasaran yang harus digunakan.   posttest hanya untuk mengukur sasaran pusat. Pada pokoknya sangat sedikit waktu  digunakan pada  saat mengujikan intruksi menjadi operasional.
D.  PERANCANG  SUATU  TEST
Bagaimana caranya mengembangkan rancangan suatu ukuran test yang disesuaikan? Merancang satu atau lebih materi test untuk masing-masing sasaran hasil perilaku. Faktor yang penting adalah adanya pertanyakan pada test yang bersesuaian  secara langsung bagi masing-masing sasaran capaian.
Sasaran hasil didalam ketrampilan intelektual  biasanya memerlukan catatan materi, atau materi yang memerlukan suatu capaian atau produk spesifik. Relatif mudah untuk menentukan prestasi dari suatu sasaran ketrampilan intelektual; yang mana para siswa" mengetahui" tanggapan yang sesuai atau  tidak. Pada tingkat yang lebih tinggi untuk ketrampilan intelektual diperlukan penetapkan satu set ukuran yang dapat dikonversi untuk suatu daftar nama atau ratting skala yang dapat digunakan untuk menilai produk siswa.
1.    Menentukan Tingkatan Penguasaan

Sasaran tingkah laku yang ditulis harus ada suatu tingkatan menetapkan ukuran, yang menandai adanya siswa harus melaksanakan ketrampilan dengan baik, pada  materi test yang disediakan. Pada pokoknya ukuran menandai adanya tingkatan penguasaan itu memerlukan siswa. Konsep tingkatan penguasaan sebagai lawan tingkatan ukuran, lebih sering diberlakukan bagi suatu test untuk suatu keseluruhan unit instruksi atau suatu keseluruhan kursus. Instruktur boleh menyatakan bahwa dalam urutan menguasai unit ini, siswa harus mencapai suatu tingkatan capaian  tertentu sesuai pertanyaan.
Sebagai penguasaan prinsip umum mengukur  capaian harus dipertimbangkan berkenaan dengan mengevaluasi capaian  yang mengarah pada waktu dan penambahan pelajaran ketrampilan.
2.    Menulis Materi test


CHAFTER TGS 2: File@Mahuri 2010

Dengan mengabaikan jenis pelajaran yang melibatkan sasaran, penulisan item test harus sesuai teknik diberlakukan pengembangan ukuran  test yang standar. Ada beberapa hal yang perlu diingat intruktur selagi penulisan ukuran materi test  yang standar. Materi perlu memenuhi perilaku dan kondisi menetapkan sasaran, dan perlu menyediakan materi untuk para siswa dengan memberikan kesempatan untuk menemukan ukuran-ukuran yang diperlukan
Pengujian Lingkungan adalah suatu faktor penting di dalam pemilihan format item. Apakah peralatan dan fasilitas  tersedia untuk situasi test? Dapatkah siswa  benar-benar melaksanakan suatu ketrampilan dalam kondisi penetapkan sasaran? Multiple-choice memberikan mempertanyakan dengan tiga, empat, atau lebih  tanggapan, dan memberi kesempatan siswa untuk memilih jawaban yang benar. Jika instruktur ingin menghadapi tantangan atau mengevaluasi kemajuan  siswa, mereka perlu membangun materi test pada  tingkat kesulitan yang lebih tinggi.
3.      Materi Peruntunan
Metode materi peruntunan yang tradisional pada suatu test ke materi seikat berdasar pada format item. Pada penggunaan strategi ini, materi penyelesaian ditempatkan bersama-sama, banyak materi pilihan  bersama-sama, materi esei adalah pengelompokan bersama-sama, dan sebagainya.  Metode ini mengakibatkan suatu test nampak menarik yang diorganisir dengan baik dan memerlukan suatu jumlah minimum.  Kendati  pengaturan strategi ini mempunyai  kekurangan, siapa yang harus meneliti penguasaan siswa tentang mengukur hasil sasaran. Setelah membuat nilai masing-masing item dan sebelum menentukan hasil penguasaan sasaran siswa, data harus diatur kembali oleh hasil sasaran  untuk dianalisa. Ini suatu langkah yang tak perlu dan memakan waktu.
Suatu strategi peruntunan digunakan untuk perancang, siapa yang harus  membangun dan meneliti tanggapan di dalam sasaran hasil, untuk materi seikat satu sasaran bersama-sama, dengan mengabaikan format item. Satu-satunya jenis item perkecualian pada  strategi ini  adalah esei yang panjang pertanyaannya. Seperti  pertanyaan yang secara khusus ditempatkan pada ujung suatu test untuk membantu siswa di dalam mengatur waktu mereka selama test.
E.   ARAH MENULIS/PETUNJUK TEST
  Arah Menulis Test meliputi jelas, bersih, arahnya ringkas. Awal suatu test pada umumnya menyebabkan ketertarikan siswa  yang akan dinilai. Didalam pikiran mereka tidak merasa ragu tentang apa yang  mereka lakukan untuk melaksanakan test. Pada umumnya pengantarkan kearah keseluruhan test
Apakah siswa perlu memilih jika mereka  tak percaya dengan jawabannya; apakah para siswa perlu menggunakan nama mereka atau hanya mengidentifikasi diri mereka sebagai anggota suatu kelompok? apakah ada batas waktu,  atau suatu ruang yang membatasi tanggapan? dan apakah mereka memerlukan yang khusus untuk bereaksi terhadap test? seperti nomor, jumlah  pensil, lembar jawaban mesin, suatu teks khusus, atau peralatan khusus seperti kalkulator atau peta. Tulis dan meninjau ulang  secara hati-hati untuk memastikan bahwa siswa memahami semua informasi untuk menjawab dengan tepat



CHAFTER TGS 2: File@Mahuri 2010

 
F. MENGEVALUASI MATERI TEST
untuk tes-tes objektif perlu mengalami percobaan perkembangan evaluasi sebelum mereka benar-benar digunakan untuk menilai capaian siswa. Suatu materi test  boleh kelihatan sempurna Banyak hal dapat menyimpang dengan suatu soal, Instruktur perlu memastikan bahwa ( 1) arah test harus jelas, sederhana, dan mudah untuk mengerti ( 2) masing-masing item test harus jelas dan dapat menyampaikan ke para siswa informasi yang diharapkan; ( 3) kondisi-kondisi tanggapan yang  dibuat  realistis; ( 4) metoda tanggapan harus jelas bagi siswa;  ( 5) sesuai ruang, waktu, dan peralatan tersedia untuk para siswa  menjawab sewajarnya.
Bahkan setelah  ujian benar-benar diberikan, instruktur perlu menilai hasil  untuk kejelasan item. Materi Test yang kebanyakan hilang dari siswa harus dianalisa. Materi yang  kurang relevan  harus dianalisa dan mungkin ditinjau kembali sebelum test diatur lagi.
Masalah pengujian praktis untuk instruktur siapa yang harus menguji kelompok siswa yang berbeda dengan sasaran hasil yang sama pada waktu yang sama dalam jangka waktu singkat. Untuk menjamin integritas dari jawaban siswa, instruktur  harus membangun beberapa versi yang berbeda dengan posttest. Sebagai tambahan terhadap pretest dan materi test yang ditempelkan, sebanyak lima atau enam versi  posttest yang mungkin  diperlukan.
Ketika membangun materi test dan menguji secara umum instruktur perlu mengingat-ingat ukuran ketercapaian test ( 1) Test dirinya sendiri, ( 2) Membentuk tanggapan, ( 3) Materi pertanyaan, ( 4) Lingkungan dan situasi, ( 5) prestasi para siswa.
G.  MENGEMBANGKAN INSTRUMEN PENGUKURAN
      CAPAIAN, PRODUK, DAN PERILAKU ( SIKAP)
Kembangkan dulu instrumen ukuran ketrampilan psychomotor, produk, atau perilaku dengan tidak melibatkan dirinya dalam menulis materi test. Sebagai pengganti, itu memerlukan petunjuk untuk memandu perilaku atau aktivitas siswa dan membangun suatu instrumen untuk memandu evaluasi  capaian, produk, atau perilaku.


CHAFTER TGS 2: File@Mahuri 2010

ARAH MENULIS/PETUNJUK.  Untuk siswa capaian dan produk perlu  jelas menguraikannya, apa yang akan dilaksanakan dan bagaimana melaksanakannya.  kondisi-kondisi khusus seperti sumber daya atau batas waktu harus diuraikan. Di dalam menulis petunjuk harus mempertimbangkan jumlah bimbingan yang harus disajikan  Satu-satu, mungkin untuk mengingatkan siswa dalam melaksanakan langkah-langkah tertentu dan menginformasikan ukuran-ukuran yang akan digunakan dalam mengevaluasi pekerjaan mereka. Peserta ujian dapat diberi suatu salinan daftar evaluasi atau skala pengharkatan yang akan digunakan untuk menilai pekerjaan mereka sebagai bagian dari petunjuk itu. Peserta ujian diamati oleh seorang pengawas dan tidak boleh memperlihatkan perilaku yang mencerminkan sikap merugikan.
  PENGEMBANGKAN INSTRUMEN  Sebagai tambahan dalam menulis instruksi untuk pelajar, harus dikembangkan suatu instrumen yang memandu penilaian prestasi, produk, atau perilaku. Langkah-Langkah di dalam mengembangkan instrumen adalah:
1. untuk mengidentifikasi unsur-unsur untuk dievaluasi,
       2. untuk menafsirkan masing-masing,
       3. urutan unsur-unsur pada  instrumen,
       4. untuk memilih jenis pertimbangan untuk dibuat oleh tikus,
       5. untuk menentukan bagaimana instrumen akan  dicapai.

MENGEMBANGKAN FORMAT TANGGAPAN Aktivitas yang keempat di dalam mengembangkan suatu instrumen untuk mengukur capaian, produk, atau perilaku adalah  menentukan tingkatan bagaimana membuat dan merekam pertimbangan itu. Sedikitnya ada tiga penilai menanggapi format yang mencakup suatu daftar nama (ya atau tidak); suatu skala pengharkatan yang memerlukan tingkatan atau pembedaan yang berkwalitas.  ( lemah, cukup, dan baik);
DAFTAR NAMA Hal-Hal paling mendasar ke tiga format pertimbangan adalah daftar nama. Yaitu satu kolom pemeriksaan " ya" untuk menunjukkan bahwa unsur masing-masing hadir. Yang lain adalah untuk pemeriksaan " tidak" untuk menandai adanya ketidakhadiran maupun  kekurangan dari suatu unsur. Manfaat daftar nama meliputi banyaknya unsur-unsur berbeda yang dapat diamati sejumlah waktu yang ditentukan, bertepatan dengan itu dapat diselesaikan oleh penilai, konsistensi atau keandalan dengan pertimbangan dapat dibuat, dan kesenangan dengan suatu keseluruhan score capaian dapat diperoleh. Satu pembatasan daftar nama adalah ketidakhadiran informasi yang disajikan ke peserta ujian tentang mengapa  " tidak" dipertimbangan setelah dikerjakan.
SKALA PENGHARKATAN Adalah suatu daftar nama dapat dikonversi untuk suatu skala pengharkatan dengan pengeluaran banyaknya pertimbangan tingkatan berkwalitas untuk masing-masing unsur di mana kemungkinan pembedaan kwalitas. Sebagai ganti penggunaan dua kolom untuk menilai suatu unsur, sedikitnya  digunakan tiga kolom. ( 1), dan baik ( 2); atau lemah ( 3) cukup. Serupa dengan daftar nama, skala pengharkatan mempunyai hal positif dan  negatif. Pada sisi yang positif, mereka memungkinkan untuk evaluasi analitis subkomponen suatu capaian atau produk, dan mereka menyediakan umpan balik lebih baik kepada peserta ujian tentang mutu suatu capaian dibandingkan melalui suatu daftar nama. Pada  sisi yang negatif, mereka memerlukan waktu untuk menggunakannya, sebab pembedaan sangat tipis sehingga harus dibuat peningkatan  mutu dari tiap unsur mengevaluasi.
Contoh







Umum (general)
Yang Hilang
Lemah
Cukup
Baik
1
Topik Kalimat
0
1
2
3


CHAFTER TGS 2: File@Mahuri 2010


Strategi pengembangan yang kedua  adalah untuk membatasi banyaknya tingkatan berkwalitas mencakup pada setiap skala. Tidak ada aturan yang menyatakan bahwa semua unsur-unsur yang dinilai perlu mengenal baik yang sama dari tingkatan berkwalitas. Banyaknya tingkatan yang dimasukkan harus ditentukan oleh kompleksitas unsur menilai dan waktunya  tersedia untuk penilaian itu. Berikut dua unsur-unsur dari suatu contoh paragrap.







Ya
Tidak


Yang hilang
lemah
cukup
baik
(1)
(0)
1
Yg bertakik
------
-------
1
Yg bertakik
0
1
2
3
2
Topik Kalimat
------
-------
2
Topik Kalimat
0
1
2
3

  MENGHITUNG FREKWENSI (The Frequency Count) Format Tanggapan penilai dapat menggunakan penilaian produk, capaian, dan perilaku adalah menghitung frekwensi. Suatu  frekwensi diperlukan ketika suatu unsur untuk diamati, apakah hal positif atau hal negatif, dapat diulangi beberapa kali oleh peserta ujian sepanjang capaian di dalam produk. Sebagai contoh, Selama suatu capaian seperti pertandingan tenis, layanan diulangi berulang kali, kadang-kadang secara efektif dan kadang-kadang bukan. Di dalam menilai perilaku seperti mereka yang diperlihatkan oleh kasir bank,  kasir dapat diamati transaksi dengan banyak orang pelanggan yang berbeda dan hari yang berbeda . Hal positif dan perilaku negatif yang diperlihatkan oleh  kasir  ke pelanggan setiap hari.
       Menghitung frekwensi instrumen dapat diciptakan hanya menyediakan ruang yang cukup di samping unsur masing-masing dalam rangka perhitungan jumlah banyaknya kejadian yang terjadi.
MENGEVALUASI  INTRUMEN Petunjuk Test dan Intrumen untuk mengevaluasi capaian, produk, dan perilaku diperlukan juga menurut bentuk evaluasi sebelum mereka benar-benar digunakan. Mengevaluasi kegunaan instrumen evaluasi harus dilakukan. Ukuran-Ukuran untuk penggunaan mengevaluasi unsur-unsur tercakup di instrumen adalah: ( 1) observabilas dari tiap unsur-unsur untuk dinilai, ( 2) kejelasan cara di mana mereka ditafsirkan, ( 3) efisiensi  peruntunan., Perlu diperiksa apakah kategori tanggapan dan ukuran-ukuran adalah layak dalam kaitan dengan jumlah dan jenis pertimbangan yang harus dibuat  waktunya tersedia untuk  mengamati, 
H. UKURAN STANDAR DAN NORMA TEST


CHAFTER TGS 2: File@Mahuri 2010

Perbedaan yang utama antara kreteria ukuran  test dan norma  test berada bagaimana capaian siswa pada  test ditafsirkan. Di dalam ukuran standar, capaian dari semua siswa di dalam kelompok dibandingkan sebanyak ketrampilan bawahan atau sasaran hasil kelulusan. Sebagai contoh, jika menjawab 80 persen materi yang dengan tepat dibentuk seperti ukuran untuk disampaikan, kemudian masing-masing capaian para siswa ditinjau untuk memecahkan ukuran, 80 persen. Ini juga mungkin untuk semua siswa dalam kelompok yang  melebihi ukuran yang ditetapkan.
penafsiran ukuran norma, pada sisi lain, dibandingkan capaian para siswa satu sama lain. Ranking siswa atau memposisikan kelompok adalah acuan  untuk menentukan mutu capaian dibanding suatu proporsi yang ditetapkan sasaran hasil kelulusan
I. TEST MATERI  UNTUK  INFORMASI  LISAN
Contoh




Sasaran hasil Capaian
Materi Test Parallel
1. dengan istilah Pokok, menggambarkan  
    Definisi harus  meliputi pokok materi
    menyebut  suatu topik
1. Gambarkan pokok bagian materi 
    dari suatu kalimat
2. apa pokok bagian materi  dari
    suatu kalimat lakukan?
3. Pokok materi bagian dari suatu
    kalimat menyebut  yang.....................
2. dengan istilah sebutan,  menggambarkan 
    Definisi harus  meliputi  sebutan  kata
     tentang sesuatu  pokok materi topik
1. Gambarkan sebutan  bagian  
    dari suatu kalimat.
 2. apa sebutan bagian dari suatu
    kalimat lakukan?
3. Sebutan bagian dari suatu
     kalimat ceritakan  kepada
     tentang sesuatu  yang..............

J.   DAFTAR  UNTUK MENGEVALUASI KETRAMPILAN MOTOR

Didalam mengukur capaian ketrampilan motor, akan memerlukan instruksi untuk capaian dan suatu instrumen yang dapat digunakan untuk merekam evaluasi capaian.
Informasi   disediakan juga untuk peserta ujian  tentang bagaimana capaian akan dinilai. Instruksi ini diceritakan kepada peserta ujian bahwa dalam rangka menerima penjelasan, mereka harus (1) mengingat masing-masing langkah, (2) melaksanakannya menggunakan alat yang sesuai, (3) menggunakan alat masing-masing  dengan baik, dan ( 4) selalu sadar keselamatan  melakukan  masing-masing langkah. dengan informasi.

K.  RINGKASAN


Dalam rangka mengembangkan ukuran test yang standar, kita memerlukan  daftar sasaran hasil tingkah laku, yang didasarkan pada analisa intervi. Kondisi-Kondisi, Perilaku, dan ukuran-ukuran berisi pada setiap sasaran akan membantu dalam menentukan format yang terbaik untuk test atau untuk materi.


CHAFTER TGS 2: File@Mahuri 2010

Suatu sasaran  format penguji akan jadi yang terbaik untuk banyak  informasi yang lisan dan sasaran hasil ketrampilan intelektual. Bagaimanapun, kita harus memutuskan item sasaran format apa yang  akan sama dan sebangun dengan perilaku dan kondisi-kondisi yang ditentukan. Sasaran Materi harus tertulis untuk memperkecil kemungkinan dengan tepat menebak jawaban, dan soal harus tertulis dengan jelas  sehingga semua stimuli atau isyarat menentukan sasaran hadir didalam item atau instruksi. Kita harus pula memutuskan berapa banyak materi yang harus mengukur capaian yang cukup pada sasaran masing-masing. Didalam menentukan banyaknya materi untuk menghasilkan, kita harus mempertimbangkan berapa kali informasi atau ketrampilan akan  diujikan. Cukup materi untuk mendukung konstruksi pretests, test yang ditempelkan, dan posttests harus diproduksi. Kapan saja mungkin, para siswa harus diberikan suatu item berbeda setiap kali suatu sasaran dirukur.
Beberapa ketrampilan intelektual tidak bisa dirukur materi test sasaran penggunaannya. Contoh yang dimasukkan penulisan adalah suatu paragrap, membuat suatu penelitian dan membandingkan corak tertentu. Ketrampilan intelektual  mengakibatkan suatu produk atau suatu capaian, ketrampilan psychomotor, dan perilaku berhubungan dengan sikap harus dirukur menggunakan test yang terdiri dari instruksi untuk pelajar dan suatu instrumen pengamatan untuk penilai. Didalam menciptakan instrumen ini kita harus mengidentifikasi, menafsirkan, dan urutan unsur-unsur yang tampak produk capaian, atau perilaku. Kita juga harus memilih suatu format pertimbangan layak untuk penilai dan menentukan bagaimana instrumen akan  dicapai.
Adalah penting untuk mengevaluasi dan memilih sasaran materi test, arah ke pelajar, dan instrumen untuk menilai produk, capaian, atau perilaku sebelum mereka benar-benar digunakan untuk mengevaluasi kemajuan pelajar atau mutu material intervi. Materi Test Dan Instrumen Evaluasi sepertinya adalah yang diatur oleh Hukum Murphy's: Meskipun terdapat perbedaan dan penympangan. Ukuran yang paling utama untuk menilai mutu dari suatu materi dan instrumen sama dan sebangunnya dengan kondisi-kondisi, perilaku, dan ukuran-ukuran menentukan sasaran. Pertimbangan ini berhubungan dengan kebenaran isi  item. Apakah item mengukur, apa itu mengira untuk mengukur? Ukuran paling utama yang kedua  adalah kepantasan bahasa, konteks, kondisi-kondisi, dan ukuran-ukuran menggunakan kemampuan tingkat para siswa. Ukuran penting yang lain adalah kelayakan mengatur test didalam lingkungan yang diberi dan waktunya tersedia. Jika tidak mempunyai materi atau instrumen yang menghasilkan score test dapat dipercaya sah, kita tidak  membiasakan mereka  untuk penguasaan siswa dari sasaran hasil atau mutu intervi.
Tentu saja, mutu dari instrumen dan materi  tergantung pada mutu dari sasaran hasil, yang  pada gilirannya tergantung pada mutu dari statemen keberhasilan dan analisa intervi






CHAFTER TGS 2: File@Mahuri 2010

 
DAFTAR PUSTAKA
Carey, L.M (1988). Measuring and evaluating school learning. Boston: Allyn and Bacon,         Excellent source on deriving test items. Terminology is consistent with this text
Dick,W. (1986). The function of the pretest in the instructional design process. Performance and Instruction, 25(4), 6-7. Discusses various issues related to the design and use of a pretest as part of the instructional design process.
Gagne, R.M., Briggs, L.J., & Wager, W. W. (1988). Principles of instructional design (3rd ed). New York: Holt, Rinehart and winston. The chapter on assesing student performance  includes not only the development of objective referenced as signments, but also the consept of mastery and norm referenced measures.
Gronlund, N.E. (1981). Measurement and evaluation in teaching. New York: Macmillan. Principles of item and test contruction as well as methods for evaluating items are described.
Haladyna, T.M., & Roid, G.H. (1983). Reviewing criterion referenced test items. Educational Technology, 23(8), 35-39. The authors provide a data based procedure for reviewing criterion referenced test items.
Hopkins,C. D., & Antes, R.L. (1978). Classrom measurement and evaluation. Itasca, IL: F.E. Peacock. Present principles of item and test contruction as well as methods for item and test analysis.
Kibler,R.J., Cegala, D.J., Barker, L.L., & Miles, D.T. (1974). Objectives for instruction and evaluation. Boston: Allyn and Bacon, 114-142. Kibler et al. Include a discussion of norm versus criterion referenced assessment and the use of mastery learning strateges.
Lathrop, R.L. (1983). The number of performance assessment necessary to determine comperence. Journal of Intructional Development, 6,3. 26-31. Lathrop presents a statistical methodology for determining which student are master and which are not through the use of sequential testing procedures.
Millman , J. (1974). Criterion referenced measurement. In Popham, W.J. (Ed) Evaluation in education: Current application. Berkeley, CA: Mc Cutchan Puplishing. 309-398. The discussing of the criterion referenced and domain referenced testing is extensive and includes some of the quantitative, as well as qualitative, issues associated with them.
Payne,D.A. (1974)The assessment of learning: Cognitive and affective. Lexington, MA:D.C. Heath. This is an excellent text that relates various types of test items to the varieties of instructional objectives. It emphasizes tecniques for writing effective test items.
Dick,W.,&Carey,L. (1978). The Systematic Design of Instruction. Third Edition. The chapter 7, Developing Crriterion Referenced Test Item, 122-156. Harper Collins Publisher
      


CHAFTER TGS 2: File@Mahuri 2010




CHAFTER TGS 2: File@Mahuri 2010

 

Tidak ada komentar:

Poskan Komentar