Jenis Evaluasi Pembelajaran dan Bentuk Penilaian yang Baik

jenis evaluasi pembelajaran

Jenis-jenis Evaluasi Pembelajaran & Bentuk Penilaiannya-Salah satu cara yang dapat dilakukan untuk mengetahui capaian hasil belajar peserta didik adalah melalui evaluasi pendidikan dalam proses pembelajaran.

Evaluasi merupakan subsistem yang sangat penting dan sangat di butuhkan dalam setiap sistem pendidikan, karena evaluasi dapat mencerminkan seberapa jauh perkembangan atau kemajuan hasil pendidikan yang telah dilaksanakan.

Dalam setiap pembelajaran, pendidik harus berusaha mengetahui hasil dari proses pembelajaran yang ia lakukan.

Pentingnya diketahui hasil ini, karena dapat menjadi salah satu patokan bagi pendidik untuk mengetahui sejauh mana proses pembelajaran yang dia lakukan dapat mengembangkan potensi peserta didik.

Ada beberapa jenis evaluasi pembelajaran yang perlu kita ketahui bersama. Artikel ini bermaksud untuk menyajikan jenis-jenis evaluasi pembelajaran tersebut beserta bentuk evaluasi hasil belajar yang dapat dilaksanakan.

Selamat membaca!

Jenis-jenis Evaluasi Pembelajaran
Evaluasi Pembelajaran

1. Jenis Evaluasi Pembelajaran Berdasarkan Tujuan

Berdasarkan tujuannya, jenis evaluasi pembelajaran dapat dibedakan menjadi 5, sebagaimana berikut:

a. Evaluasi diagnostik

Evaluasi diagnostik adalah evaluasi yang di tujukan untuk menelaah kelemahan-kelemahan peserta didik beserta faktor-faktor penyebabnya.

b. Evaluasi selektif

Evaluasi selektif adalah evaluasi yang di gunakan untuk memilih peserta didik yang paling tepat sesuai dengan kriteria program kegiatan tertentu.

c. Evaluasi penempatan

Evaluasi penempatan adalah evaluasi yang digunakan untuk menempatkan peserta didik dalam program pendidikan tertentu yang sesuai dengan karakteristik peserta didik

d. Evaluasi formatif

Evaluasi formatif adalah evaluasi yang dilaksanakan untuk memperbaiki dan meningkatkan proses belajar dan mengajar.

Evaluasi formatif ini dilaksanakan pada setiap kali satuan program pelajaran atau subpokok bahasan dapat diselesaikan, dengan tujuan untuk mengetahui sejauh mana peserta didik telah mampu menguasai (memiliki kompetensi) sesuai dengan tujuan pengajaran yang telah ditentukan.

e. Evaluasi sumatif

Evaluasi sumatif adalah evaluasi yang dilakukan untuk menentukan hasil dan kemajuan belajar peserta didik.

Evaluasi ini dilaksanakan setelah sekumpulan program pelajaran selesai diberikan (berakhir), tujuan utama dari evaluasi sumatif ini adalah untuk menentukan keberhasilan peserta didik, setelah mereka menempuh program pengajaran.

2. Jenis Evaluasi Pembelajaran Berdasarkan Sasaran

Berdasarkan sasarannya, jenis evaluasi pembelajaran bisa dibedakan menjadi 5, yaitu:

a. Evaluasi konteks

Evaluasi yang ditujukan untuk mengukur konteks program baik mengenai rasional tujuan, latar belakang program, maupun kebutuhan-kebutuhan yang muncul dalam perencanaan

b. Evaluasi input

Evaluasi yang diarahkan untuk mengetahui input baik sumber daya maupun strategi yang digunakan untuk mencapai tujuan.

c. Evaluasi proses

Evaluasi yang di tujukan untuk melihat proses pelaksanaan, baik mengenai kelancaran proses, kesesuaian dengan rencana, faktor pendukung dan faktor hambatan yang muncul dalam proses pelaksanaan, dan sejenisnya.

d. Evaluasi hasil atau produk

Evaluasi yang diarahkan untuk melihat hasil program yang dicapai sebagai dasar untuk menentukan keputusan akhir, diperbaiki, dimodifikasi, ditingkatkan atau dihentikan.

e. Evaluasi outcom atau lulusan

Evaluasi yang diarahkan untuk melihat hasil belajar siswa lebih lanjut, yakni evaluasi lulusan setelah terjun ke masyarakat.

3. Jenis Evalusi Berdasarkan Lingkup Kegiatan Pembelajaran

Berdasarkan lingkup kegiatan pembelajaran, jenis evaluasi pembelajaran dapa dibedakan menjadi 3, yaitu:

a. Evaluasi program pembelajaran

Evaluasi yang mencakup terhadap tujuan pembelajaran, isi program pembelajaran, strategi belajar mengajar, aspek-aspek program pembelajaran yang lain.

b. Evaluasi proses pembelajaran

Evaluasi yang mencakup kesesuaian antara proses pembelajaran dengan garis-garis besar program pembelajaran yang di tetapkan, kemampuan guru dalam melaksanakan proses pembelajaran, kemampuan siswa dalam mengikuti proses
pembelajaran.

c. Evaluasi hasil pembelajaran

Evaluasi hasil belajar mencakup tingkat penguasaan peserta didik terhadap tujuan pembelajaran yang ditetapkan, baik umum maupun khusus, ditinjau dalam aspek kognitif, afektif, psikomotorik.

4. Jenis evaluasi berdasarkan objek dan subjek evaluasi

Berdasarkan objeknya jenis evaluasi dapat dibedakan menjadi 3, yaitu:
a. Evaluasi input

Evaluasi terhadap siswa mencakup kemampuan kepribadian, sikap, keyakinan.

b. Evaluasi transformasi

Evaluasi terhadap unsur-unsur transformasi proses pembelajaran antara lain materi, media, metode dan lain-lain.

c. Evaluasi output

Evaluasi terhadap lulusan yang mengacu pada ketercapaian hasil pembelajaran.

Jika ditinjau berdasarkan subjeknya, jenis evaluasi pembelajaran dapat dibedakan menjadi 2, yaitu:

a. Evaluasi internal

Evaluasi yang dilakukan oleh orang dalam sekolah sebagai evaluator, misalnya guru.

b. Evaluasi eksternal

Evaluasi yang dilakukan oleh orang luar sekolah sebagai evaluator, misalnya orangtua, masyarakat.

Bentuk Evaluasi

Setelah kita mengetahui jenis-jenis evaluasi, sekarang kami sajikan mengenai bentuk-bentuk evaluasinya:

1. Evaluasi Formatif

Evaluasi yang dilakukan pada setiap akhir pembahasan suatu pokok bahasan/topic, dan di maksudkan untuk mengetahui sejauh manakah proses pembelajaran telah berjalan sebagaimana yang direncanakan.

Winkel menyatakan evaluasi formatif adalah penggunaan tes-tes selama proses pembelajaran yang masih berlangsung, agar siswa dan guru memperoleh informasi mengenai kemajuan yang telah di capai

Baca Juga:  Makna dan Lirik Lagu Hymne Guru Menurut Islam

Sementara Tesmer menyatakan evaluasi formatif adalah untuk mengontrol sampai sejauh mana siswa menguasai materi yang di ajarkan pada pokok pembahasan tersebut.

2. Evaluasi Sumatif

Evaluasi sumatif adalah evaluasi yang dilakukan pada setiap akhir satu satuan waktu yang didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk mengetahui sejauh mana peserta didik telah dapat berpindah dari satu unit ke unit yang berikutnya.

3. Evaluasi Diagnostic

Evaluasi diagnostic adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan dan kelemahan yang ada pada siswa sehingga dapat di berikan perlakuan yang tepat.

Syarat-syarat Alat Penilaian Yang Baik

Sebuah instrumen evaluasi hasil belajar hendaknya memenuhi syarat sebelum di gunakan untuk mengevaluasi atau mengadakan penilaian agar terhindar dari kesalahan dan hasil yang tidak valid (tidak sesuai kenyataan sebenarnya).

Alat evaluasi yang kurang baik dapat mengakibatkan hasil penilaian menjadi bias atau tidak sesuai nya hasil penilaian dengan kenyataan yang sebenarnya, seperti contoh anak yang pintar dinilai tidak mampu atau sebaliknya.

Jika terjadi demikian perlu ditanyakan apakah persyaratan instrumen yang digunakan menilai sudah sesuai dengan kaidah-kaidah penyusunan instrumen.

Instrumen evaluasi yang baik memiliki ciri-ciri dan harus memenuhi beberapa kaidah antara lain:

  • Validitas
  • Reliabilitas

Validitas dan Reliabilitas

1. Validitas

Menurut Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.

Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut.

Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.

Terkandung di sini pengertian bahwa ketepatan validitas pada suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat.

Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi.

Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B (Azwar 1986).

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.

Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya mengenai perbedaan yang satu dengan yang lain.

Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannya valid, yaitu tepat dan cermat.

Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.

Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror.

Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan yang sebenarnya (Azwar 1986).

Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran.

Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam “alat ukur ini valid” adalah kurang lengkap.

Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana? (Azwar 1986)

Pengertian validitas menurut Walizer (1987) adalah tingkaat kesesuaian antara suatu batasan konseptual yang diberikan dengan bantuan operasional yang telah dikembangkan.

Menurut Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan instrumen itu untuk mengukur atau mengungkap karakteristik dari variabel yang dimaksudkan untuk diukur.

Instrumen yang dimaksudkan untuk mengukur sikap konsumen terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap yang memang menunjukkan sikap konsumen terhadap iklan tersebut.

Jadi, jangan sampai hasil yang diperoleh adalah skor yang menunjukkan minat konsumen terhadap iklan itu.

Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat, persepsi, motivasi, dan lain sebagainya.

Untuk mengukur variabel yang demikian sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena karakteristik yang akan diukur dari variabel yang demikian tidak dapat diobservasi secara langsung, tetapi hanya melalui indikator (petunjuk tak langsung) tertentu. (Aritonang R. 2007)

Menurut Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur. Bila seseorang ingin mengukur berat suatu benda, maka dia harus menggunakan timbangan.

Baca Juga:  Cara Berpikir Kritis & Prosesnya Menurut Ahli [Milton Keynes]

Timbangan adalah alat pengukur yang valid bila dipakai untuk mengukur berat, karena timbangan memang mengukur berat. Bila panjang sesuatu benda yang ingin diukur, maka dia harus menggunakan meteran.

Meteran adalah alat pengukur yang valid bila digunakan untuk mengukur panjang, karena memang meteran mengukur panjang. Tetapi timbangan bukanlah alat pengukur yang valid bilamana digunakan untuk mengukur panjang.

Sekiranya peneliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka kuesioner yang disusunnya harus mengukur apa yang ingin diukurnya.

Setelah kuesioner tersebut tersusun dan teruji validitasnya, dalam praktek belum tentu data yang dikumpulkan adalah data yang valid.

Banyak hal-hal lain yang akan mengurangi validitas data; misalnya apakah si pewawancara yang mengumpulkan data betul-betul mengikuti petunjuk yang telah ditetapkan dalam kuesioner. (Masri Singarimbun)

Menurut Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur.

Menurut Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja melekat pada tes itu sendiri, tapi tergantung penggunaan dan subyeknya.

2. Reliabilitas

Menurut Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan.

Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliable.

Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.

Menurut Brennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.

Menurut Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan.

Dalam pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang.

Dengan demikian, keandalan sebuah alat ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan dan keterbatasan (Feldt & Brennan, 1989: 105)

Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai).

Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur.

Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama.

Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.

Pengukuran reliabilitas dapat dilakukan dengan menggunakan berbagai alat statistik (Feldt & Brennan, 1989: 105)

Berdasarkan sejarah, reliabilitas sebuah instrumen dapat dihitung melalui dua cara yaitu kesalahan baku pengukuran dan koefisien reliabilitas (Feldt & Brennan: 105).

Kedua statistik di atas memiliki keterbatasannya masing-masing. Kesalahan pengukuran merupakan rangkuman inkonsistensi peserta tes dalam unit-unit skala skor sedangkan koefisien reliabilitas merupakan kuantifikasi reliabilitas dengan merangkum konsistensi (atau inkonsistensi) diantara beberapa kesalahan pengukuran.

Dalam kerangka teori tes klasik, suatu tes dapat dikatakan memiliki reliabilitas yang tinggi apabila skor tampak tes tersebut berkorelasi tinggi dengan skor murninya sendiri.

Interpretasi lainnya adalah seberapa tinggi korelasi antara skor tampak pada dua tes yang pararel. (Saifuddin Azwar, 2006: 29).

Reliabilitas menurut Ross E. Traub (1994: 38) yang disimbolkan oleh dapat didefinisikan sebagai rasio antara varian skor murni dan varian skor tampak secara matematis teori di atas dapat ditulis: Reliabilitas alat ukur tidak dapat diketahui dengan pasti tetapi dapat diperkirakan.

Dalam mengestimasi reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu (1) pendekatan tes ulang, (2) pendekatan dengan tes pararel dan (3) pendekatan satu kali pengukuran.

Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda.

Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas.

Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada pemberian tes kedua.

Pendekatan tes ulang sangat sesuai untuk mengukur ketrampilan terutama ketrampilan fisik.

Misalnya seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah melakukan dua kali pengukuran didapatkan skor tes sebagai berikut:

Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut:

Dengan demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes cukup tinggi. Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over effect.

Baca Juga:  Pembelajaran Blended Learning; Desain Penerapan di Era New Normal

Masalah ini disebabkan oleh adanya kemungkinan pada test yang kedua dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan soal-soal dan bahkan jawaban ketika dilakukan test pertama.

Hal ini dapat meningkatkan korelasi serta overestimasi terhadap PXX’. Ross E. Traub (1994: 38)

Jenis-jenis Reliabilitas

Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:

a. Relibilitas stabilitas.

Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya.

Reliabilitas ini menyangkut penggunaan indikator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.

b. Reliabilitas ekivalen.

Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama.

Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indikator yang berbeda, batasan-batasan operasional, peralatan pengumpulan data, dan / atau pengamat-pengamat.

Menguji reliabilitas dengan menggunakan ukuran ekuivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survei.

Apabila satu rangkaian pertanyaan yang mengukur satu variabel dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.)

Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan.

Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekuivalen dapat juga diukur dengan menggunakan teknik pengukuran yang berbeda.

Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

Metode pengujian reliabilitas

Tiga teknik pengujian realibilitas instrumen antara lain :

1. Teknik Paralel (Paralel Form atau Alternate Form) Teknik paralel disebut juga tenik ”double test double trial”.

Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang parallel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu buah kisi-kisi.

Setiap butir soal dari instrumen yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua.

Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).

2. Teknik Ulang (Test Re-test) Disebut juga teknik ”single test double trial”.

Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.

Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besar derajat skor tes konsisten dari waktu ke waktu.

Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.

Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain.

Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara.

Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.

Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu.

Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putus dan terbaik.

Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.

Dari pembahasan tentang evaluasi, maka dapat ditarik kesimpulan bahwa dalam menggunakan konsep evaluasi dalam kaitannya dengan segala aspek,  maka ada beberapa pokok  yang harus dipegang yaitu: jenis dan bentuk evaluasi, alat penilaian yang baik, validitas dan relibialitas.

DAFTAR PUSTAKA

  • Daryanto. 1997. Evaluasi Pendidikan. Solo: Rineka Cipta.
  • Purwanto, Ngalim. 1984. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung : PT Remaja Rosdakarya.
  • Sanjaya, Wina. 2008. Kurikulum dan Pembelajaran. Bandung: Kencana Prenada Media Group.
  • Sukardi. 2008. Evaluasi Pendidikan. Yogyakarta. Bumi Aksara

You May Also Like

About the Author: Ageng Triyono

Curriculum Researcher & Developer | Guru Kampung | Penulis Lepas

Leave a Reply

Your email address will not be published. Required fields are marked *