Tes ini terdiri dari empat blok pertanyaan yang memungkinkan Anda untuk mengidentifikasi tingkat kompetensi guru dalam empat komponennya: kompetensi profesional - Dokumen. Kualitas pendidikan Sebuah komponen yang tidak termasuk dalam struktur Kim Ege

"KIM- ini adalah pekerjaan ujian standar yang dibuat sesuai dengan persyaratan teori pengukuran pedagogis, yang memungkinkan, dengan objektivitas dan keandalan yang memadai, untuk melakukan sertifikasi negara independen untuk lulusan lembaga pendidikan umum dan pemilihan pelamar universitas.

Saat menyusun KIM, ditentukan rasio efektif penggunaan berbagai bentuk tugas dalam ujian sertifikasi akhir lulusan. Pada saat yang sama, pengalaman bertahun-tahun rekan asing diperhitungkan. Untuk memastikan kontrol yang efektif dari pengetahuan dan keterampilan lulusan sekolah nasional, diputuskan untuk memasukkan berbagai bentuk tugas dalam KIM: tugas dengan pilihan jawaban yang benar, tugas tambahan dan tugas dengan jawaban rinci gratis. (tanggapan berupa esai, resensi, analisis teks).

KIM dalam berbagai mata pelajaran mencakup tiga bagian - A, B, C. Setiap bagian terdiri dari tugas yang dikelompokkan menurut bentuknya. Jumlah total tugas berkisar antara 25 hingga 70.

Bagian A menawarkan tugas dengan pilihan jawaban (tugas tipe tertutup). Tugas-tugas ini cukup mudah dan ditujukan untuk menguji pengetahuan materi faktual, aturan, rumus, definisi, dll. Proporsi tugas tersebut bervariasi tergantung pada subjek. Mereka mungkin mendominasi secara kuantitatif atas jenis tugas lain, tetapi koefisien bobot tugas tersebut kurang, yaitu. dalam total skor tertimbang untuk menyelesaikan satu tugas tipe A, poin yang diberikan lebih sedikit daripada untuk menyelesaikan tugas tipe lain.

Bagian B terdiri dari tugas-tugas tipe terbuka - dari tugas-tugas untuk penambahan dalam bentuk angka atau satu kata. Dalam tugas-tugas ini, subjek sendiri membangun jawaban yang benar, berbeda dengan tugas-tugas tipe tertutup, di mana jawabannya telah diberikan dan hanya perlu untuk menentukan yang benar. Sebagai aturan, tugas-tugas ini lebih sulit daripada tugas-tugas bagian A, sehingga koefisien bobotnya lebih tinggi.

Tugas bagian A dan B dirancang sedemikian rupa sehingga pengujian berlangsung dalam mode komputer.

PADA bagian C diberikan tugas yang melibatkan jawaban rinci gratis. Ini bisa menjadi solusi lengkap untuk masalah matematika atau menulis teks. Bagian C tugas menguji kemampuan lulusan untuk berpikir, menalar topik yang diberikan, merumuskan dan mengungkapkan pemikirannya secara benar secara tertulis. Bagian dari tes ini diverifikasi oleh para ahli independen. Ini membutuhkan biaya bahan tambahan dan, sampai batas tertentu, memungkinkan untuk mempengaruhi penilaian bagian C, tetapi, bagaimanapun, dimasukkannya bagian ini dalam KIM meningkatkan kemungkinan pengujian berbagai pengetahuan dan keterampilan lulusan.

Catatan. Di kelas praktis, pertimbangkan contoh KIM untuk Unified State Examination dan GIA dalam disiplin ilmu tertentu (matematika, fisika, ilmu komputer, sejarah, teknologi, dll.).

1. Bakhusova E.V., Korostelev A.A., Monakhov V.M. dll. Teknologi V.M. Monakhova - alat didaktik untuk modernisasi pendidikan: Proc. Keuntungan. - M.-Togliatti: Volzhsky un-t im. V.N. Tatishcheva, 2004. - 60 hal.

3. Episheva O.B. Teknologi pengajaran matematika berdasarkan pendekatan aktivitas: Buku. untuk guru / O.B. Epishev. – M.: Pencerahan. 2003. - 223 hal. (B-ka guru).

4. Zvonnikov V.I. Cara modern untuk mengevaluasi hasil belajar: buku teks untuk siswa lembaga pendidikan tinggi / V.I. Zvonnikov, M.B. Chelyshkov. - M.: Pusat Penerbitan "Academy", 2007. - 224 hal.

5. Kualitas pendidikan. Prestasi. Masalah. Prosiding Konferensi Ilmiah dan Metodologi Internasional IV / Ed. SEBAGAI. Vostrikov. - Novosibirsk: NGTU, 2001.-433p.

6. Klarin. M.V. Pendekatan teknologi untuk pembelajaran // Teknologi sekolah. 5. 2003. - S. 3 - 22.

7. Mayorov A.N. Tes dan jenisnya. Tes prestasi. Teknologi sekolah. - No. 4. - 1998. - Hal. 176.

9. Manko N.N. Kompetensi teknologi guru // Teknologi sekolah. 2002. No. 5. - S. 33 - 41.

10. Monakhov V.M. Basis teknologi untuk merancang dan membangun proses pendidikan. - Volgograd: Perubahan. 1995. - 152 hal.

12. Potashnik M.M. Kualitas Pendidikan: Masalah dan Teknologi Manajemen (Dalam Tanya Jawab). - M.: Masyarakat Pedagogis Rusia, 2002. - 352 hal.

13. Strategi modernisasi konten pendidikan umum: Bahan untuk pengembangan dokumen untuk pembaruan pendidikan umum. - M.: OOO "Dunia Buku", 2001. - 66 hal.

14. Chernilevsky D.V., Filatov O.K. Teknologi pengajaran di pendidikan tinggi: Proc. edisi / Ed. D.V. Chernilevsky.- M.: "Penerus", 1996. - 288 hal.

15. Yansufina Z.I. Meningkatkan persiapan metodologis guru matematika masa depan di universitas pelatihan guru berdasarkan pendekatan inovatif untuk mengajar: Proc. tunjangan untuk mahasiswa universitas pedagogis dalam spesialisasi 010100 - Matematika. - Tobolsk: TSPI im. DI. Mendeleeva, 2004. - 156 hal.

16. Chelyshkova M.B., Khlebnikov V.A. Pendekatan utama untuk menilai kualitas pelatihan siswa // Masalah kualitas, regulasi dan standarnya dalam pendidikan: Sat. ilmiah Seni. M., 1999

17. Chelyshkova M.B. Pengembangan tes pedagogik berdasarkan model matematika modern. M., 1995

18. Chelyshkova M.B., Saveliev B.A. Pedoman pengembangan tes pedagogis untuk penilaian komprehensif kesiapan siswa di universitas. M., 1995

Kuliah 1 Konsep mutu pendidikan. Evaluasi hasil belajar sebagai salah satu unsur manajemen mutu. Cara tradisional dan baru untuk menilai hasil belajar………………………………………………………………………………………………3

Kuliah 3 Sejarah perkembangan sistem pengujian di luar negeri dan di Rusia ………………………………………………………………………………………..…… ..8

Kuliah 4 Tes pedagogis. Istilah dan Definisi. Klasifikasi tes pedagogik ……………………………….…………………………………….12

Kuliah 5 Jenis, bentuk dan jenis tugas tes ….………………………………..15

Latihan 1…………………………………………………………..……16

Kuliah 6 Tahapan utama dalam pengembangan tes pedagogis ………………………………………………….21

Kuliah 7 Melakukan uji coba. Indikator kualitas tes…………………………..…………………………………………………………….25

Latihan 2………………………………………………………………..29

Kuliah 8 Teori desain pengujian modern …………………………….33

Kuliah 9 Standarisasi pengujian dan interpretasi hasil pengujian. PENGGUNAAN dan kualitas pendidikan…………………….……………………………………………………… 34

Spesifikasi

mengontrol bahan pengukuran

untuk mengadakan ujian negara bersatu pada tahun 2012

tentang sastra

1. Penunjukan KIM USE

Unified State Examination (selanjutnya disebut USE) adalah bentuk penilaian objektif terhadap kualitas pelatihan orang yang telah menguasai program pendidikan menengah (lengkap) pendidikan umum, menggunakan tugas dalam bentuk standar (bahan pengukur kontrol) .

Bahan pengukur kontrol memungkinkan untuk menetapkan tingkat perkembangan oleh lulusan komponen Federal dari standar negara bagian pendidikan umum menengah (lengkap).

Hasil ujian negara terpadu dalam sastra diakui oleh lembaga pendidikan pendidikan kejuruan menengah dan lembaga pendidikan pendidikan tinggi profesional sebagai hasil ujian masuk sastra.

2. Dokumen yang mendefinisikan konten KIM USE

Isi pekerjaan ujian ditentukan berdasarkan komponen Federal dari standar negara bagian pendidikan umum (Perintah Kementerian Pendidikan Rusia tertanggal 05.03.2004 No. 1089). Beberapa posisi dari dokumen ini ditentukan berdasarkan konten minimum Wajib dari pendidikan umum dasar dan menengah (lengkap) dalam literatur, disetujui oleh perintah Kementerian Pendidikan Rusia tanggal 19.05.1998 No. 1236 dan tanggal 06.30.1999 No. 56 (pembenaran diberikan dalam catatan penjelasan untuk pengkode unsur konten dan persyaratan untuk tingkat persiapan lulusan lembaga pendidikan untuk ujian negara terpadu dalam sastra tahun 2012).

3. Pendekatan pemilihan konten, pengembangan struktur KIM USE

Prinsip-prinsip untuk memilih konten dan mengembangkan struktur KIM USE dalam literatur sesuai dengan tujuan untuk memperoleh informasi yang objektif dan dapat diandalkan tentang kesiapan lulusan untuk melanjutkan pendidikan di lembaga pendidikan menengah khusus dan pendidikan profesional yang lebih tinggi dalam humaniora.

Peningkatan jangka panjang dari KIM USE dalam literatur mengarah pada menemukan struktur optimal pekerjaan pemeriksaan, menciptakan sistem yang andal untuk mengevaluasinya, memastikan objektivitas hasil ujian. Jumlah tugas yang menguji pengetahuan tentang fakta sastra tertentu berkurang (pada tahun 2007, tugas dengan pilihan jawaban dihapus dari model pemeriksaan: eksperimen menunjukkan ketidakefisienannya, "keterasingan" dalam kaitannya dengan sastra, pengetahuan-sentris yang tidak dapat dibenarkan, pendekatan "faktual" dalam pelaksanaan sertifikasi negara (final) dalam sastra), jumlah tugas dengan jawaban terperinci, terkait dengan masalah moral karya seni, dikembangkan, tipologi tugas dengan orientasi konten yang berbeda dikembangkan , kriteria penilaian ditentukan, rasio optimal tugas dari berbagai jenis dalam struktur pekerjaan pemeriksaan ditentukan, dll.

Setiap versi KIM mencakup tugas-tugas yang berbeda baik dalam bentuk presentasi maupun dalam tingkat kerumitan tugas, yang pemenuhannya mengungkapkan tingkat asimilasi oleh peserta USE dari elemen-elemen utama konten berbagai bagian kursus, tingkat pembentukan kompetensi mata pelajaran dan keterampilan pendidikan umum.

Jadi, ketika lulus ujian sastra, peserta ujian diharuskan untuk mengaktifkan jenis kegiatan pendidikan yang paling signifikan untuk subjek: pemahaman analitis dari teks sastra, interpretasinya, mencari alasan untuk membandingkan fenomena dan fakta sastra, menulis jawaban yang masuk akal. untuk pertanyaan yang bermasalah, dll.

Hasil Unified State Examination dalam Sastra menegaskan bahwa model ujian saat ini dalam sastra memungkinkan untuk menilai secara memadai prestasi pendidikan lulusan dalam mata pelajaran, untuk mengidentifikasi tingkat pembentukan keterampilan mata pelajaran dasar dan super-mata pelajaran di antara lulusan. Ujian dalam bentuk ini memungkinkan untuk membedakan peserta USE berdasarkan tingkat persiapan mata pelajaran mereka, dan memberikan alasan obyektif bagi universitas dan perguruan tinggi untuk memilih pelamar.

4. Struktur PENGGUNAAN KIM

Pekerjaan ujian dalam sastra didasarkan pada sistem pengujian tahap demi tahap kemampuan lulusan untuk memahami dan menganalisis karya seni dalam kekhususan genre-generik mereka, berdasarkan pengetahuan tentang sifat historis-sastra dan teoritis-sastra. Persiapan ujian dalam sastra melibatkan pengulangan oleh siswa dari seluruh materi pelajaran, yang isinya ditentukan oleh dokumen normatif tentang subjek tersebut.

Dalam pekerjaan ujian, tiga bagian dibedakan, berisi serangkaian tugas untuk menentukan tingkat persiapan lulusan dalam sastra.

Pada bagian 1 dan 2, diusulkan untuk menyelesaikan tugas yang mencakup pertanyaan untuk analisis karya sastra. Kemampuan lulusan untuk menentukan unsur-unsur utama isi dan struktur artistik karya yang dipelajari (tema dan masalah, pahlawan dan peristiwa, teknik artistik, berbagai jenis kiasan, dll.) diperiksa, serta mempertimbangkan karya sastra tertentu. dalam hubungannya dengan materi pelajaran.

Struktur umum dari dua bagian pertama dari karya tersebut berada di bawah tugas cakupan materi sastra yang luas dan bermakna. Teks sastra yang ditawarkan untuk analisis memungkinkan untuk menguji tidak hanya pengetahuan tentang karya-karya tertentu oleh lulusan, tetapi juga kemampuan untuk menganalisis teks, dengan mempertimbangkan genre-nya. Tugas terakhir di bagian 1 dan 2 dari karya ini melibatkan memasuki konteks sastra yang luas (membuktikan hubungan teks artistik ini dengan karya-karya lain sesuai dengan aspek perbandingan yang ditentukan dalam tugas). Dengan demikian, mengandalkan koneksi intra-mata pelajaran dari kursus yang dipelajari memungkinkan cakupan tambahan dari konten bahan sastra yang sedang diperiksa.

Bagian 1, yang melibatkan analisis fragmen dari sebuah epik, atau lirik-epik, atau karya dramatis, terdiri dari 9 tugas:

7 tugas dengan jawaban singkat (B), membutuhkan penulisan kata, atau frasa, atau urutan angka;

2 tugas (C1, C2) membutuhkan penulisan teks yang padu sebanyak 5-10 kalimat.

Bagian 2, yang melibatkan analisis karya liris (puisi atau penggalan puisi liris), terdiri dari 7 tugas:

5 tugas dengan jawaban singkat (B), membutuhkan penulisan kata, atau frasa, atau urutan angka;

2 tugas (C3, C4) membutuhkan penulisan teks yang runtut sebanyak 5-10 kalimat.

Persyaratan untuk menyelesaikan tugas bagian 1 dan bagian 2 adalah sama.

Mengikuti algoritma kerja yang diusulkan memungkinkan peserta ujian untuk mengidentifikasi tempat dan peran episode (adegan) dalam keseluruhan struktur karya (analisis fragmen), mengungkapkan fitur komposisi plot, figuratif-tema dan gaya dari teks yang dianalisis, menggeneralisasi pengamatan mereka dengan akses ke konteks sastra.

Bagian 3 dari pekerjaan mengharuskan peserta ujian untuk memiliki pernyataan rinci lengkap tentang topik sastra (dengan demikian, komponen lain yang bermakna dari kursus yang diuji ditambahkan ke materi sastra yang dikerjakan di bagian 1 dan 2). Lulusan ditanyai 3 pertanyaan (C5.1–C5.3), yang mencakup tonggak terpenting dalam proses sejarah dan sastra domestik: 1 - tentang karya sastra Rusia kuno, klasik abad ke-18. dan paruh pertama abad ke-19; 2 - berdasarkan karya paruh kedua abad ke-19; 3 - berdasarkan karya abad XX. Lulusan hanya memilih salah satu pertanyaan dan memberikan jawabannya dalam bentuk esai, memperkuat penilaiannya dengan merujuk pada karya (dari ingatan). Karya jenis ini memberi lulusan kesempatan untuk mengekspresikan sikapnya terhadap masalah yang diangkat oleh penulis, memahami orisinalitas artistik dari karya tersebut. Menulis esai membutuhkan kemandirian kognitif yang besar dan sebagian besar memenuhi spesifikasi sastra sebagai bentuk seni dan disiplin akademik, yang bertujuan untuk membentuk pembaca yang berkualitas dengan selera estetika yang berkembang dan kebutuhan untuk pengembangan spiritual, moral dan budaya. .

Di bawah ini adalah tabel yang menunjukkan pembagian tugas berdasarkan bagian-bagian kertas ujian.

Tabel 1

Pembagian tugas berdasarkan bagian kertas ujian

Bagian dari pekerjaan	Jenis pekerjaan	Jumlah pekerjaan	Pratama Maks	Persentase nilai utama maksimum untuk tugas-tugas di bagian ini dari nilai utama maksimum untuk seluruh pekerjaan, sama dengan 42
	Dengan jawaban singkat

	Dengan jawaban singkat
	Dengan respons terperinci dari ruang lingkup terbatas
	Dengan jawaban yang diperluas
Total:

Secara struktural, bagian 1 dan 2 dari pekerjaan ujian dibangun dalam langkah-langkah: dari pertanyaan tingkat dasar yang ditujukan untuk menguji pengetahuan teoretis dan sastra (bagian 1: B1–B7, bagian 2: B8–B12), hingga tugas-tugas tingkat lanjutan dari a tipe generalisasi (bagian 1: C1–C2, bagian 2: C3–C4). Bagian 3 mencakup tugas alternatif dengan tingkat kerumitan yang tinggi (C5.1-C5.3), yang sebagian besar mencerminkan persyaratan standar tingkat profil.

Struktur dan konten KIM USE

Untuk PENGGUNAAN KIM dalam mode normal stabilitas tertentu(secara umum, struktur dan konten KIM USE di sebagian besar mata pelajaran dipertahankan dari tahun ke tahun).

Penyesuaian yang diperlukan untuk struktur dan isi pekerjaan(mengubah jumlah tugas, memperkuat komponen yang berorientasi pada praktik, meningkatkan proporsi tugas yang membutuhkan ketergantungan pada pemikiran logis, kemampuan untuk menarik kesimpulan, dll.) diperkenalkan secara bertahap setelah diskusi publik yang luas dan studi percontohan.

Di mana KIM USE setiap tahun sedang ditingkatkan untuk setiap mata pelajaran pendidikan umum:

Kata-kata tugas dan pendekatan untuk pemilihan bahan ujian sedang diklarifikasi,

Sistem untuk mengevaluasi tugas individu dan pekerjaan ujian secara keseluruhan sedang diperbaiki.

PENGGUNAAN KIM 2012 meningkat dibandingkan dengan KIM 2011 di semua mata pelajaran (paling signifikan - dalam ilmu komputer dan TIK, sejarah dan sastra).

Area utama untuk perbaikan adalah sebagai berikut:

Pengurangan jumlah soal pilihan ganda di KIM dalam sejarah, studi sosial, kimia, geografi.

Menambahkan tugas baru ke KIM dalam sejarah, matematika, sastra, biologi, geografi, ilmu sosial, ilmu komputer dan TIK.

Berbagai keterampilan yang diuji dalam fisika, kimia, sejarah, ilmu sosial, geografi.

Peningkatan kriteria untuk mengevaluasi tugas dengan jawaban terperinci dalam sejarah, sastra, ilmu sosial, fisika, kimia, bahasa Rusia dan bahasa asing.

Kata-kata dan persyaratan tugas telah diklarifikasi di KIM di semua mata pelajaran.

KIM 2012 ditandai dengan:

pengurangan jumlah tugas yang bersifat reproduktif;
peningkatan jumlah tugas untuk mengidentifikasi tingkat pemahaman oleh lulusan elemen utama dari konten program pelatihan, menilai pembentukan keterampilan untuk menerapkan pengetahuan yang diperoleh dalam berbagai situasi, menganalisis dan menggeneralisasi informasi, mengekspresikan dan memperdebatkan penilaian nilai .

Tabel rangkuman tersebut mencantumkan perubahan struktur, isi, dan sistem penilaian kertas ujian Unified State Examination tahun 2012 untuk setiap mata pelajaran pendidikan umum.

Perubahan KIM 2012

Bahasa Rusia -

Format tugas A2 telah diubah.
Tugas A26 telah dipindahkan ke posisi A6 di blok tugas yang memeriksa norma tata bahasa.
Kata-kata tugas C1 telah diklarifikasi.
Kriteria untuk memeriksa dan mengevaluasi kinerja tugas dengan jawaban rinci telah ditentukan (kriteria K2, menghitung kata dalam esai).

Matematika -tidak ada perubahan mendasar.

Dua tugas telah ditambahkan ke bagian 1: satu tugas pada geometri (stereometri) dan satu tugas praktis tentang penggunaan model probabilistik. Dengan demikian, semua bagian dari kursus matematika akan disajikan dalam KIM USE sesuai dengan volume studi mereka di kursus sekolah menengah, signifikansinya dalam praktik dan untuk pendidikan berkelanjutan.
Subjek tugas C3 telah agak diperluas (tanpa mengubah kompleksitas) - tugas ini mungkin juga berisi sistem ketidaksetaraan.

biologi -tidak ada perubahan mendasar.

Pada posisi A36, format tugas baru dengan tingkat kerumitan yang meningkat diperkenalkan, yang mengontrol pengetahuan tentang pola biologis umum dan kemampuan untuk menganalisis, membandingkan, dan menentukan penilaian yang benar.
Pengetahuan tentang evolusi dunia organik dan pola ekologi pada tingkat lanjut dikendalikan oleh satu baris tugas (A35).
Pada bagian 2, jumlah tugas untuk membandingkan objek biologis, fenomena, proses meningkat dan jumlah tugas untuk menentukan urutan objek biologis, fenomena, proses berkurang.
Penambahan telah dibuat pada kata-kata tugas C5 dan C6: ketika memecahkan masalah dalam sitologi dan genetika, diusulkan untuk menjelaskan hasil yang diperoleh, untuk menunjukkan hukum mana yang memanifestasikan dirinya dalam kasus tertentu.

Kimia -tidak ada perubahan mendasar.

Jumlah tugas dengan pilihan jawaban telah dikurangi dari 30 menjadi 28 (alasan untuk mengurangi jumlah tugas adalah kenyataan bahwa penerapan beberapa di antaranya melibatkan penggunaan algoritma tindakan yang serupa untuk penerapan teori yang relevan. dan materi faktual).
Tugas C2, yang menguji pengetahuan tentang hubungan genetik zat anorganik dari berbagai kelas, diusulkan dalam dua format. Dalam beberapa versi CMM, itu akan ditawarkan dalam format lama, dan yang lain dalam yang baru, ketika kondisi tugas adalah deskripsi percobaan kimia tertentu, kursus yang harus dicerminkan oleh peserta ujian melalui persamaan dari reaksi yang sesuai.
Tugas C5 untuk menentukan rumus molekul suatu zat telah diperbaiki. Pemecahan masalah akan mencakup tiga operasi berturut-turut: menyusun skema reaksi kimia, menentukan rasio stoikiometrik reaktan dan menghitung berdasarkan mereka, yang mengarah pada pembentukan rumus molekul zat. Akibatnya, skor maksimum untuk menyelesaikan tugas ini telah meningkat dari 2 menjadi 3 poin.

Fisika– tidak ada perubahan mendasar.

Struktur varian CMM diubah dengan tetap mempertahankan jumlah total dan tipologi tugas: semua tugas dalam fisika termasuk dalam bagian 3 pekerjaan. Dengan demikian, Bagian 3 mencakup empat masalah komputasi dengan tingkat kerumitan yang meningkat dengan pilihan jawaban (A22-A25) dan enam tugas dengan jawaban terperinci - masalah kualitatif dengan tingkat kerumitan yang meningkat (C1) dan lima masalah komputasi dari tingkat tinggi (C2-C6). Dalam struktur seperti itu, "bagian universitas" dari Unified State Examination dalam fisika diwakili secara visual.
Kisaran keterampilan metodologis yang diuji telah diperluas, serta proporsi tugas menggunakan foto dan gambar pengaturan eksperimental telah ditingkatkan, yang akan memungkinkan untuk menolak "pencucian" eksperimen dari pengajaran fisika.
Kriteria untuk mengevaluasi tugas dengan jawaban terperinci telah ditingkatkan. Jadi, untuk tugas kualitatif, persyaratan untuk mencetak dua poin telah disesuaikan, dan persyaratan baru untuk jawaban benar yang lengkap telah diperkenalkan ke dalam sistem untuk mengevaluasi tugas komputasi.

Geografi – tidak ada perubahan mendasar.

1. Jumlah tugas di Bagian 1 telah dikurangi dari 25 menjadi 24. Dengan demikian, jumlah total tugas telah dikurangi dari 45 menjadi 44, dan skor utama maksimum untuk menyelesaikan semua tugas pekerjaan telah dikurangi dari 55 menjadi 54.

2. CIM 2012 mencakup tugas baru (B1) tingkat kerumitan dasar, yaitu menguji kemampuan membaca peta geografis berbagai konten.

3. Tugas yang menguji kemampuan untuk menggunakan pengetahuan tentang zona waktu dalam kegiatan praktis dan kehidupan sehari-hari untuk menentukan waktu standar telah dikecualikan karena adopsi Undang-Undang Federal tentang Ketepatan Waktu pada Juni 2011 (Sejak prosedur untuk menghitung waktu di wilayah tersebut Federasi Rusia akan diubah, termasuk dalam tugas kerja untuk menghitung waktu tidak mungkin, karena materi ini tidak dipelajari oleh lulusan 2012)

Cerita- perubahan signifikan (dalam struktur dan isi KIM)

Elemen utama kebaruan model pemeriksaan pada tahun 2012:

1. Struktur CIM telah dioptimalkan dan jumlah tugas yang bersifat reproduktif telah dikurangi (jumlah tugas dengan pilihan jawaban telah dikurangi dari 27 menjadi 21, jumlah tugas dengan jawaban singkat telah dikurangi dari 15 menjadi 12, dan jumlah tugas dengan jawaban terperinci telah dikurangi dari 7 menjadi 6;

2. meningkatkan jumlah tugas yang bertujuan untuk menguji kemampuan untuk mensistematisasikan fakta sejarah, membangun hubungan sebab akibat, struktural dan lainnya, menggunakan sumber informasi untuk memecahkan masalah kognitif, merumuskan dan memperdebatkan posisi sendiri dengan melibatkan pengetahuan sejarah; model tugas baru C6 telah dimasukkan (esai sejarah yang melibatkan analisis aktivitas orang bersejarah, tugas alternatif: lulusan memiliki kesempatan untuk memilih salah satu dari tiga tokoh dari era yang berbeda dan menunjukkan pengetahuan dan keterampilannya di bahan sejarah yang paling akrab));

3. arah umum peningkatan KIM adalah memperkuat blok tugas yang menguji kemampuan analisis dan informasi dan komunikasi lulusan; penciptaan dan pengenalan bertahap jenis tugas baru dengan jawaban terperinci untuk membedakan lulusan yang berencana untuk melanjutkan pendidikan di universitas dalam humaniora dengan berbagai tingkat persyaratan untuk persiapan historis lulusan secara lebih akurat.

Ilmu kemasyarakatan -tidak ada perubahan mendasar.

Jumlah tugas dengan pilihan jawaban berkurang (dari 22 menjadi 20).
Tugas B2 telah diperbaiki: diusulkan untuk memilih dua (sebelumnya satu) posisi yang keluar dari baris yang disajikan.
Pada posisi B8, tugas baru diperkenalkan untuk memilih konsep generalisasi untuk semua konsep lain yang disajikan dalam daftar.
Kriteria untuk menilai kinerja tugas C8 telah diperjelas. Menyelesaikan kinerja yang benar dari tugas ini pada tahun 2012 diperkirakan mencapai 3 poin.

Literatur - perubahan signifikan (dalam sistem penilaian).

Arah utama perubahan KIM USE 2012:

Berdasarkan hasil pengujian, tugas-tugas baru untuk menjalin korespondensi dan untuk pilihan ganda dari daftar dimasukkan ke dalam blok tugas tingkat kerumitan dasar untuk meningkatkan kemampuan membedakan bagian 1 dan 2 pekerjaan (total jumlah tugas dasar tetap tidak berubah: B1–B12).
Sistem untuk memeriksa dan mengevaluasi kinerja tugas yang memerlukan penulisan jawaban terperinci telah ditingkatkan secara signifikan.

Saat mengevaluasi tugas C1 dan C3 dalam Unified State Examination bidang Sastra 2012, desain pidato jawaban diperhitungkan.
Nama-nama kriteria telah diklarifikasi, kata-kata dari sebagian besar kriteria untuk tugas C1–C5 telah direvisi secara signifikan.
Kriteria untuk memeriksa dan mengevaluasi pemenuhan tugas C2 dan C4 telah direvisi secara mendasar (bukannya tiga, empat posisi penilaian telah diperkenalkan). Perubahan tersebut mengakibatkan peningkatan skor maksimal dari 3 menjadi 4.
Alhasil, nilai maksimal soal ujian secara keseluruhan meningkat dari 39 menjadi 42.

bahasa asing -tidak ada perubahan mendasar.

Diklarifikasi:

rencana tugas C2 (pernyataan tertulis rinci dengan unsur penalaran, bagian "Surat");
merumuskan kriteria penilaian tugas C1-C2, format skema evaluasi tambahan untuk tugas-tugas ini telah dioptimalkan;
persyaratan untuk sifat produktif pidato tertulis peserta ujian dalam tugas tingkat kompleksitas yang tinggi C2. (ketika mengevaluasi tugas C2, perhatian khusus diberikan pada kemampuan peserta ujian untuk menghasilkan pernyataan tertulis yang terperinci; jika lebih dari 30% jawaban secara tekstual cocok dengan sumber yang diterbitkan atau makalah ujian lainnya, maka 0 poin diberikan sesuai dengan kriteria "Solusi tugas komunikatif" dan, karenanya, seluruh tugas diberi nilai 0 poin;
bentuk perekaman jawaban untuk tugas B1 (bagian "Mendengarkan"): dalam tugas ini untuk menetapkan kepatuhan, disediakan transisi ke bentuk digital dari jawaban rekaman, seperti pada tugas B2 dan B3, yang akan mengurangi jumlah kesalahan lulusan saat mengisi formulir, dan memberikan pengakuan yang lebih baik atas jawaban yang diperiksa selama pemrosesan hasil mesin.
Waktu eksekusi telah ditingkatkan menjadi 180 menit.

Informatika dan TIK -perubahan signifikan (dalam struktur dan isi KIM)

Rasio bagian 1 dan 2 dari pekerjaan telah diubah (jumlah tugas di bagian pertama telah dikurangi dari 18 menjadi 13, di bagian kedua ditingkatkan dari 10 menjadi 15).
Distribusi tugas berdasarkan bagian kursus informatika telah diubah: jumlah tugas di bagian "Elemen teori algoritma" dan "Pemodelan dan eksperimen komputer" telah meningkat, jumlah tugas di bagian "Sistem angka" dan "Dasar-dasar logika" telah dikurangi.
Alih-alih tugas untuk memproses informasi grafis, KIM Unified State Examination pada tahun 2012 memasukkan tugas untuk memproses suara.

Halaman 1

Kuliah 17

1. Maksud dan Tujuan Percobaan Pengenalan Unified State Examination.

2. Bahan Kontrol dan Pengukuran (KIM).

3. Teknologi untuk pengembangan KIM, organisasi dan pelaksanaan ujian.

4.Menskalakan hasil USE dan penggunaannya dalam mengelola mutu pendidikan.

5. Ujian Negara Bersatu dan sistem All-Rusia untuk menilai kualitas pendidikan.

1. Maksud dan tujuan percobaan pada pengenalan Unified State Exam.

1. Tujuan percobaan pengenalan Unified State Examination . Eksperimen pengenalan Unified State Examination, diluncurkan pada tahun 2001, membuka halaman baru dalam pengembangan sistem pendidikan domestik dan inovatif tidak hanya dalam desain, tetapi juga dalam bentuk perilaku, dalam skala dan tidak adanya aturan ketat. regulasi oleh pihak yang berwenang. Untuk pertama kalinya dalam sejarah pendidikan nasional, upaya dilakukan bukan dengan arahan, tetapi dengan eksperimen, untuk menentukan kelayakan restrukturisasi mendasar kegiatan lembaga pendidikan dan sistem manajemen mutu pendidikan.

Eksperimen ini memiliki dua tujuan: meningkatkan ketersediaan pendidikan tinggi dan kualitas pendidikan sekolah menengah, yang implementasinya dicapai secara bersamaan dengan menggabungkan ujian kelulusan sekolah dan ujian masuk ke institusi pendidikan tinggi dalam satu prosedur. Menurut hasil Unified State Examination, lulusan sekolah menerima dua nilai, salah satunya ditetapkan pada skala lima poin sekolah, dan yang lainnya pada skala seratus poin untuk diserahkan kepada komite penerimaan universitas dan perguruan tinggi.

Tugas diselesaikan dengan bantuan ujian. Tugas utama yang diselesaikan dalam USE meliputi:

Objektivisasi penilaian kualitas pendidikan berdasarkan penciptaan mekanisme penilaian eksternal dan penggunaan pengukuran pedagogis;

Meningkatkan ketersediaan pendidikan kejuruan, terutama bagi kaum muda dari keluarga berpenghasilan rendah dan dari tempat tinggal yang jauh dari pusat universitas;

Objektifikasi persyaratan untuk "pelatihan pendidikan umum pelamar lembaga pendidikan dalam sistem pendidikan kejuruan;

Mengurangi beban psikologis lulusan lembaga pendidikan dengan mengurangi jumlah ujian; - pengembangan kesinambungan pendidikan umum dan kejuruan, menjamin kesiapan lulusan sekolah untuk melanjutkan pendidikan;

Meningkatkan sistem pengendalian negara dan pengelolaan mutu pendidikan berdasarkan penilaian independen terhadap mutu lulusan diklat.

Solusi dari masalah terakhir, khususnya, memungkinkan kita untuk berbicara tentang kontribusi signifikan USE terhadap pembentukan dan pengembangan sistem All-Rusia untuk menilai kualitas pendidikan (OSOKO), yang saat ini sedang dibuat di Rusia. Memenuhi tugas utamanya, USE merupakan elemen struktural penting dari OSOKO dan salah satu mata rantai utama dalam pengembangan dan peningkatan sistem manajemen mutu pendidikan.

Solusi dari tugas-tugas yang terdaftar dipastikan dengan kinerja pekerjaan di sejumlah bidang, yang meliputi: pembentukan kerangka peraturan untuk eksperimen; pembuatan KIM; pengembangan teknologi penyelenggaraan ujian; memastikan keamanan informasi prosedur, materi dan hasil ujian; pembentukan sistem informasi untuk mendukung eksperimen dan penggunaan datanya dalam pendidikan; pelatihan spesialis untuk staf eksperimen; GUNAKAN pemantauan; analisis dan interpretasi data pemantauan dalam rangka peningkatan mutu pendidikan.

Skema partisipasi daerah dalam Unified State Examination dan pengembangan eksperimen. Setelah memutuskan partisipasi dalam USE, wilayah secara sukarela memilih salah satu skema yang memungkinkan untuk melakukan ujian, yang mungkin berbeda dari yang lain dalam jumlah dan komposisi mata pelajaran, kesukarelaan atau sertifikasi wajib lulusan sekolah dalam bentuk PENGGUNAAN, pangsa pengujian komputer dan fitur spesifik lainnya karena kemampuan keuangan wilayah , basis materialnya, tingkat perkembangan komunikasi, jumlah universitas, kesiapan mereka untuk berpartisipasi dalam percobaan, dll.

Sesuai dengan garis utama tentang kurangnya arahan yang ketat dari pihak otoritas pendidikan federal, USE mempertahankan variabilitas maksimum yang mungkin dalam skema pelaksanaan, yang sering mengubah wilayah itu sendiri dalam proses pengembangan percobaan.

Terlepas dari kerangka peraturan yang ada yang mendefinisikan daftar mata pelajaran wajib untuk sertifikasi akhir lulusan sekolah, banyak daerah, sebagai bagian dari pekerjaan untuk meningkatkan skema USE, menolak mata pelajaran wajib dan memberikan lulusan hak untuk secara mandiri memilih jumlah ujian dan berpartisipasi dalam USE itu sendiri. Perlu diperhatikan bahwa dengan semakin luasnya cakupan prinsip variabilitas dan voluntaritas, jumlah peserta eksperimen terus bertambah seiring dengan manifestasi sikap positif masyarakat terhadap eksperimen tersebut.

Analisis data pemantauan USE secara meyakinkan menunjukkan peningkatan tajam dalam jumlah wilayah yang berpartisipasi dalam eksperimen, dan peningkatan kepercayaan pada USE di pihak otoritas pendidikan, komunitas profesional universitas dan sekolah, siswa dan orang tua mereka. Secara khusus, jumlah wilayah yang berpartisipasi dalam eksperimen berubah dari 6 pada tahun 2001 menjadi 78 pada tahun 2005, dan jumlah lulusan dari wilayah ini yang mengikuti ujian dalam bentuk USE dalam matematika dan bahasa Rusia pada tahun 2005 melebihi 50%. Daftar universitas dan perguruan tinggi yang menerima pelamar berdasarkan hasil Unified State Examination telah berkembang secara signifikan. Pada tahun 2005, 1543 universitas (termasuk cabang) dan 1765 perguruan tinggi mengambil bagian dalam percobaan, sedangkan pada tahun 2001 hanya 16 universitas yang berpartisipasi di dalamnya. Jumlah total mata pelajaran yang diajukan untuk USE di wilayah telah meningkat tajam. Menurut data pemantauan dan statistik daerah, selama bertahun-tahun percobaan, jumlah lulusan dari daerah pedesaan yang masuk universitas berdasarkan hasil Unified State Examination telah meningkat secara signifikan. Secara keseluruhan, tren eksperimen menunjukkan bahwa harapan yang terkait dengan USE untuk memperluas aksesibilitas pendidikan tinggi bagi penduduk pedesaan dan daerah terpencil Rusia sepenuhnya dibenarkan. Ini dikonfirmasi oleh data pemantauan USE.

Partisipasi guru dalam pelaksanaan ujian. Guru sering bertindak sebagai penyelenggara USE di sekolah, tetapi mereka hanya bekerja dengan lulusan yang sebelumnya bukan siswa mereka. Dalam hal ini, guru mengambil bagian dalam persiapan ujian, mengatur prosedur ujian itu sendiri, dan memastikan pengumpulan dan pengiriman materi ujian.

Dalam persiapan untuk pengujian, guru menerima semua materi yang diperlukan, termasuk kit KIM dengan bahan cadangan jika salah ketik, daftar lulusan, bentuk protokol pengujian yang mencatat semua penyimpangan dari persyaratan standardisasi ”dan panduan tes yang mencakup deskripsi semua persyaratan untuk melaksanakan ujian.

Setelah ujian selesai, panitia mengumpulkan materi: tes bekas dan tidak terpakai, protokol tes yang sudah selesai dan daftar siswa yang dilampirkan. Bahan-bahan ini ditransfer ke pusat khusus untuk verifikasi dan pemrosesan lebih lanjut, yang disebut pusat pemrosesan informasi regional (RTsOI) dalam sistem USE. Tugas dengan jawaban pilihan ganda tunduk pada verifikasi otomatis di tempat atau di Moskow, dan untuk memverifikasi tugas dengan jawaban terperinci, para ahli diundang, yang pekerjaannya diatur di tempat ujian dalam kondisi keamanan informasi yang lengkap dan kemandirian ahli penilaian.

2. Kontrol bahan pengukur

struktur KIM.Ada tiga bagian dalam struktur CIM (A, B, C), memiliki jumlah tugas yang berbeda tergantung pada subjek. Misalnya, tugas dalam biologi dan sejarah bisa menjadi 50, dan dalam bahasa Rusia - 40,

Bagian A untuk semua mata pelajaran hanya berisi tugas dengan jawaban pilihan ganda. Bagian tugas PADA bervariasi secara signifikan dalam bentuk dan menyarankan kemungkinan jawaban singkat yang diatur, membangun korespondensi antara elemen dua set dan urutan yang benar dari berbagai proses, fenomena, objek. Bagian C adalah untuk konstruksi gratis dari sebuah respon. Misalnya, ketika menguji dalam bahasa Rusia, tugas diberikan untuk menulis karya tulis singkat (esai), dalam matematika - untuk memberikan solusi terperinci untuk tugas, dll.

Isi KIM. Hasil USE digunakan dalam penilaian akhir mahasiswa dan seleksi pelamar. Konten KIM dimaksudkan untuk menerima informasi yang dipersonalisasi tentang pencapaian lulusan sekolah dari pelatihan tingkat dasar dan lanjutan dalam mata pelajaran. Karena pengesahan memerlukan pemeriksaan penguasaan sebagian besar elemen pelatihan mata pelajaran oleh lulusan, dan waktu ujian terbatas, untuk meningkatkan keterwakilan cakupan konten pendidikan, perlu sedikit memvariasikan spesifikasi KIM USE dalam satu tahun dan lebih signifikan selama bertahun-tahun. Berkat perencanaan khusus yang dilakukan oleh komite subjek untuk pengembangan CIM, dalam 2-3 tahun dimungkinkan untuk mencakup semua elemen konten yang diperlukan. Karena variasi spesifikasi KIM, komparabilitas hasil lulusan berkurang, tetapi kemungkinan penggunaan hasil USE di tingkat federal dan regional dalam memantau kualitas pendidikan semakin meluas. Dengan demikian, berdasarkan analisis hasil untuk masing-masing tahun USE, dimungkinkan untuk memperoleh informasi yang masuk akal tentang tren perubahan dalam pendidikan umum lulusan sekolah Rusia.

Secara umum, konten KIM dipilih berdasarkan spesifikasi yang diperbarui setiap tahun di Internet dan mencakup rencana umum untuk makalah ujian dengan tautan ke posisi pengkode yang sesuai (daftar elemen konten bernomor berdasarkan subjek). Isi KIM hanya mencerminkan pengetahuan dan keterampilan mata pelajaran yang diajarkan di sekolah, meskipun hal ini bertentangan dengan pandangan modern tentang prioritas pengajaran, yang diterima di banyak negara. Akibatnya, siswa Rusia berkinerja buruk dalam studi perbandingan internasional tentang kualitas pendidikan. Mereka tidak dapat melakukan tugas yang membutuhkan penerapan pengetahuan dalam situasi yang meniru kehidupan atau keterampilan interdisipliner.

Analisis hasil implementasi KIM dalam konteks interpretasi yang bermakna memberikan informasi penting bagi peningkatan persyaratan SES dan peningkatan mutu pendidikan. Menurut hasil analisis yang dilakukan oleh komisi subjek untuk pengembangan KIM dan diterbitkan pada tahun 2006 dalam laporan analitis, tugas-tugas tingkat kesulitan dasar dilakukan terutama oleh lulusan yang menerima nilai bagus dan sangat baik dalam Ujian Negara Bersatu. . Persentase siswa dalam kelompok ini yang menyelesaikan semua tugas di tingkat dasar agak lebih tinggi dalam matematika dan bahasa Rusia (lebih dari 90%) dan lebih rendah dalam mata pelajaran lain (tidak lebih dari 85%). Sekitar setengah dari lulusan yang menerima "dua" dan "tiga" menurut hasil UN Unified State, tidak menguasai bahkan setengah dari materi yang direncanakan untuk dipelajari. Hasil ini membantu mengidentifikasi masalah yang terkait dengan persyaratan SES yang berlebihan dan jumlah konten sekolah yang berlebihan.

3. Teknologi untuk pengembangan instrumentasi

bahan, organisasi dan perilaku

Ujian Negara Bersatu

Struktur yang terlibat dalam organisasi dan pelaksanaan ujian. Struktur yang menyediakan dukungan organisasi, manajerial dan ilmiah dan metodologis dalam penerapan teknologi USE termasuk otoritas pendidikan federal dan regional, Pusat Pengujian Federal (FTS), Institut Pengukuran Pedagogis Federal (FIPI), perusahaan KROK, pemrosesan informasi regional pusat dan berbagai organisasi (universitas dan struktur pendidikan lainnya) yang melakukan proyek penelitian secara kompetitif untuk membentuk dasar ilmiah dan metodologis teknologi untuk melakukan Ujian Negara Terpadu dan meningkatkan KIM.

teknologi pengembangan CMM. Siklus tahunan teknologi pengembangan KIM pada mata kuliah dimulai dengan revisi pengkode elemen konten yang akan diverifikasi, serta dengan pembuatan spesifikasi dan versi demonstrasi KIM. Biasanya, untuk 13 mata pelajaran yang dideklarasikan di USE, setidaknya 10 ribu tugas baru dikembangkan setiap tahun. Selain urutan target tugas untuk mengisi bank USE, sebuah kompetisi diumumkan di mana semua penulis tugas tes yang tertarik dari berbagai wilayah Rusia ambil bagian. Materi yang diajukan untuk kompetisi menjalani pemeriksaan, yang hasilnya adalah pemilihan dan pembelian item tes untuk bank USE. Spesialis FILI, menggunakan bank, membentuk varian CIM. Kemudian, pemeriksaan kualitas konten opsi dilakukan, analisis paralelismenya dan kepatuhan tugas dengan persyaratan formulir tes. Setelah dikoreksi berdasarkan hasil ujian, KIM ditransfer untuk persetujuan yang dilakukan pada sampel perwakilan siswa: sekolah di Rusia. Pemrosesan data pengujian dan analisisnya memungkinkan untuk melakukan koreksi berikutnya, setelah itu versi CMM yang setara diperoleh dengan set dokumentasi yang menyertainya untuk melakukan MENGGUNAKAN, dibuat dalam kondisi keamanan informasi tingkat tinggi dan disimpan di ruangan khusus hingga dimulainya ujian.

Setelah ujian dan pemrosesan data, spesialis FIPI menyiapkan laporan analitis yang berisi rekomendasi untuk meningkatkan CMM, yang diperhitungkan saat melakukan siklus teknologi tahunan berikutnya.

Teknologi ujian. Saat melakukan ujian, teknologi utama adalah yang kosong, yang melibatkan pemberian tugas kepada lulusan di atas kertas. Implementasi teknologi blank tergantung pada organisasi yang terlibat dalam implementasinya. Misalnya, FCT mencetak semua materi di Moskow, dan kemudian, sebelum ujian dimulai, mentransfer paket dengan CMM dan formulir jawaban ke wilayah, CROC mendukung teknologi di mana formulir jawaban dicetak di tempat penggunaan di wilayah tersebut. .

Saat menggunakan pengujian komputer dalam ujian, teknologinya beragam, karena tugas bagian C dengan jawaban terperinci dilakukan pada formulir kertas. Teknologi tunggal untuk melakukan ujian belum dikembangkan. Masing-masing opsi untuk melakukan eksperimen memiliki kelebihan dan kekurangannya sendiri, yang hanya dapat diungkapkan sepenuhnya di akhir.

4. Menskalakan hasil dari Negara Bersatu

ujian dan penggunaannya dalam manajemen

kualitas pendidikan

Jenis skala yang digunakan dalam ujian. Sesuai dengan tujuan dan tugas yang harus diselesaikan, menurut data USE, dua nilai diberikan - dalam skala sekolah seratus lima poin. Yang pertama diperoleh oleh spesialis FCT dengan menskalakan data primer USE, mengubahnya menjadi skala logit standar berdasarkan teori pengujian modern. Yang kedua, sekolah, dipilih oleh spesialis kelompok penskalaan yang diselenggarakan oleh Rosobrnadzor selama ujian dan terdiri dari penguji, perwakilan dari komisi mata pelajaran FIPI, dan karyawan FCT. Untuk memilih batas interval skala 100 poin dan menetapkan korespondensinya dengan penilaian skala 4 poin, hasil USE di setiap mata pelajaran dan semua wilayah dikenai analisis multidimensi, termasuk masalah konten : validitas nilai sekolah dan komparabilitas nilai mata pelajaran di USE pada tahun yang berbeda.

Keterbandingan GUNAKAN hasil di tahun yang berbeda. Untuk memastikan komparabilitas nilai ujian yang berarti, banyak negara yang memiliki ujian berbasis ujian nasional atau jenis ujian massal lainnya memperkenalkan skala tingkat standar (lihat Bagian 13.5) untuk melacak hubungan antara konten ujian selama bertahun-tahun. Keuntungan penting dari skala tingkat adalah untuk memperluas kemungkinan menafsirkan hasil ujian, karena nilai ujian dapat dilengkapi dengan deskripsi yang berarti tentang persiapan lulusan sekolah dalam hal elemen tematik yang dikuasai dan yang belum dikuasai dari mata pelajaran.

Untuk memperkenalkan interpretasi yang bermakna ke dalam praktik USE, pertama-tama perlu dilakukan siklus kerja untuk meningkatkan struktur SES berdasarkan ide-ide diferensiasi level dan untuk menggambarkan dengan cara yang bermakna berbagai jenjang pendidikan umum di semua mata pelajaran sekolah. Kemudian, pada sampel yang representatif dari lulusan sekolah Rusia, skala nilai tes standar yang stabil harus dibangun dan rentang skala harus diidentifikasi dengan menghubungkannya dengan isi tugas yang diselesaikan di setiap tingkat.

Dalam hal teori pengukuran pedagogis, komparabilitas berarti kemungkinan mentransfer hasil tes dari tahun yang berbeda ke skala tunggal. Keterbandingan memberi lulusan kesempatan untuk lulus Ujian Negara Bersatu sekali dan menggunakan hasilnya jika tidak berhasil masuk ke universitas di tahun-tahun berikutnya, dan bagi manajer - kesempatan untuk melakukan studi perbandingan kualitas pendidikan.

Pendekatan tradisional untuk memecahkan masalah komparatif didasarkan pada definisi norma-norma yang disebut tes jangkar untuk menyusun tabel kesetaraan skor untuk tes yang berbeda. Tes jangkar dipilih dan distandarisasi pada sampel yang mewakili secara nasional dari subjek tes yang dipilih dengan cermat dari populasi nasional.

Berdasarkan tes jangkar, ditentukan norma-norma nasional yang representatif dalam berbagai mata pelajaran. Data yang dikumpulkan pada sampel uji jangkar nasional berfungsi untuk membangun skala indikator umum. Setiap tes baru yang dikembangkan di tahun-tahun berikutnya dikalibrasi terhadap tes jangkar, sebagai akibatnya dimungkinkan untuk menetapkan mana: hasil mata pelajaran di tahun-tahun berikutnya setara dengan indikator dalam tes jangkar.

Untuk membangun tabel terjemahan dalam kasus umum pada sampel mata pelajaran yang sama, biasanya digunakan metode persentil yang sama, yang menurutnya indikator dianggap setara jika memiliki persentil yang sama dan diperoleh pada kelompok pembanding normal sesuai dengan opsi tes paralel . Kerugian dari metode ini termasuk biaya tinggi, koreksi dan peningkatan konten tes yang tak terhindarkan, perubahan konten pendidikan dan prioritas dalam perjanjian pendidikan, dan keuntungannya adalah stabilitas dan akurasi tinggi, karena hasil untuk semua versi berikutnya dari tes dibandingkan dengan satu tes jangkar.

Dengan munculnya teori IRT mulai menggunakan teknologi yang lebih efisien yang memastikan komparabilitas hasil tes untuk tahun yang berbeda. Teknologi ini didasarkan pada penyertaan kelompok tugas jangkar (umum) dalam pengujian tahun yang berbeda, yang menghubungkan hasil versi pengujian yang lebih baru dan lebih awal dalam satu rangkaian. Hitung mundur berasal dari skala yang dibangun di atas kelompok pembanding referensi. Dengan demikian, setiap versi dari versi pengujian berikutnya, berkat blok tugas umum, dikaitkan dengan versi baterai pengujian sebelumnya dan selanjutnya.

Materi penjelasan yang diperlukan biasanya dikembangkan untuk pengguna tes untuk memastikan konversi skor mentah menjadi indikator turunan yang sebanding dengan hasil skala referensi. Langkah-langkah tambahan untuk meningkatkan komparabilitas hasil tes disediakan oleh teori khusus keselarasan tes. Metode modern serupa direncanakan akan digunakan dalam ujian.

5. Ujian Negara Terpadu dan Sistem Seluruh Rusia untuk Menilai Kualitas Pendidikan

Apa yang dimaksud dengan sistem All-Rusia untuk menilai kualitas pendidikan . Sistem All-Rusia untuk menilai kualitas pendidikan dipahami sebagai seperangkat struktur organisasi dan fungsional yang memberikan penilaian pencapaian pendidikan warga negara berdasarkan satu basis konseptual dan metodologis, serta identifikasi faktor-faktor yang mempengaruhi pendidikan hasil.

Tujuan utama pembuatan OSEKO adalah untuk meningkatkan objektivitas dan validitas basis informasi sistem manajemen mutu pendidikan di Rusia, serta memberikan informasi yang andal tentang kualitas pendidikan kepada semua peserta dalam proses pendidikan dan masyarakat secara keseluruhan. pendidikan di tanah air.

Sesuai dengan tujuan tugas pokok OSOKO dapat dikaitkan dengan:

Penilaian kualitas prestasi pendidikan peserta didik dan lulusan lembaga pendidikan di berbagai jenjang pendidikan;

Pengembangan dukungan ilmiah dan metodologis untuk prosedur dan alat untuk menilai kualitas pendidikan;

Penciptaan struktur yang memastikan kualitas alat dan teknologi untuk pengukuran pedagogis (pusat sertifikasi);

Pembuatan pusat untuk pemrosesan statistik dan analisis data tentang kualitas pendidikan, organisasi sistem untuk pelatihan dan pelatihan ulang staf pengajar, dll.

Proses pembuatan OSOKO di Rusia belum selesai, sehingga jumlah tugas utama dapat berubah seiring perkembangannya.

Pembangunan OSOKO melibatkan penggunaan luas dari struktur, mekanisme dan prosedur organisasi yang ada: Unified State Examination, pusat sertifikasi, pengesahan dan akreditasi, pusat kualitas pendidikan dan pemantauan, bekerja atas dasar ilmiah dan metodologis terpadu sebagai bagian dari strategi pengembangan untuk sistem semua-Rusia untuk menilai kualitas pendidikan.

GUNAKAN di OSOKO. USE merupakan elemen struktural integral dari OSOKO dan memberikan informasi objektif tentang keadaan sebenarnya dari kualitas pendidikan sekolah. Data USE memungkinkan untuk memperoleh penilaian keadaan pencapaian pendidikan lulusan sekolah, untuk mengidentifikasi tren dan dinamika perubahan dalam sistem pendidikan menengah, untuk membentuk serangkaian faktor utama yang mempengaruhi kualitas pendidikan di berbagai daerah, dan untuk menilai tingkat pengaruh mereka.

USE bukan satu-satunya sumber informasi OSOKO. Tidak diragukan lagi, selain informasi yang dikumpulkan selama ujian tentang pengetahuan dan keterampilan mata pelajaran lulusan sekolah, diperlukan data tambahan yang mencirikan keadaan kualitas pendidikan di berbagai tingkatan (penilaian kemampuan untuk menerapkan pengetahuan yang dikumpulkan dengan menggunakan portofolio dan lainnya). sarana penilaian otentik; penilaian interdisipliner, keterampilan pendidikan dan komunikasi umum , data tentang tingkat pendidikan peserta pelatihan dan efektivitas pengaruh pendidikan, hasil partisipasi siswa dalam olimpiade dan kompetisi kreatif, dll.).

Persyaratan penting yang memastikan penggunaan data USE yang benar di OSEKO adalah pertimbangan berbagai faktor dalam menafsirkan hasil ujian, yang seringkali berada di luar pengaruh sekolah, tetapi secara signifikan mempengaruhi kualitas pendidikan.