Testen består av fire blokker med spørsmål som lar deg identifisere kompetansenivået til læreren i sine fire komponenter: faglig kompetanse - Dokument. Kvaliteten på utdanningen En komponent som ikke er inkludert i strukturen til Kim Ege
"KIMs - dette er et standardisert eksamensarbeid opprettet i samsvar med kravene til teorien om pedagogiske målinger, som gjør det mulig med tilstrekkelig objektivitet og pålitelighet å gjennomføre en uavhengig statlig sertifisering av kandidater fra generelle utdanningsinstitusjoner og valg av universitetssøkere.
Ved sammenstilling av KIM-er ble det effektive forholdet mellom bruk av ulike former for oppgaver i testen for endelig sertifisering av kandidater bestemt. Samtidig ble mange års erfaring fra utenlandske kolleger tatt i betraktning. For å sikre effektiv kontroll av kunnskapen og ferdighetene til nyutdannede ved nasjonalskolen, ble det besluttet å inkludere ulike former for oppgaver i KIM: oppgaver med valg av riktig svar, oppgaver for tillegg og oppgaver med gratis detaljert svar (svar i form av essay, anmeldelse, tekstanalyse).
KIM-er i ulike fag inkluderer tre deler - A, B, C. Hver del består av oppgaver gruppert etter form. Det totale antallet oppgaver varierer fra 25 til 70.
Del A tilbyr oppgaver med valg av svar (oppgaver av lukket type). Disse oppgavene er ganske enkle og tar sikte på å teste kunnskapen om faktastoff, regler, formler, definisjoner osv. Andelen slike oppgaver varierer avhengig av fag. De kan dominere kvantitativt over andre typer oppgaver, men vektkoeffisienten til slike oppgaver er mindre, dvs. i totalvektet poengsum for å løse en oppgave av type A gis det mindre poeng enn for å løse oppgaver av en annen type.
Del B består av oppgaver av åpen type - fra oppgaver for tillegg i form av et tall eller ett ord. I disse oppgavene konstruerer forsøkspersonen selv det riktige svaret, i motsetning til oppgaver av lukket type, hvor svaret allerede er gitt og det bare er nødvendig å fastslå det riktige. Som regel er disse oppgavene vanskeligere enn oppgavene til del A, så vektkoeffisienten deres er høyere.
Oppgavene til del A og B er utformet på en slik måte at testen foregår i datamodus.
PÅ del C gitt en oppgave som innebærer et gratis detaljert svar. Det kan være en komplett løsning på et matematisk problem eller å skrive en tekst. Del C-oppgaver tester kandidatenes evne til å tenke, resonnere om et gitt emne, formulere og korrekt uttrykke sine tanker skriftlig. Denne delen av testen er verifisert av uavhengige eksperter. Dette krever ekstra materialkostnader og gjør det til en viss grad mulig å påvirke poengsummen til del C, men likevel øker inkluderingen av denne delen i KIM muligheten for å teste et bredt spekter av kunnskaper og ferdigheter til nyutdannede.
Merk. I praktiske klasser, vurder eksempler på KIM-er for Unified State Examination og GIA i spesifikke disipliner (matematikk, fysikk, informatikk, historie, teknologi, etc.).
1. Bakhusova E.V., Korostelev A.A., Monakhov V.M. etc. Technologies V.M. Monakhova - didaktiske verktøy for modernisering av utdanning: Proc. Fordel. - M.-Togliatti: Volzhsky un-t im. V.N. Tatishcheva, 2004. - 60 s.
3. Episheva O.B. Teknologi for undervisning i matematikk basert på aktivitetstilnærmingen: Bok. for læreren / O.B. Epishev. – M.: Opplysning. 2003. - 223 s. (B-ka lærer).
4. Zvonnikov V.I. Moderne midler for å evaluere læringsutbytte: lærebok for studenter ved høyere utdanningsinstitusjoner / V.I. Zvonnikov, M.B. Chelyshkov. - M.: Publishing Center "Academy", 2007. - 224 s.
5. Kvalitet på utdanning. Prestasjoner. Problemer. Proceedings of the IV International Scientific and Methodological Conference / Ed. SOM. Vostrikova. - Novosibirsk: NGTU, 2001.-433s.
6. Clarin. M.V. Teknologisk tilnærming til læring // Skoleteknologier. nr. 5. 2003. - S. 3 - 22.
7. Mayorov A.N. Tester og deres typer. Prestasjonsprøver. Skoleteknologier. - Nr. 4. - 1998. - S. 176.
9. Manko N.N. Lærerens teknologiske kompetanse // Skoleteknologier. 2002. nr. 5. - S. 33 - 41.
10. Monakhov V.M. Teknologiske grunnlag for å designe og konstruere utdanningsprosessen. - Volgograd: Endre. 1995. - 152 s.
12. Potashnik M.M. Kvalitet på utdanning: problemer og teknologier for ledelse (i spørsmål og svar). - M .: Pedagogical Society of Russia, 2002. - 352 s.
13. Strategi for modernisering av innholdet i allmennutdanningen: Materialer for utvikling av dokumenter for fornyelse av allmennutdanningen. - M .: OOO "World of Books", 2001. - 66 s.
14. Chernilevsky D.V., Filatov O.K. Undervisningsteknologi i høyere utdanning: Proc. utgave / Red. D.V. Chernilevsky. - M .: "Forwarder", 1996. - 288 s.
15. Yansufina Z.I. Forbedre den metodiske forberedelsen til en fremtidig lærer i matematikk ved et lærerutdanningsuniversitet basert på innovative tilnærminger til undervisning: Proc. godtgjørelse for studenter ved et pedagogisk universitet i spesialiteten 010100 - Matematikk. - Tobolsk: TSPI im. DI. Mendeleeva, 2004. - 156 s.
16. Chelyshkova M.B., Khlebnikov V.A. De viktigste tilnærmingene til å vurdere kvaliteten på opplæringsstudenter // Kvalitetsproblemer, dens regulering og standarder i utdanning: Lør. vitenskapelig Kunst. M., 1999
17. Chelyshkova M.B. Utvikling av pedagogiske prøver basert på moderne matematiske modeller. M., 1995
18. Chelyshkova M.B., Saveliev B.A. Retningslinjer for utvikling av pedagogiske prøver for en helhetlig vurdering av beredskapen til studenter ved universitetet. M., 1995
Forelesning 1 Konseptet om utdanningskvalitet. Evaluering av læringsutbytte som et element i kvalitetsledelse. Tradisjonelle og nye måter å vurdere læringsutbytte på …………………………………………………………………………………………………………3
Forelesning 3 Historien om utviklingen av testsystemet i utlandet og i Russland …………………………………………………………………………………………………..… …..8
Forelesning 4 Pedagogiske prøver. Begreper og definisjoner. Klassifisering av pedagogiske prøver ……………………………….………………………………………….12
Forelesning 5 Typer, former og typer testoppgaver …………………………………………..15
Øvelse 1…………………………………………………………..……16
Forelesning 6 Hovedtrinnene i utviklingen av en pedagogisk prøve ………………………………………………………….21
Forelesning 7 Gjennomfør prøvetesting. Testkvalitetsindikatorer…………………………..………………………………………………………………………….25
Øvelse 2………………………………………………………………..29
Forelesning 8 Moderne teori om testdesign………………………………….33
Forelesning 9 Teststandardisering og tolkning av testresultater. BRUK og kvalitet på utdanning………………………….………………………………………………………34
Spesifikasjon
kontrollere målematerialer
for å ha holdt den enhetlige staten-eksamenen i 2012
på litteratur
1. Utnevnelse av KIM BRUK
Unified State Examination (heretter referert til som USE) er en form for objektiv vurdering av kvaliteten på opplæringen til personer som har mestret utdanningsprogrammene for videregående (fullstendig) generell utdanning, ved bruk av oppgaver i standardisert form (kontrollmålemateriell) .
Kontrollmålingsmaterialer gjør det mulig å etablere utviklingsnivået for nyutdannede fra den føderale komponenten av statens standard for videregående (fullstendig) generell utdanning.
Resultatene av den enhetlige statlige eksamen i litteratur anerkjennes av utdanningsinstitusjoner for videregående yrkesutdanning og utdanningsinstitusjoner for høyere profesjonell utdanning som resultatene av opptaksprøver i litteratur.
2. Dokumenter som definerer innholdet i KIM USE
Innholdet i eksamensarbeidet bestemmes på grunnlag av den føderale komponenten i den statlige standarden for generell utdanning (ordre fra Utdanningsdepartementet i Russland datert 05.03.2004 nr. 1089). Noen posisjoner i dette dokumentet er spesifisert basert på det obligatoriske minimumsinnholdet i grunnleggende generell og videregående (fullstendig) generell utdanning i litteratur, godkjent av ordre fra utdanningsdepartementet i Russland datert 19.05.1998 nr. 1236 og datert 06/30 /1999 nr. 56 (begrunnelse er gitt i den forklarende merknaden til kodifisereren av innholdselementer og krav til opplæringsnivået til kandidater fra utdanningsinstitusjoner for enhetlig statlig eksamen i litteratur i 2012).
3. Tilnærminger til valg av innhold, utvikling av strukturen til KIM BRUK
Prinsippene for valg av innhold og utvikling av strukturen til KIM USE i litteratur samsvarer med målet om å oppnå objektiv og pålitelig informasjon om beredskapen til en kandidat til å fortsette utdanning i institusjoner for videregående spesialisert og høyere profesjonsutdanning i humaniora.
Den langsiktige forbedringen av KIM USE i litteratur gikk i retning av å finne den optimale strukturen for eksamensarbeidet, skape et pålitelig system for å evaluere det, sikre objektiviteten til eksamensresultatene. Antall oppgaver som testet kunnskap om bestemte litterære fakta ble redusert (i 2007 ble oppgaver med valg av svar fjernet fra eksamensmodellen: eksperimentet viste deres ineffektivitet, "fremmedhet" i forhold til litteratur, det uberettiget kunnskapssentriske, "faktisk" tilnærming i gjennomføringen av den statlige (endelige) vurderingen i litteraturen), antall oppgaver med et detaljert svar, relatert til de moralske spørsmålene til kunstverk, ble utviklet, en typologi av oppgaver med forskjellig innholdsorientering ble utviklet , vurderingskriterier ble spesifisert, det optimale forholdet mellom oppgaver av ulike typer i strukturen av eksamensarbeidet ble bestemt, etc.
Hver versjon av KIM inkluderer oppgaver som er forskjellige både i form av presentasjon og i kompleksitetsnivået til oppgaven, hvis oppfyllelse avslører nivået på assimilering av USE-deltakeren av hovedelementene i innholdet i forskjellige seksjoner av kurset, graden av dannelse av fagkompetanser og allmennpedagogiske ferdigheter.
Ved bestått eksamen i litteratur er det derfor påkrevd at eksaminanden aktiverer de viktigste typene pedagogiske aktiviteter for faget: analytisk forståelse av en litterær tekst, tolkning av den, søke etter grunnlag for å sammenligne litterære fenomener og fakta, skrive et begrunnet svar til et problematisk spørsmål osv.
Resultatene fra Unified State Examination in Literature bekrefter at dagens eksamensmodell i litteratur gjør det mulig å tilstrekkelig vurdere utdanningsprestasjonene til nyutdannede i faget, for å identifisere nivået på dannelsen av grunnleggende fag- og superfagferdigheter blant nyutdannede. En eksamen i denne formen gjør det mulig å differensiere deltakere i USE etter nivået på deres fagforberedelse, og gir universiteter og høyskoler saklig grunnlag for å velge søkere.
4. Strukturen til KIM BRUK
Eksamensarbeid i litteratur er basert på et system med trinnvis utprøving av kandidaters evner til å oppfatte og analysere kunstverk i deres sjangergeneriske spesifikasjoner, basert på kunnskap av historisk-litterær og teoretisk-litterær karakter. Forberedelse til eksamen i litteratur innebærer repetisjon av studentene av hele kursmaterialet, hvis innhold bestemmes av de normative dokumentene om emnet.
I eksamensarbeidet skilles det ut tre deler, som inneholder et sett med oppgaver for å bestemme nivået på kandidatenes forberedelse i litteratur.
Del 1 og 2 tilbyr oppgaver som inkluderer spørsmål for analyse av litterære verk. Nyutdannedes evne til å bestemme hovedelementene i innholdet og den kunstneriske strukturen til de studerte verkene (temaer og problemer, helter og hendelser, kunstneriske teknikker, ulike typer troper, etc.) kontrolleres, samt vurdere spesifikke litterære verk i forbindelse med kursmateriellet.
Den generelle strukturen til de to første delene av verket er underordnet oppgaven med en bred meningsfull dekning av litterært materiale. De litterære tekstene som tilbys for analyse gjør det mulig å teste ikke bare kunnskapen om spesifikke verk av kandidater, men også evnen til å analysere teksten, med tanke på sjangeren. Den siste oppgaven i del 1 og 2 av verket innebærer å gå inn i en bred litterær kontekst (underbygge sammenhengen mellom denne kunstneriske teksten og andre verk i henhold til det sammenligningsaspektet som er spesifisert i oppgaven). Å stole på intra-fagforbindelser i det studerte kurset gir dermed mulighet for ytterligere dekning av innholdet i det litterære materialet som kontrolleres.
Del 1, som involverer analyse av et fragment av et episk, eller lyrisk-epos, eller dramatisk verk, består av 9 oppgaver:
7 oppgaver med et kort svar (B), som krever skriving av et ord, en frase eller en tallsekvens;
2 oppgaver (C1, C2) som krever å skrive en sammenhengende tekst i mengden 5–10 setninger.
Del 2, som involverer analyse av et lyrisk verk (dikt eller fragment av et lyrisk dikt), består av 7 oppgaver:
5 oppgaver med et kort svar (B), som krever skriving av et ord, en frase eller en tallsekvens;
2 oppgaver (C3, C4) som krever å skrive en sammenhengende tekst i mengden 5–10 setninger.
Kravene for å gjennomføre oppgavene i del 1 og del 2 er de samme.
Å følge den foreslåtte arbeidsalgoritmen lar eksaminanden identifisere plasseringen og rollen til episoden (scenen) i den overordnede strukturen til arbeidet (fragmentanalyse), avsløre plot-komposisjonelle, figurativ-tematiske og stilistiske trekk ved den analyserte teksten, generalisere deres observasjoner med tilgang til den litterære konteksten.
Del 3 av arbeidet krever at eksamensdeltakerne har en detaljert uttalelse i full lengde om et litterært emne (derved legges en annen meningsfull komponent av emnet som testes til det litterære materialet som er utarbeidet i del 1 og 2). Kandidaten tilbys 3 spørsmål (C5.1–C5.3), som dekker de viktigste milepælene i den innenlandske historiske og litterære prosessen: 1 - om verkene fra gammel russisk litteratur, klassikere fra 1700-tallet. og første halvdel av 1800-tallet; 2 - basert på verkene fra andre halvdel av 1800-tallet; 3 - basert på verkene fra XX århundre. Den nyutdannede velger bare ett av spørsmålene og gir et svar på det i form av et essay, som underbygger sine vurderinger ved å referere til arbeidet (fra hukommelsen). Arbeid av denne typen gir kandidaten muligheten til å uttrykke sin holdning til problemene som er reist av forfatteren, og forstå den kunstneriske originaliteten til arbeidet. Å skrive et essay krever et stort mål av kognitiv uavhengighet og er mest i samsvar med litteraturens spesifikasjoner som kunstform og akademisk disiplin, som har som mål å danne en kvalifisert leser med en utviklet estetisk smak og behov for åndelig, moralsk og kulturell utvikling.
Nedenfor er en tabell som viser oppgavefordelingen på deler av eksamensoppgaven.
Tabell 1
Fordeling av oppgaver etter deler av eksamensoppgaven
En del av arbeidet |
Type jobb |
Antall jobber |
Max Primær |
Prosentandelen av maksimal primærpoengsum for oppgaver i denne delen av maksimal primærpoengsum for hele arbeidet, lik 42 |
Med et kort svar |
||||
Med et kort svar |
||||
Med et detaljert svar av begrenset omfang |
||||
Med utvidet svar |
||||
Total: |
Strukturelt er del 1 og 2 av eksamensarbeidet bygget opp i trinn: fra spørsmål på grunnleggende nivå rettet mot å teste teoretiske og litterære kunnskaper (del 1: B1–B7, del 2: B8–B12), til oppgaver på et avansert nivå på en generaliserende type (del 1: C1–C2, del 2: C3–C4). Del 3 inkluderer alternative oppgaver med høy kompleksitet (C5.1-C5.3), som mest reflekterer kravene til profilnivåstandarden.
Struktur og innhold i KIM BRUK
For KIM BRUK i normal modus en viss stabilitet(generelt er strukturen og innholdet i KIM BRUK i det absolutte flertallet av fagene bevart fra år til år).
Nødvendige justeringer av arbeidets struktur og innhold(endre antall oppgaver, styrke den praksisorienterte komponenten, øke andelen oppgaver som krever avhengighet av logisk tenkning, evnen til å trekke konklusjoner osv.) introdusert gradvis etter bred offentlig diskusjon og pilotstudier.
Hvori KIM BRUK årlig blir forbedret for hvert allmennutdanningsfag:
Ordlyden av oppgaver og tilnærminger til valg av eksamensmateriell er under avklaring,
Systemet for vurdering av enkeltoppgaver og eksamensarbeid under ett forbedres.
KIM USE 2012 forbedret sammenlignet med KIM 2011 i alle fag (mest betydelig - i informatikk og IKT, historie og litteratur).
Hovedområdene for forbedring er som følger:
Redusert antall flervalgsspørsmål i KIM i historie, samfunnsfag, kjemi, geografi.
Lagt til nye oppgaver til KIM i historie, matematikk, litteratur, biologi, geografi, samfunnsvitenskap, informatikk og IKT.
Utvidet utvalg av testede ferdigheter i fysikk, kjemi, historie, samfunnsvitenskap, geografi.
Forbedrede kriterier for å evaluere oppgaver med detaljert svar i historie, litteratur, samfunnsvitenskap, fysikk, kjemi, russisk og fremmedspråk.
Ordlyden og kravene til oppgaver er avklart i KIM i alle fag.
KIM 2012 er preget av:
reduksjon i antall oppgaver av reproduktiv karakter;
økning i antall oppgaver for å identifisere graden av forståelse av kandidaten av hovedelementene i innholdet i treningsprogrammer, vurdere dannelsen av ferdigheter for å anvende den ervervede kunnskapen i ulike situasjoner, analysere og generalisere informasjon, uttrykke og argumentere for verdivurderinger .
Endringer i KIM 2012
Russisk språk - |
|
Matematikk -det er ingen grunnleggende endringer. |
|
Biologi -det er ingen grunnleggende endringer. |
|
Kjemi -det er ingen grunnleggende endringer. |
|
Fysikk– det er ingen grunnleggende endringer. |
|
Geografi – det er ingen grunnleggende endringer. |
1. Antall oppgaver i del 1 er redusert fra 25 til 24. Følgelig er det totale antallet oppgaver redusert fra 45 til 44, og den maksimale primærskåren for å fullføre alle oppgaver i arbeidet er redusert fra 55 til 54. 2. CIM 2012 inkluderer en ny oppgave (B1) av det grunnleggende nivået av kompleksitet, som tester evnen til å lese geografiske kart av forskjellig innhold. 3. Oppgaven som tester evnen til å bruke kunnskap om tidssoner i praktiske aktiviteter og hverdagsliv for å bestemme standardtid er ekskludert på grunn av vedtakelsen av Federal Law on Timekeeping i juni 2011 (Siden prosedyren for å beregne tid på territoriet av den russiske føderasjonen vil bli endret, inkludere i arbeidsoppgavene for å beregne tid er umulig, siden dette materialet ikke ble studert av nyutdannede fra 2012) |
Historie- betydelige endringer (i strukturen og innholdet til KIM) |
Hovedelementene i nyheten til eksamensmodellen i 2012: 1. Strukturen til CIM er optimalisert og antall oppgaver av reproduktiv karakter er redusert (antall oppgaver med svarvalg er redusert fra 27 til 21, antall oppgaver med kort svar er redusert fra 15 til 12, og antall oppgaver med detaljert besvarelse er redusert fra 7 til 6; 2. økt antall oppgaver rettet mot å teste evnen til å systematisere historiske fakta, etablere årsakssammenhenger, strukturelle og andre sammenhenger, bruke informasjonskilder for å løse kognitive problemer, formulere og argumentere egen posisjon med involvering av historisk kunnskap; en ny oppgavemodell C6 er inkludert (et historisk essay som involverer en analyse av aktivitetene til en historisk person, en alternativ oppgave: en nyutdannet har muligheten til å velge en av tre figurer fra forskjellige tidsepoker og demonstrere sine kunnskaper og ferdigheter på mest kjente historisk materiale)); 3. den generelle retningen for å forbedre KIM er å styrke blokken av oppgaver som tester analytiske og informasjons- og kommunikasjonsevner til nyutdannede; opprettelse og gradvis introduksjon av nye typer oppgaver med et detaljert svar for mer nøyaktig å differensiere kandidater som planlegger å fortsette sin utdanning ved universiteter i humaniora med ulike nivåer av krav til historisk forberedelse av kandidater. |
Samfunnsvitenskap -det er ingen grunnleggende endringer. |
|
Litteratur - vesentlige endringer (i vurderingssystemet). |
De viktigste endringsretningene i KIM USE 2012:
|
Fremmedspråk -det er ingen grunnleggende endringer. |
Avklart:
|
Informatikk og IKT -betydelige endringer (i strukturen og innholdet til KIM) |
|
Side 1
Forelesning 17
1. Mål og mål for eksperimentet med innføringen av Unified State Examination.
2. Kontroll- og målemateriell (KIM).
3. Teknologi for utvikling av KIM, organisering og gjennomføring av eksamen.
4.Skalering av resultatene av BRUK og deres bruk i styring av kvaliteten på utdanning.
5. Unified State Examination og det all-russiske systemet for vurdering av kvaliteten på utdanning.
1. Mål og mål for eksperimentet med innføringen av Unified State Exam.
1. Mål for eksperimentet om innføring av Unified State Examination . Eksperimentet med innføringen av Unified State Examination, lansert i 2001, åpner en ny side i utviklingen av det innenlandske utdanningssystemet og er nyskapende ikke bare i design, men også i form av oppførsel, i skala og fravær av strenge regulering fra myndighetene. For første gang i historien til nasjonal utdanning ble det gjort et forsøk ikke ved direktiv, men ved eksperiment, for å bestemme gjennomførbarheten av en grunnleggende omstrukturering av virksomheten til utdanningsinstitusjoner og kvalitetsstyringssystemet for utdanning.
Eksperimentet har to mål: å øke tilgjengeligheten til høyere utdanning og kvaliteten på videregående opplæring, som gjennomføres samtidig ved å kombinere skoleeksamenseksamen og opptaksprøven til høyere utdanningsinstitusjoner i én prosedyre. I følge resultatene fra Unified State Examination får skolekandidater to karakterer, hvorav den ene er satt på en skole fem-punkts skala, og den andre på en hundre-punkts skala for innsending til opptakskomiteene til universiteter og høyskoler.
Oppgaver løst ved hjelp av eksamen. Hovedoppgavene som er løst i USE inkluderer:
Objektivisering av vurdering av utdanningskvalitet basert på opprettelse av en ekstern vurderingsmekanisme og bruk av pedagogiske målinger;
Øke tilgjengeligheten til yrkesfaglig utdanning, først og fremst for unge mennesker fra lavinntektsfamilier og fra bosteder som ligger fjernt fra universitetssentre;
Objektivering av kravene til "generell opplæring av søkere til utdanningsinstitusjoner i systemet for yrkesutdanning;
Redusere den psykologiske byrden på nyutdannede ved utdanningsinstitusjoner ved å redusere antall eksamener; - utvikling av kontinuiteten i generell og yrkesrettet utdanning, og sikrer at skolekandidater er klare til å fortsette sin utdanning;
Forbedre systemet for statlig kontroll og styring av kvaliteten på utdanning basert på en uavhengig vurdering av kvaliteten på utdannet opplæring.
Løsningen av den siste oppgaven, spesielt, lar oss snakke om det betydelige bidraget fra USE til dannelsen og utviklingen av det all-russiske systemet for vurdering av utdanningskvaliteten (OSOKO), som for tiden opprettes i Russland. For å oppfylle sine hovedoppgaver, er USE et viktig strukturelt element i OSOKO og en av de sentrale leddene i utvikling og forbedring avmet.
Løsningen av disse oppgavene er sikret ved utførelse av arbeid på en rekke områder, som inkluderer: dannelsen av et regelverk for eksperimentet; etableringen av KIM; utvikling av teknologi for gjennomføring av eksamen; sikre informasjonssikkerhet for prosedyrer, materialer og eksamensresultater; dannelse av informasjonssystemer for å støtte eksperimentet og bruken av dets data i utdanning; opplæring av spesialister for bemanning av eksperimentet; BRUK overvåking; analyse og tolkning av overvåkingsdata for å forbedre kvaliteten på utdanningen.
Ordninger for deltakelse av regioner i Unified State Examination og utviklingen av eksperimentet. Etter å ha bestemt seg for å delta i USE, velger regionen på frivillig basis en av de mulige ordningene for gjennomføring av eksamen, som kan avvike fra andre i antall og sammensetning av fag, frivillighet eller obligatorisk sertifisering av skolekandidater i form av BRUK, andelen av datatesting og andre spesifikke funksjoner på grunn av regionens økonomiske evner, dens materielle base, kommunikasjonsutviklingsnivået, antall universiteter, deres beredskap til å delta i eksperimentet, etc.
I samsvar med hovedlinjen om mangelen på strenge direktiver fra de føderale utdanningsmyndighetene, beholder USE maksimalt mulig variasjon i ordningene for å gjennomføre, som ofte endrer regionene selv i prosessen med å utvikle eksperimentet.
Til tross for det eksisterende regelverket som definerer listen over obligatoriske emner for den endelige sertifiseringen av skolekandidater, nekter mange regioner, som en del av arbeidet med å forbedre USE-ordningen, obligatoriske emner og gir nyutdannede rett til selvstendig å velge antall eksamener og delta i selve BRUKEN. Det er betydelig at etter hvert som omfanget av prinsippene om variasjon og frivillighet utvides, øker antallet deltakere i eksperimentet jevnt og trutt sammen med manifestasjonen av en positiv holdning fra samfunnet til eksperimentet.
En analyse av USE-overvåkingsdataene indikerer på en overbevisende måte en kraftig økning i antall regioner som deltar i eksperimentet og en økning i tilliten til USE fra utdanningsmyndighetenes, fagmiljøet ved universiteter og skoler, studenter og deres foreldre. Spesielt endret antallet regioner som deltok i eksperimentet seg fra 6 i 2001 til 78 i 2005, og antallet kandidater fra disse regionene som tok USE-eksamener i matematikk og russisk språk i 2005 oversteg 50 %. Listen over universiteter og høyskoler som godtar søkere basert på resultatene fra Unified State Examination har utvidet seg betydelig. I 2005 deltok 1543 universiteter (inkludert filialer) og 1765 høyskoler i eksperimentet, mens i 2001 deltok bare 16 universiteter i det. Det totale antallet innsendte emner til BRUK i regionene har økt kraftig. I følge overvåkingsdata og regional statistikk, i løpet av eksperimentets år, har antallet kandidater fra landlige områder som gikk inn på universiteter basert på resultatene fra USE økt betydelig. I det hele tatt indikerer eksperimentets trender at håpene knyttet til USE for å utvide tilgjengeligheten til høyere utdanning for innbyggere i landlige og avsidesliggende regioner i Russland er fullt ut berettiget. Dette bekreftes av USE-overvåkingsdataene.
Lærers deltakelse i gjennomføringen av eksamen. Lærere fungerer ofte som arrangører av USE på skolene, men de jobber bare med de nyutdannede som ikke tidligere var deres elever. I dette tilfellet deltar lærere i forberedelsene til eksamen, organiserer selve testprosedyren og sørger for innsamling og sending av eksamensmateriell.
Som forberedelse til testing mottar lærere alt nødvendig materiell, inkludert KIM-sett med reservemateriell i tilfelle skrivefeil, lister over kandidater, former for testprotokoller som noterer alle avvik fra standardiseringskravene ”og en testguide som inkluderer en beskrivelse av alle kravene for gjennomføring av eksamen.
Etter at eksamen er over samler arrangørene inn materialer: brukte og ubrukte tester, en utfylt prøveprotokoll og legger ved lister over studenter. Disse materialene overføres til spesielle sentre for verifisering og viderebehandling, som kalles regionale informasjonsbehandlingssentre (RTsOI) i USE-systemet. Oppgaver med flervalgssvar blir utsatt for automatisert verifisering på stedet eller i Moskva, og for å verifisere oppgavene med detaljerte svar, inviteres eksperter, hvis arbeid er organisert på eksamensstedet under forhold med fullstendig informasjonssikkerhet og uavhengighet av ekspert. dommer.
2. Kontroll målematerialer
KIM struktur.Det er tre deler i CIM-strukturen (A, B, C), ha et forskjellig antall oppgaver avhengig av emnet. For eksempel kan oppgaver i biologi og historie være 50, og på russisk - 40,
Del A for alle fag inneholder kun oppgaver med flervalgssvar. Deloppgaver PÅ varierer betydelig i form og foreslår muligheten for et kort regulert svar, som etablerer en samsvar mellom elementene i to sett og den riktige sekvensen av ulike prosesser, fenomener, objekter. Del C er for gratis konstruksjon av et svar. For eksempel, når du tester på det russiske språket, gis oppgaven å skrive et kort skriftlig arbeid (essay), i matematikk - å gi detaljerte løsninger på oppgaver, etc.
Innhold i KIM. Resultatene av USE brukes i sluttvurdering av studenter og utvelgelse av søkere. Innholdet i KIM er ment å motta personlig informasjon om oppnåelse av skolekandidater på grunnleggende og avanserte nivåer av opplæring i fag. Siden attestasjon krever kontroll av mestring av de fleste elementene i fagopplæringen av kandidater, og eksamenstiden er begrenset, for å øke representativiteten av dekningen av innholdet i utdanningen, er det nødvendig å variere spesifikasjonene til KIM BRUK litt innenfor ett år og mer betydelig gjennom årene. Takket være spesialplanlegging utført av fagkomiteene for utvikling av CIM, er det i løpet av 2-3 år mulig å dekke alle nødvendige innholdselementer. På grunn av variasjonen i KIM-spesifikasjonene reduseres sammenlignbarheten av resultatene til nyutdannede, men mulighetene for å bruke resultatene av USE på føderalt og regionalt nivå for å overvåke utdanningskvaliteten utvides. Basert på analysen av resultatene for individuelle år av USE, er det derfor mulig å få rimelig informasjon om trendene i endringer i den generelle utdanningen til russiske skolekandidater.
Generelt velges innholdet i KIM på grunnlag av spesifikasjoner som oppdateres årlig på Internett og inkluderer generaliserte planer for eksamensoppgaver med lenker til de tilsvarende stillingene til kodifikatorer (nummererte lister over innholdselementer etter emne). Innholdet i KIM gjenspeiler kun fagkunnskaper og ferdigheter som undervises på skolen, selv om dette er i strid med moderne syn på prioriteringer i undervisningen, akseptert i mange land. Som et resultat presterer russiske studenter dårlig i internasjonale komparative studier av kvaliteten på utdanningen. De er ikke i stand til å utføre oppgaver som krever anvendelse av kunnskap i situasjoner som etterligner livet eller tverrfaglige ferdigheter.
Analyse av resultatene av implementeringen av KIM i sammenheng med meningsfull tolkning gir viktig informasjon for å forbedre kravene til SES og forbedre kvaliteten på utdanningen. I følge resultatene av analysen utført av fagkommisjonene for utvikling av KIM og publisert i 2006 i en analytisk rapport, utføres oppgaver på det grunnleggende vanskelighetsnivået hovedsakelig av nyutdannede som fikk gode og gode karakterer i USE. Andelen elever i denne gruppen som fullførte alle oppgaver på grunnnivå er noe høyere i matematikk og russisk språk (over 90 %) og lavere i andre fag (ikke mer enn 85 %). Omtrent halvparten av kandidatene som mottok "to" og "tre" i henhold til resultatene fra Unified State Exam, mestrer ikke engang halvparten av materialet som er planlagt for studiet. Dette resultatet hjelper til med å identifisere problemer knyttet til de overdrevne kravene til SES og den overdrevne mengden skoleinnhold.
3. Teknologi for utvikling av instrumentering
materialer, organisering og oppførsel
Unified State-eksamen
Strukturer involvert i organisering og gjennomføring av eksamen. Strukturene som gir organisatorisk, ledelsesmessig og vitenskapelig og metodisk støtte i implementeringen av USE-teknologien inkluderer føderale og regionale utdanningsmyndigheter, Federal Testing Center (FTS), Federal Institute of Pedagogical Measurements (FIPI), KROK-selskapet, regional informasjonsbehandling sentre og ulike organisasjoner (universiteter og andre utdanningsstrukturer) som utfører forskningsprosjekter på et konkurransedyktig grunnlag for å danne det vitenskapelige og metodiske grunnlaget for teknologien for å gjennomføre Unified State Examination og forbedre KIM.
CMM utviklingsteknologi. Den teknologiske årlige syklusen for utvikling av KIM i faget begynner med revisjonen av kodifisereren av innholdselementer som skal verifiseres, samt med opprettelsen av en spesifikasjon og en demonstrasjonsversjon av KIM. Vanligvis, for 13 emner deklarert i USE, utvikles minst 10 tusen nye oppgaver årlig. I tillegg til målrekkefølgen for oppgaver for å fylle opp USE-banken, utlyses det en konkurranse der alle interesserte forfattere av testoppgaver fra forskjellige regioner i Russland deltar. Materialene som sendes inn til konkurransen gjennomgår en undersøkelse, hvis resultater er valg og kjøp av testartikler for USE-banken. FILI-spesialister, ved hjelp av banken, danner varianter av CIM. Deretter utføres en undersøkelse av kvaliteten på innholdet i alternativene, en analyse av deres parallellitet og samsvar med oppgavene med kravene til testskjemaet. Etter korrigering basert på resultatene av eksamen, blir KIM overført for godkjenning utført på representative utvalg av elever: skoler i Russland. Behandlingen av testdataene og deres analyse gjør det mulig å utføre neste korreksjon, hvoretter tilsvarende versjoner av CMM oppnås med sett med tilhørende dokumentasjon for utførelse BRUK, opprettet under forhold med høy informasjonssikkerhet og lagret i spesialrom frem til eksamensstart.
Etter eksamen og databehandling utarbeider FIPI-spesialister en analytisk rapport som inneholder anbefalinger for å forbedre CMM, som tas i betraktning når de utfører den neste årlige teknologiske syklusen.
Teknologien til eksamen. Når du gjennomfører eksamen, er hovedteknologien en tom, som innebærer å utstede oppgaver til nyutdannede på papir. Implementeringen av blank teknologi avhenger av organisasjonen som er involvert i implementeringen. For eksempel skriver FCT ut alt materiell i Moskva, og før eksamensstart overfører pakker med CMM og svarskjemaer til regionene, CROC støtter en teknologi der svarskjemaer skrives ut på bruksstedet i regionene .
Ved bruk av datatesting i USE er teknologien blandet, siden oppgavene i del C med detaljerte svar utføres på papirskjemaer. En enkelt teknologi for gjennomføring av eksamen er ennå ikke utviklet. Hvert av alternativene for å utføre eksperimentet har sine egne fordeler og ulemper, som bare kan avsløres fullt ut på slutten av det.
4. Skalering av resultatene til Unified State
eksamener og deres bruk i ledelsen
kvaliteten på utdanningen
Typer skalaer brukt i eksamen. I henhold til oppgitte mål og oppgaver som skal løses, gis det ifølge USE-dataene to karakterer - i en hundre- og fempunkts skoleskala. Den første innhentes av FCT-spesialister ved å skalere primærdata USE, konverterer dem til en standard logit-skala basert på moderne testteori. Den andre, skolen, velges av spesialistene fra skaleringsgruppen organisert av Rosobrnadzor under eksamener og består av testere, representanter for FIPI-fagkommisjonene og FCT-ansatte. For å velge grensene for intervallene til 100-punktsskalaen og etablere samsvar med vurderingene av 4-punktsskalaen, blir resultatene av BRUK i hvert fag og alle regioner utsatt for en flerdimensjonal analyse, inkludert innholdsproblemer : gyldigheten av skolepoeng og sammenlignbarheten av karakterer i faget i USE i ulike år.
Sammenliknbarhet BRUK resultater i forskjellige år. For å sikre meningsfull sammenlignbarhet av testresultater, introduserer mange land som har nasjonale testbaserte eksamener eller andre typer massetesting standardiserte nivåskalaer (se avsnitt 13.5) for å spore forholdet mellom testinnhold over år. En viktig fordel med nivåskalaene er å utvide muligheten for å tolke resultatene av eksamen, siden prøveresultatet kan suppleres med en meningsfull beskrivelse av forberedelsen av skolekandidater når det gjelder mestrede og ubeherskede tematiske elementer i faget.
For å introdusere en meningsfull tolkning i praktiseringen av USE, er det først og fremst nødvendig å gjennomføre en arbeidssyklus for å forbedre strukturen til SES basert på ideene om nivådifferensiering og å beskrive de forskjellige på en meningsfull måte. generell utdanning i alle skolefag. Deretter, på et representativt utvalg av nyutdannede russiske skoler, bør det bygges en stabil skala av standard testresultater, og skalaområder bør identifiseres ved å korrelere dem med innholdet i oppgavene som er fullført på hvert nivå.
Når det gjelder teorien om pedagogiske målinger, betyr sammenlignbarhet muligheten for å overføre testresultater fra ulike år til en enkelt skala. Sammenliknbarhet gir kandidaten muligheten til å bestå BRUK en gang og bruke resultatene i tilfelle mislykket opptak til universitetet i de påfølgende årene, og for ledere - muligheten til å gjennomføre sammenlignende studier av kvaliteten på utdanningen.
Den tradisjonelle tilnærmingen til å løse problemet med sammenlignbarhet er basert på definisjonen av normene for den såkalte ankertesten for å sette sammen tabeller over ekvivalens av poeng for ulike tester. Ankerprøven er valgt og standardisert på et nasjonalt representativt utvalg av forsøkspersoner nøye utvalgt fra en nasjonal populasjon.
Med utgangspunkt i ankerprøven fastsettes representative nasjonale normer i ulike fag. Dataene samlet på den nasjonale ankertestprøven tjener til å bygge en skala av vanlige indikatorer. Hver ny test utviklet i de påfølgende årene kalibreres mot ankertesten, som et resultat av at det er mulig å fastslå hvilken resultatet av emnet i de påfølgende årene tilsvarer indikatoren i ankertesten.
For å bygge oversettelsestabeller i det generelle tilfellet på samme utvalg av emner, brukes vanligvis metoden med like persentiler, ifølge hvilken indikatorene anses som likeverdige hvis de har like persentiler og oppnås på en normal sammenligningsgruppe i henhold til parallelle testalternativer . Ulempene med metoden inkluderer høye kostnader, uunngåelig korrigering og forbedring av innholdet i tester, endringer i innholdet i utdanning og prioriteringer i utdanningsavtaler, og fordelene er stabilitet og høy nøyaktighet, siden resultatene for alle påfølgende versjoner av tester sammenlignes med én ankertest.
Med fremkomsten av teorien IRT begynte å bruke mer effektive teknologier som sikrer sammenlignbarhet av testresultater for forskjellige år. Denne teknologien er basert på inkludering av grupper av (generelle) ankeroppgaver i tester fra forskjellige år, og kobler resultatene fra senere og tidligere versjoner av testen i en kjede. Nedtellingen er fra skalaen bygget på referansesammenligningsgruppen. Dermed er hver versjon av neste versjon av testen, takket være blokken med vanlige oppgaver, assosiert med forrige og etterfølgende versjoner av testbatteriet.
Det nødvendige forklaringsmaterialet utvikles vanligvis for testbrukere for å sikre konvertering av råskårer til avledede indikatorer som kan sammenlignes med resultatene av referanseskalaen. Ytterligere tiltak for å øke sammenlignbarheten av testresultater er gitt av en spesiell teori om testjustering. Lignende moderne metoder er planlagt brukt i eksamen.
5. Den enhetlige statlige eksamen og det all-russiske systemet for vurdering av kvaliteten på utdanning
Hva menes med det all-russiske systemet for å vurdere kvaliteten på utdanning . Det all-russiske systemet for å vurdere kvaliteten på utdanning er forstått som et sett med organisatoriske og funksjonelle strukturer som gir en vurdering av innbyggernes utdanningsprestasjoner basert på en enkelt konseptuell og metodisk base, samt identifisering av faktorer som påvirker utdanning. resultater.
Hovedmålet med å opprette OSEKO er å øke objektiviteten og validiteten til informasjonsgrunnlaget for utdi Russland, samt å gi alle deltakere i utdanningsprosessen og samfunnet som helhet pålitelig informasjon om kvaliteten på utdanning i landet.
I samsvar med målet til hovedoppgavene OSOKO kan tilskrives:
Vurdering av kvaliteten på utdanningsprestasjoner til studenter og nyutdannede ved utdanningsinstitusjoner på ulike utdanningsnivåer;
Utvikling av vitenskapelig og metodisk støtte for prosedyrer og verktøy for å vurdere kvaliteten på utdanningen;
Oppretting av strukturer som sikrer kvaliteten på verktøy og teknologier for pedagogiske målinger (sertifiseringssentre);
Opprettelse av sentre for statistisk behandling og analyse av data om utdanningskvalitet, organisering av et system for opplæring og omskolering av lærerpersonale, etc.
Prosessen med å opprette OSOKO i Russland er ennå ikke fullført, så antall hovedoppgaver kan endre seg etter hvert som den utvikler seg.
Konstruksjonen av OSOKO innebærer utstrakt bruk av eksisterende organisasjonsstrukturer, mekanismer og prosedyrer: Unified State Examination, sentre for sertifisering, attestasjon og akkreditering, sentre for utdanningskvalitet og overvåking, arbeider på et enhetlig vitenskapelig og metodisk grunnlag som en del av utviklingsstrategien for det all-russiske systemet for vurdering av kvaliteten på utdanning.
BRUK i OSOKO. USE er et integrert strukturelt element i OSOKO og gir objektiv informasjon om den virkelige tilstanden til kvaliteten på skoleundervisningen. USE-dataene gjør det mulig å få vurderinger av tilstanden til utdanningsprestasjoner til skolekandidater, for å identifisere trender og dynamikk i endringer i videregående opplæringssystemet, for å danne et sett med hovedfaktorer som påvirker kvaliteten på utdanningen i ulike regioner, og å vurdere graden av deres innflytelse.
USE er ikke den eneste informasjonskilden til OSOKO. Uten tvil, i tillegg til informasjonen som samles inn under eksamen om fagkunnskaper og ferdigheter til skolekandidater, er det nødvendig med ytterligere data som karakteriserer tilstanden til kvaliteten på utdanningen på ulike nivåer (vurderinger av evnen til å anvende kunnskap samlet ved hjelp av porteføljer og andre metoder for autentisk vurdering; vurderinger av data om tverrfaglige, generelle utdannings- og kommunikasjonsferdigheter om oppvekstnivået til traineer og effektiviteten av pedagogisk påvirkning, resultatene av elevenes deltakelse i olympiader og kreative konkurranser, etc.).
Et viktig krav som sikrer riktig bruk av BRUK-data i OSEKO er hensynet til ulike faktorer ved tolkning av eksamensresultater, som ofte ligger utenfor skolens innflytelse, men som i betydelig grad påvirker kvaliteten på utdanningen.