De test bestaat uit vier blokken met vragen waarmee u het competentieniveau van de leraar kunt identificeren in de vier componenten: professionele competentie - Document. De kwaliteit van het onderwijs Een onderdeel dat niet is opgenomen in de structuur van Kim Ege

"KIM's - dit is een gestandaardiseerd examenwerk dat is gemaakt in overeenstemming met de vereisten van de theorie van pedagogische metingen, waarmee met voldoende objectiviteit en betrouwbaarheid een onafhankelijke staatscertificering van afgestudeerden van instellingen voor algemeen onderwijs en de selectie van universitaire kandidaten kan worden uitgevoerd.

Bij het samenstellen van KIM's is de effectieve verhouding van het gebruik van verschillende taakvormen in de toets voor de eindcertificering van afgestudeerden bepaald. Tegelijkertijd werd rekening gehouden met jarenlange ervaring van buitenlandse collega's. Om te zorgen voor een effectieve beheersing van de kennis en vaardigheden van afgestudeerden van de landelijke school, is ervoor gekozen om verschillende taakvormen in het KIM op te nemen: taken met de keuze van het juiste antwoord, taken voor aanvulling en taken met een gratis gedetailleerd antwoord (antwoord in de vorm van een essay, recensie, tekstanalyse).

KIM's in verschillende vakken omvatten drie delen - A, B, C. Elk deel bestaat uit taken die zijn gegroepeerd op vorm. Het totaal aantal taken varieert van 25 tot 70.

Deel A biedt taken met een keuze aan antwoorden (taken van een gesloten type). Deze taken zijn vrij eenvoudig en zijn gericht op het testen van de kennis van feitenmateriaal, regels, formules, definities, enz. Het aandeel van dergelijke taken varieert afhankelijk van het onderwerp. Ze kunnen kwantitatief overheersen over andere soorten taken, maar de gewichtscoëfficiënt van dergelijke taken is minder, d.w.z. in de totaal gewogen score voor het oplossen van een taak van type A worden minder punten gegeven dan voor het oplossen van taken van een ander type.

Deel B bestaat uit taken van een open type - van taken voor de toevoeging in de vorm van een cijfer of een woord. Bij deze taken construeert de proefpersoon zelf het juiste antwoord, in tegenstelling tot taken van een gesloten type, waarbij het antwoord al is gegeven en het alleen nodig is om het juiste te bepalen. Deze taken zijn in de regel moeilijker dan de taken van deel A, dus hun gewichtscoëfficiënt is hoger.

De taken van deel A en B zijn zo ontworpen dat de toets in computermodus plaatsvindt.

BIJ deel C gegeven een taak die een gratis gedetailleerd antwoord omvat. Het kan een complete oplossing zijn voor een wiskundig probleem of het schrijven van een tekst. Taken van deel C testen het vermogen van afgestudeerden om na te denken, over een bepaald onderwerp te redeneren, hun gedachten schriftelijk te formuleren en correct uit te drukken. Dit deel van de test wordt geverifieerd door onafhankelijke experts. Dit vereist extra materiële kosten en maakt het tot op zekere hoogte mogelijk om de score van deel C te beïnvloeden, maar desalniettemin vergroot de opname van dit deel in KIM de mogelijkheid om een ​​breed scala aan kennis en vaardigheden van afgestudeerden te testen.

Opmerking. Overweeg in praktijklessen voorbeelden van KIM's voor het Unified State Examination en GIA in specifieke disciplines (wiskunde, natuurkunde, informatica, geschiedenis, technologie, enz.).



1. Bakhusova EV, Korostelev AA, Monakhov VM. enz. Technologieën V.M. Monakhova - didactische instrumenten voor de modernisering van het onderwijs: Proc. Ten goede komen. - M.-Togliatti: Volzhsky un-t im. VN Tatishcheva, 2004. - 60 p.

3. Episheva OB Technologie voor het onderwijzen van wiskunde op basis van de activiteitenbenadering: Boek. voor de leraar / O.B. episjev. – M.: Verlichting. 2003. - 223 d. (Bka-leraren).

4. Zvonnikov V.I. Moderne manieren om leerresultaten te evalueren: leerboek voor studenten van instellingen voor hoger onderwijs / V.I. Zvonnikov, MB Tsjelysjkov. - M.: Uitgeverijcentrum "Academy", 2007. - 224 p.

5. Kwaliteit van het onderwijs. Prestaties. Problemen. Proceedings van de IV International Scientific and Methodological Conference / Ed. NET ZO. Vostrikova. - Novosibirsk: NGTU, 2001.-433p.

6. Clarin. MV Technologische benadering van leren // Schooltechnologieën. Nr. 5. 2003. - S. 3 - 22.

7. Mayorov A.N. Testen en hun typen. Prestatie testen. School technologieën. - Nr. 4. - 1998. - P. 176.

9. Manko NN Technologische competentie van de leraar // Schooltechnologieën. 2002. Nr. 5. - S. 33 - 41.

10. Monachov VM Technologische basis voor het ontwerpen en construeren van het onderwijsproces. - Wolgograd: Wijzigen. 1995. - 152 d.

12. Potashnik M.M. Kwaliteit van het onderwijs: problemen en technologieën van management (in vragen en antwoorden). - M.: Pedagogische Vereniging van Rusland, 2002. - 352 p.

13. Strategie voor de modernisering van de inhoud van het algemeen onderwijs: Materialen voor de ontwikkeling van documenten voor de vernieuwing van het algemeen onderwijs. - M.: OOO "World of Books", 2001. - 66 p.

14. Chernilevsky D.V., Filatov O.K. Lesgeven in techniek in het hoger onderwijs: Proc. editie / red. D.V. Chernilevsky. - M.: "Forwarder", 1996. - 288 d.

15. Yansufina Z.I. Verbetering van de methodologische voorbereiding van een toekomstige leraar wiskunde in een lerarenopleiding op basis van innovatieve benaderingen van lesgeven: Proc. toelage voor studenten van een pedagogische universiteit in de specialiteit 010100 - Wiskunde. - Tobolsk: TSPI im. DI. Mendelejeva, 2004. - 156 p.

16. Chelyshkova MB, Khlebnikov V.A. De belangrijkste benaderingen voor het beoordelen van de kwaliteit van opleidingsstudenten // Kwaliteitsproblemen, de regelgeving en normen in het onderwijs: Sat. wetenschappelijk Kunst. M., 1999

17. Chelyshkova MB Ontwikkeling van pedagogische tests op basis van moderne wiskundige modellen. M., 1995

18. Chelyshkova M.B., Saveliev B.A. Richtlijnen voor de ontwikkeling van pedagogische tests voor een uitgebreide beoordeling van de gereedheid van studenten aan de universiteit. M., 1995

College 1 Het concept van de kwaliteit van het onderwijs. Evaluatie van leerresultaten als onderdeel van kwaliteitsmanagement. Traditionele en nieuwe manieren om leerresultaten te beoordelen……………………………………………………………………………………………… 3

College 3 De geschiedenis van de ontwikkeling van het testsysteem in het buitenland en in Rusland …………………………………………………………………………………………..… …..8

Hoorcollege 4 Pedagogische testen. Termen en definities. Classificatie van pedagogische toetsen ……………………………….…………………………………….12

College 5 Soorten, vormen en soorten toetstaken ….………………………………..15

Oefening 1…………………………………………………………..……16

College 6 De belangrijkste fasen in de ontwikkeling van een pedagogische toets ……………………………………………….21

College 7 Proeftesten uitvoeren. Testkwaliteitsindicatoren…………………………..……………………………………………………………….25

Oefening 2………………………………………………………………..29

College 8 Moderne theorie van testontwerp………………………….33

College 9 Teststandaardisatie en interpretatie van testresultaten. GEBRUIK en kwaliteit van het onderwijs…………………….……………………………………………………34

Specificatie

controle meetmaterialen

voor het houden van het eengemaakte staatsexamen in 2012

over literatuur

1. Benoeming van KIM USE

Het Unified State Examination (hierna USE genoemd) is een vorm van objectieve beoordeling van de kwaliteit van de opleiding van personen die de onderwijsprogramma's van het secundair (volledig) algemeen vormend onderwijs beheersen, met behulp van taken in een gestandaardiseerde vorm (controle meetmateriaal) .

Controle meetmaterialen maken het mogelijk om het ontwikkelingsniveau van afgestudeerden van de federale component van de staatsnorm van secundair (volledig) algemeen onderwijs vast te stellen.

De resultaten van het eengemaakt staatsexamen literatuur worden door onderwijsinstellingen van het middelbaar beroepsonderwijs en onderwijsinstellingen van het hoger beroepsonderwijs erkend als de resultaten van toelatingsexamens literatuur.

2. Documenten die de inhoud van KIM USE definiëren

De inhoud van het examenwerk wordt bepaald op basis van de federale component van de staatsnorm van het algemeen onderwijs (Orde van het Ministerie van Onderwijs van Rusland van 05.03.2004 nr. 1089). Sommige posities van dit document zijn gespecificeerd op basis van de Verplichte minimuminhoud van het basis algemeen en secundair (volledig) algemeen onderwijs in literatuur, goedgekeurd door orders van het Ministerie van Onderwijs van Rusland van 19-05-1998 nr. 1236 en gedateerd 30-06 /1999 nr. 56 (rechtvaardiging wordt gegeven in de toelichting bij de codering van inhoudselementen en vereisten voor het opleidingsniveau van afgestudeerden van onderwijsinstellingen voor het eengemaakte staatsexamen literatuur in 2012).

3. Benaderingen voor de selectie van inhoud, de ontwikkeling van de structuur van de KIM USE

De uitgangspunten voor het selecteren van de inhoud en het uitwerken van de opbouw van het KIM USE in de literatuur sluiten aan bij het doel objectieve en betrouwbare informatie te verkrijgen over de bereidheid van een afgestudeerde om door te studeren aan instellingen voor mbo en hbo geesteswetenschappen.

De langetermijnverbetering van de KIM USE in de literatuur ging in de richting van het vinden van de optimale structuur van het examenwerk, het creëren van een betrouwbaar systeem voor het evalueren ervan en het waarborgen van de objectiviteit van de examenresultaten. Het aantal taken dat de kennis van bepaalde literaire feiten testte, werd verminderd (in 2007 werden taken met een keuze aan antwoorden uit het examenmodel verwijderd: het experiment toonde hun inefficiëntie, "vreemdheid" in relatie tot literatuur, de ongerechtvaardigde kennisgerichte, "feitelijke" benadering bij het uitvoeren van de staat (definitieve) certificering in de literatuur), het aantal taken met een gedetailleerd antwoord, gerelateerd aan de morele kwesties van kunstwerken, werd ontwikkeld, een typologie van taken met verschillende inhoudsoriëntatie werd ontwikkeld , werden beoordelingscriteria gespecificeerd, werd de optimale verhouding van taken van verschillende soorten in de structuur van het examenwerk bepaald, enz.

Elke versie van de KIM bevat taken die verschillend zijn, zowel in de vorm van presentatie als in het niveau van complexiteit van de taak, waarvan de vervulling het niveau van assimilatie door de USE-deelnemer van de belangrijkste elementen van de inhoud van verschillende secties van de cursus, de mate van vorming van vakcompetenties en algemene onderwijsvaardigheden.

Dus bij het behalen van het examen in de literatuur moet de examinandus de belangrijkste soorten educatieve activiteiten voor het onderwerp activeren: analytisch begrip van een literaire tekst, de interpretatie ervan, zoeken naar gronden om literaire fenomenen en feiten te vergelijken, een gemotiveerd antwoord schrijven op een problematische vraag, enz.

De resultaten van het Unified State Examination in Literature bevestigen dat het huidige examenmodel in de literatuur het mogelijk maakt om de onderwijsprestaties van afgestudeerden in het vak adequaat te beoordelen, om het vormingsniveau van basisvak- en supervakvaardigheden onder afgestudeerden te identificeren. Een examen in deze vorm maakt het mogelijk om USE-deelnemers te differentiëren naar het niveau van hun vakvoorbereiding en geeft universiteiten en hogescholen objectieve gronden voor het selecteren van kandidaten.

4. De structuur van KIM USE

Onderzoekswerk in de literatuur is gebaseerd op een systeem van stapsgewijs testen van het vermogen van afgestudeerden om kunstwerken waar te nemen en te analyseren in hun genre-generieke bijzonderheden, gebaseerd op kennis van historisch-literair en theoretisch-literair karakter. Voorbereiding op het examen literatuur omvat de herhaling door studenten van het volledige cursusmateriaal, waarvan de inhoud wordt bepaald door de normatieve documenten over het onderwerp.

In het examenwerk worden drie onderdelen onderscheiden, die een reeks taken bevatten om het niveau van de voorbereiding van afgestudeerden in de literatuur te bepalen.

Deel 1 en 2 bieden opdrachten met vragen voor de analyse van literaire werken. Het vermogen van afgestudeerden om de belangrijkste elementen van de inhoud en artistieke structuur van de bestudeerde werken te bepalen (thema's en problemen, helden en gebeurtenissen, artistieke technieken, verschillende soorten stijlfiguren, enz.) Wordt gecontroleerd, evenals om specifieke literaire werken te overwegen in combinatie met het cursusmateriaal.

De algemene structuur van de eerste twee delen van het werk is ondergeschikt aan de taak van een brede betekenisvolle dekking van literair materiaal. De literaire teksten die voor analyse worden aangeboden, maken het mogelijk om niet alleen de kennis van specifieke werken van afgestudeerden te testen, maar ook het vermogen om de tekst te analyseren, rekening houdend met het genre. De laatste taak in deel 1 en 2 van het werk betreft het betreden van een brede literaire context (het onderbouwen van de verbinding van deze artistieke tekst met andere werken volgens het vergelijkingsaspect dat in de taak wordt gespecificeerd). Door te vertrouwen op intra-vakgebonden verbindingen van de bestudeerde cursus, kan dus extra aandacht worden besteed aan de inhoud van het literaire materiaal dat wordt gecontroleerd.

Deel 1, dat de analyse van een fragment van een episch, of lyrisch-epos, of dramatisch werk omvat, bestaat uit 9 taken:

    7 taken met een kort antwoord (B), waarvoor het schrijven van een woord, een zin of een reeks cijfers vereist is;

    2 taken (C1, C2) die het schrijven van een samenhangende tekst van 5-10 zinnen vereisen.

Deel 2, dat de analyse van een lyrisch werk omvat (gedicht of fragment van een lyrisch gedicht), bestaat uit 7 taken:

    5 taken met een kort antwoord (B), waarvoor het schrijven van een woord, een zin of een reeks cijfers vereist is;

    2 taken (C3, C4) die het schrijven van een samenhangende tekst van 5-10 zinnen vereisen.

De vereisten voor het voltooien van de taken van deel 1 en deel 2 zijn hetzelfde.

Door het voorgestelde werkalgoritme te volgen, kunnen de proefpersonen de plaats en rol van de episode (scène) in de algehele structuur van het werk identificeren (fragmentanalyse), de plot-compositionele, figuratief-thematische en stilistische kenmerken van de geanalyseerde tekst onthullen, generaliseren hun observaties met toegang tot de literaire context.

Deel 3 van het werk vereist dat de deelnemers aan het examen een volledige gedetailleerde verklaring hebben over een literair onderwerp (dus wordt een ander belangrijk onderdeel van de cursus die wordt getest toegevoegd aan het literaire materiaal dat in deel 1 en 2 is uitgewerkt). De afgestudeerde krijgt 3 vragen (C5.1-C5.3), die de belangrijkste mijlpalen in het binnenlandse historische en literaire proces behandelen: 1 - over de werken van de oude Russische literatuur, klassiekers uit de 18e eeuw. en de eerste helft van de 19e eeuw; 2 - gebaseerd op de werken uit de tweede helft van de 19e eeuw; 3 - gebaseerd op de werken van de twintigste eeuw. De afgestudeerde kiest slechts één van de vragen en geeft daarop een antwoord in de vorm van een essay, waarbij hij zijn oordeel onderbouwt door te verwijzen naar het werk (uit het hoofd). Werk van dit type geeft de afgestudeerde de mogelijkheid om zijn houding te uiten ten opzichte van de problemen die de schrijver opwerpt, waarbij hij de artistieke originaliteit van het werk begrijpt. Het schrijven van een essay vereist een grote mate van cognitieve onafhankelijkheid en voldoet in de grootste mate aan de specifieke kenmerken van literatuur als kunstvorm en academische discipline, die tot doel heeft een gekwalificeerde lezer te vormen met een ontwikkelde esthetische smaak en een behoefte aan spirituele, morele en culturele ontwikkeling .

Hieronder vindt u een tabel met de taakverdeling naar onderdelen van het tentamenpapier.

tafel 1

Verdeling van taken naar onderdelen van het examenpapier

Onderdeel van werk

Soort baan

Aantal banen

Max primair

Het percentage van de maximale primaire score voor taken in dit deel van de maximale primaire score voor het gehele werk, gelijk aan 42

Met een kort antwoord

Met een kort antwoord

Met een gedetailleerd antwoord van beperkte omvang

Met uitgebreid antwoord

Totaal:

Structureel zijn de delen 1 en 2 van het examenwerk in stappen opgebouwd: van vragen op basisniveau gericht op het testen van theoretische en literaire kennis (deel 1: B1-B7, deel 2: B8-B12), tot taken van een gevorderd niveau van een generaliserend type (deel 1: C1-C2, deel 2: C3-C4). Deel 3 bevat alternatieve taken van een hoog niveau van complexiteit (C5.1-C5.3), die het meest voldoen aan de eisen van de profielniveaustandaard.


Structuur en inhoud van KIM USE

Voor KIM GEBRUIK in normale modus een zekere stabiliteit(over het algemeen blijft de structuur en inhoud van het KIM USE in de absolute meerderheid van de onderwerpen van jaar tot jaar behouden).

Noodzakelijke aanpassingen aan de structuur en inhoud van het werk(veranderen van het aantal taken, versterken van de praktijkgerichte component, vergroten van het aandeel taken waarvoor logisch denken nodig is, conclusies kunnen trekken, etc.) geleidelijk ingevoerd na brede publieke discussie en pilotstudies.

Waarin KIM GEBRUIK jaarlijks worden verbeterd voor elk algemeen vormend vak:

De formulering van taken en benaderingen voor de selectie van examenmateriaal worden verduidelijkt,

Het systeem voor het evalueren van individuele taken en examenwerk als geheel wordt verbeterd.

KIM GEBRUIK 2012 verbeterd in vergelijking met KIM 2011 in alle vakken (het meest significant - in informatica en ICT, geschiedenis en literatuur).

De belangrijkste verbeterpunten zijn de volgende:

Minder meerkeuzevragen in KIM in geschiedenis, sociale studies, scheikunde, aardrijkskunde.

Nieuwe taken toegevoegd aan KIM in geschiedenis, wiskunde, literatuur, biologie, aardrijkskunde, sociale wetenschappen, informatica en ICT.

Uitgebreid scala aan geteste vaardigheden in natuurkunde, scheikunde, geschiedenis, sociale wetenschappen, aardrijkskunde.

Verbeterde criteria voor het evalueren van taken met een gedetailleerd antwoord in geschiedenis, literatuur, sociale wetenschappen, natuurkunde, scheikunde, Russisch en vreemde talen.

De formulering en vereisten van taken zijn verduidelijkt in KIM in alle vakken.

KIM 2012 kenmerkt zich door:


  • vermindering van het aantal taken van reproductieve aard;

  • toename van het aantal taken om de mate van begrip van de afgestudeerde van de belangrijkste elementen van de inhoud van trainingsprogramma's te bepalen, de vorming van vaardigheden te beoordelen om de verworven kennis in verschillende situaties toe te passen, informatie te analyseren en te generaliseren, waardeoordelen uit te drukken en te beargumenteren .
In de overzichtstabel staan ​​de wijzigingen met betrekking tot de opbouw, inhoud en beoordelingssystematiek van de examenopgaven van het Unified State Examination in 2012 per algemeen vormend vak vermeld.

Wijzigingen in KIM 2012


Russische taal -

  1. Het formaat van taak A2 is gewijzigd.

  2. Taak A26 is verplaatst naar positie A6 in het blok met taken die grammaticale normen controleren.

  3. De formulering van taak C1 is verduidelijkt.

  4. De criteria voor het controleren en evalueren van de uitvoering van een taak met een gedetailleerd antwoord zijn gespecificeerd (criterium K2, woorden tellen in een essay).

Wiskunde -er zijn geen fundamentele veranderingen.

  1. Aan deel 1 zijn twee taken toegevoegd: één taak over geometrie (stereometrie) en één praktische taak over het gebruik van probabilistische modellen. Zo worden alle onderdelen van de wiskundecursus in de KIM USE gepresenteerd in overeenstemming met de omvang van hun studie in de middelbare school, hun betekenis in de praktijk en voor permanente educatie.

  2. Het onderwerp van taak C3 is enigszins uitgebreid (zonder de complexiteit te veranderen) - deze taak kan ook een systeem van ongelijkheden bevatten.

biologie -er zijn geen fundamentele veranderingen.

  1. Op positie A36 wordt een nieuw formaat van taken met een verhoogd niveau van complexiteit geïntroduceerd, dat de kennis van algemene biologische patronen en het vermogen om correcte beoordelingen te analyseren, vergelijken en bepalen bepaalt.

  2. Kennis over de evolutie van de organische wereld en ecologische patronen op een gevorderd niveau wordt gestuurd door één taaklijn (A35).

  3. In deel 2 wordt het aantal taken voor het vergelijken van biologische objecten, fenomenen, processen vergroot en het aantal taken voor het bepalen van de volgorde van biologische objecten, fenomenen, processen verminderd.

  4. Aan de formulering van taken C5 en C6 is een aanvulling toegevoegd: bij het oplossen van problemen in cytologie en genetica wordt voorgesteld de verkregen resultaten toe te lichten, om aan te geven welke wet zich in een bepaald geval manifesteert.

Chemie -er zijn geen fundamentele veranderingen.

  1. Het aantal taken met een keuze aan antwoorden is teruggebracht van 30 naar 28 (de reden voor het verminderen van het aantal taken was het feit dat de uitvoering van sommige ervan het gebruik van vergelijkbare algoritmen van acties voor de toepassing van de relevante theoretische en feitelijk materiaal).

  2. Taak C2, die de kennis van de genetische verwantschap van anorganische stoffen van verschillende klassen test, wordt in twee formaten voorgesteld. In sommige versies van de CMM wordt het aangeboden in het oude formaat, en in andere in een nieuwe, wanneer de taakvoorwaarde een beschrijving is van een specifiek chemisch experiment, waarvan de proefpersoon het verloop zal moeten reflecteren door middel van de vergelijkingen van de bijbehorende reacties.

  3. De C5-taak voor het bepalen van de molecuulformule van een stof is verbeterd. De oplossing van het probleem omvat drie opeenvolgende bewerkingen: het opstellen van een chemisch reactieschema, het bepalen van de stoichiometrische verhoudingen van de reactanten en het op basis daarvan berekenen, wat leidt tot de vaststelling van de molecuulformule van de stof. Hierdoor is de maximale score voor het voltooien van deze taak verhoogd van 2 naar 3 punten.

Natuurkundeer zijn geen fundamentele veranderingen.

  1. De structuur van de CMM-variant is gewijzigd met behoud van het totale aantal en typologie van taken: alle taken in de natuurkunde zijn opgenomen in deel 3 van het werk. Deel 3 omvat dus vier rekenproblemen met een verhoogd complexiteitsniveau met een keuze aan antwoorden (A22-A25) en zes taken met een gedetailleerd antwoord - een kwalitatief probleem met een verhoogd complexiteitsniveau (C1) en vijf rekenproblemen van een hoog niveau (C2-C6). In een dergelijke structuur wordt het 'universitaire deel' van het Unified State Examination in de natuurkunde visueel weergegeven.

  2. Het scala aan geteste methodologische vaardigheden is uitgebreid, evenals het aandeel van taken met foto's en tekeningen van experimentele opstellingen is verhoogd, waardoor het mogelijk wordt weerstand te bieden aan de "uitspoeling" van het experiment uit het natuurkundeonderwijs.

  3. De criteria voor het evalueren van taken met een gedetailleerd antwoord zijn verbeterd. Zo zijn voor kwalitatieve taken de vereisten voor het scoren van twee punten aangepast en zijn nieuwe vereisten voor een volledig correct antwoord geïntroduceerd in het systeem voor het evalueren van computertaken.

Geografieer zijn geen fundamentele veranderingen.

1. Het aantal taken in deel 1 is teruggebracht van 25 naar 24. Dienovereenkomstig is het totale aantal taken teruggebracht van 45 naar 44 en is de maximale primaire score voor het voltooien van alle taken van het werk verlaagd van 55 naar 54.

2. CIM 2012 bevat een nieuwe taak (B1) van het basisniveau van complexiteit, die het vermogen test om geografische kaarten van verschillende inhoud te lezen.

3. De taak die het vermogen test om kennis van tijdzones te gebruiken in praktische activiteiten en het dagelijks leven om de standaardtijd te bepalen, is uitgesloten vanwege de goedkeuring van de federale wet op tijdwaarneming in juni 2011 (Sinds de procedure voor het berekenen van tijd op het grondgebied van de Russische Federatie zal worden gewijzigd, opnemen in de werktaken voor het berekenen van tijd is onmogelijk, omdat dit materiaal niet is bestudeerd door afgestudeerden van 2012)


Verhaal- significante veranderingen (in de opbouw en inhoud van KIM)

De belangrijkste elementen van de nieuwigheid van het examenmodel in 2012:

1. De opzet van de CIM is geoptimaliseerd en het aantal taken met een reproductief karakter is teruggebracht (het aantal taken met een keuze aan antwoorden is teruggebracht van 27 naar 21, het aantal taken met een kort antwoord is verlaagd teruggebracht van 15 naar 12 en het aantal taken met een gedetailleerd antwoord is teruggebracht van 7 naar 6;

2. vergroting van het aantal taken gericht op het testen van het vermogen om historische feiten te systematiseren, causale, structurele en andere verbanden te leggen, informatiebronnen te gebruiken om cognitieve problemen op te lossen, het formuleren en beargumenteren van het eigen standpunt met behulp van historische kennis; er is een nieuw taakmodel C6 toegevoegd (een historisch essay waarin de activiteiten van een historisch persoon worden geanalyseerd, een alternatieve taak: een afgestudeerde heeft de mogelijkheid om een ​​van de drie figuren uit verschillende tijdperken te kiezen en zijn kennis en vaardigheden op de meest bekende historische materiaal));

3. de algemene richting van het verbeteren van KIM is het versterken van het takenpakket dat de analytische en informatie- en communicatieve vaardigheden van afgestudeerden test; het creëren en geleidelijk invoeren van nieuwe soorten taken met een gedetailleerd antwoord om afgestudeerden die van plan zijn hun opleiding aan universiteiten in de geesteswetenschappen voort te zetten, nauwkeuriger te differentiëren met verschillende niveaus van vereisten voor de historische voorbereiding van afgestudeerden.


Sociale wetenschappen -er zijn geen fundamentele veranderingen.

  1. Het aantal taken met een keuze aan antwoorden wordt verminderd (van 22 naar 20).

  2. Taak B2 is gecorrigeerd: er wordt voorgesteld om twee (voorheen één) posities te kiezen die uit de gepresenteerde rij vallen.

  3. Op positie B8 wordt een nieuwe taak geïntroduceerd om een ​​generaliserend concept te kiezen voor alle andere concepten die in de lijst worden gepresenteerd.

  4. De criteria voor het beoordelen van de uitvoering van taak C8 zijn verduidelijkt. Het volledig correct uitvoeren van deze taak in 2012 wordt geschat op 3 punten.

Literatuur - significante veranderingen (in het beoordelingssysteem).

De belangrijkste richtingen van verandering in KIM USE 2012:

  1. Op basis van de testresultaten werden nieuwe opdrachten voor het tot stand brengen van correspondentie en voor meerkeuze uit de lijst in het takenpakket van het basisniveau van complexiteit geïntroduceerd om het onderscheidend vermogen van deel 1 en 2 van het werk (de totale aantal basistaken bleef ongewijzigd: B1-B12).

  2. Het systeem voor het controleren en evalueren van de uitvoering van taken waarvoor een gedetailleerd antwoord moet worden geschreven, is aanzienlijk verbeterd.

  • Bij het evalueren van taken C1 en C3 in het Unified State Examination in Literature 2012, wordt rekening gehouden met het spraakontwerp van de antwoorden.

  • De namen van de criteria zijn verduidelijkt, de formulering van de meeste criteria voor taken C1-C5 is aanzienlijk herzien.

  • De criteria voor het controleren en evalueren van de vervulling van taken C2 en C4 zijn fundamenteel herzien (in plaats van drie zijn er vier beoordelingsfuncties ingevoerd). De wijzigingen hebben geleid tot een verhoging van de maximale score van 3 naar 4.

  • Hierdoor steeg de maximale score voor de gehele tentamenopgave van 39 naar 42.

Vreemde talen -er zijn geen fundamentele veranderingen.

verduidelijkt:

  1. plan voor taak C2 (gedetailleerde schriftelijke verklaring met redeneerelementen, sectie "Brief");

  2. het formuleren van de criteria voor het beoordelen van taken C1-C2 is de opmaak van het aanvullende evaluatieschema voor deze taken geoptimaliseerd;

  3. vereisten voor het productieve karakter van de schriftelijke spraak van de examinandus bij de taak van een hoog niveau van complexiteit C2. (bij de evaluatie van taak C2 wordt speciale aandacht besteed aan het vermogen van de examinandus om een ​​gedetailleerde schriftelijke verklaring af te leggen; als meer dan 30% van het antwoord tekstueel overeenkomt met de gepubliceerde bron of andere examenpapers, dan worden 0 punten toegekend volgens het criterium "Oplossing van de communicatieve taak" en dienovereenkomstig wordt de hele taak beoordeeld met 0 punten;

  4. de vorm van het opnemen van het antwoord op taak B1 (paragraaf "Luisteren"): in deze taak om naleving vast te stellen, wordt een overgang naar een digitale vorm van het opnemen van antwoorden, zoals in taken B2 en B3, voorzien, waardoor het aantal fouten wordt verminderd van afgestudeerden bij het invullen van de formulieren, en zorgen voor een betere herkenning van de antwoorden die zijn onderzocht tijdens de machinale verwerking van resultaten.

  5. De uitvoeringstijd is verhoogd naar 180 minuten.

Informatica en ICT -significante veranderingen (in de structuur en inhoud van KIM)

  1. De verhouding van deel 1 en 2 van het werk is gewijzigd (het aantal taken in het eerste deel is teruggebracht van 18 naar 13, in het tweede deel is het verhoogd van 10 naar 15).

  2. De taakverdeling per sectie van de cursus informatica is gewijzigd: het aantal taken in de secties "Elementen van de theorie van algoritmen" en "Modelleren en computerexperiment" is toegenomen, het aantal taken in de secties "Nummersystemen" en "Fundamentals of logic" is verminderd.

  3. In plaats van een taak voor het verwerken van grafische informatie, bevatte het KIM Unified State Examination in 2012 een taak voor het verwerken van geluid.

Pagina 1

College 17

1. Doelen en doelstellingen van het experiment over de invoering van het Unified State Examination.

2. Controle- en meetmaterialen (KIM).

3. Technologie voor de ontwikkeling van KIM's, organisatie en uitvoering van het examen.

4. Het opschalen van de resultaten van de USE en het gebruik ervan bij het managen van de kwaliteit van het onderwijs.

5. Eengemaakt staatsexamen en het All-Russische systeem voor het beoordelen van de kwaliteit van het onderwijs.

1. Doelen en doelstellingen van het experiment over de invoering van het Unified State Exam.

1. Doelstellingen van het experiment over de invoering van het Unified State Examination . Het experiment over de invoering van het Unified State Examination, gelanceerd in 2001, opent een nieuwe pagina in de ontwikkeling van het binnenlandse onderwijssysteem en is innovatief, niet alleen qua ontwerp, maar ook in de vorm van gedrag, schaal en het ontbreken van strikte regelgeving door de autoriteiten. Voor het eerst in de geschiedenis van het nationale onderwijs is niet per richtlijn, maar experimenteel geprobeerd de haalbaarheid vast te stellen van een fundamentele herstructurering van de activiteiten van onderwijsinstellingen en het kwaliteitsmanagementsysteem van het onderwijs.

Het experiment heeft twee doelen: het vergroten van de beschikbaarheid van het hoger onderwijs en de kwaliteit van het voortgezet onderwijs, waarvan de uitvoering gelijktijdig wordt gerealiseerd door het eindexamen en het toelatingsexamen hoger onderwijs in één procedure te combineren. Volgens de resultaten van het Unified State Examination krijgen afgestudeerden van de school twee cijfers, waarvan één op een vijfpuntsschaal voor scholen en de andere op een schaal van honderd voor onderwerping aan de toelatingscommissies van universiteiten en hogescholen.

Taken opgelost met behulp van het examen. De belangrijkste taken die in de USE zijn opgelost, zijn onder meer:

Objectivering van de beoordeling van de kwaliteit van het onderwijs op basis van het creëren van een extern beoordelingsmechanisme en het gebruik van pedagogische metingen;

Vergroten van de toegankelijkheid van beroepsonderwijs, vooral voor jongeren uit gezinnen met een laag inkomen en uit woonplaatsen ver van universitaire centra;

Objectivering van de vereisten voor "algemene onderwijsopleiding van aanvragers van onderwijsinstellingen in het systeem van beroepsonderwijs;

Het verminderen van de psychologische belasting van afgestudeerden van onderwijsinstellingen door het verminderen van het aantal examens; - ontwikkeling van de continuïteit van het algemeen en beroepsonderwijs, zodat afgestudeerden klaar staan ​​om hun opleiding voort te zetten;

Verbetering van het systeem van staatscontrole en beheer van de kwaliteit van het onderwijs op basis van een onafhankelijke beoordeling van de kwaliteit van de graduate training.

Vooral de oplossing van het laatste probleem stelt ons in staat te spreken over de belangrijke bijdrage van het USE aan de vorming en ontwikkeling van het All-Russische systeem voor de beoordeling van de kwaliteit van het onderwijs (OSOKO), dat momenteel in Rusland wordt gecreëerd. De USE, die haar hoofdtaken vervult, is een belangrijk structureel onderdeel van de OSOKO en een van de centrale schakels in de ontwikkeling en verbetering van het kwaliteitsmanagementsysteem van het onderwijs.

De oplossing van de opgesomde taken wordt verzekerd door de uitvoering van werkzaamheden op een aantal gebieden, waaronder: de vorming van een regelgevend kader voor het experiment; oprichting van KIM; ontwikkeling van technologie voor het afnemen van het examen; zorgen voor informatiebeveiliging van procedures, materialen en examenresultaten; de vorming van informatiesystemen ter ondersteuning van het experiment en het gebruik van de gegevens ervan in het onderwijs; opleiding van specialisten voor het bemannen van het experiment; GEBRUIK toezicht; analyse en interpretatie van monitoringgegevens om de kwaliteit van het onderwijs te verbeteren.

Regelingen voor deelname van regio's aan het Unified State Examination en de ontwikkeling van het experiment. Na de beslissing om deel te nemen aan de USE, kiest de regio op vrijwillige basis een van de mogelijke regelingen voor het afnemen van het examen, die van andere kunnen verschillen in het aantal en de samenstelling van vakken, vrijwilligheid of verplichte certificering van afgestudeerden in de vorm van de GEBRUIK, het aandeel van computertesten en andere specifieke kenmerken vanwege de financiële mogelijkheden van de regio, de materiële basis, het ontwikkelingsniveau van de communicatie, het aantal universiteiten, hun bereidheid om deel te nemen aan het experiment, enz.

In overeenstemming met de hoofdlijn over het gebrek aan strikte directiviteit van de kant van de federale onderwijsautoriteiten, behoudt de USE de grootst mogelijke variabiliteit in de uitvoeringsschema's, die vaak de regio's zelf veranderen tijdens het ontwikkelingsproces van het experiment.

Ondanks het bestaande regelgevingskader dat de lijst van verplichte vakken voor de eindcertificering van afgestudeerden definieert, weigeren veel regio's, als onderdeel van het werk om de USE-regeling te verbeteren, verplichte vakken en geven ze afgestudeerden het recht om onafhankelijk het aantal examens en deelnemen aan het USE zelf. Het is veelzeggend dat naarmate de reikwijdte van de principes van variabiliteit en vrijwilligheid groter wordt, het aantal deelnemers aan het experiment gestaag groeit, samen met de manifestatie van een positieve houding van de samenleving ten opzichte van het experiment.

Een analyse van de USE-monitoringgegevens wijst overtuigend op een sterke toename van het aantal regio's dat aan het experiment deelneemt, en een toenemend vertrouwen in de USE van onderwijsautoriteiten, de beroepsgemeenschap van universiteiten en scholen, studenten en hun ouders. Met name het aantal regio's dat aan het experiment deelnam, veranderde van 6 in 2001 naar 78 in 2005, en het aantal afgestudeerden uit deze regio's dat in 2005 examens aflegde in de vorm van het USE in wiskunde en de Russische taal, bedroeg meer dan 50%. De lijst met universiteiten en hogescholen die kandidaten accepteren op basis van de resultaten van het Unified State Examination is aanzienlijk uitgebreid. In 2005 deden 1543 universiteiten (inclusief branches) en 1765 hogescholen mee aan het experiment, terwijl in 2001 nog maar 16 universiteiten meededen. Het totaal aantal ingediende onderwerpen voor de USE in de regio's is fors gestegen. Volgens monitoringgegevens en regionale statistieken is in de loop van de jaren van het experiment het aantal afgestudeerden van plattelandsgebieden dat op basis van de resultaten van de USE naar universiteiten ging, aanzienlijk toegenomen. Over het algemeen geven de trends van het experiment aan dat de hoop in verband met het USE om de toegankelijkheid van hoger onderwijs voor inwoners van landelijke en afgelegen regio's van Rusland uit te breiden, volledig gerechtvaardigd is. Dit wordt bevestigd door de monitoringgegevens van USE.

Deelname van docenten aan de uitvoering van het examen. Docenten treden vaak op als organisatoren van de USE op scholen, maar ze werken alleen met afgestudeerden die niet eerder hun studenten waren. In dit geval nemen docenten deel aan de voorbereiding van het examen, organiseren ze zelf de toetsprocedure en zorgen ze voor het verzamelen en verzenden van examenmateriaal.

Docenten krijgen ter voorbereiding op de toets al het benodigde materiaal, waaronder KIM-kits met reservematerialen in geval van een typfout, lijsten van afgestudeerden, formulieren van toetsprotocollen die alle afwijkingen van de standaardisatie-eisen noteren en een toetswijzer met daarin een beschrijving van alle de eisen voor het afnemen van het examen.

Na afloop van het examen verzamelen de organisatoren materialen: gebruikte en ongebruikte toetsen, een ingevuld toetsprotocol en lijsten van studenten bijvoegen. Deze materialen worden overgebracht naar speciale centra voor verificatie en verdere verwerking, die in het USE-systeem regionale informatieverwerkingscentra (RTsOI) worden genoemd. Opdrachten met meerkeuze-antwoorden worden ter plaatse of in Moskou geautomatiseerd gecontroleerd en om de taken met gedetailleerde antwoorden te verifiëren, worden experts uitgenodigd, wiens werk wordt georganiseerd op de plaats van het examen in omstandigheden van volledige informatiebeveiliging en onafhankelijkheid van deskundige oordelen.

2. Controle meetmaterialen

KIM-structuur.Er zijn drie delen in de CIM-structuur: (A, B, C), met een verschillend aantal taken, afhankelijk van het onderwerp. Taken in biologie en geschiedenis kunnen bijvoorbeeld 50 zijn, en in het Russisch - 40,

Deel A voor alle vakken bevat alleen taken met meerkeuzeantwoorden. Deelopdrachten BIJ variëren aanzienlijk in vorm en suggereren de mogelijkheid van een kort gereguleerd antwoord, waarbij een overeenkomst tot stand wordt gebracht tussen de elementen van twee sets en de juiste volgorde van verschillende processen, verschijnselen, objecten. Deel C is voor de vrije opbouw van een antwoord. Bij het testen in de Russische taal wordt bijvoorbeeld de taak gegeven om een ​​kort schriftelijk werk (essay) te schrijven, in wiskunde - om gedetailleerde oplossingen voor taken te geven, enz.

Inhoud van KIM. De resultaten van de USE worden gebruikt bij de eindbeoordeling van studenten en de selectie van aanvragers. De inhoud van KIM is bedoeld om gepersonaliseerde informatie te ontvangen over de prestaties van afgestudeerden van het basis- en gevorderd opleidingsniveau in vakken. Aangezien attestatie vereist dat de beheersing van de meeste elementen van de vakopleiding door afgestudeerden wordt gecontroleerd en de examentijd beperkt is, is het, om de representativiteit van de dekking van de inhoud van het onderwijs te vergroten, noodzakelijk om de specificaties van de KIM USE binnen een jaar en meer significant door de jaren heen. Dankzij een speciale planning die is uitgevoerd door de vakcommissies voor de ontwikkeling van CIM, is het in 2-3 jaar mogelijk om alle noodzakelijke inhoudselementen te behandelen. Door de variatie in KIM-specificaties neemt de vergelijkbaarheid van de resultaten van afgestudeerden af, maar de mogelijkheden om de USE-resultaten op federaal en regionaal niveau te gebruiken bij het bewaken van de kwaliteit van het onderwijs worden groter. Op basis van de analyse van de resultaten voor individuele jaren van het USE is het dus mogelijk om redelijke informatie te verkrijgen over de trends in veranderingen in het algemene onderwijs van Russische afgestudeerden.

In het algemeen wordt de inhoud van KIM geselecteerd op basis van specificaties die jaarlijks op internet worden geactualiseerd en omvatten veralgemeende plannen voor examenopgaven met links naar de bijbehorende posities van codeerders (genummerde lijsten van inhoudselementen per onderwerp). De inhoud van KIM weerspiegelt alleen de vakkennis en vaardigheden die op school worden onderwezen, hoewel dit in strijd is met de moderne opvattingen over de prioriteiten in het onderwijs, die in veel landen worden geaccepteerd. Als gevolg daarvan presteren Russische studenten slecht in internationaal vergelijkend onderzoek naar de kwaliteit van het onderwijs. Ze zijn niet in staat taken uit te voeren die de toepassing van kennis vereisen in situaties die het leven nabootsen of interdisciplinaire vaardigheden.

Analyse van de resultaten van de implementatie van KIM in de context van zinvolle interpretatie levert belangrijke informatie op voor het verbeteren van de eisen van de SES en het verbeteren van de kwaliteit van het onderwijs. Volgens de resultaten van de analyse uitgevoerd door de vakcommissies voor de ontwikkeling van KIM en gepubliceerd in 2006 in een analytisch rapport, worden taken met de basis moeilijkheidsgraad voornamelijk uitgevoerd door afgestudeerden die goede en uitstekende cijfers hebben behaald in de USE. Het percentage leerlingen in deze groep dat alle taken op het basisniveau heeft voltooid, is bij wiskunde en de Russische taal iets hoger (meer dan 90%) en lager bij overige vakken (niet meer dan 85%). Ongeveer de helft van de afgestudeerden die volgens de resultaten van het Unified State Exam "twee" en "drie" hebben gekregen, beheerst niet eens de helft van het voor studie geplande materiaal. Dit resultaat helpt bij het identificeren van problemen die verband houden met de buitensporige eisen van de SES en de buitensporige hoeveelheid schoolinhoud.

3. Technologie voor de ontwikkeling van instrumentatie

materialen, organisatie en gedrag

Uniform staatsexamen

Structuren die betrokken zijn bij de organisatie en het verloop van het examen. De structuren die organisatorische, bestuurlijke en wetenschappelijke en methodologische ondersteuning bieden bij de implementatie van de USE-technologie omvatten federale en regionale onderwijsinstanties, het Federaal Testcentrum (FTS), het Federaal Instituut voor Pedagogische Metingen (FIPI), het bedrijf KROK, regionale informatieverwerking centra en verschillende organisaties (universiteiten en andere onderwijsstructuren) die op competitieve basis onderzoeksprojecten uitvoeren om de wetenschappelijke en methodologische basis te vormen voor de technologie voor het uitvoeren van het Unified State Examination en het verbeteren van KIM.

CMM-ontwikkelingstechnologie. De technologische jaarlijkse ontwikkelingscyclus van KIM in het onderwerp begint met de herziening van de codering van te verifiëren inhoudselementen, evenals met het maken van een specificatie en een demonstratieversie van KIM. Doorgaans worden voor 13 onderwerpen die in de USE zijn aangegeven jaarlijks minimaal 10 duizend nieuwe opdrachten ontwikkeld. Naast de streefvolgorde voor taken om de USE-bank aan te vullen, wordt een wedstrijd aangekondigd waaraan alle geïnteresseerde auteurs van testtaken uit verschillende regio's van Rusland deelnemen. De materialen die voor de wedstrijd worden ingezonden, ondergaan een onderzoek, waarvan de resultaten worden gebruikt om testitems te selecteren en aan te schaffen voor de USE-bank. FILI-specialisten maken met behulp van de bank varianten van CIM. Vervolgens wordt een onderzoek uitgevoerd naar de kwaliteit van de inhoud van de opties, een analyse van hun parallellisme en de naleving van taken met de vereisten van het testformulier. Na correctie, op basis van de resultaten van het onderzoek, worden KIM overgedragen voor goedkeuring, uitgevoerd op representatieve steekproeven van studenten: scholen in Rusland. De verwerking van de testgegevens en hun analyse maken het mogelijk om de volgende correctie uit te voeren, waarna equivalente versies van de CMM worden verkregen met sets bijbehorende documentatie voor het uitvoeren van GEBRUIKEN, gemaakt onder omstandigheden van een hoog niveau van informatiebeveiliging en opgeslagen in speciale ruimtes tot de start van het examen.

Na het examen en de gegevensverwerking stellen FIPI-specialisten een analytisch rapport op met aanbevelingen voor het verbeteren van CMM, waarmee rekening wordt gehouden bij het uitvoeren van de volgende jaarlijkse technologische cyclus.

De technologie van het examen. Bij het afnemen van het examen is de belangrijkste technologie een blanco technologie, waarbij opdrachten op papier aan afgestudeerden worden gegeven. De implementatie van blanco technologie is afhankelijk van de organisatie die bij de implementatie betrokken is. Zo drukt de FCT alle materialen in Moskou af en draagt ​​dan, voor aanvang van het examen, pakketten met CMM en antwoordformulieren over naar de regio's, ondersteunt CROC een technologie waarbij antwoordformulieren worden afgedrukt op de plaats van gebruik in de regio's .

Bij het gebruik van computertesten in de USE is de technologie gemengd, aangezien de taken van deel C met gedetailleerde antwoorden op papieren formulieren worden uitgevoerd. Er is nog geen enkele technologie ontwikkeld voor het afnemen van het examen. Elk van de opties voor het uitvoeren van het experiment heeft zijn eigen voor- en nadelen, die pas aan het einde volledig kunnen worden onthuld.

4. De resultaten van de verenigde staat schalen

examens en hun gebruik in management

kwaliteit van het onderwijs

Soorten schalen die in het examen worden gebruikt. In overeenstemming met de gestelde doelen en taken die moeten worden opgelost, worden volgens de USE-gegevens twee cijfers gegeven - in een schoolschaal van honderd en vijf punten. De eerste wordt verkregen door FCT-specialisten door primaire gegevens te schalen USE, om ze om te zetten in een standaard logitschaal op basis van moderne testtheorie. De tweede, school, wordt geselecteerd door specialisten van de schaalgroep die door Rosobrnadzor wordt georganiseerd tijdens examens en bestaat uit testers, vertegenwoordigers van de FIPI-vakcommissies en FCT-medewerkers. Om de grenzen van de intervallen van de 100-puntsschaal te selecteren en hun overeenstemming met de beoordelingen van de 4-puntsschaal vast te stellen, worden de resultaten van de USE in elk onderwerp en alle regio's onderworpen aan een multidimensionale analyse, inclusief de inhoudelijke problemen : de validiteit van schoolscores en de vergelijkbaarheid van cijfers in het vak in de USE in verschillende jaren.

vergelijkbaarheid USE resultaten in verschillende jaren. Om een ​​zinvolle vergelijkbaarheid van testscores te garanderen, introduceren veel landen met nationale op tests gebaseerde examens of andere soorten massatests gestandaardiseerde niveauschalen (zie paragraaf 13.5) om de relatie tussen testinhoud over de jaren heen te traceren. Een belangrijk voordeel van de niveauschalen is het vergroten van de mogelijkheid om de resultaten van examens te interpreteren, aangezien de testscore kan worden aangevuld met een zinvolle beschrijving van de voorbereiding van afgestudeerden in termen van beheerste en onbeheerde thematische elementen van het onderwerp.

Om een ​​zinvolle interpretatie in de praktijk van de USE te introduceren, is het allereerst noodzakelijk om een ​​werkcyclus uit te voeren om de structuur van de SES te verbeteren op basis van de ideeën van niveaudifferentiatie en om op een zinvolle manier de verschillende algemeen vormend onderwijs in alle schoolvakken. Vervolgens moet op een representatieve steekproef van Russische afgestudeerden een stabiele schaal van standaardtestscores worden gebouwd en moeten schaalbereiken worden geïdentificeerd door ze te correleren met de inhoud van de taken die op elk niveau zijn voltooid.

In termen van de theorie van pedagogische metingen betekent vergelijkbaarheid de mogelijkheid om toetsresultaten van verschillende jaren over te dragen naar één schaal. Vergelijkbaarheid biedt de afgestudeerde de mogelijkheid om eenmaal te slagen voor het Unified State Examination en de resultaten ervan te gebruiken in het geval van niet-succesvolle toelating tot de universiteit in de daaropvolgende jaren, en voor managers - de mogelijkheid om vergelijkend onderzoek te doen naar de kwaliteit van het onderwijs.

De traditionele benadering voor het oplossen van het vergelijkbaarheidsprobleem is gebaseerd op de definitie van de normen van de zogenaamde ankertest voor het samenstellen van tabellen van gelijkwaardigheid van scores voor verschillende tests. De ankertest wordt gekozen en gestandaardiseerd op een landelijk representatieve steekproef van proefpersonen die zorgvuldig zijn geselecteerd uit een landelijke populatie.

Op basis van de ankertoets worden representatieve landelijke normen in verschillende vakken bepaald. De gegevens die zijn verzameld op de nationale ankerteststeekproef dienen om een ​​schaal van gemeenschappelijke indicatoren te construeren. Elke nieuwe test die in de jaren daarna wordt ontwikkeld, wordt gekalibreerd tegen de ankertest, waardoor kan worden vastgesteld welke het resultaat van het vak in de daaropvolgende jaren is gelijk aan de indicator in de ankertoets.

Om vertaaltabellen in het algemeen op dezelfde steekproef van proefpersonen te bouwen, wordt meestal de methode van gelijke percentielen gebruikt, volgens welke de indicatoren als gelijkwaardig worden beschouwd als ze gelijke percentielen hebben en worden verkregen op een normale vergelijkingsgroep volgens parallelle testopties . De nadelen van de methode zijn onder meer hoge kosten, de onvermijdelijke correctie en verbetering van de inhoud van tests, veranderingen in de inhoud van het onderwijs en prioriteiten in onderwijsovereenkomsten, en de voordelen zijn stabiliteit en hoge nauwkeurigheid, aangezien de resultaten voor alle volgende versies van de tests worden vergeleken met één ankertest.

Met de komst van de theorie IRT begon efficiëntere technologieën te gebruiken die de vergelijkbaarheid van testresultaten voor verschillende jaren garanderen. Deze technologie is gebaseerd op het opnemen van groepen anker (algemene) taken in tests van verschillende jaren, waarbij de resultaten van latere en eerdere versies van de test in een keten worden gekoppeld. Het aftellen is van de schaal die is gebouwd op de referentievergelijkingsgroep. Elke versie van de volgende versie van de test is dus, dankzij het blok met veelvoorkomende taken, gekoppeld aan de vorige en volgende versies van de reeks tests.

De nodige verklarende materialen worden meestal ontwikkeld voor testgebruikers om de omzetting van ruwe scores in afgeleide indicatoren die vergelijkbaar zijn met de resultaten van de referentieschaal te verzekeren. Aanvullende maatregelen om de vergelijkbaarheid van testresultaten te vergroten, worden geleverd door een speciale theorie van testuitlijning. Soortgelijke moderne methoden zijn gepland om te worden gebruikt in het examen.

5. Het eengemaakte staatsexamen en het geheel-Russische systeem voor het beoordelen van de kwaliteit van het onderwijs

Wat wordt bedoeld met het Al-Russische systeem voor het beoordelen van de kwaliteit van het onderwijs? . Het All-Russische systeem voor het beoordelen van de kwaliteit van het onderwijs wordt opgevat als een reeks organisatorische en functionele structuren die een beoordeling geven van de onderwijsprestaties van burgers op basis van een enkele conceptuele en methodologische basis, evenals de identificatie van factoren die van invloed zijn op het onderwijs resultaten.

Het belangrijkste doel van het creëren van de OSEKO is om de objectiviteit en validiteit van de informatiebasis van het ondein Rusland te vergroten, en om alle deelnemers aan het onderwijsproces en de samenleving als geheel betrouwbare informatie te geven over de kwaliteit van onderwijs in het land.

In overeenstemming met het doel naar de hoofdtaken OSOKO kan worden toegeschreven aan:

Beoordeling van de kwaliteit van onderwijsprestaties van studenten en afgestudeerden van onderwijsinstellingen op verschillende onderwijsniveaus;

Ontwikkeling van wetenschappelijke en methodologische ondersteuning voor procedures en instrumenten om de kwaliteit van het onderwijs te beoordelen;

Creëren van structuren die de kwaliteit van instrumenten en technologieën voor pedagogische metingen waarborgen (certificeringscentra);

Oprichting van centra voor statistische verwerking en analyse van gegevens over de kwaliteit van het onderwijs, organisatie van een systeem voor de opleiding en omscholing van onderwijzend personeel, enz.

Het proces van het creëren van OSOKO in Rusland is nog niet voltooid, dus het aantal hoofdtaken kan veranderen naarmate het zich ontwikkelt.

De bouw van OSOKO omvat het wijdverbreide gebruik van bestaande organisatiestructuren, mechanismen en procedures: het Unified State Examination, centra voor certificering, attestatie en accreditatie, centra voor de kwaliteit van onderwijs en monitoring, werken op een uniforme wetenschappelijke en methodologische basis als onderdeel van de ontwikkelingsstrategie voor het volledig Russische systeem voor de beoordeling van de kwaliteit van het onderwijs.

GEBRUIK in OSOKO. De USE is een integraal structureel onderdeel van de OSEKO en geeft objectieve informatie over de werkelijke staat van de kwaliteit van het schoolonderwijs. De USE-gegevens maken het mogelijk om beoordelingen te krijgen van de onderwijsprestaties van afgestudeerden, om trends en dynamiek van veranderingen in het secundair onderwijssysteem te identificeren, om een ​​reeks hoofdfactoren te vormen die de kwaliteit van het onderwijs in verschillende regio's beïnvloeden, en om de mate van hun invloed beoordelen.

Het GEBRUIK is niet de enige informatiebron van OSOKO. Naast de tijdens het examen verzamelde informatie over de vakkennis en vaardigheden van afgestudeerden, zijn er ongetwijfeld aanvullende gegevens nodig die de staat van de kwaliteit van het onderwijs op verschillende niveaus karakteriseren (beoordelingen van het vermogen om kennis die is verzameld met behulp van portfolio's en andere middelen voor authentieke beoordeling; beoordelingen van interdisciplinaire, algemene onderwijskundige en communicatieve vaardighedengegevens over het opvoedingsniveau van stagiairs en de effectiviteit van educatieve invloeden, de resultaten van de deelname van studenten aan olympiades en creatieve wedstrijden, enz.).

Een belangrijke vereiste die zorgt voor een correct gebruik van USE-gegevens in OSEKO, is het in overweging nemen van verschillende factoren bij het interpreteren van examenresultaten, die vaak buiten de invloed van de school liggen, maar de kwaliteit van het onderwijs aanzienlijk beïnvloeden.