Публикация 11 Юни, 2026 / Асенка Христова / 36 Министерството на образованието и науката (МОН) - не може да знае дали резултатите са се подобрили
Резултатите от тазгодишния държавен зрелостен изпит по български език и литература са най-високите от въвеждането на задължителните матури през 2008 година, обяви зам.-министърът на образованието д-р Таня Панчева на база получения среден брой точки - 60, и определи това като успех за учениците и учителите. Броят на точките и съответстващата им оценка и сравнението на същите показатели от предишните години категорично не означава повишаване на нивото на знанията на учениците, категорична е Асенка Христова - основател и изпълнителен директор на Института за изследвания в образованието в коментар във "Фейсбук",
"Средните резултати на държавните зрелостни изпити са най-високи от въвеждането им през 2008 г. досега",
обяви заместник-министърът на образованието и науката д-р Таня Панчева. Според нея "имаме основание да говорим за обща тенденция за повишаване на резултатите, а не за единични постижения".
За съжаление никакво подобно основание нямаме и това е ясно на всеки, който поне малко разбира от тестология и образователни измервания. Писала съм много пъти по темата, но да кажем, че аз не съм авторитет. Същото го пишат и екипите от Организацията за икономическо сътрудничество и развитие (ОИСР), които получават сериозно заплащане за своите анализи и съвети.
Накратко: "Рекорд" има смисъл само ако уредът, с който мерим, е един и същ през годините. Или ако разликите между уредите са измерени и коригирани. За държавните зрелостни изпити (ДЗИ) (и националното външно оценяване, НВО) не е изпълнено нито едното.
Всяка година изпитът е нов тест с нови задачи, а два теста никога не са еднакво трудни - нито по замисъл, нито по случайност. Затова в образователните измервания съществува цяла технология за приравняване на формите:
- секретни задачи-котви, повтаряни между годините
- предварително калибрирани задачи
- статистически модели, които поставят резултатите от различни години върху обща скала
- публичен технически доклад, който показва как е направено това и с каква грешка.
За българските ДЗИ и НВО нищо подобно не е публикувано никога, а самата конструкция на изпита го изключва
всички задачи се разсекретяват веднага след провеждането, резултатите се отчитат в сурови точки, прагът е фиксиран на 30% независимо от трудността.
През 2022 г. ОИСР направи подробен преглед на системата за оценяване в България и написа същото: "България НЯМА национален инструмент, който да проследява образователните резултати във времето".
Щом уредът не е постоянен, какво друго може да "премести" средния резултат с две точки?
- По-лек тест или по-позната конструкция - учители и ученици се адаптират към формат, който е стабилен пета поредна година.
- Променен състав на явяващите се - демографията, делът на професионалните гимназии и отпадането преди 12-и клас променят популацията, чиято средна стойност отчитаме.
- Ефектите на оценяващите при отворените задачи - в България данни за съгласуваност между оценителите никога не са публикувани.
- Таванен ефект: когато "рекорден" брой зрелостници попадат в горния край на скалата, средната стойност губи способността да различава.
Впрочем ОИСР отбеляза още през 2022 г., че големите дялове на оценките "отличен" обезценяват изпита и правят резултатите по-малко информативни. Обаче ние сега се хвалим, че "броят на зрелостниците с оценка поне 5.50 се увеличава с близо 42% спрямо миналата година".
При сегашния дизайн всички тези обяснения са неразличими от "мерките дават резултати". Че ръстът е по всички предмети и във всички области, не променя нищо - ширината на един ефект не идентифицира причината му. Системно облекчаване, адаптация към формата и натиск към високи оценки също действат навсякъде едновременно. Точно хората с опит в образователната сфера трябва да разпознават добре това.
Изводът е, че при сегашната конструкция на изпита никой - включително Министерството на образованието и науката (МОН) - не може да знае дали резултатите са се подобрили.
За да е възможно приравняване на резултати през годините, трябва друг дизайн на изпит със секретни задачи - котви, предварително калибрирани задачи и публикуван технически доклад с метода, параметрите и грешката на свързването. Без това "60 срещу 57.53 точки" сравнява НЕСРАВНИМИ величини.
Вече съм писала как се прави това по света. Например в Нидерландия всеки централен изпит получава ежегодна корекция, с която се изравняват разликите в трудността, така че оценката на ученика да не зависи от годината на изпита, а от това какво знае и умее. В Англия границите на оценките се местят всяка година според трудността на изпита, затова самият изпит не може да покаже дали учениците стават по-добри. За това служи отделен стандартизиран тест с едно и също съдържание, който всяка година се решава от национална извадка ученици, без последствия за тях или училищата им. Щом тестът не се променя, промяна в резултатите означава едно - промяна в уменията.
Вместо фиксиран праг от 30%, чието значение се мени с трудността на теста, Латвия, Литва и Словения определят прага отново след всеки изпит - експерти преценяват колко точки в конкретния тест отговарят на предварително описано минимално равнище на знания и умения, така че числото се мести, а стандартът остава постоянен. В Германия никой не обявява "рекорден" среден успех от абитура (German Abitur - зрелостният изпит, който се полага след 12-и или 13-и клас в Германия - бел. ред.) - изпитът не служи за сравнение между години. Дали постиженията растат или спадат, се проверява от отделни периодични изследвания: извадка от ученици решава защитени задачи, а изричната задача на изследването е да покаже дали предприетите мерки дават резултат. Така промяната може да се проследи за повече от десетилетие - нещо, което самият зрелостен изпит не може.
Полша пък показа, че пропусната съпоставимост може да се възстанови и със задна дата. Изследователският институт IBE (Instytut Badań Edukacyjnych - Институт за образователни изследвания - бел. ред.) преизчисли резултатите от матурата и от по-ранните външни изпити върху обща скала, като даде задачи от изпитите от различни години на съпоставими групи ученици - именно за да провери дали постиженията реално са се променили, и публикува съпоставимите резултати в открита база данни. Отделно измери и колко от оценката на отворените задачи зависи не от ученика, а от проверителя.
Още нещо важно:
през периода 2008-2026 г. има смяна на учебните програми и формата на ДЗИ. За да се обяви "рекорд от 2008 г." е нужно двата формата на изпита да бъдат проведени паралелно върху съпоставими групи ученици, за да се измери разликата между тях. Такова нещо не е правено.
Докато тези неща ги няма, коректната формулировка на съобщението е една: "Средният резултат на ДЗИ по БЕЛ тази година е 60 точки. Дали това е повече, по-малко или колкото миналата година, не можем да кажем." Министерство на образованието и науката би трябвало добре да разбира разликата между желанието нещо да е вярно и способността да го докажеш.