Startseite ► Beamtenrecht ► Dienstliche Beurteilung ► Quotenvorgaben
Quotenvorgaben für die dienstlichen Beurteilung des Beamten

Die Vorgabe von Quoten - z. B. Höchstgrenzen für den Anteil der sehr gut und gut beurteilten Beamten - wird unter bestimmten Bedingungen allgemein akzeptiert. So zum Beispiel in dem Urteil des Bundesverwaltungsgerichts vom 24.11.05 - 2 C 34.04 = BVerwG, 124, 356. In dieser Entscheidung hat das Gericht die Vorgabe akzeptiert, dass der Anteil der mit höchsten Note Beurteilten 15 v.H. und bei der zweithöchsten Note 35 v.H. nicht überschreiten soll.
Man muss sich jedoch der Gefahren bewusst sein, welche die Anwendung von Richtwerten mit sich bringen kann. Insbesondere ist möglich, dass die Einzelfallgerechtigkeit leidet, wenn die Beurteiler sich an Quoten orientieren. Dann entstehen Quotenopfer.

Allgemein fordert man in Anlehnung an eine etwas ältere Entscheidung des Bundesverwaltungsgerichts, dass sich die Richtwerte auf einen hinreichend großen Verwaltungsbereich beziehen müssen, in dem es eine vergleichbare Aufgaben- und Personalstruktur gibt. In der erwähnten Entscheidung vom 24.11.05 liest sich das wie folgt:
"1. Sind bei dienstlichen Beurteilungen Richtwerte für die Notenvergabe vorgeschrieben, muss die jeweilige Vergleichsgruppe hinreichend groß und hinreichend homogen sein.
2. Die Gruppe der Sachbearbeiter des gehobenen Dienstes einer Fachabteilung einer Behörde genügt dem Homogenitätserfordernis, wenn die Beamten trotz unterschiedlicher Statusämter im Wesentlichen gleiche Dienstaufgaben wahrnehmen."

Im Grunde geht es darum, dass die Vergleichsgruppe der zu beurteilenden Beamten groß genug sein muss. Eine feste (gar im Gesetz festgeschriebene) Mindestgröße der Vergleichsgruppe gibt es nicht. Bisweilen setzen Beurteilungsrichtlinien eine Mindestanzahl der zu vergleichenden Beamten fest. In verschiedenen Beurteilungsrichtlinien und in Gerichtsentscheidungen hat man sich auf eine Größe von mindestens 30 Personen als Vergleichsgruppe festgelegt.
Wird die Mindestgröße nicht erreicht, sollte der Dienstherr eine flexiblere Handhabung ermöglichen, also ein Abweichen von den Quoten.
Eine ganz ausführliche Darstellung zum Problem der Mindestgröße von Vergleichsgruppen finden Sie in einem
Urteil des Bayerischen VGH vom 17.12.15 - 3 BV 13.773 -.

Und auf jeden Fall gilt: die einzelne Beurteilung muss weiterhin gerecht erscheinen.

In den meisten Fällen werden Quoten für die Anteile der besten Beurteilungsnoten vorgegeben, oft in Größenordnungen von 10 - 15% für die Bestnote und 20 - 30% für die zweitbeste Notenstufe.
Der Bund regelt für die Bundesbeamten die Quoten wie folgt:

§ 50 BLV: Beurteilungsverfahren und Beurteilungsmaßstab
...
(2) Der Anteil der Beamtinnen und Beamten einer Besoldungsgruppe oder einer Funktionsebene, die beurteilt werden, soll bei der höchsten Note zehn Prozent und bei der zweithöchsten Note zwanzig Prozent nicht überschreiten. Im Interesse der Einzelfallgerechtigkeit ist eine Über- oder Unterschreitung um jeweils bis zu fünf Prozentpunkte möglich. Ist die Bildung von Richtwerten wegen zu geringer Fallzahlen nicht möglich, sind die dienstlichen Beurteilungen in geeigneter Weise entsprechend zu differenzieren.

Bis Mitte Februar 2009 war die Quotenregelung für Bundesbeamte großzügiger, nämlich in § 41 a der früheren Fassung der Bundeslaufbahnverordnung (BLV) wie folgt:
"Der Anteil der Beamtinnen und Beamten einer Besoldungsgruppe oder einer Funktionsebene, die beurteilt werden, soll bei der höchsten Note 15 vom Hundert und bei der zweithöchsten Note 35 vom Hundert nicht überschreiten.
Ist die Bildung von Richtwerten wegen zu geringer Fallzahlen nicht möglich, sind die Beurteilungen in geeigneter Weise entsprechend zu differenzieren."

Bitte beachten Sie, dass die Bundeslaufbahnverordnung keine gesetzliche Vorschrift ist, die in den Ländern für Landesbeamte unmittelbar gilt. Sie stellt hier nur ein Beispiel dar.



In Hamburg hatte sich die Polizei seit Herbst 2007 dazu entschieden, eine Verteilung der Beurteilungsnoten anzustreben, welche der Gaußschen Kurve nahe kommt.
Dies ist ein anderes Prinzip als jenes der Vorgabe von Quoten für die Bestnote usw.
Denn dieses Modell geht davon aus, dass jedem sehr guten Beamten ein sehr schlechter gegenüber steht, so dass sich die Noten bei dem Durchschnitt von 3,0 einpendeln.
Der Dienstherr scheint zu meinen, er habe durchschnittliches Personal.
Aus den inzwischen nicht mehr geltenden Beurteilungsrichtlinien der Polizei Hamburg, Ziffer 10.1:
"Als Maßstabsorientierung bei der Leistungsbeurteilung dient die Verständigung über die Leistung, die erbracht werden soll, um den Punktwert 3 (entspricht den Anforderungen) zu erhalten. Davon ausgehend sollten schwächere oder bessere Leistungen eingeschätzt werden. ...
Um eine Vergleichbarkeit der Beurteilungen und die damit verbundene Notwendigkeit der Maßstabswahrung zu gewährleisten, wirken die 8eurteiler darauf hin, dass sich die Gesetzmäßigkeiten der Gauß'schen Normalverteilungskurve ... in der Gesamtschau der Beurteilungen in ihren Bereichen wieder finden lassen."

Nach diesem Modell gibt es, so meinte die Polizei Hamburg, eine regelmäßig wiederkehrende, zahlenmäßig gleiche Verteilung des Leistungsvermögens von Beschäftigten nach folgendem Verteilungsmuster:
"Bei realitätsnaher Betrachtung und Bewertung der Leistungen des Einzelnen sowie unter Berücksichtigung der am Arbeitsplatz jeweils zugrunde liegenden Anforderungen bewegen sich etwa 2,27 % der Mitarbeiter im Spitzenleistungsbereich (Endnote 4,30 bis 5) und etwa 13,59 % im sog. 8esser-/ oder Gutbereich (Endnote 3,70 bis 4,29). Die meisten Mitarbeiter, und zwar 68, 26 %, befinden sich im Normal-/ Durchschnittsbereich (Endnote 2,30 bis 3,69), d.h. dass diese die Anforderungen des Arbeitsplatzes im vollen Umfang erfüllen, sie somit "die richtigen Mitarbeiter am richtigen Arbeitsplatz" sind. Für den Bereich der defizitären Leistungen gelten dieselben Werte wie für den Besser-/ Gutbereich (13,59 %) und den Spitzenleistungsbereich (2,27%). "

Danach müssten 15,86% der Polizeibeamten der Hansestadt Hamburg mit der Endnote 2,30 oder schlechter zu beurteilen sein, also knapp jeder 7. Beamte erbringt nur "defizitäre Leistungen".
Wer wollte das glauben?
Und wenn man dann noch zur Kenntnis nimmt, dass nach Meinung der Polizei nicht befördert werden durfte, wer weniger als 2,70 Punkte erhielt, dann wurde ein großer Teil der Belegschaft abqualifiziert.

Ein solches System ist unbrauchbar. Es übersieht völlig, dass die Polizeibeamten der Hansestadt Hamburg eben nicht den Durchschnitt der Bevölkerung widerspiegeln. Sie haben sich in Auswahlverfahren durchgesetzt, sind ausgebildet und trainiert worden, haben im Dienst über Jahre an Erfahrung gewonnen. Defizitäre Leistungen dürften der seltene Ausnahmefall sein.
Auch ist es eine Illusion, dass sich menschliche Eignungen und Fähigkeiten so exakt sollten messen lassen, dass sich am Ende eine Annäherung an ein mathematisches Modell ergeben wird.
Dem entsprechend hat das System 2010 sein Ende gefunden. Man war drei Jahre lang in die Irre gelaufen.


Das Gaußsche Verteilungsprinzip eignet sich jedenfalls nicht in seiner mathematisch-exakten Form als Mittel für eine Richtwertbestimmung.
Schnellenbach schreibt in seinem unverzichtbaren Werk "Die dienstliche Beurteilung der Beamten und der Richter" unter RN 404, das Bundesverwaltungsgericht habe "die Gaußsche Normalverteilung ... gänzlich unerwähnt" gelassen, und zwar zu Recht, weil es den Dienstherrn nicht in der Rolle desjenigen sehe, "der eine rechtlicher und rechtspolitischer Verfügungsmacht entzogene anthropologische Gesetzmäßigkeit (nur) erkennt und (mehr oder weniger vereinfacht bzw. vergröbert) kundgibt."

Man befasse sich zum Thema "anthropologische Gesetzmäßigkeit" nur einmal mit den Ausführungen in dem Buch von Siegfried Grubitzsch, Testtheorie - Testpraxis, 2. Auflage 1999, S. 137 ff.. Dort wird in wenigen Worten dargestellt, dass es nicht möglich ist, einem Beurteilungssystem eine Gauß´sche Kurve überzustülpen.
Die von der Polizei Hamburg ihrem Beurteilungssystem unterlegte "statistische Gesetzmäßigkeit" gibt es ganz einfach nicht. Ein Beispiel, das bisweilen gewählt wird, um dem blinden Glauben an die Gaußsche Kurve vorzubeugen, ist folgendes: Würden Sie glauben, dass der IQ von Universitätsprofessoren im Schnitt genau der Verteilung des IQ in der Gesamtbevölkerung entspricht?
Die Antwort überlassen wir Ihrer Intelligenz ...
Kurzes Fazit: die Gaußsche Kurve (bisweilen auch Normalverteilung genannt) gilt nicht absolut für alle Lebensbereiche und sämtliche gesellschaftlichen Erscheinungen, insbesondere auch nicht für Persönlichkeitseigenschaften und Fähigkeiten.
Die "Meßobjekte" dienstlicher Beurteilungen sind nicht die Eigenschaften selbst, sondern Verhaltensweisen, in denen sie sich äußern. Dazu meint Grubitzsch (aaO, S. 140):
"Verhalten ist von so vielen und je nach Individuum derart unterschiedlichen Einflussgrößen situativer, interaktiver, kommunikativer Art mitgeprägt, dass ... die Annahme einer Normalverteilung ins Absurde vorstößt."
Die Polizei Hamburg übersieht außerdem, dass die Gaußsche Verteilungskurve spitzer oder flacher verlaufen kann und dass ihr Scheitelpunkt nicht unbedingt genau in der Mitte einer Skala liegen muss.

Beenden wir den Diskurs mit einem recht plastischen Beispiel von Grubitzsch (aaO, S. 144):
Eine Lehrerin, die nach Durchsicht der Klassenarbeiten die Aufgabenbewertung ändert, weil sonst zu viele gute und sehr guten Noten verteilt würden, produziert die Mittelmäßigkeit der Schüler künstlich.
So geht die Polizei Hamburg vor: sie presst alles unter eine Kurve, was zu großen Ungerechtigkeiten führen kann.

Die Gerichte belassen es, wenn sie sich überhaupt mit der Gaußschen Kurve auseinandersetzen, in aller Regel bei kurzen Anmerkungen.
Etwa das OVG Rheinland-Pfalz in einem Urteil vom 19.09.03 - 2 A 10795/03.OVG -:

"
Schließlich steht es dem Dienstherrn in Anlehnung an den Leistungsdurchschnitt frei - wiederum im Rahmen des ihm zukommenden Ermessens -, Richtwerte erfahrungsorientiert aufzustellen. Die Durchschnittswerte dürfen allerdings nicht statistisch als absolute Größen im Sinne der Gaußschen Normalverteilungskurve missverstanden werden. Ausreichend ist es aber, wenn ihre Festsetzung jedenfalls nicht erfahrungsunabhängig oder gar erfahrungswidrig erfolgt."



Aber wie immer, so gibt es auch in diesem Punkt in der Juristerei mindestens zwei Meinungen.
Das OVG Lüneburg stellt sich zu dieser Frage wie folgt:

OVG Lüneburg, Beschluss vom 19.10.2009 - 5 ME 175 / 09 -

Soweit der Antragsteller die fehlende Einzelfallgerechtigkeit bei der Erstellung der Beurteilungen zum Stichtag 31.08.08 wegen der Beachtung der Gauß´schen Normalverteilungskurve rügt, weil es jeglicher Erfahrung und realitätsnahen Annahme widerspreche, davon ausgehen zu wollen, dass bei über 14.000 Beurteilten landesweit ein statistisches Endergebnis eintrete, das geradezu idealtypisch der Gauß´schen Normalverteilungskurve entspreche, vermag dieses Vorbringen ebenfalls seinem Antrag nicht zum Erfolg zu verhelfen. Denn es begegnet keinen rechtlichen Bedenken, wenn der Dienstherr durch die Angabe eines in der betreffenden Verwaltung insgesamt erwarteten Verhältnisses der Noten - hier unter Berücksichtigung der Gauß´schen Normalverteilungskurve - deren von ihm gewollten Inhalt und damit die anzuwendenden Maßstäbe näher bestimmt (vgl. BVerwG, Urteil vom 13.11.1997 - BVerwG 2 A 1.97 -, DVBl. 1998, 638, das die Vorgabe von Notenquoten als Richtsätze bezeichnet; ihm folgend Nds. OVG, Beschluss vom 06.08.09 - 5 LA 51/08 -).

Im Übrigen setzt sich das Vorbringen des Antragstellers nicht mit der Argumentation des Verwaltungsgerichts auseinander, das im Einzelnen ausgeführt hat, aus welchen Gründen dem Antrag nicht aufgrund eines angeblichen Systemfehlers wegen der Bezugnahme auf die Gauß´sche Normalverteilungskurve stattzugeben sei (BA S. 6 f.).



Hinzuweisen ist darauf, dass in den Beurteilungsrichtlinien der Polizei Niedersachsen (BRLPol) laut RdErl. d. MI v. 11.07.08 - P 25.22-03002 (Nds.MBl. Nr.28/2008 S.782) - VORIS 20400 - folgende Regelung enthalten ist:

5.1.1 Maßstabsbildung

Um eine Vergleichbarkeit der Beurteilungen und die damit verbundene Notwendigkeit der Maßstabswahrung zu gewährleisten, wirken die Beurteilenden darauf hin, dass sich die Gesetzmäßigkeiten der Gaußschen Normalverteilungskurve in der Gesamtschau der Beurteilungen in den jeweiligen Vergleichsgruppen wiederfinden lassen.

Dazu findet sich dort eine Anmerkung, die wie folgt lautet:

Nach diesem Modell gibt es eine regelmäßig wiederkehrende, zahlenmäßig gleiche Verteilung des Leistungsvermögens von Beschäftigten. Die meisten Beschäftigten befinden sich im Normal- bzw. Durchschnittsbereich, d.h., dass diese den Anforderungen des Arbeitsplatzes voll entsprechen.


Dieser Hinweis gibt uns Gelegenheit zu der Anmerkung, dass wir Ihnen hier nicht irgendeine "Wahrheit" verkünden wollen, sondern eine juristische Meinung darlegen. Die niedersächsische Polizei und das OVG Lüneburg sind eben anderer Auffassung.
Beamtenrecht / Übersicht Beamtengesetze
Einleitung - Bundesarbeitsgericht
Gesetze / Verordnungen Bundesbeamtengesetz, BLV Landesrecht Hamburg - FHH: Beurteilungsrichtlinie - Richter in Hamburg LVO Niedersachsen Bedeutung von Richtlinien Soldatenlaufbahnverordnung
Formelles zur Anfechtung Eröffnung der Beurteilung Anfechtung, Widerspruch Zeitablauf / Verwirkung Gericht: Kontrolldichte Rechtsschutzbedürfnis
Einzelne Probleme Beurteilungsmaßstab Beurteilungszeitraum Beurteilungsbeitrag Personalgespräche vorher Maßstabskonferenzen Erst- und Zweitbeurteiler - Voreingenommenheit? Verschlechterung der Note Absinken nach Beförderung Quotenopfer Punkte-/ Ankreuzverfahren Begründung der Gesamtnote Beurteilung: Fortschreibung Schwerbehinderte Beamte Assessment Center



















Wie ein Dienstherr scheitern kann, wenn er von falschen Annahme ausgeht.
(Und leider haben die Beamten es auszubaden. Mit wenigen Ausnahmen. Denn einige Profiteure gibt es in jedem System.)























Kann es möglich sein, dass jeder 7. Beamte der Polizei Hamburg nur "defizitäre Leistungen" erbringt, dass jeder 5. oder 6. nicht beförderungswürdig ist?



Ein groß angelegte Experiment, etwas anderes war es bei der Polizei Hamburg nicht.
Es ist gescheitert - hunderte von Beamten waren betroffen.



Dies entspricht unserer Auffassung: menschliche Fähigkeiten lassen sich nicht mathematisch exakt vermessen.






















▲ zum Seitenanfang