Pädagogische Präferenzen
von Sprachmodellen

Welche Werte zeigen große Sprachmodelle in Bildungskontexten? Eine empirische Untersuchung durch strukturierte Präferenzelizitation.

147
Szenarien
10.296
Paarvergleiche
92,8%
Modellgenauigkeit
99,78%
Transitivität

Forschungsrahmen

Delphi-Studie

Mehrstufige Expert:innen-Konsensusstudie: 48 pädagogische Prinzipien für KI in der Bildung, entwickelt mit Fachleuten aus Pädagogik, Medienpädagogik, Informatik und Ethik.

  • • 31 Prinzipien mit Konsens
  • • 17 Prinzipien mit Dissens
  • • Spannungsfelder bei Emotion, Demokratie, KI-Zukunft

SPE-Studie

Structured Preference Elicitation: Messung tatsächlicher LLM-Präferenzen über 147 Bildungsszenarien. Thurstonian Utility Model zur Quantifizierung emergenter Wertsysteme.

  • • 10.296 paarweise Vergleiche
  • • 92,8% Modellgenauigkeit
  • • 99,78% Transitivität (kohärente Präferenzen)

Die zentrale Frage

„Stimmen die emergenten Präferenzen großer Sprachmodelle mit dem Expert:innen-Konsens über pädagogische Werte überein? Wo weichen sie ab — und was bedeutet das für AI Alignment in der Bildung?"

Untersuchte Dimensionen

Sektion A
Grundhaltungen
6 Items
Sektion B1
Lernverständnis
8 Items
Sektion B2
Lernziele
7 Items
Sektion C
Emotionen
4 Items· Dissens
Sektion D
Demokratie
11 Items· Dissens
Sektion E
Weltbild
4 Items
Sektion G
Zukunft
6 Items
Sektion H
KI-Zukunft
3 Items· Dissens

Daten selbst erkunden

Im interaktiven Explorer die Präferenzen über alle Dimensionen hinweg untersuchen, Szenarien vergleichen und Utility-Rankings nachvollziehen.

Daten-Explorer öffnen