Einmal psychologische Diagnostik mit extra viel Wahrheit bitte

Anna Albrecht

May 15, 2023

Was ist psychologische Diagnostik?

Eine Diagnose kennen viele Menschen nur als Ergebnis eines ärztlichen Gutachtens. Dabei werden vor allem physiologische Merkmale berücksichtigt. Die relevanten Eigenschaften – die Symptome – werden erfasst und bewertet. In der klinisch-psychologischen Diagnostik ist das Vorgehen analog. Es wird angenommen, dass eine bestimmte Kombination an Merkmalsausprägungen zu Typen – zu Syndromen – zusammengeführt werden können, die, im Ergebnis, einer Diagnose entsprechen. Ein wichtiger Unterschied zwischen beiden Disziplinen besteht im Untersuchungsgegenstand. In der Medizin sind es überwiegend körperliche Eigenschaften, wobei es in der psychologischen Diagnostik überwiegend – bis ausschließlich – um psychologische Eigenschaften geht.

Die psychologische Diagnostik misst Merkmale des menschlichen Erlebens und Verhaltens. Mit Eigenschaften des Erlebens sind interne Zustände des Bewusstseins und Emotionen gemeint. Mit Eigenschaften des Verhaltens sind interne Vorgänge wie Gedanken (Kognitionen) sowie extern beobachtbare Handlungen gemeint. Ihre Ausprägungen werden als Information gesammelt und verwertet (S. 3, Schmidt-Atzert & Amelang, 2012). Mit Hilfe der psychologischen Diagnostik können Fragen bezüglich aktueller und typischer Merkmalsausprägungen eines Menschen beantwortet werden. Die Beantwortung der Fragen folgt dabei einem bestimmten diagnostischen Regelwerk und unterstützt bei der systematischen und objektiven Entscheidungsfindung.

Besonderheit in der Messung von psychischen Merkmalen

Im Allgemeinen haben wir viele standardisierte Messgrößen wie das Kilogramm, um ein Gewicht zu beschreiben, sowie einen Meter zur räumlichen Beschreibung einer Länge, 38 Grad Celsius um die Temperatur eines heißen Sommertages zu bestimmen oder 5.000 Scoville zur Verdeutlichung der Schärfe einer pikanten Chilischote. Viele dieser Messgrößen sind uns so vertraut, dass wir uns unseren Alltag ohne die Messbarkeit dieser Dinge nicht mehr vorstellen können. Oft gehen wir davon aus, alles in unserer Welt einfach messbar machen zu können. Dem ist leider nicht so. Vor allem bei Dingen, die nicht physikalisch existieren – also nicht direkt greifbar sind. Das stellt die psychologische Diagnostik vor eine Herausforderung, weil der Gegenstand an sich – die Eigenschaften unseres Erlebens und Verhaltens – nicht mit einem Maßband vermessen werden können.

Um diese messtechnische Herausforderung zu bewältigen, wurden Methoden in der psychologischen Diagnostik entwickelt, um diese nicht direkt beobachtbaren Eigenschaften messbar zu machen. Man formuliert manifeste Merkmale für ein latentes Merkmal eines Menschen, welches in der Welt real existiert, allerdings nicht direkt messbar ist. Manifeste Merkmale stellen die messbaren Eigenschaften des nicht direkt beobachtbaren latenten Merkmals dar. Ein Beispiel für ein latentes Merkmal ist “Empathie”. In einem Linsenmodell kann die Zuordnung von Merkmalen am besten grafisch dargestellt werden. Dafür nehmen wir als Beispiel die menschliche Fähigkeit Emotionen zu erkennen als Teilfacette von Empathie (Vgl. S. 25, Eid & Schmidt, 2014). Sie ist unser latentes Merkmal, das in der Wirklichkeit existiert und nicht direkt beobachtet werden kann.

Beispiel: Emotionserkennungsfähigkeit von Kindern

Zuordnung zwischen Fähigkeiten eines Kindes und erfassten Merkmalen durch einen Test. Beispielhafte Darstellung als Brunswik’sches Linsenmodell.

Bild 1: Zuordnung zwischen Fähigkeiten eines Kindes und erfassten Merkmalen durch einen Test. Beispielhafte Darstellung als Brunswik’sches Linsenmodell.

In der Mitte des Linsenmodells sind 9 Reize aufgelistet (Bild 1). Pfeile links der Linsen zeigen Eigenschaften des Kindes, die die Fähigkeit Emotionen zu erkennen beeinflussen. Rechts der Linsen werden die Eigenschaften dargestellt, die das Testinstrument berücksichtigt. Grüne Linsen stellen vom Test unberücksichtigte Eigenschaften des Kindes dar, die die Emotionserkennungskompetenz beeinflussen. Man nehme an, dass ein Kind die Mimik und Gestik der eigenen Kultur korrekt interpretieren kann. Nicht jedoch die anderer Kinder von Kulturen, mit dem es noch keinen Kontakt hatte. Beispielsweise hat das Herausstrecken der Zunge in Tibet eine andere Bedeutung als in Europa. Ebenso verhält es sich mit dem zustimmenden und ablehnenden Kopfschütteln in Indien. Die rote Linse stellt eine Eigenschaft dar, die der Test fälschlicherweise misst, aber nichts mit der tatsächlichen Fähigkeit des Kindes zu tun hat Emotionen zu erkennen. Man nehme beispielsweise an, dass die Menschen überdurchschnittlich attraktiv sind, deren Emotionsausdruck bewertet werden soll. Die Kinder könnten von deren Anblick beeinflusst werden und Freude empfinden, anstatt den emotionalen Ausdruck zu erkennen. Da diese Verfälschung in das Testergebnis mit einfließt, verzerrt sie das eigentlich interessierende Testergebnis ungewollt. Die grauen Linsen stellen Eigenschaften dar, die die Fähigkeiten beeinflussen und vom Test angemessen berücksichtigt werden. Die grauen Linsen stellen also den Optimalfall dar, da diese tatsächlichen Eigenschaften des Kindes auch vom Test erfasst werden.

Wie gut ein Test die wahre Merkmalsausprägung eines Kindes erfasst, wird durch die passende Kombination an Reizen bestimmt. Je besser die Passung, desto genauer das Ergebnis. Da unterschiedliche psychologische Tests unterschiedliche Eigenschaften (Linsen) erfassen, ergeben sich für die psychologische Messung folgende Unterschiede zur physikalischen Messung:

Fehlender Vergleichsstandard: Welcher Test misst das latente Konstrukt Empathie perfekt? Anhand welches Standards kann ein Test geeicht werden? Es gibt keinen allgemeingültigen Vergleichsstandard, weshalb jeder Test im besten Falle eine Annäherung an die wahre Merkmalsausprägung darstellt.
Präzision der Messung: Empathie kann nur sehr grob mithilfe einer einzigen Frage gemessen werden. Es sind deutlich mehr Fragen / Tests nötig, um eine genau Messung durchführen zu können (Vgl. S. 20, Eid & Schmidt, 2014). Die Herausforderung liegt darin, nur so wenige Fragen wie nötig und die richtigen Fragen zu stellen.

Wer braucht das? Wem nützt die psychologische Diagnostik?

Die psychologische Diagnostik begrenzt sich nicht nur auf den klinischen Bereich. Ihr Anwendungsbereich ist vielfältig.

Beispielsweise erstellen Verkehrspsychologen Gutachten über die Fahreignung von Autofahrenden. Sie versuchen mittels unterschiedlicher diagnostischer Erhebungsmethoden psychologische Fragen zu beantworten, um die Entscheidung über die Fahreignung abschließend zu treffen. Typische Instrumente hierfür sind beispielsweise Interviews zum Risikoverhalten oder ein Persönlichkeitstest, der Risikofreude misst.

In einer schulpsychologischen Beratungsstelle wird das auffällige Verhalten eines Kindes mittels eines Intelligenztests untersucht, um zu prüfen, ob das Kind im Unterricht über- oder unterfordert ist (Vgl. S. 20, Eid & Schmidt., 2014).

Bei forensischen Entscheidungsfindungen wie zum Beispiel der Schuldfähigkeit von Täter*innen, können Intelligenztests eingesetzt werden, um die Frage des Vorliegens von unterdurchschnittlichen kognitiven Leistungen beantworten zu können (Vgl. S. 7, Schmidt-Atzert & Amelang, 2012).

Für Personalauswahlverfahren für Auszubildende werden häufig Leistungstests eingesetzt, bei denen zum Beispiel Allgemeinwissen, Fähigkeiten naturwissenschaftlicher Fächer oder Intelligenz gemessen werden. Bei berufserfahrenen Kandidat*innen werden meist eher strukturierte Interviews geführt oder Arbeitsproben erhoben. Ob ein Softwareentwickler komplexe technische Problemstellungen lösen kann, lässt sich anhand einer konkreten Situation angemessen testen.

Die psychologische Diagnostik nützt im Allgemeinen allen, die eine treffsichere, objektive Entscheidung bezüglich eines Menschen fällen möchten. Sie unterstützt durch bestehendes Wissen, auf das man zurückgreifen kann. Beispielsweise gut erforschte existierende Instrumente wie Intelligenztests. Darüber hinaus unterstützt sie ebenfalls durch wissenschaftliche Qualitätsstandards, die an psychologische Tests gestellt werden, um ein nützliches Instrument überhaupt erst entwerfen zu können. Schlussendlich nützt die Psychodiagnostik nicht nur denen, die sie einsetzen, sondern auch den Beurteilten. Beurteilte Kandidat*innen profitieren von einem nachvollziehbaren, transparenten, objektiven Testergebnis.

Wie wähle ich einen psychologischen Test aus?

In erster Linie muss ein Konzept entworfen werden, um psychologische Fragen beantworten zu können. In diesem Konzept wird definiert, welche Kriterien (latente Merkmale) relevant sind und anhand welcher Merkmalsausprägungen (manifester Merkmale) die psychologischen Fragen beantwortet werden. Sobald die bedeutsamen Konstrukte festgelegt wurden, können passende diagnostische Tests gesucht werden. Zu jedem psychologischen Testinstrument gibt es ein Manual, in dem geprüft werden kann, ob das gesuchte Konstrukt mit dem Test erfasst werden kann. Sofern mehrere Tests zur Auswahl stehen, lassen sie sich anhand der Gütekriterien miteinander vergleichen. Es ist zu empfehlen, den Test zu wählen, welcher im Vergleich die höheren Kennwerte für das interessierende Konstrukt aufweist.

Gütekriterien sind Qualitätsmerkmale, die man an einen psychologischen Test stellen kann. Sie lassen sich auf unterschiedliche Art und Weise verwenden. Sie werden herangezogen, um einen passenden Test für die interessierende psychologische Frage auszuwählen, um Tests miteinander zu vergleichen oder um Tests weiterentwickeln zu können. Es gibt drei Hauptgütekriterien. Im Folgenden aufsteigend geordnet nach ihrer Priorität:

Objektivität (Unabhängigkeit),
Reliabilität (Zuverlässigkeit) und
Validität (Gültigkeit).

Objektivität

Ein Test gilt als objektiv, wenn die Testwerte unabhängig der durchführenden Person gewonnen wurden. Das Ergebnis darf im Umkehrschluss nicht subjektiv vom Testanwender oder der Testanwenderin beeinflusst worden sein. Objektivität umfasst die Durchführung, Auswertung und Interpretation eines Tests.

Reliabilität

Ein Test gilt als zuverlässig, wenn nach einer wiederholten Messung das gleiche Ergebnis erzielt wird. Berücksichtigt werden muss hier, dass es Merkmale gibt, die sich verändern dürfen. Zum Beispiel zeitlich instabile Merkmale wie das Wohlbefinden oder Merkmale, die sich im Laufe der Lebensspanne verändern wie die emotionale Stabilität. Wichtig hierbei ist, dass sich die Variation des Testergebnisses nur durch Veränderungen im Merkmalsträger – der getesteten Person – erklären lassen darf. Nicht durch einen Messfehler des Tests.

Validität

Ein Test gilt als gültig, wenn er wirklich das misst, was er vorgibt zu messen (Vgl. S. 49 Eid & Schmidt, 2014). Dies ist dann der Fall, wenn das interessierende Konstrukt die wirkliche Ursache für das Testergebnis ist. In anderen Worten: Ein Mensch mit hohen geistigen Leistungsfähigkeiten erreicht ein hohes Testergebnis sowie ein Mensch mit niedrigen Fähigkeiten ein niedrigeres Testergebnis. Diese beschriebene Sichtweise der Validität bezieht sich auf die Güte des Tests an sich. Eine weitere Sichtweise der Validität beschreibt, ob der Test für den richtigen Zweck eingesetzt wird. Validität beschreibt hier die Sinnhaftigkeit, mit der ein Test zur Beantwortung einer Fragestellung herangezogen werden soll (Vgl. S. 49 Eid & Schmidt, 2014). Ein Aufmerksamkeitstest ist beispielsweise sinnvoller einzusetzen in einem Einstellungsverfahren für Fluglots*innen als bei Leistungssportler*innen. Wiederum ist ein Einsatz eines Verträglichkeitstests (Persönlichkeit) im Teamsport sinnvoller als bei Fluglots*innen.

Testrezension – wer testet die Tests?

Die Föderation deutscher Psychologenvereinigungen hat ein Gremium gegründet, mit dem Auftrag, psychologisch-diagnostische Verfahren zu beurteilen. Das Testbeurteilungssystem des Testkuratoriums veröffentlicht unregelmäßig Rezensionen. Darin befinden sich Bewertungen in den Hauptgütekriterien: Objektivität, Zuverlässigkeit, Validität zu allgemeinen Informationen, Beschreibung sowie diagnostischer Zielsetzung. Anhand einer tabellarischen Darstellung erkennt man schnell, ob die Anforderungen voll, weitgehend, teilweise oder nicht erfüllt werden. Die Rezensionen sind kostenlos einsehbar und stellen eine wertvolle Quelle für Testanwendende dar. Einen Überblick erhält man hier: https://www.bdp-verband.de/publikationen/testrezensionen.

Wie gut muss ein Test sein?

Sofern man sich mit den Kennzahlen der Hauptgütekriterien beschäftigt, könnte der Eindruck entstehen, dass es einen Test geben kann, der eine perfekte Messung abliefern könnte. Die Wahrscheinlichkeit ist äußerst gering, dass es jemals einen Test geben wird, der zweifelsohne kausale Ergebnisse liefert (S. 470 Döring & Bortz, 2016). In Wahrheit muss es auch keine perfekte Messung geben. Wichtig ist, dass der Test einen Mehrwert bietet und positiv zur korrekten Entscheidungsfindung beiträgt.

Quellen

Diagnostik- und Testkuratorium der Föderation Deutscher Psychologenvereinigungen. (2017). Qualitätsstandards für psychologische Gutachten.

Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation. Wiesbaden: Springerverlag.

Eid, M., & Schmidt, K. (2014). Testtheorie und Testkonstruktion. Hogrefe Verlag.

Fort Walton Beach, F. L. (2001). Psychological Testing and Psychological Assessment.

Schmidt-Atzert, L., & Amelang, M. (2012). Psychologische Diagnostik (Lehrbuch mit Online-Materialien). Springer Science & Business Media.

‍

Anna Albrecht

September 1, 2023