erschien in: Hermer, Matthias (Hrsg): Psychotherapeutische Perspektiven am Beginn des 21 Jahrhunderts. Tübingen: DGVT-Verlag, 2000, 43-66

Perspektiven zur ”Wissenschaftlichkeit” von Psychotherapie

Jürgen Kriz

0. Vorbemerkungen

Zu Beginn eines neuen Jahrtausends sind wir mit der Gefahr konfrontiert, unter dem Bann(er) angeblich ”wissenschaftlicher Standards” ins Zeitalter der Glaubenskämpfe zurückkatapultiert zu werden, aus dessen dogmatischen Fesseln uns einst eine wissenschaftsgeleitete Aufklärung herausgeführt hat. Inspiriert von dem Buchtitel ”Psychotherapeutische Perspektiven am Beginn des 21. Jahrhunderts” mag es daher erlaubt sein, zu Beginn dieses Beitrags einen Wunsch für die Zukunft zu äußern: Aus der Perspektive meines Themas halte ich es für das wünschenswerteste und dringendste Anliegen, daß die Mystifikation und der Mißbrauch des Attributes ”wissenschaftlich” eingedämmt werden.

Nach gängigem Verständnis besteht nämlich eine der wichtigsten Aufgaben von Wissenschaft darin, Denk- und Handlungsräume von Menschen zu erweitern. Dazu ist es dienlich, möglichst umfangreiche Erkenntnisse über die Welt zu sammeln - oder auch aktiv zu generieren - und in Verstehenszusammenhänge einzubetten. Wesentlich für ein wissenschaftliches Vorgehen ist dabei, Alternativen in Fragestellung und Herangehensweisen nicht zu vermeiden, sondern diese in offensiver Weise möglichst zu erweitern und (dann!) kritisch zu diskutieren. Dazu gehört auch, daß die eigenen stillschweigenden Vorannahmen und damit die methodologischen und methodischen Voraussetzungen reflektiert und diskutiert werden. Wissenschaft sollte sich als Anwalt für eine Pluralität vieler unterschiedlicher Perspektiven verstehen, zumindest ideologischen Verengungen trotzen und einen möglichst großen Teil der ”Welt” durch eine Vielzahl an Fragestellungen sowie Methoden für deren Untersuchung für die Allgemeinheit erschließen.

Solche eher globalen Standards für Wissenschaft sind unter Wissenschaftstheoretikern seit langem weitgehend unumstritten. Und im Allgemeinen wird die aufklärerische Vielfalt an Perspektiven und Zugangsweisen als ein Fortschritt gegenüber den dogmatischen und ideologischen Beschränkungen des Mittelalters gesehen und begrüßt. Um so beunruhigender ist es, wenn an der Schwelle zu einem neuen Jahrtausend unter Berufung auf ”Wissenschaftlichkeit” versucht wird, im Bereich der Psychotherapie die Vielfalt der Perspektiven und Zugangsweisen und mit ihnen den Raum an Denk- und Forschungsmöglichkeiten drastisch zu beschneiden und - wenn auch nur innerhalb der Grenzen des Nationalstaates Deutschland - eine ganze Gesellschaft in ein bestimmtes Glaubens- und Wertekorsett hinsichtlich psychotherapeutischer Behandlungsmöglichkeiten zu zwängen.

Dies klingt wie eine ungeheuerliche Behauptung - und es bedarf daher zumindest des Verweises auf einige Fakten, um den Realitätsgehalt dieser Aussage überprüfbar zu machen.




1. Die Gleichschaltung der psychotherapeutischen Arbeits-, Forschungs- und Denkmöglichkeiten im Namen der Wissenschaft

Das 1983 in Deutsch erschienene zweibändige ”Handbuch der Psychotherapie” (amer. Original 1981) des Professors für klinische Psychologie und Trägers mehrerer wissenschaftlicher Preise, Raymond J. Corsini weist rund 70 ”Therapieansätze” (so das Vorwort) aus. Ein Blick in den Anzeigenteil einer Zeitschrift wie ”Psychologie heute” zeigt, daß dies sicher nur die - von Corsini als nennenswert akzeptierte - ”Spitze eines Eisberges” ist, zu dem vermutlich mehrere hundert Bezeichnungen gehören, die den Anspruch erheben, ein ”Therapieverfahren” zu sein.

Mir schiene auf der Basis des derzeitigen Forschungsstandes nicht akzeptabel, auch nur den größeren Teil dieser Ansätze als ”wissenschaftlich begründet” zu bezeichnen, da sie z.B. im wissenschaftlichen Diskurs - selbst bei einem sehr weit gefaßten Verständnis - kaum präsent sind und u. a. auch die Qualität der Ausbildung meist keineswegs hinreichend belegt ist. Auf der anderen Seite bin ich sicher, daß ein rein auf wissenschaftlicher Basis und ohne berufs- und standespolitische Interessen geführter Diskurs aller deutschen Fachwissenschaftler für den Bereich von Psychotherapie konstatieren würde, daß weit mehr als die gegenwärtig zugelassenen beiden ”Richtlinienverfahren” als wissenschaftlich fundiert und anerkannt zu gelten haben.

Dafür spricht, daß auch der 1982 von Bastine, Fiedler, Grawe, Schmidtchen und Sommer - allesamt Universitätprofessoren mit klinisch-therapeutischer Fachkompetenz - herausgegebene Band ”Grundbegriffe der Psychotherapie” mindestens 28 Therapieverfahren ausweist. Selbst wenn man einige dieser Verfahren für unsere Betrachtungsperspektive zu Oberkategorien zusammenfassen müßte, bleiben immer noch deutlich mehr als ein Dutzend übrig. Und das, obwohl die Herausgeber im Vorwort betonen: ”Wir wenden uns (...) gegen den Wildwuchs (an) Therapien..” und das Buch ”gründet sich wissenschaftstheoretisch auf ein empirisch-wissenschaftliches Grundverständnis ... Aufgrund dieses Wissenschaftsverständnisses werden im Buch Konzepte bevorzugt, die sich in der Theorienbildung einer empirischen Überprüfung stellen.” Ebenso weist meine eigene Zusammenstellung ”Grundkonzepte der Psychotherapie” (Erstauflage 1985) - das an vielen deutschen Universitäten Prüfungslektüre für Diplompsychologen ist - rund ein Dutzend Therapieansätze aus (die ebenfalls teilweise noch zu berufspolitisch begründeten Oberkategorien zusammengefaßt werden können). Das gleiche gilt für das vierbändige Werk ”Psychotherapeutische Verfahren” des Tübinger Professors Dirk Revenstorf Anfang der 80er Jahre.

Die ungewöhnlichen Verweise auf Amtstitel und Prüfungskontexte dienen der Betonung der Verankerung im und Anerkennung durch das Wissenschaftssystem. Doch im Spätherbst 1999 wurde den beiden ersten (und in Fachkreisen unumstritten aussichtsreichsten) Antragstellern nach dem neuen Psychotherapeutengesetz die notwendige ”Anerkennung der Wissenschaftlichkeit” bestritten - worauf konsequenterweise andere ihre Antragsvorbereitungen erst einmal einstellten. Erschreckend ist, daß dies durch einen sog. ”Wissenschaftlichen Beirat” bewirkt wurde - aufgrund von Kriterien für ”Wissenschaftlichkeit”, die dieser Beirat selbst erlassen hatte. Es kann hier nicht der Ort sein, auf Detailprobleme dieser Entscheidung einzugehen und etwa zu fragen, ob es überhaupt Aufgabe des ”Wissenschaftliche Beirat” war, eigene Kriterien für die Anerkennung von ”Wissenschaftlichkeit” zu entwickeln, statt die Anerkennung durch andere (eben durch die Wissenschaft) zu untersuchen; und ob es statthaft oder zumindest schicklich war, die im Frühjahr 1999 selbst beschlossenen Kriterien ein halbes Jahr später und nach Vorliegen der Anträge (die natürlich auf die ursprünglichen Kriterien zugeschnitten waren) per Tischvorlage unmittelbar vor der Abstimmung wesentlich zu ändern. Mit diesen und weiteren ”merkwürdigen” Aspekten werden sich noch Juristen, Politiker (und später vielleicht einmal: Wissenschafts-Historiker) zu beschäftigen haben. Wichtiger ist es, kurz die Konsequenzen dieser Entscheidung zu beleuchten. In der Annahme, daß Wissenschaftler in der Lage sein müßten, die Konsequenzen ihrer Entscheidungen mit ins Kalkül zu ziehen, muß davon ausgegangen werden, daß diese Konsequenzen entweder intendiert oder zumindest fahrlässig billigend in Kauf genommen wurden:

Da ”Psychotherapie” nach dem Gesetz nur Anwendung ”wissenschaftlich anerkannter Verfahren” beinhaltet, dürften damit Psychotherapeuten keine anderen Verfahren als die beiden Richtlinienverfahren ausüben (faktisch sogar nur Verhaltenstherapie, da in Fachkreisen bezweifelt wird, daß die tiefenpsychologischen Verfahren diese Kriterien auch nur annähernd selbst erfüllen, da sie auch für diese allzu eng und inadäquat sind - was z. B. die Diskussion zwischen Tschuschke, Kächele und Hölzer auf der einen und Grawe auf der anderen Seite im Psychotherapeut 1994/95 deutlich macht). Was aber nicht ausgeübt werden darf, kann auch nicht (oder nur unter extrem erschwerten Bedingungen) praktisch erprobt und beforscht werden. Mit gutem Grund könnte man dann auch die Berechtigung der Lehre an den Universitäten problematisieren (zumal auch hier immer mehr vordergründige ”Effektivität” als zentrales Kriterium zur Beschneidung von Pluralität verwendet wird). Das Spektrum der Ansätze wäre schlagartig auf einen Ansatz (oder ggf. zwei) reduziert und diese radikale Reduktion für Jahrzehnte zementiert. Wer Therapie anbietet und wer Therapie nachfragt, wäre (von sehr erschwerten Ausnahmemöglichkeiten abgesehen) auf diese eine Richtung festgelegt. Und sehr schnell würden dann auch die nicht mehr gebrauchten, gelehrten und erforschten alternativen Zugänge, Menschenbilder, Konzepte, Denkweisen und Methoden aus der lebendigen Wissenschaft und der Gesellschaft verschwinden. Dies darf wohl durchaus als eine Kulturrevolution im Bereich der Psychotherapie (und der damit verbundenen Lebenskonzepte, Menschenbilder, Wertvorstellungen usw.) bezeichnet werden.

Auch wenn ich hoffnungsvoll sicher bin, daß vor allem wach gewordene Politiker und Verwaltungsjuristen diesem Alptraum bald ein Ende setzen werden, kann ich nicht glücklich darüber sein, weil dies zeigt, daß Selbstregulationsmechanismen der Wissenschaft in diesem Sektor derart versagt haben. Es ist erschreckend, wenn wissenschaftliche Vielfalt, Pluralität der Perspektiven und unterschiedliche Forschungszugänge - kurz: der Kern dessen, was viele für das Wesen von Wissenschaft ansehen - nur gegen eine massive Reduktion im Namen von ”Wissenschaftlichkeit” und letztlich allein mit Hilfe von Verwaltungsjuristen und Politikern aufrechterhalten bzw. wiederhergestellt werden können.

Wie kann es dazu kommen, daß ein ”Wissenschaftlicher Beirat” Kriterien für ”Wissenschaftlichkeit” erläßt, die sich derart verheerend auch auf Wissenschaft auswirken würden? Immerhin ist beispielsweise das nach Meinung dieses Beirates nicht ”wissenschaftlich anerkannte” Verfahren ”Gesprächspsychotherapie” (GT) von Rogers selbstverständlich nicht nur in den eben angeführten und allen weiteren Lehrbüchern über unterschiedliche Psychotherapieverfahren vertreten, sondern es wird an über zwei Dutzend deutschen Universitäten regelmäßig gelehrt und ist Bestandteil von wissenschaftlichen Prüfungen. Zahlreiche wissenschaftliche Kongresse fanden statt und es gibt wohl kaum eine wissenschaftliche Zeitschrift im Bereich der Psychotherapie, die im vergangenen Jahrzehnt nicht vielfach auf Konzepte und Forschungsergebnisse der GT Bezug genommen hätte . Selbst die viel zitierte umfangreiche Meta-Analyse von Grawe, Donati und Bernauer (1994) - der bei aller Kritik niemals vorgeworfen wurde, ein Verfahren zu gut bewertet zu haben - kam zu dem Schluß: ”Vergleicht man die Ergebnistabellen für die Prä-Post-Vergleiche und die Kontrollgruppen-Vergleiche mit den analogen Tabellen zu den meisten anderen Therapieformen, dann muß man der Gesprächspsychotherapie eine sehr überzeugend nachgewiesene Wirksamkeit bescheinigen” (S. 134) und: ”Es führt kein Weg an der Schlußfolgerung vorbei: Gesprächspsychotherapie ist nachweislich ein sehr wirksames Verfahren für ein weites Spektrum an Störungen” (S. 135).

Im Frühjahr 1998 unterzeichneten denn auch binnen weniger Wochen 80 ”Deutsche Universitätsprofessorinnen und -professoren im Bereich Psychotherapie / Klinische Psychologie / medizinische Psychologie” einen Aufruf, in dem u. a. nochmals betont wurde: ”Die Gesprächspsychotherapie gehört sowohl international als auch in Deutschland seit Jahrzehnten zu den praktizierten und bewährten Verfahren. Tausende von Patienten wurden mit Gesprächspsychotherapie erfolgreich ambulant bzw. stationär behandelt. In zahlreichen Lehrbüchern der Psychotherapie / Klinischen Psychologie wird dieses Verfahren als wissenschaftlich ausgewiesen und als effektiv dokumentiert. An vielen deutschen Universitäten gehört die Gesprächspsychotherapie sowohl zur Forschung als auch zur Lehre und somit zum Prüfungsstoff u. a. im Hauptdiplom in Psychologie...”.

Nun sollte man meinen, daß eine deutlichere Dokumentation der ”wissenschaftlichen Anerkennung” kaum denkbar ist, als wenn dies explizit von der ganz überwiegenden Mehrheit der fachlich kompetenten Wissenschaftler an Universitäten betont und zudem durch die Präsenz im wissenschaftlichen Diskurs in Fachbüchern und -zeitschriften und letztlich noch in Forschung und Meta-Analysen unterstrichen wird.

Wenn trotzdem der ”Wissenschaftliche Beirat” mehrheitlich zu dem Schluß kam, der Gesprächspsychotherapie diese Bestätigung als ”wissenschaftlich anerkanntes psychotherapeutisches Verfahren” nicht zu erteilen, wurde hier offensichtlich das Attribut ”wissenschaftlich” in einer Weise definiert, die keinen Bezug zur Wissenschaftlergemeinschaft und deren (zumindest deutlich mehrheitlicher) wissenschaftlicher Bewertung herstellt. Da man einen ”direkten Draht zum Weltgeist” oder ähnliche überirdische Wahrheitsquellen und -kriterien ausschließen muß und kann, ist dies nur erklärlich, indem man sich auf ”streng objektive” (und von der Intersubjektivität der scientific community unabhängige) Kriterien beruft.

Meines Erachtens ist dies ein extremes Beispiel für die Mystifikation von bestimmten methodischen Zugängen und ein fast magischer Glauben an die Bedeutung statistischer Zahlen, den ich bereits vor Jahrzehnten mit dem Verweis glossiert habe, daß manche Wissenschaftler an der Tür zum Rechenraum mit dem Mantel scheinbar auch ihren inhaltlichen Sachverstand abgeben (Kriz 1975, 1981). Trotz vehementer Kritik seitens der Methodiker - von der Signifkanztest-Kontroverse in amerikanischen Zeitschriften in den sechziger Jahren, über den Beitrag des Statistikers L.Guttmann mit dem bezeichnenden Titel ”What is not what in statistics”, bis hin zu dem markanten Aufsatz Kromreys (1999) ”von den Problemen anwendungsorientierter Sozialforschung und den Gefahren methodischer Halbbildung”- wird vielfach den Outputs formaler Prozeduren, wie Signifikanzsternen oder statistischen Parametern, eine Bedeutung eingeräumt, die diesen nicht zukommt. Es ist hier sicher nicht der Ort, Grundkurse kritischer Statistik zu reproduzieren (u. a. Kriz 1973, Kriz & Lisch 1988). Aber für diesen Kontext mag es sinnvoll sein, zumindest exemplarisch am Beispiel der sog. ”Effektstärke” die Probleme von Parameter-Gläubigkeit aufzuzeigen, da Effektstärke durchaus eine wesentliche Rolle in dem vom Beirat verordneten ”Wissenschaftlichkeits”-Standard spielt.





2. Exkurs: Effektstärke versus Effektivität von Psychotherapie

Es gibt zahlreiche wissenschaftliche Debatten um inhaltliche Fragen darüber, wie die Effektivität von Psychotherapie zu konzeptionalisieren, zu operationalisieren und zu messen sei. Im Gegensatz zu den klar operational definierten Größen etwa der Physik haben unterschiedliche Therapierichtungen entsprechend ihren unterschiedlichen Zielvorstellungen nicht nur unterschiedliche inhaltliche Konzepte von ”Effektivität”, sondern selbst unterschiedliche Studien ein und derselben Richtung verwenden je nach Detailfrage(n) recht verschiedene Kriterien und damit Operationalisierungen. Hinzu kommt die grundsätzliche Frage, ob ”effektive” Veränderungen unter streng kontrollierten Laborbedingungen mit ihren Anforderungen an ”reine” Störungen und ”reine” (also meist manualisierte) Behandlung valide Aussagen erlaubt über ”effektive” Veränderungen unter üblichen Bedingungen - d. h. bei Menschen, die oft nicht nur eine Störung haben und die von Therapeuten behandelt werden, die nicht ”manual-rein” vorgehen.

Das zentrale Problem bei einer Diskussion über therapeutische ”Effektivitäts”-Maße, nämlich daß ”Äpfel” nicht nur mit ”Birnen” sondern eher mit ”Armbanduhren” verglichen werden, läßt sich strukturbedingt nicht beseitigen: Es besteht eben kein Konsens dahingehend, was Effektivität von Therapie bedeutet - und mit einem Konsens ist auch nicht zu rechnen, weil die Heterogenität hinsichtlich der Vorgehensweisen und Maße nur die Heterogenität der Menschenbilder, Lebensziele, Erfahrungen, subkulturellen Gewohnheiten und Vorlieben in der Bevölkerung widerspiegelt.

Gleichwohl entspricht es dem Zeitgeist, sich nicht so sehr offen über die unterschiedlichen Lebensziele und Werte in der Gesellschaft auseinanderzusetzen, sondern nach ”Effektivität” zu rufen. Und wenn man denn schon nicht weiß, wie die unterschiedlichen Vorstellungen von Effektivität unter einen Hut zu bringen sind, dann zumindest von ”der Wissenschaft” ein genaues Maß für ”Effektivität” zu fordern - in der trügerischen Hoffnung, damit sei das inhaltliche Problem wenn schon nicht gelöst, dann doch zumindest vom Tisch. Zu Recht kann man darauf hoffen, daß die Heterogenität der Wissenschaft tatsächlich immer wieder Vorschläge für scheinbar einfache ”Lösungen” eigentlich unlösbarer Probleme hervorbringen wird.

Dem offenbaren Bedürfnis, die Eigenwerte von unterschiedlichen Zugangsweisen zur Welt auch im Bereich von Psychotherapien nicht einfach akzeptieren zu wollen, sondern doch ”Äpfel” mit ”Armbanduhren” irgendwie vergleichen zu können, entspringt die ”Effektstärke”. Sie hat sich in Meta-Analysen durchgesetzt, damit die unterschiedlichen Erfolgsmaße aus unterschiedliche Studien mit unterschiedlichen Fragestellungen an unterschiedlichen Patienten mit unterschiedlichen Therapiemethoden überhaupt formal zusammengefaßt und dann z. B. Gruppen miteinander verglichen werden können.

Die Effektstärke, ES, ist üblicherweise definiert und operationalisert als (vgl. Reinecker 1996)

ES = (Me - Mk)/ Sk

wobei:

Me = Mittelwert von T der Experimental( = Behandlungs-)gruppe i.d. Post-Messung

Mk = Mittelwert von T der Kontrollgruppe i.d. Post-Messung

Sk = Standardabweichung von T der Kontrollgruppe i.d. Post-Messung

T = Test-/Meßvariable (z.B. Klin. Test)

Die inhaltlichen Probleme - d.h. der ”Preis”, für den ein solcher Vergleich überhaupt möglich ist - sind nach dem oben Gesagten beträchtlich und betreffen hier insbesondere die genauere Spezifikation des ”T”. Doch sollen in diesem Abschnitt zunächst solche inhaltlichen Aspekte völlig außer acht gelassen werden (einige werden später noch kurz aufgegriffen). Vielmehr soll hier gezeigt werden, daß auch formal ES nur bedingt etwas über Effektivität aussagen kann - d. h. auch dann, wenn das ”T” überhaupt nicht problematisiert wird.

Der Grund liegt darin, daß aus der obigen Formel hervorgeht, daß dann ES groß ist:

i) wenn Me - Mk groß ist - das ist weitgehend wohl auch das, was man sich unter ”Effektivität” vorstellt (sofern eben auch T dem hinreichend entspräche)

ii) wenn Sk klein ist - das aber hat fast nichts mit Effektivität zu tun, sondern hängt von Besonderheiten der Gruppe in Relation zu T ab

Insgesamt ”mißt” ES somit eher statistische Diskriminierung zwischen zwei Gruppen, die das, was man sich inhaltlich klinisch unter ”Effektivität” vorstellt, aber eben nur bedingt wiedergibt - ja ggf. sogar ins Gegenteil verkehren kann.

Hierzu ein Demonstrationsbeispiel mit einfachen, runden Zahlen.

Annahme: Man habe eine klinisch relevante Testgröße T, diese liege zwischen 0 (völlig störungsfrei) und 100 (schwerst gestört). Der Mittelwert von T in der Normalbevölkerung sei 40, die Standardabweichung 15.

Fall A: homogene, störungsspezifische Gruppe:

M (der störungsspezifischen Grundgesamtheit) sei 60 (wo auch der Postwert der Kontrollgruppe bleibe), s sei 5 (und bleibe es für die Postwerte der Kontrollgruppe);

die Therapie erbringe eine mittlere Verbesserung um 10 Punkte, d. h. Me = 50

Es gilt dann:

ES = (Me - Mk)/Sk = (50 - 60)/5 = 2,0 - eine hohe Effektstärke !

Fall B: heterogene, ”Mischgruppe”:

Wieder sei M = 60 (also im Mittel genau so gestört wie oben), s sei 15 (das spiegelt realistisch die Heterogenität wieder)

die Therapie erbringe eine mittlere Verbesserung um 20 Punkte, d. h. Me = 40

Es gilt dann:

ES = (Me - Mk)/Sk = (40 - 60)/15 = 1,3 - eine deutlich geringere Effektstärke !

De facto aber liegt in diesem Beispiel bei Fall B das M der Behandlungsgruppe nach der Therapie genau auf dem der Normalbevölkerung. Die Behandlungsgruppe ist somit nach der Therapie als ”völlig normal” anzusehen.

In Fall A hingegen, trotz der um 50% höheren Effektstärke, liegt die Behandlungsgruppe 10 Punkte über (=schlechter) der Normalbevölkerung; Daraus folgt (sofern s gleich geblieben ist): über 97,5% der Behandlungsgruppe liegen hier über dem Mittel der Normalbevölkerung, sind also gestörter.

Fall A hat somit die deutlich höhere Effektstärke, Fall B aber die deutlich höhere Effektivität der Therapie !

Die inhaltlichen Zusammenhänge, in denen in der Literatur über ”Effektstärke” gesprochen wird, lassen zweifeln, daß diese formalen Zusammenhänge bzw. Unterschiede hinreichend bekannt sind und daß bewußt ist, daß mit ”Effektstärke” lediglich eine spezifische statistische Diskriminationsfähigkeit zwischen Gruppen gemeint ist. Diese ist im Fall A unbestritten höher - doch was haben die Therapeuten oder die Patienten davon ? Vielmehr wird meist so getan, als messe die Effektstärke tatsächlich und unbesehen einen therapeutischen Effekt. Es zeigt sich darüber hinaus, daß es falsch wäre, Effekte in heterogenen, störungs-unspezifischen Gruppen als unbedeutsamer oder weniger aussagekräftig abzutun: Zumindest in formal-quantitativer Hinsicht ist eher das Gegenteil richtig (da störungs-unspezifische Gruppen typischerweise eher eine größere als eine kleinere Varianz gegenüber homogenen Gruppen aufweisen).

Es zeigt sich somit auch an diesem Beispiel die bekannte Tatsache, daß die Genauigkeit einer Messung noch nichts über deren Sinnhaftigkeit aussagt. Allerdings sind Versuche, inhaltliche und gesellschaftliche Wertfragen als Fragen wissenschaftlicher Messung zu kaschieren, keineswegs neu. In einem anderen Beitrag über ”Vermessene Qualität” (Kriz 1996) habe ich kürzlich nochmals in Erinnerung gebracht, wie sich beispielsweise Mitte des 19. Jahrhunderts zahlreiche - auch heute noch in Lehrbüchern als ”renommierte Gelehrte” ausgewiesene - Forscher an dem Programm beteiligten, die damals gängigen rassistischen Ansichten ”wissenschaftlich” zu unterstützen bzw. zu ,,beweisen”. Diese Beweise erfolgten auf der Basis von scheinbar harten objektiven Daten aus dem Bereich der aufblühenden naturwissenschaftlich orientierten Humanwissenschaften und unter Verwendung akribischer Meßmethoden. So veröffentlichte beispielsweise S. G. Morton mehrere Bände von exakten Meßwerten und Tabellen über Hirnvolumina. Vor dem Hintergrund der allgemein gängigen Annahme, daß die Hirngröße unmittelbaren Aufschluß über den Entwicklungsstand bzw. die angeborenen geistigen Fähigkeiten gebe, konnte er so wissenschaftlich präzise belegen, daß Weiße ganz oben, Indianer in der Mitte und Schwarze ganz unten in der Hierarchie stünden (bei Weißen übrigens Teutonen und Angelsachsen oben, Juden in der Mitte und Hindus unten). Ähnlich argumentierte der französische Chirurg und Anthropologe Broca (dem zu Ehren heute noch das motorische Sprachzentrum im Vorderhirn Broca-Zentrum benannt wird): Mittels verschiedener Schädel- und Körpermessungen und daraus konstruierter Indizes versuchte auch er, die angeborene Dummheit ”minderwertiger Rassen” zu belegen: Für eine Stichprobe von 60 Weißen und 35 Schwarzen ergab sich dabei eine durchschnittliche Schädellänge hinter dem Hinterhauptsloch von 100,385 Millimetern für Weiße und 100,875 Millimetern für Schwarze, aber eine Schädellänge vor dem Hinterhauptsloch von 90,736 zu 100,404 Millimetern (man beachte das bemerkenswerte Verhältnis von inhaltlicher Relevanz und Meß-”Exaktheit”). Daraus schloß er 1872: ,,Es ist daher unbestreitbar..., daß der Körperbau des Negers in dieser Hinsicht wie in vielen anderen dem des Affen angenähert ist.” (zit. n. Gould 1983). Ein anderes ,,Kriterium” - das Verhältnis des Unterarmknochens zum Oberarmknochen (!) - hatte er zuvor aufgegeben, weil die ”richtige” Reihenfolge sich dabei nicht ergab. Es ist einsichtig, daß auch für die Verhältnisse innerhalb der weißen Rasse beliebte Vorurteile mit ebensolcher wissenschaftlichen Autorität vertreten und weitgehend durch ,,objektive Meßdaten” belegt wurden.

Ist diese historische Verknüpfung von ideologischer Intention und ”wissenschaftlich” präziser Quantifizierung wirklich so weit von der aktuellen Situation entfernt, wo nahezu beliebige ”Kriterien” gewählt werden (z.B. Nachweis in ”4 von 8” Störungsbereichen mit mindestens ”3 störungsspezifischen” Studien, wobei bei ”8” störungs-unspezifischen nur noch jeweils 2 erforderlich sind, etc.), um dann durch Abzählen eine scheinbare Objektivität vorzugeben, ohne daß die völlige Subjektivität der ”Kriterien” auch nur irgendeinen Anlaß zu Selbstzweifeln gibt, während alle anderen in der Scientific Community anerkannten Daten und Belege für ”Wissenschaftlichkeit” und Effektivität bewußt ignoriert werden?

3. Wie stellt man die Effektivität eines Psychotherapie-Verfahrens denn nun ”richtig” fest?

Es ist offenbar nicht leicht, auf den ersten Blick die Tücken der beiden häufig hörbaren Fragen zu durchschauen - nämlich (a): ”Wirkt eine bestimmte Psychotherapie überhaupt (und wenn ja: wie effektiv)?” und (b): ”Wirkt Vorgehensweise A besser als Vorgehensweise B?” Die letztere Frage ist typisch für sog. Therapievergleichsstudien, bei der ersteren geht es um Therapieerfolg bzw. Evaluation (Bewertung einer Maßnahme). Beide Fragen klingen nämlich ganz ”einfach und unschuldig” und scheinen üblichen naturwissenschaftlichen Fragestellungen ziemlich ähnlich zu sein - etwa: ”Bewegt sich ein Objekt überhaupt (und wenn ja: mit welcher Geschwindigkeit)?”, bzw.: ”Bewegt sich Objekt A schneller als Objekt B?”

Doch der Ähnlichkeits-Schein trügt gewaltig: Während nämlich ”Bewegung”, ”Geschwindigkeit” und ”Geschwindigkeitsdifferenz” in der Physik für alle verbindlich operational (d.h. unmittelbar auf Beobachtungs-Handlungen bezogen) definiert sind, gilt dies für keinen der o. a. Begriffe in Bezug auf Psychotherapie.

Denn ein kleiner Blick in die Debatte klinischer Psychologie zeigt, daß keineswegs klar ist, wie man ”Therapie-Erfolg” überhaupt definieren soll (bevor man sich überlegt, das Definierte dann zu messen). Hinsichtlich der inhaltlichen Ziele, was überhaupt erstrebenswert ist, herrscht bekanntlich keineswegs Konsens. So hat sich z. B. für das große Spektrum sog. ”chronischer Krankheiten” - angefangen von schwerer Schizophrenie, Hirnschädigungen, Asthma, Diabetes, etc. - oder andere nicht (mehr) heilbare Krankheiten wie z. B. Krebs das Konzept der ”Bewältigung” durchgesetzt, bei dem eine ”Ausheilung” der Primärsymptome nicht als sinnvoller Therapie-Erfolg angestrebt werden kann, sondern eben eine Erhöhung der ”Lebensqualität” und ein ”erträglicher Umgang” mit der Krankheit. Doch wie sind diese - ebenfalls wohl nicht von jedem gleich verstandenen - Begriffe zu definieren?

Offenbar besteht zwischen der Frage, wie ein bestimmter Effekt möglichst wissenschaftlich präzise gemessen werden kann, und der Frage, welche Effekte aus wissenschaftlicher Sicht überhaupt zu erwarten sind und was sie bedeuten, ein großer Unterschied. Solange man beispielsweise davon ausgeht, daß sich die Sonne um die Erde dreht, lassen sich viele wissenschaftlich präzise Registrier- und Meßverfahren ersinnen, um den Weg der Sonne zu beschreiben und sogar um möglichst gute Vorhersagen zu machen. Es sei beachtet, daß selbst akzeptierte Effekte nicht unbedingt etwas über wissenschaftliche Begründbarkeit aussagen: So sind die Effekte von Akupunktur inzwischen mit wissenschaftlichen Methoden belegt und weitgehend akzeptiert - aber es fehlt (meines Wissens) eine wissenschaftlich fundierte Theorie, die Akupunktur ins abendländische Paradigma einzureihen imstande wäre. Die Frage nach der Wissenschaftlichkeit berührt somit auch zentrale Grundlagen- und Grundsatzfragen.

Selbst dann, wenn man hinsichtlich der Konzept-Definitionen weit mehr Einigkeit hätte, als faktisch vorherrscht: Wie werden diese Konzepte nun konkret operationalisiert und gemessen, d. h. an welchen konkreten empirisch erfaßbaren Größen wird das Konzept denn festgemacht? Werden - wie meist üblich - Tests und Fragebögen eingesetzt, muß (mit Devereux 1992, S. 27) gefragt werden: Zu welchem Universum des Diskurses gehören überhaupt die erhobenen Daten? Sind Fragebogen-Daten eher als Meinungen oder klinische Diagnosen zu werten? Therapie-Forscher setzen ”selbstverständlich” das Letztere voraus - worin und wann ist dies begründet?

Es sei beachtet, daß alle diese Fragen zwar erörtert, aber nicht geklärt werden können. Denn man kann hinsichtlich dieser Fragen zwar Entscheidungen herbeiführen, aber mit guten Gründen hätte man sich meist natürlich auch anders entscheiden können. Oft werden allerdings nicht einmal die getroffenen Entscheidungen als solche dokumentiert, sondern es wird so getan, als wären die Definition des Erfolgs, dann dessen Operationalisierung und dann die Messung inhaltlich so selbstverständlich, daß man nun eine formale Methode einfach ”anwenden” könne.

Nachdem man diese Entscheidungen (explizit oder implizit) getroffen hat, taucht die nächste Gruppe an Fragen auf, über die entschieden werden muß (und auch diese Entscheidungen sind wieder keineswegs ”selbstverständlich”): An welchen Patienten werden die Messungen überhaupt durchgeführt? Nimmt man an, daß die Therapiemethode A bei allen Patienten gleich wirkt? - Eher wohl nicht! Doch wonach wählt man aus? Reicht es, eine bestimmte ”störungsspezifische” Gruppe” zu wählen? Und warum wird diese abgegrenzt - es ist nämlich wiederum keineswegs ”selbstverständlich”, daß unsere klinischen Klassifikationen, auf der Ebene von Krankheitsverläufen gewonnen, auch die optimalen Klassifikationen für Therapieverläufe sind. Geht es eher um möglichst homogene Symptome oder um eine homogene Schwere von Beeinträchtigungen oder um einen homogenen Verlauf der bisherigen Krankengeschichten oder um homogenen ”sozialen Support” (der erheblich mit dem Therapie-Verlauf interagieren dürfte) oder...oder..? Auch dies sind nur vordergründig methodische Fragen, denn dahinter stehen unterschiedliche inhaltlich-theoretische Vorstellungen, für die man so oder so Partei ergreift, wenn man sich für das eine oder das andere entscheidet - und wieder ist eine Entscheidung etwas anderes als die algorithmisierte Durchführung einer Methode.

Welche Therapeuten von Richtung A läßt man nun die zu beforschenden Therapien durchführen? Eine möglichst repräsentative Auswahl? (Woher gewinnt man die Basisinformation dafür?) Oder nimmt man möglichst erfahrene Therapeuten? (Was heißt das - und: Wie realistisch ist es anzunehmen, daß erfahrene Therapeuten genau ”Methode A” in ”Reinkultur” vertreten?). Wählt man (was wohl realistisch ist) jene, die man gerade bekommen kann: Sind das dann nicht eher jene, die vielleicht unter Patientenmangel leiden (und vielleicht überzufällig Anfänger sind oder andere Eigenschaften aufweisen, die sie nicht gerade zu den Aushängeschildern für diese Therapieform machen)?

Wenn diese Fragen nun alle entschieden sind: Was bleibt, als kleine ”Zwischenbilanz”, eigentlich noch von der Ausgangs-Frage übrig, (z.B.) ”ob und wie effektiv Therapiemethode A wirkt?” Was wir nach den bisherigen Entscheidungen erwarten könnten, wäre eine Information darüber, wie Patienten der Gruppe X, nach den Kriterien C, D und E... zusammengestellt, hinsichtlich Antworten und Beobachtungen der Variablen F, G und H... bei Therapeuten mit den Eigenschaften I, J und K... sich verändern. Beantwortet das noch unsere obige Frage - bzw. ist diese Information noch als angemessene Basis anzusehen, um Aussagen über ”die Therapieform A” zu machen?

Daß diese Probleme allzu wenig diskutiert werden, mag wohl daran liegen, daß als Metapher (oder gar Ideal) der komparativen Psychotherapie-Forschung immer noch die Pharma-Forschung angesehen wird, bei der eine Substanz A zu jeder Zeit und an jedem Ort nach einer bestimmten, algorithmusartigen Prozedur hergestellt werden kann und dann auch in derselben Weise wirken sollte. Dabei ist diese Vorstellung schon in der Pharma-Forschung eine Fiktion, da das Resultat der ”Einwirkung” von A auch vom System abhängt und höchstens für isolierte, möglichst monoklone Zellen im Reagenzglas ein zutreffendes Modell sein mag. Daher sind selbst in der Pharmaforschung ergänzende Feldstudien eine wichtige Gepflogenheit. Bei realen Patienten, so weiß auch jeder gute Arzt, muß erprobt werden, ob und wie im Detail und in welcher Dosierung A wirkt oder ob nicht besser B verabreicht werden sollte (wobei diese Rangordnung der ”Effektivität” zwischen A und B beim nächsten Patienten trotz gleicher Symptome genau umgekehrt sein kann). Daher müssen die Effekte meist über größere Gruppen gemittelt werden (mit allen Problemen, die nicht-lineare, rückgekoppelte Systeme aufwerfen - vgl. Kriz 1997). Vernachlässigt man auch noch Aspekte wie z.B. zirkadiane Schwankungen (d.h. die stark unterschiedliche Ansprechbarkeit eines Organismus auf Wirkstoffe in Abhängigkeit vom Tageszyklus) und zahlreiche andere Faktoren, so kann man unter allen diesen Einschränkungen im Pharma-Bereich von der Wirkungsweise von A sprechen.

Was kann es aber bedeuten, die ”Wirkung von Psychotherapie-Methode A” zu untersuchen? Wenn man A im Kontext der experimentellen Psychologie auf wenige, klar umrissene Handlungen reduziert oder A über exakte Manuale definiert, die dann genau befolgt werden, mag dies mit den o. a. Einschränkungen ähnlich wie im Pharma-Bereich gelten. Dies setzt allerdings voraus, daß der Experimentator möglichst wenig Entscheidungsfreiheit hat, von den vorher festgelegten Bedingungen abzuweichen. Zwar könnten prinzipiell auch Entscheidungsbäume vorgegeben werden; aber erstens reichen dafür unsere inhaltlich-theoretischen Kenntnisse nicht aus, zweitens würde das Design viel zu kompliziert, varianzanalytisch aufgefächert und damit massenstatistisch kaum mehr untersuchbar werden (s. u.).

Der Gegenstandsbereich, über den Aussagen zu treffen wären, bezieht sich aber zum größten Teil nicht auf Situationen, die durch solche experimentellen Labordesigns abgebildet werden. ”Psychotherapie-Richtung A” wird in der Realität üblicherweise durch Therapeuten repräsentiert, die ihre Therapie ”A” von unterschiedlichen Ausgangsbedingungen (Lebens- und Bildungs(ver)läufen), in unterschiedlichen Ausbildungsstätten und mit einer erheblichen Varianz an theoretischen und praktischen Vorstellungen erlernt haben und sich (spätestens!) danach (hoffentlich!) auch um andere Konzepte und Vorgehensweisen von Therapie gekümmert haben - kurz: ihre therapeutische Kompetenz und Vorgehensweise verändert haben. Was also kann ”Therapie A” mehr bedeuten als eine sehr heterogene Menge an Therapeuten, die mit heterogenen Kompetenzen, Vorstellungen und Vorgehensweisen sich einem therapeutischen Ansatz ”A” zuordnen (genauer: dem meist zusätzlich ebenfalls heterogenen Ideen-Konglomerat unter der Bezeichnung ”A”). Manuale für bestimmte Ansätze sind möglich und werden auch verwendet - aber man kann nicht das Leben in ein Labor sperren, nur weil die Forschung dort etwas artefaktärmer verläuft. Und selbst bei der Verkümmerung von Psychotherapie zu einer sklavisch-beschränkten Manualvollstreckung am Patienten wird es ”Therapieform A” nie so rein geben können wie die ”Pharma-Substanz A”. Eine äquivalente Metapher wäre daher vielmehr die folgende: Ein Pharma-Konzern schickt viele Menschen mit recht unterschiedlichen Vorstellungen über die Wirkung von Heilkräutern in unterschiedlichen Regionen mit dem Auftrag, dort nach heilenden Kräutern zu suchen, diese (nach weit auslegbaren Vorschriften) zu verarbeiten und letztlich und vorgefertigte Fläschchen mit der Aufschrift ”A” abzufüllen. Selbst wenn man nun einige dieser Fläschchen mit der Aufschrift ”A” (und im Detail sehr unterschiedlichem Inhalt) mit der gesamten ausgeklügelten Methodik der Pharma-Forschung untersuchen würde: Jeder Konzern müßte zu Recht einen Prozeß fürchten, wenn er nun Werbung für die wissenschaftlich geprüfte Wirkung des Medikamentes ”A” behaupten würde. Ebenso aber ist die Formulierung: ”Therapieform A bewirkt...” faktischer Unsinn, bzw. Etikettenschwindel.

Dieses Problem verschärft sich noch, wenn eine Therapieform aus einem sehr großen Spektrum an überaus unterschiedlichen Einzelvorgehensweisen oder -verfahren besteht, was z. B. für ”die Verhaltenstherapie” gilt (vgl. Margraf 1996, Linden & Hautzinger 1996): Systematische Desensibilisierung, Aversionstherapien, Biofeedbacktherapie, Reizkonfrontation, Stimuluskontrolle, Token-Programm, Selbstinstruktionstraining, Training sozialer Kompetenz, Rational Emotive Therapie (um nur einige zu nennen) entstammen nicht nur recht heterogenen theoretischen Erklärungskontexten von Störung und Veränderung, sondern dürften wohl kaum alle kompetent von einem einzelnen Verhaltenstherapeuten beherrscht werden (und manualisierte Vorgehensweisen haben nochmals andere Gewichtungen). Dazu sind spezifische Vorgehensweisen für spezifische Störungsbilder untersucht und für wirksam befunden worden. Doch obwohl dies forschungslogisch und für die weitere Entwicklung auch aus meiner Sicht durchaus positiv zu bewerten ist, hat dies für die hier diskutierte ”Wissenschaftlichkeits”-Debatte eine gravierende Schwäche: Wenn ein Verhaltenstherapeut einen Patienten mit Störungsbild ”S” nicht mit jener Vorgehensweise behandelt, für die experimentell der Wirksamkeitsnachweis erbracht wurde (weil er eben nicht alle ausführen kann - oder sogar guten Grund hat, bei diesem Patienten anders vorzugehen), über welche globale Wirksamkeit ”der Verhaltenstherapie” wird dann eigentlich noch ”als wissenschaftlich gesichert” gesprochen ? Wählen andererseits Therapeuten immer jene, in einer Untersuchung belegte, Vorgehensweise, so kann man fragen, wieso aus einer massenstatistischen Wahrscheinlichkeitsaussage für deren Überlegenheit dann eine faktisch 100%- zu 0%-Entscheidung gegen andere verhaltenstherapeutische Vorgehensweisen folgt. Ein Dilemma, das sich nicht lösen läßt. Auch dieses Argument zeigt, daß die Globalfrage zur ”Wissenschaftlichkeit” einer Therapieform seriöserweise nicht beantwortet werden kann, weil nicht klar ist, worauf sich die praktisch überhaupt beziehen soll.

Dabei hätten wir nun noch fast jene Fragen vergessen, um die in der Literatur über Psychotherapie-Forschung gemeinhin so viel Aufhebens gemacht wird: Soll man einen Vergleich ”vorher”/”nachher” (d.h. ein pre-post-design) durchführen oder aber eine Verlaufsstudie (panelanalyse), bei der zu vielen Zeitpunkten die Information erhoben wird? Wie soll eine Kontrollgruppe zusammengesetzt sein, die den Therapie-Erfolg gegen Zufallseinflüsse bzw. Spontanremission sichert (d.h. gegenüber der Tatsache, daß sich auch bei einem Teil der unbehandelten Patienten nach einer Zeit ”Besserung” einstellt)? Wie groß soll die Stichprobe an Patienten sein usw.? Doch die in diesem Absatz skizzierten Fragen sind vergleichsweise zu den vorher aufgeworfenen trivial, da es sich hier tatsächlich eher (wenn auch nicht vollständig) um statistisch-methodische Fragen handelt, bei denen die Kriterien daher (vergleichsweise) klar sind und deren adäquate Beantwortung zum Handwerkszeug des Forschers gehören sollte.

Weit schwieriger und unklarer ist es da schon wieder, statt die Wirkung einer Therapieform A untersuchen zu wollen die Frage nach einem Therapie-Vergleich zu stellen. Denn nun müssen nicht nur sämtliche oben aufgeführten Entscheidungen (mit den dahinter liegenden theoretischen Vorstellungen und Problemen) getroffen werden. Sondern zusätzlich ist natürlich zu entscheiden, hinsichtlich welcher Aspekte (bzw. welches Aspekte-Raumes) ein solcher Vergleich überhaupt stattfinden könnte. Erinnern wir uns: Die obigen Entscheidungen führten sinnvollerweise zu einer, für A ganz spezifischen Auswahlkombination aller dieser Entscheidungsaspekte. Wenn dieselbe Entscheidungssequenz analog für Therapieform B durchgeführt wird, bleiben dann überhaupt noch irgendwo Überschneidungen, um über einen Vergleich etwas aussagen zu können?

Nun, wer nur statistische Modelle im Kopf hat und von klinischer Psychologie nichts versteht, könnte auf die Idee kommen, alles per Zufall auszuwählen - d. h. Patienten werden per Zufall auf zufällig ausgewählte Therapeuten der Schulen A und B aufgeteilt und die Veränderungen werden mit zufällig gezogenen Kategorien, Tests etc. bestimmt. Abgesehen davon, daß diese Vorgehensweise fernab jeder praktischen Realisierung liegen würden, gäbe es zwei Möglichkeiten: Entweder man hat ein vollständiges Design, in dem alle Kategorienkombinationen vertreten sind, oder man führt tatsächlich nur eine Zufallsauswahl durch. Im ersten Fall muß man nur ein Dutzend der oben aufgeworfenen Entscheidungsfragen (die keineswegs Anspruch auf Vollständigkeit erheben!) mit je 5 Abstufungen bzw. Alternativen berücksichtigen, um die Absurdität zu erkennen: Es ergeben sich 512, das sind über 244 Millionen, Kombinationen. Man müßte also eine ”Stichprobe” vom Umfang mehrerer europäischen Staaten erheben, um pro Kombination auch nur jeweils einen einzigen Menschen zu untersuchen. Im zweiten Fall wären die Untersuchungs- (und Kontroll-)gruppen zwar klein - jedoch was sagt es aus, wenn Therapieform A bei anderen ”Störungen” etc. hinsichtlich anderer Kriterien ”besser” abschneidet als Therapieform B? Dies wäre der Aussage äquivalent, daß Geigenunterricht effektiver ist als Klavierunterricht - nachdem man einige Kinder, die ein Instrument lernen wollten, zufällig auf verschiedene Lehrer an unterschiedlichen Geigen- und an Klavierschulen aufgeteilt hätte und nach einem Jahr die Eltern, mit ihren unterschiedlichen Vorstellungen darüber, was überhaupt der Sinn des Musikunterrichtes sein könnte, diese ”Erfolge” beurteilen ließe. (Und auch hier wird, nebenbei bemerkt, das ”Ergebnis” zwar ”objektiver”, aber nicht sinnvoller, wenn man mit großem Meßaufwand die Geschwindigkeit des Fingerbeugens, die Abweichungen von der Idealfrequenz jedes gespielten Tones etc. genau erhebt und eine aufwendige Statistik darüber stülpt - obwohl beide genannten Variablen sicher auch etwas mit dem Erfolg zu tun haben).

Diese eher anekdotische Schilderung einiger Probleme und Schwierigkeiten beim direkten Vergleich nur zweier Therapie-Ansätze hat wohl deutlich werden lassen, welche immensen theoretischen und konzeptionellen Defizite aufzuarbeiten wären, bevor die obigen Fragen einigermaßen kompetent entschieden werden können und man ”loslegen” könnte, herumzurechnen. Es sollte übrigens auf der Hand liegen, daß es da nicht unbedingt leichter ist, Meta-Analysen durchzuführen, d.h. Analysen, in die ”Ergebnisse” zahlreicher anderer Studien eingehen, um zu einer Gesamtaussage zu kommen. Das Wort ”Ergebnisse” wurde deshalb in Anführungszeichen gesetzt, weil eben jedes ”Ergebnis” einer solchen Einzelstudie implizit oder (selten) explizit die gesamte Entscheidungssequenz über alle oben aufgeworfenen Fragen (und weitere) enthält.

Hier stellen sich zusätzlich Fragen wie: Welche Studien werden einbezogen? Wie begründet sich die Auswahl? Wie wird mit unterschiedlichen Stichproben, mit unterschiedlicher Anzahl von Erfolgskriterien umgegangen (d.h. ist eine Studie an 50 Personen genau so aussagekräftig wie eine an 1000, und ist eine Studie mit nur einem klaren Effekt nur 1/10 so wichtig zu nehmen wie eine andere mit 10 nachgewiesenen Effekten)? Wie werden Abhängigkeiten berücksichtigt (sind 10 fast gleiche Kriterien 10 mal so wichtig wie nur eines in einer anderen Studie)?

Wir wollen es bei diesen Fragen bewenden lassen. Es zeigt sich, daß die Frage nach der Wirksamkeit oder gar nach dem Vergleich keineswegs einfach beantwortet werden kann. Zudem gibt es neben den aufgezeigten Ebenen noch viel grundlegendere - z.B. welche Modelle von ”Ursache-Wirkung” wir unseren Überlegungen zugrunde legen. Wenn wir ernst nehmen, was uns die moderne naturwissenschaftlich fundierte Systemtheorie lehrt, dann sind in komplex vernetzten Systemen diskontinuierliche Verläufe zu erwarten - und Psychotherapieforscher reden auch gern davon, daß die unterschiedlichen Faktoren, die den Erfolg einer Therapie beeinflussen, miteinander vernetzt sind. Daraus würde aber folgen, daß z. B. keine Gruppenvergleiche derart durchgeführt werden dürften, daß die Veränderungen auf Datenniveau aggregiert (d.h. zusammengefaßt - etwa über Mittelwertsbildung) werden. Je nach individuellem Ausgangspunkt (der zu erheben wäre) kann nämlich ggf. eine ”große Ursache” dann keine Wirkung, eine ”kleine Ursache” eine große Wirkung entfalten. Auch solche Fragen müßten natürlich vorher explizit geklärt werden, bevor man nach irgendwelchen ”statistischen Verfahren” etwas ”berechnet” (und damit natürlich unwissentlich in dieser Frage eine bestimmte Stellung bezieht - meist jene, daß man nicht von diskontinuierlichen Verläufen und damit, entgegen den verbalen Beteuerungen, auch nicht von vernetzten Prozessen ausgeht). Solange wir in der Erforschung und wissenschaftlichen Debatte, was überhaupt unter Psychotherapie-Effekten zu verstehen ist, so weit am Anfang stehen, kann die großangelegte und wissenschaftspolitisch brisante ”Sammlung” von Effekten eben nur Effekt-Hascherei sein.


4. Alternativen zu ”vermessenen” Standards/Entscheidungen

Wird damit dann alles beliebig - d. h. können wir keine Aussagen zur Wissenschaftlichkeit und Wirksamkeit von Psychotherapieverfahren machen? Dies stände nur zu befürchten, wenn Wissenschaftler meinen, ”im Rechenraum” bleiben zu müssen (um das Bild oben nochmals zu verwenden), statt diesen schleunigst zu verlassen, um sich die inhaltliche Kompetenz wieder anzuziehen.

Wenn wir unter ”wissenschaftlich” beispielsweise auch verstehen,

- mit wesentlichen Theorien eines Faches in Einklang zu stehen,

- von der scientific community akzeptiert zu werden,

- bestimmte fachspezifische aber auch ansatzspezifische Kriterien zu erfüllen,

dann brauchen wir uns nicht allein auf sog. ”objektive” Daten - mit allen aufgezeigten Problemen - berufen. Vielmehr gibt es auch Therapieansätze, die seit vielen Jahren klinisch gut erprobt sind - hier müßten wir nur die entsprechenden Klinikchefs befragen. Die Tatsache, daß mehrere zehntausend Patienten mit einem Ansatz in den letzten Jahrzehnten erfolgreich und mit Abrechnung durch die Kassen behandelt wurden (was z. B. für die vom ”Beirat” nicht ”wissenschaftlich anerkannte” Gesprächstherapie gilt), ist zwar nicht unbedingt ein Beweis für ”Wissenschaftlichkeit”, aber doch auch nicht irrelevant. Immerhin könnten Wissenschaftler diese Fakten systematischer erheben und damit noch stärker zum Gegenstand des wissenschaftlichen Diskurses machen. Die Effektivität einer manualisierten Anwendung ist schließlich auch noch kein Beleg für die ”Wissenschaftlichkeit” dieses Verfahrens selbst, sondern eben nur der Nachweis der (Labor-)Effektivität mit wissenschaftlichen Methoden. Und zu den wissenschaftlichen Methoden kann genau so gut auch die empirische Erhebung der Heilerfolge außerhalb des Labors gehören.

Es war ein mutiger Schritt von hoher Brisanz, als 1995 Martin E. P. Seligman mit einer goß angelegten Studie in den USA mit der von ihm geleiteten Consumer-Report-Studie den Aspekt der Labor-Wirksamkeit (efficacy) durch den Aspekt der klinischen Brauchbarkeit und Bewährtheit (effectiveness) bereicherte, indem das breite Spektrum realer therapeutischer Praxis untersucht wurde. Wie von vielen zuvor vermutet, zeigten diese Ergebnisse über die Wirksamkeit von Psychotherapie in der realen Praxis ein deutlich anderes Bild als die efficacy-Studien: Die Consumer-Report-Daten belegten für längere Behandlungen durchaus einen höheren Besserungsgrad als für kurze; Psychotherapie wurde durch Medikamente (in der Regel) nicht verbessert; keine Therapieform konnte allgemein oder mit Hinblick auf bestimmte Störungsbilder eine höhere Wirkung als andere nachweisen; Psychologen, Psychiater und Sozialarbeiter waren gleich effektiv - aber deutlich besser als Eheberater und (nicht fachtherapeutische) Ärzte. Besonders bedeutsam ist, daß Seligman einen vehementen Artikel für die Bedeutsamkeit der effectiveness-Studien schrieb, worin er offen bekannte, daß er zuvor selbst die efficacy-Kriterien für den einzigen ”Gold-Standard” hielt, die 1994 nochmals durch die APA (American Psychological Association) formuliert worden waren. Nach seiner Kritik dieser Kriterien als zu einseitig (Seligman 1995) wurde er 1997 zum Präsidenten der APA gewählt (Amtszeit 1998) - was in sofern bedeutsam ist, als in der gegenwärtigen deutschen Debatte mit Verweis auf die Bedeutung der APA fast ausschließlich die efficacy-Kriterien von 1994 referiert werden. Die späteren Entwicklungen in der APA aber, die nicht so gut ins Bild einer rigorosen efficacy-Ideologie passen, werden dabei kaum erwähnt.

Eine solche Untersuchung zur Gewinnung umfangreicher Daten über die Wirksamkeit von Psychotherapie im Spektrum alltäglicher Praxis aus der Sicht der Betroffenen sollte auch in Deutschland nachvollzogen werden. Zumindest theoretisch ist denkbar, daß diese Daten flankierend um exemplarische Erhebungen von Kassendaten ergänzt werden, um Kenntnisse über die Wirksamkeit auf weitere Aspekte auszudehnen - etwa: Medikamentenverbrauch, Krankenhaus-, Kur- und Fehlzeiten, Kosten für (nicht-psychotherapeutische) Arztbesuche etc. jeweils vor und nach den Psychotherapien. Ich weiß nicht, ob und wie schnell wir an die nötigen Daten kommen - der Datenschutz wird hierzulande ja sehr ernst genommen, wofür wir eben auch Preise zu zahlen haben.

Eine weitere Entscheidungsgrundlage wäre, ein fundiertes Delphi-Verfahren in Gang zu setzen, bei dem eine Erhebung bei den Fachprofessoren (denn diese definieren letztlich, was Wissenschaft ist!) erfolgt, deren Ergebnisse in mehreren Schritten rückzumelden und zu revidieren sind. Dabei müssen dann z. B. die Abweichungen von den Modalwerten der Rückmeldungen in den nächsten Schritten von jenen sorgsam begründet werden, die bei dieser Abweichung bleiben wollen. Durch ein solches Vorgehen würden wir Wissenschaftler dokumentieren, daß wir unsere Entscheidungskompetenz und -befugnis ernst nehmen und diese nicht allein an mechanisierte Auswahlprozeduren delegieren, die nicht selten aufgrund wissenschaftstheoretisch überholter Methoden mit ansatz-spezifischem Bias behaftet sind.

Das würde allerdings bedeuten, daß klinische Professoren schon jetzt die Verantwortung für das, was sich als Wissenschaft darstellt, ernster nehmen und sich nicht allein von statistischen Maßzahlen aus artifiziellen Untersuchungen leiten lassen. Ich bin ganz sicher: Wenn wir unseren eigenen Sachverstand, unsere Lehrbücher, das, was wir unterrichten und die Vielfalt der mit unterschiedlichen Methoden erbrachten Ergebnisse wirklich ernst nehmen, kann ein breiter Konsens gefunden werden, in dem sich dann weit mehr als nur die beiden Richtlinienverfahren als wissenschaftlich fundiert und klinisch erprobt herausstellen. Es ist vielleicht auch nicht verboten, die Erfahrungen aus Nachbarländern mit einzubeziehen und nicht der Fiktion zu unterliegen, an den nationalstaatlichen Grenzen Deutschlands hörten der Sachverstand und die Wissenschaft auf. Die Ignoranz gegenüber Erfahrungen und Ergebnissen anderer Wissenschaftler als derjenigen des derzeitigen deutschen Mainstreams wäre jedenfalls kein Beleg für ”Wissenschaftlichkeit”.

Langfristig sollten wir als Wissenschaftler allerdings auch das Ziel (weiter) verfolgen, durch Ausarbeitung einer möglichst umfassenden Psychotherapie-Theorie unter Einbeziehung all dessen, was unsere Wissenschaft vom Erleben und Verhalten zu bieten hat (und einige Nachbarwissenschaften), einerseits bei möglichst vielen der praktisch vorfindlichen Therapiemethoden klar wissenschaftlich rekonstruieren und begründen zu können, warum wann was wie wirkt bzw. warum (und wann etc.) etwas nicht so wirkt, wie behauptet. Bis wir diesem Ziel aber einen bedeutsamen Schritt nähergekommen sind, wäre es gegenwärtig redlich, zu akzeptieren, daß therapeutische Handlungskompetenz sich historisch in heterogenen Schulen entwickelt hat - bei denen viele Gründer und spätere Mitarbeiter allerdings keineswegs, wie oft abfällig in der öffentlichen Polemik suggeriert wird, idiosynkratisch-sektenhafte Eigenbrötler mit rational nicht begründbaren Vorlieben waren, sondern durchaus gut ins Wissenschaftssystem integrierte Forscher, oft mit Professorenrang, deren Vorstellungen klar und explizit am wissenschaftlichen Fachdiskurs teilhatten und teilhaben und das heutige Spektrum wissenschaftlicher Kenntnisse der klinischen Psychologie wesentlich bereichert haben.


5. Pluralität - ein Kennzeichen von Wissenschaft

Nun wird in der Debatte um die Wissenschaftlichkeit und um eine fortschreitende weitere Verwissenschaftlichung von Psychotherapie oft ins Feld geführt, daß die Vielfalt der Therapie-Richtungen eher als ein Manko zu werten sei, und es ein wichtiges Ziel wissenschaftlicher Bemühungen sein sollte, zu einer einheitlichen Psychotherapie zu kommen. Was ist davon zu halten?

Meines Erachtens wird bei dieser Forderung der Aspekt einer rekonstruierenden Beschreibung (und damit teilweise Erklärung) von Zusammenhängen mit dem Aspekt einer präskriptiven Handlungsanweisung vermengt. Diese Vermengung ist leider gerade im Bereich der Psychotherapie nicht untypisch - etwa wenn in der Gesprächspsychotherapie die drei sog. Basisvariablen (Akzeptanz, Empathie, Kongruenz), die als wichtige beschreibende Aspekte durchaus fruchtbar sind, in der Therapeutenausbildung trainiert werden. Dies ist nämlich so fragwürdig wie ein Training der Wangenmuskulatur, nur weil man empirisch beobachten kann, daß Menschen, die sich gerade freuen und glücklich sind, die Mundwinkel nach oben ziehen. Und ein Training, um möglichst ”echt” zu wirken, steht in geradezu paradoxalem Gegensatz dazu, ”echt” zu sein. Entsprechend teile ich zwar das Bestreben, zu einer möglichst einheitlichen, umfassenden (rekonstruktiven) Theorie therapeutischen Geschehens zu kommen - aber als praktische Tätigkeit kann ich mir eine Zukunft der Psychotherapie nur als ein Spektrum unterschiedlicher Ansätze vorstellen, das die Heterogenität menschlichen Lebens widerspiegelt (s.u.). Und selbst die Vorstellung einer einheitlichen Theorie muß nochmals relativiert und differenziert werden - besonders wenn man grundsätzliche Fragen von ”Wissenschaftlichkeit” im Auge hat.

Während man nämlich im vergangenen Jahrhundert noch vielfach daran glaubte, Wissenschaft könnte den Anteil letztlich ”wahrer” (und kulturunabhängiger) Erkenntnisbausteine ständig vergrößern, woraus sich dann nach und nach die eine große, wahre Welttheorie zusammenfügen ließe, ist die überwiegende Mehrheit der Wissenschaftstheoretiker heute deutlich bescheidener geworden. Zwar dient in der ”Mutter” aller Naturwissenschaften, der Physik, eine einheitliche Welttheorie vielen immer noch als prinzipielle Leitidee. Aber selbst in der Physik - zumindest im Verständnis ihrer führenden Vertreter - hat man längst die Idee aufgegeben, eine solche Theorie könne zu einer objektiven, vom Menschen unabhängigen Ordnung dieser Welt vordringen. Vielmehr ist selbst dort akzeptiert, daß immer nur spezifische Antworten auf spezifische Fragen möglich sind. Beispielsweise wird man auf ”Teilchen”-”Fragen” andere Antworten erhalten als auf ”Wellen”-”Fragen”, so daß allein schon wegen der Fragen-Relativität Wissenschaft nicht von Kultur getrennt werden kann. Dies hat der Physik-Nobelpreisträger Werner Heisenberg bereits 1955 wie folgt klar herausgestellt: ”Wenn von einem Naturbild der exakten Naturwissenschaften in unserer Zeit gesprochen werden kann, so handelt es sich eigentlich nicht mehr um ein Bild der Natur, sondern um ein Bild unserer Beziehung zur Natur.” Die Physik hat sich mit dieser Bescheidenheit sehr gut abgefunden. Niemand käme auf den Gedanken, den Physikern deswegen Unexaktheit oder gar Unwissenschaftlichkeit vorzuwerfen, weil sie nicht klären wollen und können, ob die Welt nun ”wirklich” aus Wellen oder aus Teilchen besteht.

De facto ist die Entwicklung selbst in den ”harten” Naturwissenschaften und trotz der Sehnsucht nach einer Einheitstheorie gerade entgegengesetzt dazu verlaufen, wie es die Gegner therapeutischer Vielfalt ”im Dienste der Wissenschaft” gern hätten: Die historisch frühen Wissenschaftsbereiche Physik und Chemie haben sich im Laufe der wissenschaftlichen Entwicklung nämlich nicht etwa vereint (auch wenn z.B. unter manchen Perspektiven chemische Vorgänge durch physikalische Erkenntnisse besser verstanden werden). Vielmehr entwickelten sich immer mehr eigene Disziplinen: physikalische Chemie, Biologie, Biochemie, Molekularbiologie usw. Man könnte hier geradezu von ”Schulenbildung” sprechen. Solche Physiker, die sich als Anhänger einer Einheitswissenschaft verstehen, könnten dies zu Recht bemängeln und beispielsweise anderen Wissenschafts”schulen” mangelnde Professionalität vorwerfen, indem sie argumentieren, es sei reine ”Konfession”, daß diese Biochemie oder Molekularbiologie betrieben, wo man doch besser alles auf Physik zurückführen solle. Ein solches Argument träfe sogar durchaus den Kern des Problems: Es sind nämlich in der Tat meist persönliche Vorlieben, Fähigkeiten, Interessen, Lebenswege etc., die jemand zum Biochemiker oder aber zum Molekularbiologen werden lassen - und weniger rational-quantitative Analysen der Frage, welche der ”Schulen” ihre Probleme effektiver oder wissenschaftlicher löst. Daher ist für Naturwissenschaftler die Frage auch relativ uninteressant, ob Biochemie bessere Erklärungen eines bestimmten pathologischen somatischen Prozesses als Molekularbiologie liefert (und Entsprechendes gilt sogar für weitere Unterdisziplinen): Man würdigt dort eher die unterschiedlichen Zugänge, versucht ggf. sich von den Erkenntnissen für die eigene Arbeit befruchten zu lassen und pflegt ansonsten maximale Koexistenz.

Verlassen wir nun den Phänomenbereich mikroskopisch-materieller Prozesse und wenden uns dem Phänomenbereich von solchen makroskopischen psychischen und interaktiven Prozessen (einschließlich deren somatischen Korrelaten) zu, welche vor allem Übergänge von unauffällig zu pathologisch und umgekehrt im Fokus haben - kurz: dem Phänomenbereich von Psychotherapie. Auch hier haben sich in diesem Jahrhundert unterschiedliche Schulen gebildet. Die Gründe dafür sind zunächst im Kern dieselben wie für die eben skizzierte Differenzierung in Wissenschaftsdisziplinen: Es gibt unterschiedliche Vorlieben, Fähigkeiten, Interessen, Lebenswege, Menschenbilder etc., die jemand zum Psychoanalytiker oder aber zum Gestalttherapeuten werden ließen. Die Gesamtsituation ist aber im Bereich der Psychotherapie komplexer: Während es für ein Lichtquant gleich gültig ist, ob es im Rahmen der Wellen- oder der Teilchenphysik untersucht wird und während es für eine pathologische Körperzelle gleichgültig ist, ob sie biochemisch oder molekularbiologisch behandelt wird, sind den Patienten ihre Behandlungen nicht gleichgültig und damit auch deren gesamter Kontext einschließlich der Ergebnisse nicht gleich gültig. Im Bereich der Psychotherapie kommt somit nochmals ein mindestens ebenso großes Spektrum an unterschiedlichen Vorlieben, Fähigkeiten, Interessen, Lebenswegen, Menschenbilder etc. seitens der Behandelten hinzu. Diese ggf. zu ignorieren (und Patienten analog zu Gegenständen der Physik oder zu einem Zellhaufen zu sehen), dokumentiert vielleicht ein bestimmtes Menschenbild von Behandlern, löst aber dieses Heterogenitätsproblem nicht. (Und in Ignoranz sollte zudem nicht das herausragende Zeichen von ”Wissenschaftlichkeit” gesehen werden.)

Ich vermag somit in der Heterogenität psychotherapeutischer Ansätze prinzipiell nichts Verwerfliches zu sehen, da sie nur eine Widerspiegelung der Heterogenität von Lebens”weisen” sowohl seitens der Behandler als auch der Behandelten darstellt. Die Konfession, sich vorzugsweise für Verhaltenskontingenzen oder aber für Sinndeutungen des Lebens zu interessieren, sagt ebenso wie die Konfession, sich vorzugsweise für biochemische oder für molekularbiologische Abläufe zu interessieren, wenig über Professionalität aus: Den jeweiligen Interessen kann man sowohl höchst dilettantisch oder gar unseriös wie auch sehr professionell nachgehen. Hier eine bipolare Beziehung zwischen Konfession und Profession konstruieren zu wollen, mag zwar eine gewisse Suggestivkraft entfalten, kann aber letztlich nicht überzeugen.

Die sinnvolle Heterogenität der Psychotherapieansätze macht zudem auch deutlich, warum die Frage nach der ”effektivsten” Therapie ins Leere geht, denn was überhaupt erstrebenswert ist (das dann ggf. effektiv zu erreichen wäre), ist untrennbar mit den unterschiedlichen ”Lebensweisen” der Menschen verbunden. So besteht kein Zweifel, daß Mais eine den Boden sehr effektiv ausnutzende Nahrungspflanze ist; ebenso ist eine Flachlandschaft wie der amerikanische Südwesten zweifelsfrei effektiver zu bearbeiten als eine Berg- und Seenlandschaft mit vielen engen Tälern. Trotzdem käme wohl niemand auf die Idee, die Schweizer Berge abzutragen, mit dem Erdreich die Seen aufzufüllen, um so eine Flachlandschaft herzustellen, auf der dann statt der blühenden Vielfalt an Kulturpflanzen eine Mais-Monokultur angelegt werden kann - obwohl diese fraglos effektiv für Großmaschinen wäre: Es geht aber eben nicht nur um Fragen der Effektivität - nach welchen ”wissenschaftlichen Kriterien” auch immer vermessen -, sondern auch um die Grundfrage darüber, wie wir überhaupt leben wollen. Und ich bin nicht sicher, ob nicht selbst jene Wissenschaftler, die derzeit mit aller Macht die blühende Vielfalt der Therapieansätze ”plattmachen” wollen, um möglichst nur noch einen einzigen ”effektiven” Ansatz für alle zu verordnen, sehr bald in dieser geistigen Monokultur etwas vermissen würden.

Fragen der Lebensart stehen interessanterweise sogar im Zentrum jener Metapher, die meist fälschlich verwendet wird, um aus der Vielfalt mit Hilfe eines künstlich inszenierten Konkurrenzkampfes doch noch eine Monokultur zumachen. Verwiesen wird auf einen Wettlauf, der Lewis Carolls ”Alice im Wunderland” entstammt, und bei dem etwa ein Dutzend Tiere beteiligt sind. Zitiert wird in der Diskussion dabei meist die Entscheidung des ”Dodo-Bird” (dt.: Brachvogel), mit der dieser die Frage: ”Aber wer ist Sieger?” entscheidet, nämlich: ”Alle sind Sieger und jeder muß einen Preis bekommen” (vgl. Luborsky et al. 1975). Gebraucht wird diese Metapher häufig dafür, um die Absurdität der Aussage ”alle sind Sieger” in Bezug auf die Therapierichtungen zu demonstrieren. Schließlich leuchtet es in unserer auf Konkurrenz ausgerichteten Gesellschaft sofort jedem ein, daß keineswegs alle Sieger sein können. Zumal wenn dann die auch bei Caroll unmittelbar folgende Frage in den Fokus gerät: ”'Aber wer soll die Preise stiften?' rief ein ganzer Stimmenchor zurück.” - Spätestens hier wird deutlich, daß es bei begrenzten Preisen (bzw. Krankenkassen-Budgets) eben darum zu gehen hat, daß manche einen Preis erhalten und andere nicht. Die Aussage des Dodo darf daher nicht hingenommen, sondern muß als Mangel wissenschaftlicher Differenzierungsfähigkeit gedeutet werden. Ohnedies erscheint die gesamte Organisation des Wettlaufs geradezu ein Alptraum an Inkompetenz für jede an objektiven Kriterien und Standards orientierte ”wissenschaftliche” Psychotherapieforschung zu sein. So heißt es im Text: ”Er legte zuerst die Rennbahn fest, eine Art Kreis ('auf die genaue Form kommt es nicht an' sagte er), und die Mitspieler mußten sich irgendwo auf der Bahn aufstellen, wie es sich gerade traf. Es gab kein 'Eins-zwei-drei-los!', sondern jeder begann zu laufen, wann er wollte...” (Caroll 1963, S.29). Hier scheint genau jener Dilettantismus zu herrschen, den nur präzise Effektivitätsmaße und genaue Vermessungen (z.B. der Rennbahn) eindämmen können.

Doch der Schein trügt. Verglichen mit manchen ”wissenschaftlichen” Abhandlungen zur komparativen Wirksamkeit ist das Vorgehen des ”Dodo-Bird” von tiefer Weisheit erfüllt. Der Kontext des Rennens ist nämlich der, daß die Tiere in einen Teich gefallen und tropfnaß und verdrossen waren: ”Das Wichtigste war natürlich, wieder trocken zu werden” heißt es bei Caroll. Angesichts dieses Kontextes steht das Rennen plötzlich in völlig anderem Licht: Es ist nun wirklich egal, wie genau die Form einer Kreisbahn erreicht wird; gleichgültig ist auch, von wo die Tiere losrennen und wer wann durch welches Ziel geht. Wichtig ist es vielmehr, das gemeinsame Ziel zu erreichen: nämlich trocken zu werden. Und da kein Tier mit ”wissenschaftlichen”, aber völlig irrelevanten Kriterien über Bahnform, exakte Zeit- und Wegmessung und dergleichen das Geschehen behinderte (was vermutlich die Erkrankung etlicher Tiere zur Folge gehabt hätte), erreichten alle dieses Ziel, jeder hatte gewonnen und daher durchaus auch einen Preis verdient!

Mich hat immer schon gewundert, warum die Weisheit des ”Dodo-Bird” in der Psychotherapie-Debatte so geflissentlich übersehen wird (wobei die Frage außer Acht bleiben soll, ob zumindest die Kontexte der Psychotherapie-Verfahren sorgfältiger rezipiert wurden als der Kontext des Rennens). Sind die unterschiedlichen Psychotherapie-Ansätze nicht eher mit den unterschiedlichen Tieren von ”Alice im Wunderland” vergleichbar als mit Formel-1-Wagen, bei deren Rennen ein Sieger hinreichend objektiv ermittelt werden kann? Wie Carolls Tiere weisen auch die Therapierichtungen eine große individuelle Unterschiedlichkeit auf; und sie sind wie diese historisch zu sehr verschiedenen Zeitpunkten und von recht unterschiedlichen Standpunkten aus gestartet. Im Gegensatz zu Formel-1-Wagen lag der tiefere Sinn ihres Entstehens und ihrer Weiterentwicklung nicht darin, als Sieger aus irgendeinem Rennen hervorzugehen, sondern der Vielfalt menschlichen Lebens und dessen Beeinträchtigungen besser gerecht zu werden, als jede einzelne Richtung es könnte. Und das gemeinsame Ziel der unterschiedlichen Menschen, die zu Therapeuten aus unterschiedlichen Therapierichtungen gehen, ist es, "trocken" zu werden, d.h. eine ihren spezifischen Lebensvorstellungen und -umständen entsprechende Weise zu finden, mit der sie weniger leidvoll diese je unterschiedlichen Lebenswege meistern können.

Darüber hinaus sollte auch nicht unerwähnt bleiben, daß ”Psychotherapie” ein weitaus breiteres Spektrum an Antworten bietet als das, worauf sich der Fokus in der gegenwärtigen Diskussion immer mehr verengt. Man mag nur an Aspekte wie Persönlichkeitsentwicklung, Individuation, Entängstigung u.a. denken, zu denen unterschiedliche Psychotherapieansätze durchaus Effektives beizutragen hätten, deren Perspektive aber weiter reicht als das, was Krankenkassen und die dahinter stehende Sozialgemeinschaft sinnvollerweise bezahlen sollten. Denn es ist klar, daß nicht für alle Leistungen die Sozialgemeinschaft aufkommen kann und soll (unabhängig von der Frage, wie viele Milliarden die Sozialgemeinschaft z. B. zur Entsorgung des mit privatwirtschaftlichen Gewinnen verbundenen Atommülls aufwendet). Doch die wichtige und relevante Frage: ”Wer soll die Preise stiften” führt auf ein ganz anderes Diskussionsfeld als die Frage nach der Wissenschaftlichkeit oder der Wirksamkeit von Psychotherapie - und die Vermengung dieser Fragen gehört zu den vielen Unredlichkeiten, mit denen die gegenwärtige Debatte belastet ist.


6. Quintessenz

Bei einer angemessenen Würdigung der hier zusammengetragenen Aspekte müssen wir uns von der Fiktion verabschieden, wir könnten und sollten in nächster Zeit auf wissenschaftlich redliche Weise entscheiden, welches Therapieverfahren das beste oder effektivste ist (bzw. dies für eine allzu kleine Anzahl von Therapieverfahren entscheiden). Die Hauptgründe sind, nochmals zusammengefaßt:

n es gibt nicht ”das Therapieverfahren X”, das sich wie eine Pharmasubstanz rein herstellen und in saubere, leere Flaschen (= un”voreingenommene” Therapeuten-Kandidaten) abfüllen ließe. Selbst bei hochgradig manualisierter Therapie (die ohnedies niemals Paradigma für alle Ansätze werden kann, ohne deren Wesen umzubringen) führen diese kompetente Menschen aus, die ihre je unterschiedlichen Begabungen und Teilkompetenzen auch nutzen wollen.

n Patienten sind - selbst nach reinen Störungsgruppen zusammengestellt - nur sehr artefiziell als ”Störungsträger” bzw. ”Manifestation einer Störung” anzusehen. Nicht nur, daß Klassifikationen und Ätiologien zwei völlig verschiedene Konzeptualisierungen sind; selbst eine ”reine” Depression vom Typ 300.40 DSM III-R verläuft anders als z. B. eine Virusinfektion, ein Beinbruch oder ein Asthma (und selbst dort weiß ein guter Arzt um die Grenzen manualisierter Vorgehensweisen und wie stark andere, nicht so leicht meßbare und im Detail vorschreibbare ärztliche Kompetenzen gefragt sind). Weder lassen sich somit die für eine weitgehende Manualisierung notwendigen Regelverläufe vorhersagen (ohne die aber das Konzept einer ”Therapieform X” wieder zerfließt) noch wird dies der Heterogenität an Lebensweisen und -bildern der Menschen, deren Beeinträchtigung 300.40 zuzuordnen wäre, auch nur annähernd gerecht.

n Es gibt derzeit keine Forschungsergebnisse, die seriös etwas über ein ”Therapieverfahren” in der geforderten Globalität aussagen. Es liegen - gottlob - zahlreiche Ergebnisse zu zahlreichen Kontingenzen vor, die für Therapie als Wissenschaft von großem Wert sind und zur Qualität der Therapeutenausbildung viel beitragen können. Es sei auch nicht bestritten, daß unterschiedliche Richtungen in unterschiedlichem Ausmaß - vor allem aber auch: in unterschiedlicher Art und Weise! - Ergebnisse vorgelegt haben. Diese lassen sich aber nur sehr bedingt - und schon gar nicht reduziert auf einzelne Parameter - miteinander vergleichen. Insbesondere geben sie aber nur Auskunft über bestimmte Aspekte, die mit jeweils einer Richtung X zu tun haben - nicht über die ”Richtung X” als ganze (was immer damit gemeint sein soll).

n Die Anzahl und die Art der Forschungsergebnisse sind keineswegs irrelevant - aber sie sind kein Gradmesser für "Wissenschaftlichkeit" oder gar ”Effektivität” oder dergleichen. Die ganz überwiegende Zahl der Studien wurde nicht ”von Richtungen” oder ”Schulen” durchgeführt, sondern von Forschungseinrichtungen (i. W. Universitäten), für welche die Sozialgemeinschaft viele Milliarden an Mitteln bereitgestellt hat. Die Ergebnisstrukturen spiegeln primär diese Wissenschaftsstrukturen wider und hängen mit den üblichen Karrieremustern - und diese wiederum mit den Publikations- und Zitiermustern - zusammen. Diese Strukturen - und nicht etwa die inhaltlichen Themen - begünstigten bestimmte methodische Zugänge.

Es gibt somit derzeit keine rational wissenschaftlich begründete Möglichkeit, die Unternehmung des ”Dodo-Birds” doch noch in einen Wettlauf umzufunktionieren, damit sich möglichst wenige Tiere die Preise teilen und die anderen in ihrer Eigenart und Funktion als wertlos und überflüssig deklarieren können. Es gibt insbesondere keine wissenschaftliche Basis, um über die Ziellinie zu entscheiden, die alle Tiere zu passieren haben. Solange keine monoklonen Behandler an monoklonen Störungsträgern in reiner Form Manuale vollstrecken, sondern unsere gesellschaftliche Pluralität sich auch in der Heterogenität unterschiedlicher Menschenbilder mit unterschiedlichen Lebensweisen und -zielen ausdrückt, solange wird Bedarf an unterschiedlichen Therapierichtungen sein.

Natürlich kann und darf über die kontroversen Vorstellungen immer wieder gesellschaftlich diskutiert werden. Und hier kann auch die Wissenschaft mit ihren Forschungsergebnissen zur Debatte beitragen. Die Wissenschaft kann und sollte sich selbst aber nicht zum Richter in diesen Wertfragen aufspielen. Und sie sollte dies schon gar nicht in unredlicher, verdeckter Form tun, indem inhaltliche und gesellschaftliche Wert-Fragen als ”methodische” Fragen und Probleme umdefiniert werden. Hier erleben wir leider in der Tat einen zunehmenden Mißbrauch von ”Wissenschaft” und ”wissenschaftlicher Methodik”, nämlich als Waffe, um pluralistische Wertdebatten zu unterlaufen und möglichst für eine bestimmte Partei zu entscheiden. Seriöse Erörterungen der obigen Fragen führen eben in jeweils überaus komplexe Zusammenhänge und münden in das angeführte heterogene Geflecht aus unterschiedlichen Lebensweisen, Zielen, Werten und Vorstellungen, das sich nicht durch Berufung auf eine oder wenige Zahlen homogenisieren und damit gleichschalten läßt. Genau das wird aber z. B. mit Operationalisierungen und Messungen in diesem Bereich allzu oft versucht: Statt den gesellschaftlichen Diskurs zwischen den unterschiedlichen Gruppen über deren Wertvorstellungen zu führen, wird unter dem Deckmantel von scheinbar neutraler ”Methodik” und ”Wissenschaftlichkeit” Partei im Wertestreit ergriffen. Wenn dieser kognitive Taschenspielertrick gelingt - und ein Blick auf viele gegenwärtige gesellschaftliche Werte-Auseinandersetzungen zeigt leider, daß er nur allzu häufig und allzu gut gelingt -, braucht man dem Gegner im Disput keine inhaltlichen Argumente mehr zu liefern und sich selbst der Diskussion auszusetzen, sondern kann sich hinter einer ”korrekten Methodik” und dem Prädikat ”wissenschaftlich” verschanzen. So lassen sich dann Menschen mit anderen Wertvorstellungen als ”unwissenschaftlich” oder ”methodisch unzulänglich” diskreditieren und der Gesellschaft letztlich die eigenen Wertvorstellungen möglichst unangefochten aufdrücken.

Die Akzeptierung der Heterogenität der Therapieansätze bedeutet keineswegs, daß jeder Therapeut tun kann und sollte, was ihm beliebt, oder daß Wissenschaftler einem bunten Treiben von Therapieansätzen nur zuzusehen hätten. Vielmehr sind die Wissenschaftler gerade mit ihrer inhaltlichen Kompetenz gefragt, zu entscheiden, welche Therapieverfahren auf dem jeweiligen Stand des Wissens bevorzugt (d. h. von der Sozialgemeinschaft finanziert) zum Einsatz kommen. Diese inhaltliche Kompetenz liegt allerdings vor allem nicht im Rechnen und Zählen, sondern in der Kenntnis der Bücher und Fachliteratur, der entsprechenden Diskurse und in der Qualifikation, vorgelegtes Material bewerten zu können, wie oben ausgeführt wurde. Allerdings müßte viel weniger über ”Verfahren”, sondern zumindest zugleich über Ausbildungswege und -institutionen diskutiert werden - denn ein guter Therapeut ergibt sich nicht durch Glaubensbekenntnis zu irgendeinem Verfahren, sondern durch eine gute Ausbildung (ein Aspekt, dem m. E. viel zu wenig Rechnung getragen wurde). Und selbstverständlich müssen und dürfen auch die Erkenntnisse aus der Prozeßforschung oder aus der Erforschung der realen Wirksamkeit (wie im Consumer-Report) mit einbezogen werden.

Realistischerweise wird auch eine solche ”wissenschaftliche Anerkennung” nur bei einem Dutzend oder weniger Ansätzen (je nach Zusammenfassung in Clustern - und mit jeweils qualifizierten Ausbildungsgängen) konsensfähig sein. Das mag für zahlreiche andere ggf. ungerecht erscheinen, die nur eine sehr erschwerte Chance haben, sich dann noch als eigenständiges Verfahren zu etablieren. Aber zunächst einmal würde das Spektrum an zugelassenen Richtungen weit besser der vielfach betonten Pluralität unserer Gesellschaft gerecht werden. Darüber hinaus würde damit der allergrößte Teil faktischer psychotherapeutischer Behandlungen der letzten Jahrzehnte erfaßt sein. Und letztlich hätten auch andere Richtungen in dieser Heterogenität gute Chancen, sich durch Anbindung an vorhandene zu qualifizieren.

In einer so auch zum Nutzen der Patienten beruhigten therapeutischen Kulturlandschaft könnten sich Wissenschaftler endlich wieder an ihre Hausaufgaben machen: nämlich die Vielfalt möglicher Kontingenzen zwischen therapeutischen Vorgehensweisen und Lebensschicksalen (mit ihren ggf. mehr oder minder typischen Verläufen) leidender Menschen weiter zu erforschen, die Ergebnisse zu systematisieren und auf dieser Basis die theoretische Diskussion voranzutreiben. Hier gibt es unglaublich viel zu tun, und hier sind Wissenschaftler gefragt. Zu Preisrichtern in umfunktionierten Wettkämpfen, die letztlich sogar die Forschungs- und Denkmöglichkeiten beschränken und daher zutiefst antiwissenschaftlich sind, sollten sich seriöse Wissenschaftler möglichst nicht hochstilisieren lassen.

Literatur

Caroll, L. (1963). Alice im Wunderland. Frankfurt: Insel-Verlag.

Corsini, R.J. (Hg.) (1983). Handbuch der Psychotherapie. 2 Bde. Weinheim: Beltz

Bastine, R., Fiedler, P. A., Grawe, K., Schmidtchen, S., Sommer, G. (Hrsg) (1982). Grundbegriffe der Psychotherapie. Weinheim: Edition Psychologie

Devereux, G. (1992). Angst und Methode in den Verhaltenswissenschaften. Frankfurt: Suhrkamp

Gould, S, J. (1983). Der falsch vermessene Mensch. Basel: Birkhäuser

Grawe, K. (1995). Welchen Sinn hat Psychotherapieforschung? Eine Erwiderung auf Tschuschke, Kächele & Hölzer (1994)Psychotherapeut, 40, 281-297

Grawe K., Bernauer, F., Donati, R. (1994). Psychotherapie im Wandel. Göttingen: Hogrefe

Guttmann, L. (1977). What is not what in Statistics. The Statistician 26: 81-107

Kriz, J. (1973). Statistik in den Sozialwissenschaften. Einführung und kritische Diskussion. Reinbek: Rowohlt (ab 5. Aufl. Opladen: Westdeutscher Verlag)

Kriz, J. (1975). Datenverarbeitung für Sozialwissenschaftler. Einführung in Grundlagen, Programmierung und Anwendung. Reinbek: Rowohlt (rororo-studium Bd. 45)

Kriz, J. (1981). Methodenkritik empirischer Sozialforschung. Eine Problemanalyse sozialwissenschaftlicher Forschungspraxis. Stuttgart: Teubner

Kriz, J. (1985). Grundkonzepte der Psychotherapie. München: Urban & Schwarzenberg (ab 4. Aufl. 1993: Beltz/PVU)

Kriz, J. (1996). Grundfragen der Forschungs- und Wissenschaftsmethodik. In: Hutterer-Krisch, R., Kriz, J., Parfy, E., Margreiter, U., Schmetterer, W., Schwendtner, G.: Psychotherapie als Wissenschaft - Fragen der Ethik, Bd. 5 der "Serie Psychotherapie" (Hrsg.: G. Sonneck), Wien: Facultas, 15-160

Kriz, J. (1997): Systemtheorie. Eine Einführung für Psychotherapeuten, Psychologen und Mediziner. Wien: Facultas (ab 3. Aufl. 1999: UTB)

Kriz, J. & Lisch, R. (1988). Methodenlexikon; für Mediziner, Psychologen, Soziologen. München: PVU

Kromrey, H. (1999). Von den Problemen anwendungsorientierter Sozialforschung und den Gefahren methodischer Halbbildung. Sozialwissenschaften und Berufspraxis, 22: 58-77

Linden, M. & Hautzinger, M. (Hrsg) (1996). Verhaltenstherapie.3 Heidelberg: Springer

Luborsky, L., Singer, B., Luborsky, E. (1975). Comparative Studies of Psychotherapies: Is it True that ”everyone has won and all must have prizes”? Archives of General Psychiatry, 32, 995-1008

Margraf, J. (Hrsg) (1996). Lehrbuch der Verhaltenstherapie. Heidelberg: Springer

Reinecker, H. (1996). Therapieforschung. S. 31-47 In: Margraf, J. (Hrsg). Lehrbuch der Verhaltenstherapie. Heidelberg: Springer

Revenstorf, D. (1982). Psychotherapeutische Verfahren. 4 Bde. Stuttgart: Kohlhammer

Seligman, M.E.P. (1995). The Effectiveness of Psychotherapy. Amer. Psychologist, 50, 965-974

Tschuschke, V., Kächele, H., Hölzer, M. (1994). Gibt es unterschiedlich effektive Formen von Psychotherapie? Psychotherapeut, 29, 281-291

Tschuschke, V., Hölzer, M., Kächele, H., (1995). Ach, du liebe ”Güte”. Eine Einladung statt einer Erwiderung. Psychotherapeut, 30, 304-308