GESCHICHTE DER SOZIALEN EXPERIMENTE
EINSCHRÄNKUNGEN DER SOZIALEN EXPERIMENTE
ZUKUNFT DER SOZIALEN EXPERIMENTE
BIBLIOGRAPHIE
Ein soziales Experiment ist die zufällige Zuordnung von Menschen zu zwei Gruppen, um die Auswirkungen sozialer Maßnahmen zu untersuchen. Einer Gruppe, der sogenannten „Behandlungsgruppe“, wird die Teilnahme an einem neuen Programm angeboten oder vorgeschrieben, während eine zweite Gruppe, die „Kontrollgruppe“, das bestehende Programm erhält. Die beiden Gruppen werden im Laufe der Zeit beobachtet, um Unterschiede in ihrem Verhalten zu messen. Ein soziales Experiment kann zum Beispiel ein Programm, das Arbeitslosen eine finanzielle Belohnung für die Suche nach einem Arbeitsplatz bietet, mit einem Programm vergleichen, das dies nicht tut. Oder ein soziales Experiment vergleicht Schüler in Schulen, die einen neuen Lehrplan erhalten, mit Schülern in Schulen, die keinen Lehrplan erhalten. Da das Randomisierungsverfahren garantiert, dass die beiden Gruppen ansonsten ähnlich sind, können die gemessenen Unterschiede in ihrem Verhalten kausal auf das neue Programm zurückgeführt werden. Die Verhaltensunterschiede werden manchmal als „Auswirkungen“ des Programms bezeichnet. Zu den üblicherweise in sozialen Experimenten gemessenen Verhaltensergebnissen gehören Einkommen, Beschäftigung, Erhalt von Transferleistungen, Gesundheit, Bildungsniveau und die Entwicklung von Kindern. Die Stichprobengrößen in sozialen Experimenten reichen von unter 100 bis weit über 10.000.
Einige soziale Experimente haben mehr als eine Behandlungsgruppe. In solchen Fällen wird jede Behandlungsgruppe einem anderen Programm zugewiesen. Die verschiedenen Behandlungsgruppen können miteinander verglichen werden, um die unterschiedlichen Auswirkungen von zwei der getesteten Programme zu ermitteln, oder sie können mit der Kontrollgruppe verglichen werden, um die Auswirkungen des Programms im Vergleich zum Status quo zu bestimmen. Die Versuchspersonen können nach dem Zufallsprinzip aus der Allgemeinbevölkerung ausgewählt werden oder, was häufiger der Fall ist, nach dem Zufallsprinzip aus einer Zielbevölkerung, z. B. aus benachteiligten Bevölkerungsgruppen.
Soziale Experimente werden seit Ende der 1960er Jahre in großem Umfang eingesetzt. Laut Greenberg und Shroder (2005) wurden seither fast 300 soziale Experimente durchgeführt. Soziale Experimente sind medizinischen Laborexperimenten sehr ähnlich, bei denen der Behandlungsgruppe ein neues Medikament oder Verfahren verabreicht wird, während die Kontrollgruppe ein Placebo oder die Standardbehandlung erhält. Laborexperimente werden seit den 1970er Jahren auch im Bereich der Wirtschaftswissenschaften in großem Umfang eingesetzt (Smith 1994), doch unterscheiden sie sich von sozialen Experimenten insofern, als sie hauptsächlich dazu dienen, verschiedene Aspekte der Wirtschaftstheorie zu testen, z. B. die Existenz eines Gleichgewichts oder die Effizienz von Markttransaktionen, und nicht die Auswirkungen eines Sozialprogramms. Außerdem gibt es bei wirtschaftswissenschaftlichen Laborexperimenten in der Regel keine Kontrollgruppe; stattdessen wird den geldmotivierten Mitgliedern einer Behandlungsgruppe die Möglichkeit gegeben, in einem kontrollierten Umfeld Markttransaktionen durchzuführen, um festzustellen, ob ihr Verhalten mit den Vorhersagen der Wirtschaftstheorie übereinstimmt. Einige Laborexperimente in den Wirtschaftswissenschaften wurden verwendet, um politische Alternativen zu testen.
GESCHICHTE DER SOZIALEN EXPERIMENTE
Ein Großteil der Grundlagen des modernen Ansatzes für soziale Experimente kann auf die Arbeit des berühmten Statistikers Ronald Fisher in den 1920er Jahren zurückgeführt werden. Fisher verfeinerte den Begriff der Zufallszuweisung und wies darauf hin, dass keine zwei Gruppen jemals identisch sein können. Er stellte fest, dass die Zuteilung von Probanden zu Behandlungs- und Kontrollgruppen durch reinen Zufall (z. B. durch das Werfen einer Münze oder anhand einer Tabelle mit Zufallszahlen) gewährleistet, dass Unterschiede im durchschnittlichen Verhalten der beiden Gruppen sicher auf die Behandlung zurückgeführt werden können. Folglich kann die Richtung der Kausalität mit einfachen statistischen Berechnungen bestimmt werden. Fisher erkannte auch, dass die Randomisierung ein Mittel zur Bestimmung der statistischen Eigenschaften von Unterschieden in den Ergebnissen zwischen den Gruppen darstellt.
Das erste große soziale Experiment war das New Jersey Income Maintenance Experiment, das 1968 in den Vereinigten Staaten gestartet wurde. Obwohl dem New Jersey Experiment einige kleinere soziale Experimente vorausgingen (z.B. das Perry Preschool Project im Jahr 1962), waren sie vom Umfang her viel kleiner und weniger anspruchsvoll. Das New Jersey Experiment testete die Idee einer negativen Einkommenssteuer (NIT), die erstmals in den 1960er Jahren von den Wirtschaftswissenschaftlern Milton Friedman und James Tobin vorgeschlagen wurde. Das New-Jersey-Experiment war das erste von fünf in Nordamerika durchgeführten NIT-Experimenten (vier in den Vereinigten Staaten und eines in Kanada), die sehr ausgefeilte Designs und viele Behandlungsgruppen hatten. Probleme bei der Bewertung bestimmter Aspekte dieser komplexen Experimente führten in den folgenden Jahren zu wesentlich einfacheren Versuchsplänen.
Von den 1970er Jahren bis heute wurden soziale Experimente in zahlreichen sozialpolitischen Bereichen durchgeführt, darunter Kindergesundheit und -ernährung, Kriminalität und Jugendkriminalität, frühkindliche Entwicklung, Bildung, Strompreise, Gesundheitsdienste, Wohnungsfürsorge, Berufsausbildung und Programme zur Förderung von Sozialleistungen. Zu den bemerkenswerten Experimenten gehören das Rand Health Insurance Experiment, bei dem verschiedene Zuzahlungspläne für die Krankenversicherung getestet wurden; die Moving to Opportunity Experimente, bei denen Programme getestet wurden, die es armen Familien ermöglichten, aus Sozialwohnungen auszuziehen; vier Experimente zur Arbeitslosenversicherung, bei denen die Auswirkungen verschiedener finanzieller Anreize getestet wurden, um Arbeitslose zur Rückkehr an den Arbeitsplatz zu bewegen; und eine Reihe von Experimenten zum Thema „welfare-to-work“, bei denen Möglichkeiten getestet wurden, Sozialhilfeempfängern bei der Arbeitssuche zu helfen.
EINSCHRÄNKUNGEN VON SOZIALEN EXPERIMENTEN
Obwohl weithin als ideales Mittel zur Bestimmung der kausalen Auswirkungen vorgeschlagener sozialpolitischer Maßnahmen anerkannt, haben soziale Experimente mehrere wichtige Einschränkungen. Erstens, und das ist vielleicht das Wichtigste, erfordern soziale Experimente, dass einer Kontrollgruppe die politische Veränderung verweigert wird, die der Behandlungsgruppe zuteil wird. Da die Kontrollgruppen in sozialen Experimenten in der Regel benachteiligt sind, kann die Verweigerung von Programmleistungen als ethischer Verstoß angesehen werden, wodurch soziale Experimente auf Orte beschränkt werden, an denen die Ressourcen verhindern, dass alle in Frage kommenden Personen versorgt werden. Auch Behandlungen, die einen Teilnehmer schlechter stellen, werden als unethisch und politisch undurchführbar angesehen.
Zweitens haben gut konzipierte Experimente zwar ein hohes Maß an interner Validität (die Schlussfolgerungen sind für die getestete Stichprobe gültig), aber möglicherweise keine externe Validität (sie sind nicht auf andere Situationen verallgemeinerbar). Ein häufiger Kritikpunkt an Experimenten ist, dass sie aufgrund ihrer begrenzten Größe nicht die makroökonomischen, „gemeinschaftlichen“ Effekte erzeugen, die ein voll funktionsfähiges Programm erzeugen würde. Ein voll funktionsfähiges Berufsbildungsprogramm kann sich beispielsweise auf die Löhne und die Beschäftigung von Nichtteilnehmern auswirken und soziale Normen und Einstellungen beeinflussen, was bei einem Experiment mit begrenztem Umfang nicht der Fall ist. Darüber hinaus lässt sich nicht mit Sicherheit sagen, ob ein erfolgreiches Experiment an einem Ort auch an einem anderen Ort erfolgreich wäre, insbesondere weil soziale Experimente in der Regel an Orten durchgeführt werden, die nicht zufällig ausgewählt werden, sondern aufgrund ihrer Fähigkeit und Bereitschaft, an einem Experiment teilzunehmen.
Drittens benötigen soziale Experimente Zeit für die Planung und Auswertung, in der Regel mehrere Jahre. Politische Entscheidungsträger wollen möglicherweise nicht die erforderliche Zeit abwarten, um herauszufinden, ob ein bestimmtes Programm funktioniert.
Schließlich hat es sich in der Praxis oft als schwierig erwiesen, eine Zufallszuweisung durchzuführen. Es kann sein, dass Einzelpersonen aus dem einen oder anderen Grund nicht bereit sind, an einer Forschungsstudie teilzunehmen, und in Fällen, in denen eine Zusammenarbeit zwischen Forschern und Regierungsbehörden erforderlich ist, können einige nicht bereit sein, sich zu beteiligen. Infolgedessen können sich die getesteten Behandlungs- und Kontrollgruppen als nicht repräsentativ für die Zielpopulation erweisen.
Aufgrund der verschiedenen Einschränkungen sozialer Experimente wurden andere Methoden zur Bewertung der Auswirkungen sozialer Maßnahmen entwickelt. Diese werden allgemein als „nicht-experimentelle“ oder „quasi-experimentelle“ Methoden bezeichnet. Bei nicht-experimentellen Methoden wird das Verhalten von Personen beobachtet, die einer neuen Politik unterworfen sind (die Behandlungsgruppe), und eine „Vergleichsgruppe“ ausgewählt, die als Kontrollgruppe dient. Da die beiden Gruppen jedoch nicht nach dem Zufallsprinzip ausgewählt werden, kann nie mit Sicherheit festgestellt werden, ob die Vergleichsgruppe mit der Behandlungsgruppe in anderer Hinsicht als dem Erhalt der Behandlung identisch ist. Viele Forscher gleichen die Mitglieder der Behandlungsgruppe mit Personen aus der nicht teilnehmenden Bevölkerung ab, um die Gruppen so ähnlich wie möglich zu machen. Der Abgleich erfolgt in der Regel anhand demografischer und wirtschaftlicher Merkmale wie Alter, Bildung, Rasse, Wohnort, Beschäftigungs- und Einkommensgeschichte usw. Ein beliebtes Matching-Verfahren ist das Propensity-Score-Matching, bei dem ein gewichteter Durchschnitt der beobachteten wirtschaftlichen und demografischen Merkmale der nicht teilnehmenden Bevölkerung verwendet wird, um eine Vergleichsgruppe zu bilden.
Eine besonders attraktive nicht-experimentelle Methode ist das „natürliche Experiment“. Natürliche Experimente werden häufig eingesetzt, um die Auswirkungen bereits eingeführter sozialpolitischer Maßnahmen zu testen. Das natürliche Experiment macht sich die Art und Weise zunutze, wie eine neue Politik umgesetzt wurde, so dass die Vergleichsgruppe fast eine echte Kontrollgruppe ist. So wurde zum Beispiel die Wehrpflicht während des Vietnamkriegs durch eine nationale Lotterie durchgeführt, bei der die Auswahl der Personen für den Militärdienst ausschließlich anhand ihres Geburtsdatums erfolgte. Theoretisch müsste also die Gruppe, die für den Militärdienst ausgewählt wurde, mit der Gruppe, die nicht ausgewählt wurde, identisch sein, da der einzige Unterschied das Geburtsdatum ist. Forscher, die die Auswirkungen der Wehrpflicht auf das künftige Verhalten von Personen untersuchen wollen, könnten die Ergebnisse (z. B. Bildungsstand oder Einkommen) der Wehrpflichtigen mit denen der Nicht-Wehrpflichtigen vergleichen und die „Auswirkungen“ mit Sicherheit der Wehrpflicht zuschreiben (Angrist 1990). Da nicht alle Wehrpflichtigen tatsächlich zum Militärdienst eingezogen werden und einige Nicht-Wehrpflichtige sich freiwillig zum Militärdienst melden, ist es auch möglich, die Auswirkungen des tatsächlichen Militärdienstes auf das künftige Verhalten zu schätzen, indem die Auswirkungen der Wehrpflicht um die Unterschiede im Anteil der Wehrpflichtigen in der Behandlungs- und der Vergleichsgruppe bereinigt werden. Die Gültigkeit dieses Verfahrens hängt jedoch entscheidend von der Vergleichbarkeit der Wehrdienstveteranen in den beiden Stichproben ab.
ZUKUNFT DER SOZIALEN EXPERIMENTE
Soziale Experimente haben sich seit Ende der 1960er Jahre in ihrem Charakter verändert. Viele frühe soziale Experimente wie die NIT-Experimente, die Arbeitslosenversicherungsexperimente und das Rand-Krankenversicherungsexperiment testeten eine „Reaktionsfläche“, bei der die Probanden „quantifizierbare“ Behandlungen mit unterschiedlichen Steuer- oder Subventionssätzen erhielten. Im Gegensatz dazu handelt es sich bei den meisten neueren Sozialexperimenten um „Black Box“-Experimente, d.h. die Behandlungsgruppe erhält ein Paket von Behandlungen, und es ist nicht möglich, die kausalen Auswirkungen der einzelnen Komponenten des Pakets getrennt zu ermitteln.
Black-Box-Experimente wurden kritisiert, weil sie in der Regel viel weniger verallgemeinerbar sind als Response-Surface-Experimente. Daher haben viele Forscher eine Rückkehr zur nicht-experimentellen Evaluierung als bevorzugte Methode zur Analyse der Auswirkungen von Sozialmaßnahmen gefordert. Die Befürworter experimenteller Methoden haben jedoch gekontert, dass soziale Experimente die Grundlage für die Evaluierung sozialpolitischer Maßnahmen bleiben sollten, da die Vorteile im Vergleich zu nicht-experimentellen Methoden immer noch groß sind (Burtless 1995). In einem Versuch, „in die Blackbox“ einzudringen, haben diejenigen, die mit dem sozialen Experiment als Evaluierungsinstrument sympathisieren, Möglichkeiten vorgeschlagen, experimentelle und nicht-experimentelle Evaluierungsmethoden zu kombinieren, um kausale Auswirkungen von sozialpolitischen Maßnahmen zu ermitteln (Bloom 2005). Nicht-experimentelle Methoden sind notwendig, weil es zu Selektionsverzerrungen kommt, wenn die Mitglieder der Behandlungsgruppe, die bestimmte Komponenten der Behandlung erhalten, keine zufällige Teilmenge der gesamten Behandlungsgruppe sind. In Zukunft könnte die Evaluierung der Sozialpolitik verstärkt auf beide Evaluierungsmethoden zurückgreifen, d.h. Experimente verwenden, wenn dies möglich ist, und sie mit nicht-experimentellen Methoden kombinieren, wenn Experimente nicht alle relevanten politischen Fragen beantworten können.
Siehe auch Negative Einkommenssteuer
BIBLIOGRAPHIE
Angrist, Joshua D. 1990. Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social Security Administrative Records. American Economic Review 80 (3): 313-336.
Bloom, Howard S., ed. 2005. Learning More from Social Experiments. New York: Russell Sage Foundation.
Burtless, Gary. 1995. The Case for Randomized Field Trials in Economic and Policy Research. Journal of Economic Perspectives 9 (2): 63-84.
Greenberg, David, und Mark Shroder. 2005. The Digest of Social Experiments. 3rd ed. Washington, DC: Urban Institute Press.
Greenberg, David, Donna Linksz, and Marvin Mandell. 2003. Social Experimentation and Public Policymaking. Washington, DC: Urban Institute Press.
Smith, Vernon. 1994. Economics in the Laboratory. Journal of Economic Perspectives 8 (1): 113-131.
Philip K. Robins