HISTORIA OM SOCIALA EXPERIMENTER
BEGRÄNSNINGAR AV SOCIALA EXPERIMENTER
FRAMTIDEN FÖR SOCIALA EXPERIMENTER
BIBLIOGRAFI
Ett socialt experiment är ett slumpmässigt fördelat försökspersoner i två grupper för att undersöka effekterna av socialpolitik. Den ena gruppen, kallad ”behandlingsgruppen”, erbjuds eller åläggs att delta i ett nytt program, medan den andra gruppen, ”kontrollgruppen”, får det befintliga programmet. De två grupperna övervakas över tid för att mäta skillnader i deras beteende. I ett socialt experiment kan man till exempel jämföra ett program som ger arbetslösa personer en ekonomisk belöning för att de hittar ett jobb med ett program som inte gör det. Ett socialt experiment kan också jämföra elever i skolor som får en ny läroplan med elever i skolor som inte får det. Eftersom randomiseringsförfarandet garanterar att de två grupperna i övrigt är likadana kan de uppmätta skillnaderna i deras beteende kausalt hänföras till det nya programmet. Skillnaderna i beteende kallas ibland för programmets ”effekter”. Vanligt uppmätta beteendemässiga resultat i sociala experiment är bl.a. inkomster, sysselsättning, mottagande av transfereringar, hälsa, utbildningsnivå och barns utveckling. Urvalsstorleken i sociala experiment har varierat från under 100 till långt över 10 000.
Vissa sociala experiment har mer än en behandlingsgrupp. I sådana fall tilldelas varje behandlingsgrupp ett annat program. De olika behandlingsgrupperna kan jämföras med varandra för att fastställa de olika effekterna av två av de testade programmen, eller så kan de jämföras med kontrollgruppen för att fastställa programmets effekt i förhållande till status quo. De mänskliga försökspersonerna kan väljas slumpmässigt från den allmänna befolkningen eller, vilket är vanligare, slumpmässigt från en målpopulation, t.ex. missgynnade.
Sociala experiment har använts i stor utsträckning sedan slutet av 1960-talet. Enligt Greenberg och Shroder (2005) har nästan 300 sociala experiment genomförts sedan dess. Sociala experiment påminner mycket om medicinska laboratorieexperiment där behandlingsgruppen får ett nytt läkemedel eller ett nytt förfarande, medan kontrollgruppen får placebo eller standardbehandling. Laboratorieexperiment har också använts i stor utsträckning inom ekonomi, sedan 1970-talet (Smith 1994), men de skiljer sig från sociala experiment genom att de huvudsakligen används för att testa olika aspekter av ekonomisk teori, t.ex. förekomsten av jämvikt eller marknadstransaktionernas effektivitet, snarare än effekterna av ett socialt program. Dessutom har ekonomiska laboratorieexperiment vanligtvis ingen kontrollgrupp; i stället ges kontantmotiverade medlemmar av en behandlingsgrupp möjlighet att delta i marknadstransaktioner i en kontrollerad miljö för att avgöra om de beter sig på ett sätt som överensstämmer med förutsägelserna i den ekonomiska teorin. Vissa laboratorieexperiment inom ekonomi har använts för att testa alternativ till offentlig politik.
HISTORIA OM SOCIALA EXPERIMENTER
En stor del av grunden för det moderna tillvägagångssättet för sociala experiment kan spåras tillbaka till den berömde statistikern Ronald Fishers arbete på 1920-talet. Fisher förfinade begreppet slumpmässig tilldelning och påpekade att inga två grupper någonsin kan vara identiska. Han påpekade att om försökspersoner tilldelas behandlings- och kontrollgrupper av en ren slump (t.ex. genom att slå ett mynt eller från en tabell med slumpmässiga tal) garanteras att skillnader i de två gruppernas genomsnittliga beteende säkert kan tillskrivas behandlingen. Kausalitetsriktningen kan därför bestämmas med hjälp av grundläggande statistiska beräkningar. Fisher insåg också att randomisering ger ett sätt att bestämma de statistiska egenskaperna hos skillnader i resultat mellan grupperna.
Det första större sociala experimentet var New Jersey Income Maintenance Experiment, som inleddes i USA 1968. Även om några mindre sociala experiment föregick New Jersey-experimentet (t.ex. Perry Preschool Project 1962) var de mycket mindre omfattande och mycket mindre sofistikerade. I New Jersey-experimentet testades idén om en negativ inkomstskatt (NIT), som först föreslogs av ekonomerna Milton Friedman och James Tobin på 1960-talet. New Jersey-experimentet var det första av fem NIT-experiment som genomfördes i Nordamerika (fyra i USA och ett i Kanada) med mycket sofistikerad utformning och många behandlingsgrupper. Problem med att utvärdera vissa aspekter av dessa komplexa experiment ledde till mycket enklare experimentella utformningar under efterföljande år.
Från 1970-talet och fram till i dag har sociala experiment genomförts inom många socialpolitiska områden, bland annat barnhälsa och näring, brottslighet och ungdomsbrottslighet, tidig utveckling av barn, utbildning, prissättning av elektricitet, hälsovård, bostadsstöd, arbetsträning och program för att få välfärd till arbete. Bland de mest anmärkningsvärda experimenten kan nämnas Rand Health Insurance Experiment, där man testade olika sjukförsäkringsmodeller för egenavgifter, Moving to Opportunity Experiments, där man testade program som gjorde det möjligt för fattiga familjer att flytta från allmännyttiga bostäder, fyra experiment inom arbetslöshetsförsäkringen, där man testade effekterna av olika ekonomiska incitament för att få arbetslösa att återgå till arbete, och ett antal experiment inom välfärdssektorn, där man testade olika sätt att hjälpa socialbidragstagare att hitta ett arbete.
BEGRÄNSNINGAR AV SOCIALA EXPERIMENTER
Och även om sociala experiment allmänt erkänns som det idealiska sättet att fastställa kausala effekter av föreslagna socialpolitiska åtgärder, har de sociala experimenten flera viktiga begränsningar. För det första, och kanske viktigast av allt, kräver sociala experiment att en kontrollgrupp nekas den politiska förändring som ges till behandlingsgruppen. Eftersom kontrollgrupperna i sociala experiment vanligtvis är missgynnade kan det ses som ett etiskt brott att nekas programtjänster, vilket begränsar sociala experiment till platser där resurserna hindrar alla berättigade individer från att få hjälp. Behandlingar som gör en deltagare sämre ställd betraktas också som oetiska och politiskt ogenomförbara.
För det andra, även om väl utformade experiment har en hög grad av intern validitet (slutsatserna är giltiga för det testade urvalet), har de kanske inte extern validitet (de kan inte generaliseras till andra miljöer). En vanlig kritik mot experiment är att de på grund av sin begränsade storlek inte genererar de makroekonomiska, ”samhälleliga” effekter som ett fullt fungerande program skulle generera. Ett fullt fungerande arbetsträningsprogram kan t.ex. påverka löner och sysselsättning för icke-deltagare och kan påverka sociala normer och attityder, medan ett experiment av begränsad storlek inte skulle göra det. Dessutom finns det inget sätt att säkert veta om ett framgångsrikt experiment på en plats skulle vara framgångsrikt på en annan plats, särskilt eftersom sociala experiment vanligtvis genomförs på platser som inte väljs ut slumpmässigt, utan på grund av deras förmåga och vilja att delta i ett experiment.
För det tredje tar sociala experiment tid att utforma och utvärdera, vanligtvis flera år. Beslutsfattare kanske inte vill vänta den tid som krävs för att ta reda på om ett visst program fungerar.
För det sista har det i praktiken ofta visat sig vara svårt att genomföra slumpmässiga tilldelningar. Av en eller annan anledning kan det hända att enskilda personer inte vill delta i en forskningsstudie, och i de fall där det krävs samarbete mellan forskare och myndigheter kan vissa vara ovilliga att delta. Som ett resultat av detta kan de behandlings- och kontrollgrupper som testas visa sig vara icke-representativa för målpopulationen.
På grund av de olika begränsningarna i sociala experiment har andra metoder för att utvärdera effekterna av socialpolitik utvecklats. Dessa kallas i allmänhet ”icke-experimentella” eller ”kvasiexperimentella” metoder. Icke-experimentella metoder övervakar beteendet hos personer som utsätts för en ny politik (behandlingsgruppen) och väljer en ”jämförelsegrupp” som fungerar som kontrollgrupp. Men eftersom randomisering inte används för att välja ut de två grupperna vet man aldrig med säkerhet om jämförelsegruppen är identisk med behandlingsgruppen på andra sätt än att den har fått behandlingen. Många forskare matchar behandlingsgruppens medlemmar med personer i den icke-deltagande befolkningen för att göra grupperna så lika som möjligt. Matchningarna görs vanligen med hjälp av demografiska och ekonomiska egenskaper som ålder, utbildning, ras, bostadsort, anställnings- och inkomsthistorik och så vidare. En populär matchningsteknik är propensity score matching, som använder ett viktat genomsnitt av de observerade ekonomiska och demografiska egenskaperna hos den icke-deltagande befolkningen för att skapa en jämförelsegrupp.
En särskilt attraktiv icke-experimentell metod är det ”naturliga experimentet”. Naturliga experiment används ofta för att testa effekterna av redan existerande socialpolitik. Det naturliga experimentet drar nytta av det sätt på vilket en ny politik har genomförts så att jämförelsegruppen nästan är en riktig kontrollgrupp. Exempelvis genomfördes värnplikten (att vara värnpliktig) under Vietnamkriget genom ett nationellt lotteri som valde ut personer för militärtjänstgöring enbart utifrån deras födelsedatum. Teoretiskt sett borde alltså den grupp som valdes ut för militärtjänst vara identisk med de som inte valdes ut, eftersom den enda skillnaden är födelsedatumet. Forskare som vill testa effekterna av den militära värnplikten på individers framtida beteende skulle kunna jämföra resultaten (t.ex. utbildningsnivå eller inkomster) för de värnpliktiga med dem som inte är värnpliktiga och säkert tillskriva ”effekterna” till värnplikten (Angrist 1990). Eftersom inte alla värnpliktiga faktiskt tjänstgör i militären och eftersom vissa icke värnpliktiga personer anmäler sig frivilligt till militärtjänstgöring, är det också möjligt att uppskatta effekten av faktisk militärtjänstgöring på framtida beteende genom att justera effekterna av värnplikten för skillnader i andelen som tjänstgör i militären i behandlings- och jämförelsegrupperna. Validiteten av detta förfarande vilar dock i avgörande grad på jämförbarheten av de militärtjänstgörande veteranerna i de två urvalen.
Sociala experiment har ändrat karaktär sedan slutet av 1960-talet. Många av de tidiga sociala experimenten, t.ex. NIT-experimenten, arbetslöshetsförsäkringsexperimenten och Rand Health Insurance Experiment, testade en ”responsyta” där försökspersonerna fick ”kvantifierbara” behandlingar med varierande skatte- eller subventionssatser. Däremot är de flesta av de nyare sociala experimenten ”svarta lådor”, vilket innebär att ett paket av behandlingar ges till behandlingsgruppen, och det är inte möjligt att separat identifiera de kausala effekterna av varje komponent i paketet.
Svarta lådor-experiment har kritiserats för att de tenderar att ha mycket mindre generaliserbarhet än experiment med svarsytor. Därför har många forskare krävt en återgång till icke-experimentell utvärdering som den föredragna metoden för att analysera effekterna av socialpolitiska åtgärder. De som förespråkar experimentella metoder har dock motsatt sig att sociala experiment bör förbli grunden för utvärdering av socialpolitik eftersom fördelarna fortfarande är stora i förhållande till icke-experimentella metoder (Burtless 1995). I ett försök att ”komma in i den svarta lådan” har de som sympatiserar med det sociala experimentet som utvärderingsverktyg föreslagit sätt att kombinera experimentella och icke-experimentella utvärderingsmetoder för att identifiera kausala effekter av socialpolitiken (Bloom 2005). Icke-experimentella metoder är nödvändiga på grund av en selektionsbias som uppstår när medlemmar av behandlingsgruppen som får vissa delar av behandlingen inte är en slumpmässig delmängd av hela behandlingsgruppen. I framtiden kan utvärderingen av socialpolitiken i större utsträckning använda sig av båda utvärderingsmetoderna – genom att använda experiment när det är möjligt och kombinera dem med icke-experimentella metoder när experimenten inte kan besvara alla relevanta politiska frågor.
SEE ALSO Negative Income Tax
BIBLIOGRAFI
Angrist, Joshua D. 1990. Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social Security Administrative Records. American Economic Review 80 (3): 313-336.
Bloom, Howard S., ed. 2005. Learning More from Social Experiments. New York: Russell Sage Foundation.
Burtless, Gary. 1995. The Case for Randomized Field Trials in Economic and Policy Research. Journal of Economic Perspectives 9 (2): 63-84.
Greenberg, David och Mark Shroder. 2005. The Digest of Social Experiments. 3rd ed. Washington, DC: Urban Institute Press.
Greenberg, David, Donna Linksz och Marvin Mandell. 2003. Social Experimentation and Public Policymaking. Washington, DC: Urban Institute Press.
Smith, Vernon. 1994. Economics in the Laboratory. Journal of Economic Perspectives 8 (1): 113-131.
Philip K. Robins