SOSIAALISTEN KOKEIDEN HISTORIA
SOSIAALISTEN KOKEIDEN RAJOITUKSET
SOSIAALISTEN KOKEIDEN TULEVAISUUDEN KEHITYS
BIBLIOLOGIA
Sosiaalinen kokeilu eli sosiaalinen kokeilu on ihmishenkilöiden satunnaista jakamista kahteen eri ryhmään, jonka tarkoituksena on tutkia yhteiskuntapoliittisten toimien vaikutuksia. Toiselle ryhmälle, jota kutsutaan ”hoitoryhmäksi”, tarjotaan tai vaaditaan osallistumaan uuteen ohjelmaan, kun taas toinen ryhmä, ”kontrolliryhmä”, saa nykyisen ohjelman. Näitä kahta ryhmää seurataan ajan mittaan, jotta voidaan mitata eroja niiden käyttäytymisessä. Sosiaalisessa kokeessa voidaan esimerkiksi verrata ohjelmaa, jossa työttömät saavat rahallisen palkkion työpaikan löytämisestä, ja ohjelmaa, jossa näin ei tehdä. Tai sosiaalisessa kokeessa voidaan verrata oppilaita kouluissa, jotka saavat uuden opetussuunnitelman, ja oppilaita kouluissa, jotka eivät saa uutta opetussuunnitelmaa. Koska satunnaistamismenettely takaa, että nämä kaksi ryhmää ovat muuten samankaltaisia, heidän käyttäytymisessään mitatut erot voidaan syysuhteessa liittää uuteen ohjelmaan. Käyttäytymisen eroja kutsutaan joskus ohjelman ”vaikutuksiksi”. Yhteiskunnallisissa kokeiluissa yleisesti mitattuja käyttäytymistuloksia ovat muun muassa ansiotulot, työllisyys, tulonsiirtojen saanti, terveys, koulutustaso ja lasten kehitys. Sosiaalisten kokeilujen otoskoko on vaihdellut alle sadasta reilusti yli 10 000:een.
Joissakin sosiaalisissa kokeiluissa on useampi kuin yksi käsittelyryhmä. Tällaisissa tapauksissa kukin hoitoryhmä on osoitettu eri ohjelmaan. Eri hoitoryhmiä voidaan verrata toisiinsa kahden testatun ohjelman erilaisten vaikutusten määrittämiseksi, tai niitä voidaan verrata kontrolliryhmään ohjelman vaikutusten määrittämiseksi suhteessa vallitsevaan tilanteeseen. Koehenkilöt voidaan valita satunnaisesti yleisestä väestöstä tai yleisemmin satunnaisesti kohderyhmästä, kuten vähäosaisista.
Sosiaalisia kokeita on käytetty laajasti 1960-luvun lopulta lähtien. Greenbergin ja Shroderin (2005) mukaan sen jälkeen on tehty lähes 300 sosiaalista koetta. Sosiaaliset kokeet muistuttavat hyvin paljon lääketieteellisiä laboratoriokokeita, joissa hoitoryhmälle annetaan uusi lääke tai toimenpide, kun taas kontrolliryhmälle annetaan lumelääkettä tai tavanomaista hoitoa. Laboratoriokokeita on käytetty laajalti myös taloustieteen alalla 1970-luvulta lähtien (Smith 1994), mutta ne eroavat sosiaalisista kokeista siinä, että niitä käytetään lähinnä talousteorian eri näkökohtien, kuten tasapainon olemassaolon tai markkinatransaktioiden tehokkuuden, testaamiseen eikä niinkään sosiaalisen ohjelman vaikutusten testaamiseen. Taloustieteellisissä laboratoriokokeissa ei myöskään yleensä ole kontrolliryhmää; sen sijaan käteismotivoituneille hoitoryhmän jäsenille annetaan mahdollisuus harjoittaa markkinatransaktioita kontrolloidussa ympäristössä sen selvittämiseksi, käyttäytyvätkö he talousteorian ennusteiden mukaisella tavalla. Joitakin taloustieteen laboratoriokokeita on käytetty julkisen politiikan vaihtoehtojen testaamiseen.
SOSIAALISTEN KOKEIDEN HISTORIA
Sosiaalisten kokeiden nykyaikaisen lähestymistavan perusta voidaan paljolti jäljittää kuuluisan tilastotieteilijän Ronald Fisherin työhön 1920-luvulla. Fisher tarkensi satunnaistamisen käsitettä ja huomautti, että kaksi ryhmää ei voi koskaan olla identtisiä. Hän totesi, että koehenkilöiden jakaminen hoito- ja kontrolliryhmiin puhtaasti sattumalta (esimerkiksi kolikkoa heittämällä tai satunnaislukutaulukosta) takaa sen, että erot näiden kahden ryhmän keskimääräisessä käyttäytymisessä voidaan turvallisesti katsoa johtuvan hoidosta. Näin ollen kausaalisuuden suunta voidaan määrittää tilastollisten peruslaskelmien avulla. Fisher tunnusti myös, että satunnaistaminen tarjoaa keinon määrittää ryhmien välisten tuloserojen tilastolliset ominaisuudet.
Ensimmäinen suuri sosiaalinen koe oli New Jerseyn Income Maintenance Experiment, joka aloitettiin Yhdysvalloissa vuonna 1968. Vaikka New Jersey Experimentiä edelsi muutama pienempi sosiaalinen kokeilu (kuten Perry Preschool Project vuonna 1962), ne olivat laajuudeltaan paljon pienempiä ja vähemmän kehittyneitä. New Jerseyn kokeilussa testattiin ajatusta negatiivisesta tuloverosta (NIT), jota taloustieteilijät Milton Friedman ja James Tobin ehdottivat ensimmäisen kerran 1960-luvulla. New Jersey Experiment oli ensimmäinen viidestä Pohjois-Amerikassa tehdystä NIT-kokeesta (neljä Yhdysvalloissa ja yksi Kanadassa), joissa oli hyvin pitkälle kehitetyt suunnitelmat ja useita käsittelyryhmiä. Ongelmat näiden monimutkaisten kokeilujen tiettyjen näkökohtien arvioinnissa johtivat myöhempinä vuosina paljon yksinkertaisempiin koeasetelmiin.
Seitsemänkymmentäluvulta nykypäivään sosiaalipoliittisia kokeiluja on toteutettu lukuisilla sosiaalipolitiikan aloilla, muun muassa lasten terveyden ja ravitsemuksen, rikollisuuden ja nuorisorikollisuuden, varhaiskasvatuksen, koulutuksen, sähkön hinnoittelun, terveyspalvelujen, asumisen tukemisen, työpaikkakoulutuksen ja hyvinvointi- ja työllistämisohjelmien aloilla. Merkittäviä kokeiluja ovat muun muassa Randin sairausvakuutuskokeilu, jossa testattiin erilaisia sairausvakuutuksen omavastuuosuuksia; Moving to Opportunity -kokeilut, joissa testattiin ohjelmia, joiden avulla köyhät perheet pystyivät muuttamaan pois julkisista asunnoista; neljä työttömyysvakuutuskokeilua, joissa testattiin erilaisten taloudellisten kannustimien vaikutuksia työttömien henkilöiden saamiseksi palaamaan takaisin työelämään; ja useat sosiaaliturvaan liittyvät kokeilut, joissa testattiin tapoja, joiden avulla sosiaaliturvassa olevia henkilöitä autetaan löytämään työtä.
SOSIAALIKOKEIDEN RAJOITUKSET
Vaikka yhteiskuntakokeiluja pidetään laajalti ihanteellisena tapana selvittää ehdotettujen sosiaalipolitiikkojen kausaalivaikutuksia, niillä on useita merkittäviä rajoituksia. Ensinnäkin, ja ehkä tärkeimpänä, sosiaaliset kokeet edellyttävät, että kontrolliryhmältä evätään hoitoryhmälle annettu poliittinen muutos. Koska sosiaalisten kokeilujen kontrolliryhmät ovat tyypillisesti muita heikommassa asemassa, ohjelmapalvelujen epäämistä voidaan pitää eettisenä rikkomuksena, mikä rajoittaa sosiaaliset kokeilut paikkoihin, joissa resurssit estävät kaikkien kelpoisuusehdot täyttävien henkilöiden palvelemisen. Myös hoitoja, jotka huonontavat osallistujan asemaa, pidetään epäeettisinä ja poliittisesti toteuttamiskelvottomina.
Toiseksi, vaikka hyvin suunnitelluilla kokeiluilla on korkea sisäinen validiteetti (johtopäätökset pätevät testatun otoksen osalta), niillä ei välttämättä ole ulkoista validiteettia (ne eivät ole yleistettävissä muihin ympäristöihin). Yksi yleinen kritiikki kokeita kohtaan on se, että niiden rajallisen koon vuoksi ne eivät tuota makrotaloudellisia, ”yhteisöllisiä” vaikutuksia, joita täysin toimiva ohjelma tuottaisi. Täysin toimiva työvoimakoulutusohjelma voi esimerkiksi vaikuttaa muiden kuin osallistujien palkkoihin ja työllisyyteen sekä sosiaalisiin normeihin ja asenteisiin, kun taas kokeilu, jonka koko on rajallinen, ei vaikuta. Lisäksi ei ole mitään keinoa tietää varmasti, olisiko yhdessä paikassa onnistunut kokeilu onnistunut myös toisessa paikassa, erityisesti koska sosiaalisia kokeiluja tehdään yleensä paikoissa, joita ei valita sattumanvaraisesti, vaan niiden kyvykkyyden ja halukkuuden perusteella osallistua kokeiluun.
Kolmanneksi, sosiaalisten kokeilujen suunnitteluun ja arviointiin kuluu aikaa, yleensä useita vuosia. Poliittiset päättäjät eivät ehkä halua odottaa tarvittavaa aikaa saadakseen selville, toimiiko tietty ohjelma.
Viimeiseksi, käytännössä satunnaisjakoa on usein osoittautunut vaikeaksi toteuttaa. Yksilöt eivät ehkä syystä tai toisesta ole halukkaita osallistumaan tutkimukseen, ja tapauksissa, joissa tarvitaan tutkijoiden ja valtion virastojen välistä yhteistyötä, jotkut saattavat olla haluttomia osallistumaan. Tämän seurauksena testattavat hoito- ja kontrolliryhmät saattavat osoittautua kohdeväestöä huonosti edustaviksi.
Sosiaalisten kokeiden erilaisten rajoitusten vuoksi on kehitetty muita keinoja sosiaalipolitiikan vaikutusten arvioimiseksi. Näitä kutsutaan yleisesti ”ei-kokeellisiksi” tai ”kvasikokeellisiksi” menetelmiksi. Ei-kokeellisissa menetelmissä seurataan niiden henkilöiden käyttäytymistä, joihin sovelletaan uutta politiikkaa (hoitoryhmä), ja valitaan ”vertailuryhmä”, joka toimii kontrolliryhmänä. Koska näitä kahta ryhmää ei kuitenkaan valita satunnaistamalla, ei koskaan tiedetä varmasti, onko vertailuryhmä identtinen hoitoryhmän kanssa muilta osin kuin hoidon saamisen osalta. Monet tutkijat sovittavat hoitoryhmän jäsenet yhteen osallistumattomien henkilöiden kanssa, jotta ryhmät olisivat mahdollisimman samankaltaisia. Vastaukset tehdään yleensä demografisten ja taloudellisten ominaisuuksien, kuten iän, koulutuksen, rodun, asuinpaikan, työ- ja ansiohistorian jne. perusteella. Yksi suosittu vertailutekniikka on propensity score matching, jossa vertailuryhmän luomiseksi käytetään osallistumattoman väestön havaittujen taloudellisten ja demografisten ominaisuuksien painotettua keskiarvoa.
Erittäin houkutteleva ei-kokeellinen menetelmä on ”luonnollinen koe”. Luonnollisia kokeita käytetään usein jo käytössä olevien sosiaalipolitiikkojen vaikutusten testaamiseen. Luonnollisessa kokeessa hyödynnetään tapaa, jolla uusi politiikka on toteutettu, niin että vertailuryhmä on lähes todellinen kontrolliryhmä. Esimerkiksi Vietnamin sodan aikainen asevelvollisuus (kutsuntakelpoisuus) toteutettiin kansallisella arvonnalla, jossa henkilöt valittiin asevelvollisiksi yksinomaan heidän syntymäaikansa perusteella. Teoriassa asepalvelukseen valitun ryhmän pitäisi siis olla identtinen niiden kanssa, joita ei valittu, koska ainoa ero on syntymäaika. Tutkijat, jotka haluavat testata asevelvollisuuden vaikutuksia yksilöiden tulevaan käyttäytymiseen, voisivat verrata asevelvollisten ja asevelvollisuuden ulkopuolelle jääneiden tuloksia (esimerkiksi koulutustasoa tai ansioita) ja liittää ”vaikutukset” turvallisesti asevelvollisuuteen (Angrist 1990). Koska kaikki asevelvolliset eivät todellisuudessa palvele armeijassa ja koska jotkut asevelvollisuuden ulkopuolelle jäävät henkilöt ilmoittautuvat vapaaehtoisesti asepalvelukseen, on myös mahdollista arvioida todellisen asepalveluksen vaikutusta tulevaan käyttäytymiseen mukauttamalla asevelvollisuuden vaikutukset käsittely- ja vertailuryhmien asevelvollisten osuuden eroihin. Tämän menettelyn pätevyys riippuu kuitenkin ratkaisevasti asepalveluksen suorittaneiden veteraanien vertailukelpoisuudesta kahdessa otoksessa.
SOSIAALIKOKEIDEN TULEVAISUUS
Sosiaaliset kokeet ovat muuttuneet luonteeltaan 1960-luvun lopun jälkeen. Monissa varhaisissa sosiaalisissa kokeissa, kuten NIT-kokeissa, työttömyysvakuutuskokeissa ja Randin sairausvakuutuskokeessa, testattiin ”vastepintaa”, jossa koehenkilöille annettiin ”määrällisesti mitattavissa olevia” käsittelyjä, joissa vero- tai tukitasot vaihtelivat. Sen sijaan useimmat uudemmat sosiaaliset kokeet ovat ”mustalaatikkokokeita”, mikä tarkoittaa sitä, että hoitoryhmälle annetaan hoitopaketti, eikä kunkin paketin osan kausaalivaikutuksia ole mahdollista tunnistaa erikseen.
Mustalaatikkokokeita on kritisoitu siitä, että niiden yleistettävyys on yleensä paljon heikompi kuin vastauspintakokeiden. Monet tutkijat ovatkin vaatineet paluuta ei-kokeelliseen arviointiin ensisijaisena menetelmänä sosiaalipolitiikan vaikutusten analysoinnissa. Kokeellisten menetelmien kannattajat ovat kuitenkin vastanneet, että sosiaalisten kokeilujen pitäisi pysyä sosiaalipolitiikan arvioinnin perustana, koska niiden edut ovat edelleen suuret verrattuna ei-kokeellisiin menetelmiin (Burtless 1995). Pyrkiessään ”pääsemään mustan laatikon sisälle” ne, jotka kannattavat sosiaalista kokeilua arviointivälineenä, ovat ehdottaneet tapoja yhdistää kokeellisia ja ei-kokeellisia arviointimenetelmiä sosiaalipolitiikan kausaalivaikutusten tunnistamiseksi (Bloom 2005). Ei-kokeelliset menetelmät ovat välttämättömiä valikoitumisharhan vuoksi, joka syntyy, kun hoitoryhmän jäsenet, jotka saavat hoidon tiettyjä osia, eivät ole satunnainen osajoukko koko hoitoryhmästä. Tulevaisuudessa sosiaalipolitiikan arvioinnissa saatetaan käyttää enemmän molempia arviointimenetelmiä – käyttämällä kokeita silloin, kun se on mahdollista, ja yhdistämällä niitä ei-kokeellisiin menetelmiin silloin, kun kokeet eivät pysty vastaamaan kaikkiin asiaankuuluviin poliittisiin kysymyksiin.
KATSO MYÖS Negatiivinen tulovero
BIBLIOGRAFIA
Angrist, Joshua D. 1990. Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social Security Administrative Records. American Economic Review 80 (3): 313-336.
Bloom, Howard S., ed. 2005. Learning More from Social Experiments. New York: Russell Sage Foundation.
Burtless, Gary. 1995. The Case for Randomized Field Trials in Economic and Policy Research. Journal of Economic Perspectives 9 (2): 63-84.
Greenberg, David ja Mark Shroder. 2005. The Digest of Social Experiments. 3rd ed. Washington, DC: Urban Institute Press.
Greenberg, David, Donna Linksz ja Marvin Mandell. 2003. Social Experimentation and Public Policymaking. Washington, DC: Urban Institute Press.
Smith, Vernon. 1994. Economics in the Laboratory. Journal of Economic Perspectives 8 (1): 113-131.
Philip K. Robins
.