HISTORIA EKSPERYMENTÓW SPOŁECZNYCH

LIMITACJE EKSPERYMENTÓW SPOŁECZNYCH

PRZESZŁOŚĆ EKSPERYMENTÓW SPOŁECZNYCH

BIBLIOGRAFIA

Eksperyment społeczny polega na losowym przydzieleniu osób badanych do dwóch grup w celu zbadania skutków polityki społecznej. Jedna grupa, zwana „grupą terapeutyczną”, otrzymuje ofertę lub jest zobowiązana do uczestnictwa w nowym programie, podczas gdy druga grupa, „grupa kontrolna”, otrzymuje istniejący program. Te dwie grupy są monitorowane w czasie, aby zmierzyć różnice w ich zachowaniu. Na przykład, eksperyment społeczny może porównać program, który daje bezrobotnym nagrodę finansową za znalezienie pracy, z programem, który tego nie robi. Albo eksperyment społeczny może porównywać uczniów w szkołach, które otrzymują nowy program nauczania, z uczniami w szkołach, które go nie otrzymują. Ponieważ procedura randomizacji gwarantuje, że obie grupy są pod innymi względami podobne, zmierzone różnice w ich zachowaniu mogą być przyczynowo przypisane do nowego programu. Różnice w zachowaniu nazywane są czasem „efektami” programu. Powszechnie mierzone wyniki behawioralne w eksperymentach społecznych obejmują zarobki, zatrudnienie, otrzymywanie płatności transferowych, zdrowie, osiągnięcia edukacyjne i rozwój dzieci. Wielkość próby w eksperymentach społecznych wahała się od poniżej 100 do znacznie powyżej 10 000.

Niektóre eksperymenty społeczne mają więcej niż jedną grupę terapeutyczną. W takich przypadkach, każda grupa traktowania jest przypisana do innego programu. Różne grupy traktowania mogą być porównywane ze sobą w celu określenia zróżnicowanego wpływu dwóch testowanych programów, lub mogą być porównywane z grupą kontrolną w celu określenia wpływu programu w stosunku do status quo. Osoby badane mogą być wybrane losowo z populacji ogólnej lub, bardziej powszechnie, mogą być wybrane losowo z populacji docelowej, takiej jak osoby upośledzone.

Eksperymenty społeczne są szeroko stosowane od późnych lat sześćdziesiątych. Według Greenberga i Shrodera (2005) od tego czasu przeprowadzono prawie 300 eksperymentów społecznych. Eksperymenty społeczne są bardzo podobne do medycznych eksperymentów laboratoryjnych, w których grupa leczona otrzymuje nowy lek lub procedurę, podczas gdy grupa kontrolna otrzymuje placebo lub standardowe leczenie. Eksperymenty laboratoryjne są również szeroko stosowane w dziedzinie ekonomii, od lat 70. (Smith 1994), ale różnią się od eksperymentów społecznych tym, że są wykorzystywane głównie do testowania różnych aspektów teorii ekonomii, takich jak istnienie równowagi lub efektywność transakcji rynkowych, a nie efektów programu społecznego. Również eksperymenty laboratoryjne w ekonomii zazwyczaj nie mają grupy kontrolnej; zamiast tego, zmotywowani gotówką członkowie grupy zabiegowej mają możliwość zaangażowania się w transakcje rynkowe w kontrolowanym środowisku, aby ustalić, czy zachowują się w sposób zgodny z przewidywaniami teorii ekonomii. Niektóre eksperymenty laboratoryjne w ekonomii były używane do testowania alternatyw polityki publicznej.

HISTORIA EKSPERYMENTÓW SPOŁECZNYCH

Wiele z fundamentów nowoczesnego podejścia do eksperymentów społecznych można prześledzić z powrotem do pracy słynnego statystyka Ronalda Fishera w latach dwudziestych. Fisher udoskonalił pojęcie losowego przydziału i wskazał, że żadne dwie grupy nigdy nie mogą być identyczne. Zauważył, że przypisanie badanych do grup leczenia i kontroli przez czysty przypadek (na przykład przez rzut monetą lub z tabeli liczb losowych) zapewnia, że różnice w średnim zachowaniu dwóch grup mogą być bezpiecznie przypisane leczeniu. Jako rezultat, kierunek przyczynowości może być określony przy użyciu podstawowych obliczeń statystycznych. Fisher także uznawał że randomizacja zapewniać sposób determinować statystyczne właściwości różnice w wynikach między grupami.

Pierwszy główny społeczny eksperyment był New Jersey Income Maintenance Eksperyment, który zaczynał w Stany Zjednoczone w 1968. Chociaż kilka mniejszych eksperymentów społecznych poprzedziło Eksperyment New Jersey (takich jak Projekt Przedszkolny Perry’ego w 1962 roku), były one znacznie mniejsze w zakresie i znacznie mniej wyrafinowane. Eksperyment z New Jersey testował ideę ujemnego podatku dochodowego (NIT), po raz pierwszy zaproponowaną przez ekonomistów Miltona Friedmana i Jamesa Tobina w latach 60-tych. Eksperyment w New Jersey był pierwszym z pięciu eksperymentów NIT przeprowadzonych w Ameryce Północnej (cztery w Stanach Zjednoczonych i jeden w Kanadzie), które miały bardzo wyrafinowane projekty i wiele grup traktowanych. Problemy z oceną niektórych aspektów tych złożonych eksperymentów doprowadziły do znacznie prostszych projektów eksperymentalnych w kolejnych latach.

Od lat 70. do chwili obecnej eksperymenty społeczne były prowadzone w wielu obszarach polityki społecznej, w tym w zakresie zdrowia dzieci i odżywiania, przestępczości i przestępczości nieletnich, wczesnego rozwoju dzieci, edukacji, ustalania cen energii elektrycznej, usług zdrowotnych, pomocy mieszkaniowej, szkoleń zawodowych oraz programów welfare-to-work. Godne uwagi eksperymenty obejmują Rand Health Insurance Experiment, w ramach którego testowano różne plany opłat za ubezpieczenie zdrowotne; Moving to Opportunity Experiments, w ramach którego testowano programy umożliwiające ubogim rodzinom wyprowadzenie się z mieszkań komunalnych; cztery eksperymenty związane z ubezpieczeniem od bezrobocia, w ramach których testowano efekty różnych zachęt finansowych mających skłonić bezrobotnych do powrotu do pracy; oraz szereg eksperymentów związanych z pomocą społeczną, w ramach których testowano sposoby pomagania odbiorcom pomocy społecznej w znalezieniu pracy.

LIMITACJE EKSPERYMENTÓW SPOŁECZNYCH

Ale choć powszechnie uznawane za idealny sposób określania efektów przyczynowych proponowanych polityk społecznych, eksperymenty społeczne mają kilka istotnych ograniczeń. Po pierwsze, i być może najważniejsze, eksperymenty społeczne wymagają, aby grupa kontrolna została pozbawiona zmiany polityki, którą otrzymała grupa leczona. Ponieważ grupy kontrolne w eksperymentach społecznych są zazwyczaj w niekorzystnej sytuacji, odmowa usług programowych może być postrzegana jako naruszenie zasad etycznych, co ogranicza eksperymenty społeczne do miejsc, w których zasoby uniemożliwiają objęcie pomocą wszystkich kwalifikujących się osób. Ponadto, zabiegi, które pogarszają sytuację uczestnika są również postrzegane jako nieetyczne i politycznie niewykonalne.

Po drugie, chociaż dobrze zaprojektowane eksperymenty mają wysoki stopień ważności wewnętrznej (wnioski są ważne dla badanej próby), mogą nie mieć ważności zewnętrznej (nie można ich uogólnić na inne warunki). Jednym z powszechnych zarzutów wobec eksperymentów jest to, że z powodu ich ograniczonego rozmiaru, nie generują one makroekonomicznych, „wspólnotowych” efektów, które generowałby w pełni działający program. Na przykład, w pełni funkcjonujący program szkolenia zawodowego może wpłynąć na płace i zatrudnienie osób nieuczestniczących w programie, a także na normy społeczne i postawy, podczas gdy eksperyment o ograniczonym rozmiarze tego nie zrobi. Dodatkowo, nie ma sposobu, aby wiedzieć na pewno, czy udany eksperyment w jednym miejscu byłby udany w innym, zwłaszcza, że eksperymenty społeczne są zazwyczaj przeprowadzane w miejscach, które nie są wybierane losowo, ale ze względu na ich zdolność i gotowość do udziału w eksperymencie.

Po trzecie, eksperymenty społeczne wymagają czasu na zaprojektowanie i ocenę, zazwyczaj kilku lat. Decydenci polityczni mogą nie chcieć czekać wymaganego czasu, aby dowiedzieć się, czy dany program działa.

Wreszcie, w praktyce często okazuje się, że trudno jest wprowadzić losowy przydział. Z tego czy innego powodu, jednostki mogą nie chcieć uczestniczyć w badaniach, a w przypadkach, gdzie wymagana jest współpraca pomiędzy badaczami i agencjami rządowymi, niektórzy mogą nie chcieć w nich uczestniczyć. W rezultacie, badane grupy terapeutyczne i kontrolne mogą okazać się niereprezentatywne dla populacji docelowej.

Z powodu różnych ograniczeń eksperymentów społecznych, opracowano inne sposoby oceny efektów polityki społecznej. Są one ogólnie określane jako metody „nieeksperymentalne” lub „quasi-eksperymentalne”. Metody nieeksperymentalne monitorują zachowanie osób poddanych nowej polityce (grupa terapeutyczna) i wybierają „grupę porównawczą”, która ma pełnić rolę grupy kontrolnej. Ale ponieważ randomizacja nie jest używana do wyboru dwóch grup, nigdy nie wiadomo na pewno, czy grupa porównawcza jest identyczna z grupą leczoną w sposób inny niż otrzymanie leczenia. Wielu badaczy dopasowuje członków grupy leczonej do osób w populacji nieuczestniczącej, aby grupy były jak najbardziej podobne. Dopasowania są zazwyczaj dokonywane przy użyciu cech demograficznych i ekonomicznych, takich jak wiek, wykształcenie, rasa, miejsce zamieszkania, historia zatrudnienia i zarobków, i tak dalej. Jedną z popularnych technik dopasowania jest propensity score matching, która wykorzystuje średnią ważoną obserwowanych cech ekonomicznych i demograficznych populacji nieuczestniczącej w celu stworzenia grupy porównawczej.

Szczególnie atrakcyjną metodą nieeksperymentalną jest „naturalny eksperyment”. Naturalne eksperymenty często są używane do testowania efektów polityki społecznej już istniejącej. Eksperyment naturalny wykorzystuje sposób, w jaki nowa polityka została wprowadzona w życie, tak że grupa porównawcza jest prawie prawdziwą grupą kontrolną. Na przykład, pobór do wojska (bycie uprawnionym do poboru) podczas wojny w Wietnamie odbywał się poprzez narodową loterię, która wybierała osoby do służby wojskowej wyłącznie na podstawie ich daty urodzenia. Tak więc teoretycznie grupa wybrana do służby wojskowej powinna być identyczna z tymi, którzy nie zostali wybrani, ponieważ jedyną różnicą jest data urodzenia. Naukowcy chcący sprawdzić wpływ poboru wojskowego na przyszłe zachowania jednostek mogliby porównać wyniki (na przykład osiągnięcia edukacyjne lub zarobki) tych, którzy zostali wcieleni, z tymi, którzy nie zostali wcieleni, i bezpiecznie przypisać „wpływy” poborowi (Angrist 1990). Ponieważ nie wszystkie osoby wcielone do wojska faktycznie służą w wojsku i ponieważ niektóre osoby niewcielone do wojska zgłaszają się na ochotnika do służby wojskowej, możliwe jest również oszacowanie wpływu rzeczywistej służby wojskowej na przyszłe zachowanie poprzez dostosowanie wpływu poboru do różnic w proporcji służących w wojsku w grupie leczonej i porównawczej. Jakkolwiek, the ważność ten procedura spoczywać zasadniczo na the porównywalność the wojskowy usługa w the dwa próbka.

THE FUTURE OF SOCIAL EXPERIMENTS

Social eksperyment zmieniać w charakter od the opóźniony 1960s. Wiele wczesnych eksperymentów społecznych, takich jak eksperymenty NIT, eksperymenty ubezpieczenia od bezrobocia i eksperyment ubezpieczenia zdrowotnego Rand, testowało „powierzchnię odpowiedzi”, w której badani otrzymywali „kwantyfikowalne” traktowanie w postaci różnych stawek podatków lub dotacji. W przeciwieństwie do tego, większość nowszych eksperymentów społecznych jest „czarną skrzynką”, co oznacza, że pakiet zabiegów jest podawany grupie leczonej i nie jest możliwe oddzielne zidentyfikowanie efektów przyczynowych każdego składnika pakietu.

Czarne skrzynki eksperymentów zostały skrytykowane, ponieważ mają tendencję do znacznie mniejszej generalizacji niż eksperymenty z powierzchnią odpowiedzi. Dlatego też wielu badaczy wezwało do powrotu do ewaluacji nieeksperymentalnej jako preferowanej metody analizy efektów polityki społecznej. Jednak zwolennicy metod eksperymentalnych kontrargumentują, że eksperymenty społeczne powinny pozostać podstawą ewaluacji polityki społecznej, ponieważ ich zalety są nadal ogromne w porównaniu z metodami nieeksperymentalnymi (Burtless 1995). Próbując „dostać się do wnętrza czarnej skrzynki”, zwolennicy eksperymentu społecznego jako narzędzia ewaluacji zaproponowali sposoby łączenia eksperymentalnych i nieeksperymentalnych metod ewaluacji w celu identyfikacji efektów przyczynowych polityki społecznej (Bloom 2005). Metody nieeksperymentalne są konieczne z powodu błędu selekcji, który pojawia się, gdy członkowie grupy leczonej, którzy otrzymują pewne elementy leczenia, nie są losowym podzbiorem całej grupy leczonej. W przyszłości, ocena polityki społecznej może w większym stopniu wykorzystywać obie metodologie oceny – wykorzystując eksperymenty, gdy jest to wykonalne i łącząc je z metodami nieeksperymentalnymi, gdy eksperymenty nie mogą odpowiedzieć na wszystkie istotne pytania dotyczące polityki.

SEE ALSO Negative Income Tax

BIBLIOGRAFIA

Angrist, Joshua D. 1990. Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social Security Administrative Records. American Economic Review 80 (3): 313-336.

Bloom, Howard S., ed. 2005. Learning More from Social Experiments. New York: Russell Sage Foundation.

Burtless, Gary. 1995. The Case for Randomized Field Trials in Economic and Policy Research. Journal of Economic Perspectives 9 (2): 63-84.

Greenberg, David, and Mark Shroder. 2005. The Digest of Social Experiments. 3rd ed. Washington, DC: Urban Institute Press.

Greenberg, David, Donna Linksz, and Marvin Mandell. 2003. Social Experimentation and Public Policymaking. Washington, DC: Urban Institute Press.

Smith, Vernon. 1994. Economics in the Laboratory. Journal of Economic Perspectives 8 (1): 113-131.

Philip K. Robins

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.