社会実験

1月 14, 2022

HISTORY OF SOCIAL EXPERIMENTS

LIMITATIONS OF SOCIAL EXPERIMENTS

THE FUTURE OF SOCIAL EXPERIMENTS

BIBLIOGRAPHY

社会実験とは社会政策の影響を調べるために2グループにランダムに人間を割り振ることである。 一方のグループは「処置グループ」と呼ばれ、新しいプログラムへの参加を提案または要求され、もう一方のグループ「対照グループ」は既存のプログラムを受ける。 この2つのグループは、時間の経過とともに監視され、その行動の違いを測定する。 例えば、社会実験では、失業者が仕事を見つけると金銭的な報酬を与えるプログラムとそうでないプログラムを比較することができる。 あるいは、社会実験では、新しいカリキュラムを受けた学校の生徒とそうでない学校の生徒を比較することができる。 無作為化手続きにより、2つのグループが類似していることが保証されているため、彼らの行動における測定された違いは、新しいプログラムに因果関係をもって帰結させることが可能である。 このような行動の違いは、プログラムの「影響」と呼ばれることがある。 社会実験において一般的に測定される行動成果には、所得、雇用、移転支出の受領、健康、教育達成、子どもの発達などがある。 社会実験のサンプルサイズは、100人以下から1万人を大きく超えるまで様々である。 そのような場合、各治療群は異なるプログラムに割り当てられる。 様々な治療群は、テストされたプログラムのうち2つのプログラムの差分影響を決定するために互いに比較されるかもしれないし、現状に対するプログラムの相対的影響を決定するために対照群と比較されるかもしれない。 被験者は一般集団から無作為に選ばれるか、より一般的には、不利な立場にある人々などの対象集団から無作為に選ばれる。

社会実験は1960年代後半から広く利用されている。 Greenberg and Shroder (2005)によれば、それ以来、ほぼ300の社会実験が実施されている。 社会実験は、治療群に新薬や処置が与えられ、対照群にはプラセボや標準的な治療が与えられるという、医学の実験室実験に非常によく似たものである。 経済学の分野でも1970年代から実験室実験が盛んに行われているが(Smith 1994)、社会実験と異なる点は、社会プログラムの効果よりも、均衡の存在や市場取引の効率性など、主に経済理論の様々な側面を検証するために使われる点である。 また、経済学実験には通常、対照群が存在しない。その代わりに、現金で動機づけられた処理群のメンバーが、経済理論の予測と一致するような行動をとるかどうかを判断するために、制御された環境設定において市場取引に従事する機会が与えられている。 2937>

HISTORY OF SOCIAL EXPERIMENTS

社会実験の近代的アプローチの基礎は、1920年代の有名な統計学者ロナルド・フィッシャーの仕事にまで遡ることができる。 フィッシャーは無作為割付の概念を改良し、2つのグループが同一であることはあり得ないと指摘した。 彼は、純粋な偶然(例えば、コインをひっくり返すか、乱数表から)によって被験者を治療群と対照群に割り当てることで、2つの群の平均行動の違いは、安全に治療に帰することができると指摘した。 その結果、因果関係の方向は基本的な統計計算で決定することができる。 フィッシャーはまた、無作為化が群間の結果の違いの統計的特性を決定する手段を提供することも認識していた。

最初の大規模な社会実験は、1968年に米国で開始されたニュージャージー州所得維持実験であった。 ニュージャージー実験に先立ち、いくつかの小規模な社会実験(1962年のペリー幼児教室プロジェクトなど)が行われていたが、それらは規模がはるかに小さく、洗練されていなかった。 ニュージャージー実験では、1960年代に経済学者のミルトン・フリードマンとジェームズ・トービンが初めて提唱した負の所得税(NIT)のアイデアを検証した。 ニュージャージー実験は、北米で行われた5つのNIT実験のうちの最初の実験であり(米国で4つ、カナダで1つ)、非常に洗練されたデザインと多くの処理群を持った実験であった。 1970年代から現在に至るまで、子どもの健康と栄養、犯罪と少年非行、幼児発達、教育、電力価格、医療サービス、住宅支援、職業訓練、福祉労働プログラムなど、数多くの社会政策分野で社会実験が実施されてきた。 注目すべき実験には、さまざまな健康保険の自己負担プランを検証した「ランド健康保険実験」、貧困家庭の公営住宅からの転出を可能にするプログラムを検証した「機会への移動実験」、失業者の職場復帰を誘導するためのさまざまな金銭的インセンティブの効果を検証した4つの失業保険実験、生活保護受給者の就職支援方法を検証した多くの「福祉から仕事への実験」などがある。

LIMITATIONS OF SOCIAL EXPERIMENTS

提案された社会政策の因果関係を決定する理想的な方法として広く認められているが、社会実験にはいくつかの重要な限界がある。 まず、おそらく最も重要なことは、社会実験では、治療群に与えられた政策変更を対照群に否定させる必要があることである。 社会実験における対照群は一般的に不利な立場に置かれているため、プログラム・サービスの拒否は倫理的な違反を構成すると見なされる可能性があり、したがって、社会実験は、資源によってすべての適格者がサービスを受けることができない場所に限定される。 また、参加者をより悪くする治療も、非倫理的で政治的に実現不可能とみなされる。

次に、よく設計された実験は高度な内部妥当性(推論はテストしたサンプルに対して有効)を持っているが、外部妥当性(他の設定に一般化できない)を持っていない可能性がある。 実験に対するよくある批判は、規模が限られているため、完全に運用されているプログラムが生み出すであろうマクロ経済的、「コミュニティ」的な効果を生み出さないというものである。 例えば、完全に運用されている職業訓練プログラムは、非参加者の賃金や雇用に影響を与え、社会規範や態度に影響を与える可能性があるが、限られた規模の実験ではそうならないだろう。 さらに、ある場所で成功した実験が他の場所でも成功するかどうかを確実に知る方法はない。特に、社会実験は通常、無作為ではなく、実験に参加する能力と意欲のある場所を選んで行われるからである。 政策立案者は、特定のプログラムが機能するかどうかを調べるために必要な時間を待つことを望まないかもしれない。

最後に、実際には、ランダム割り当てを実施することはしばしば困難であることが判明している。 何らかの理由で、個人は研究調査に参加したがらないかもしれないし、研究者と政府機関の協力が必要な場合、参加したくない人もいるかもしれない。 その結果、実験された治療群と対照群は、対象集団を代表していないことが判明することもある。

社会実験のさまざまな限界のために、社会政策の効果を評価する他の手段が開発されてきた。 これらは一般に「非実験的」または「準実験的」な方法と呼ばれる。 非実験的方法は、新しい政策を受ける人(治療群)の行動を監視し、対照群の役割を果たす「比較群」を選択する。 しかし、2つのグループの選択には無作為化が用いられていないため、比較グループが治療を受けている以外の点で治療グループと同一であるかどうかは、確実には分からない。 多くの研究者は、両群をできるだけ類似させるために、治療群のメンバーを非参加者の人々とマッチングさせています。 この照合は、通常、年齢、学歴、人種、居住地、雇用・収入履歴などの人口統計学的・経済学的特徴を用いて行われる。 人気のあるマッチング手法のひとつに傾向スコアマッチングがあり、これは非参加者の観察された経済的・人口統計的特性の加重平均を使用して比較群を作るものである

特に魅力的な非実験的手法として “自然実験 “がある。 自然実験は、すでに実施されている社会政策の効果を検証するために用いられることが多い。 自然実験では、新しい政策が実施されていることを利用し、比較群がほぼ真の対照群となるようにする。 例えば、ベトナム戦争時の徴兵制(徴兵資格)は、生年月日だけで兵役に就く人を選ぶ国民くじで行われました。 従って、理論的には、生年月日の違いだけで、兵役に選ばれたグループと選ばれなかったグループは同一であるはずです。 個人の将来の行動に対する徴兵制の効果を検証しようとする研究者は、徴兵された人とされなかった人の成果(例えば、教育達成度や収入)を比較し、その「影響」を安全に徴兵制に帰することができる(Angrist 1990)。 徴兵された人すべてが実際に兵役に就くわけではなく、徴兵されていない人の中にも兵役に志願する人がいるので、治療群と比較群における兵役の割合の違いによって徴兵の影響を調整することによって、実際の兵役が将来の行動に与える影響を推定することも可能である。 しかし、この方法の妥当性は、2つのサンプルにおける兵役経験者の比較可能性に決定的に依存する。

社会実験の将来

社会実験は、1960年代後半以降その性格を変化させてきた。 NIT実験、失業保険実験、ランド健康保険実験などの初期の社会実験の多くは、被験者に税や補助金率を変化させるという「定量化可能な」処置を与える「応答曲面」をテストしたものであった。 これに対し、最近の社会実験の多くは「ブラックボックス型」であり、処理群に処理パッケージを与え、パッケージの各要素の因果関係を個別に識別することは不可能である

ブラックボックス型実験は、反応面型実験に比べて一般化しにくい傾向があるため批判されている。 それゆえ、多くの研究者が、社会政策の効果を分析する好ましい方法として、非実験的評価への回帰を要求している。 しかし、実験的手法を支持する人々は、非実験的手法に比べれば利点が大きいので、社会実験が社会政策評価の基礎であり続けるべきだと反論している(Burtless 1995)。 ブラックボックスの中に入る」試みとして、評価手段としての社会実験に同調する人々は、社会政策の因果的効果を特定するために、実験的評価手法と非実験的評価手法を組み合わせる方法を提案している(Bloom 2005)。 非実験的手法が必要とされるのは、治療のある構成要素を受けた治療群のメンバーが治療群全体のランダムな部分集合ではない場合に生じる選択バイアスのためである。 将来的には、社会政策評価は、可能な限り実験を使用し、実験が関連するすべての政策課題に答えることができない場合には非実験的手法と組み合わせるという、両方の評価手法をより活用することができるだろう。 生涯所得とベトナム時代の徴兵抽選。 社会保障制度記録からの証拠 社会実験からさらに学ぶ. New York:

Burtless, Gary. 1995. を参照。 このような場合、「社会実験」を実施することが重要である。 2005. The Digest of Social Experiments. このような状況下において,「社会実験」の重要性はますます高まっている. 2003. を参照。 1994. を参照。 Journal of Economic Perspectives 8 (1): 113-131.

Philip K. Robins

.

コメントを残す

メールアドレスが公開されることはありません。