2009/06/05

Deaton vs. Imbens

Levitt のblog (一ヶ月以上前の投稿ですが) で開発経済学の大御所 Deaton と Harvard の計量経済学者 Imbens のバトルが紹介されてました。フォローしとこ(Deatonの論文Heackman and Urzmaの論文Imbensの論文)。以下議論のざっくりとした要約です。間違ってたら指摘して下さい。

Deatonは、最近の開発経済学のはやりのフィールド実験や、あるいは労働経済学者の操作変数法やregression discontinuity design(訳語がわからん)による因果効果の推定 (impact evaluation)が大嫌いで、すごい勢いで攻撃しています。経済理論に基づかない回帰分析なんて全然役に立たない、もっと理論をもとに実証分析をデザインせよ、とのこと。やり玉に上がっている論文は有名な論文ばかりで、私が読んだときには、なるほどこうすればある政策の因果効果(causal effect)を識別(identify)できるのかと感心してしまったものばかりです。(例えば、Angrist and Lavy の小学校のクラスのサイズと子供の成績に関する論文やAcemoglu, Johnson, and Robinsonの植民地時代に宗主国が導入した制度の違いと現代のその国のパフォーマンスとの関係に関する論文など。)攻撃の焦点は、以下の2点(1)internal validity(2)external validity。(1)は因果効果の推定値が調査対象としている個体群のなかで妥当かどうかという議論で、他方(2)は因果効果の推定値を調査対象外の個体群に対して一般化できるかどうかという議論。Deatonの主張は、(1)に関しては、ある政策の効果を知りたいとき、操作変数法で推定できるのは高々LATE(Local Average Treatment Effect)で、これは本当に知りたいATE(Average Treatment Effect)とかATT(Average Treatment Effect on the Treated)とは一般に異なる。それらが等しくなる為には、沢山の仮定が必要で、そんなもの使いものにならん、もっと理論を用いてその効果が生まれるメカニズムを知ろうとしないと意味が無い、という。また、ランダム化実験(randomized experiment)をしたところで、ATEは推計できるけど、Median Treatment EffectとかQuantile Treatment Effectとか求まらないし、また個体ごとにTreatment Effectが異なる場合、その平均値の分散は自明じゃないから既存論文の多くの帰無仮説の検定も当てにならんし、さらに悪い事に経済学の文脈で理想的なランダム化実験なんか不可能だし、それならこれまで計量経済学が悪戦苦闘して来た識別の問題をクリアしてるとは全くもって言い難い。だから、ランダム化実験による因果効果の評
価なんて大した価値はない、とのこと。(2)に関しては、効果のメカニズムが分からないとランダム化実験だとか操作変数法だとかで、ある環境のもとでその効果を計測しても、環境が違ったらその計測値は役にたたんでしょ、と。

一方、LATEの理論を生み出したImbensはDeaton論文に対して反撃しています。論文のタイトルがイカしています、"Better LATE than Nothing"。Imbensはランダム化実験が可能なら、ランダム化実験から得られる証拠こそ最も信頼できるものだし、そもそも因果効果の識別の分野で、自然実験(natural experiment)を利用した操作変数法とかランダム化実験が浸透してきたのは、構造推定が役に立たなかったからだろ、とLalonde (1986)の論文を引用しつつ主張します。(Lalondeの論文では、ランダム化実験のデータを用いて職業訓練の効果を推定し、その推定値を、同じデータを用いて同様の効果を構造推定(Heckman Selection Model)した推定値とを比較し構造推定による推定結果がいかに加減かを示している。)また、Deatonが言うように、ランダマイズ実験でMedian Treatment Effectを推定できないけど、どんなメソッドだろうと余計な(しかもuntestableな)仮定なしで、そんなもん推定できないだろ、と。さらに、政策策定者が知りたいのは、Deatonが言ってるMedian Treatment Effect とかQuantile Treatment EffectとかといったTreatment Effect(Yi1-Yi0)の分布じゃなくて、Yi1とYi0それぞれの分布だろ、 と。(ここで、Yi1:Treatmentを受けた場合の結果、Yi0:Treatmentを受けなかった場合の結果、i は個体の識別子を表す。ちなみに、ここで議論している問題の元凶は、個体iに関して実際に観察できるのはYi1かYi0のどちらか一方なのに、E[Yi1-Yi0]とかYi1とYi0それぞれの分布を知りたいという欲求から来ている。)External validityに関しては、ランダム化実験が役に立たない訳ではなく、構造モデルを検証するのに使えるよ、だから構造モデルとランダム化実験の組み合わせが有用だよ、と。

開発経済学の分野では、MITのPoverty Action Labが牽引するフィールド実験の異常な盛り上がりに批判的な研究者も多いのですが、Deatonのようにここまで攻撃している論文は初めてではないでしょうか。しかし、Deatonも、経済理論から演繹される理論予測をフィールド実験で検証する、というごく最近の潮流はある程度評価しているようです(例えば、Todd and Wolpine (2006)とか Karlan and Zinman (2008)とか Giné and Karlan (2008)とか)。

学会の最先端のところでは激しい賞賛と批判に晒されて、学問自体が進化している感じがしますね。Deaton のような厳しい批判者もこの分野の発展を後押しするのに貢献しているといったところでしょうか。私がこの分野で生き残って行ける可能性はあるのでしょうか???

以下のはDeatonとImbensの論文で引用されていた面白そうな論文です。

Chattopadhyay, Raghabendra, and Esther Duflo, 2004, "Women as policy makers: evidence from a randomized controlled experiment in India," Econometrica, 72(5), 1409–43.

Todd, Petra E. and Kenneth I. Wolpin, 2006, "Assessing the impact of a school subsidy program in Mexico: using a social experiment to validate a dynamic behavioral model of child schooling and fertility," American Economic Review, 96(5), 1384–1417.

Urquiola, Miguel, and Eric Verhoogen, 2008, "Class-size caps, sorting, and the regression-discontinuity design," American Economic Review, forthcoming.

0 件のコメント:

コメントを投稿