目的:
因果関係と単なる相関関係の違いを再確認していただきます。
因果関係を証明する方法を研究いただきます。
「それはウソ」の事例を研究していただきます。
ねらい:
因果関係に強くなりましょう。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
二つの数値間に相関関係がある場合に、
それが因果関係によるものか単なる相関関係にすぎないのか
を論じている書です。
単なる相関を因果関係であるかのように言われることは、
結構起きています。
本書の冒頭にこういう解説があります。
相関があると言われたら以下を疑ってみようというものです。
1.全くの偶然ではないか。
例として、ミスアメリカの年齢と暖房器具による死亡者数
(非常にきれいな相関関係の図が示されています)、
スタジオジブリの映画が日本のテレビで放映されると
アメリカの株価が下がる
「風が吹けば桶屋が儲かる」の類です。
2.「第3の変数」は存在していないか。
「体力がある子どもは学力が高い」は、
体力があるから学力が高いのではなく、
体力のある子どもの家庭は裕福で
子どもの教育にも投資できる、からだとされている。
第3の変数を「交絡因子」というそうです。
3.因果関係は逆ではないか
警察官の多い地域では犯罪が多い、のではなく、
犯罪が多いから警察官が多いのです。
友人が少ないから控えめになるのではなく、
控えめだから友人が少ないのです。
これらの例はすぐに分かりますが、
実際にはこの逆転の認識が起きているようです。
しかしなぜこれらの解明が経済学なのだろう?
と思いました。
ところが、本書中に以下の記述がありました。
少し長くなりますが、因果関係論全体を理解するのにも
有効ですのでご紹介させていただきます。
ーーーーーーーーーーーーーーーーーーーーーーーー
因果推論はどのように発展してきたか
経済学・統計学における因果推論
実は、経済学における因果推論の歴史はそう長くない。
1940年代にはノルウェーのオスロ大学の経済学者
トリグヴェ・ホーヴェルモが自身の論文の中で
反事実の概念をほのめかす表現を用いているものの、
正確に定義されたとはとうてい言えないものだった。
それが1990年代に入ると、大きな変化が起こる。
当時、ハーバード大学経済学部に所属していた著名な
計量経済学者であるグイド・インベンスや、
マサチューセッツ工科大学の労働経済学者である
ヨシュア・アングリストが、
ドナルド・ルービンと協働するようになり、
「ルービンの因果推論モデル」を経済学に取り入れたのである。
(注)
ハーバード大学とマサチューセッツ工科大学はともに
アメリカのマサチューセッツ州ケンブリッジ市にあり、
地理的な近接性が
彼らのコラボレーションを生むことに一役買ったのだろう。
ルービンとインベンスが共著し、
2015年に刊行されたにもかかわらず、
早くも「因果推論」の最も代表的な教科書だと名高い
"Casual Inference for Statistics,Social,
and Biomedical Sciences:An Introduction"は、
彼らが長年ハーバード大学の経済学部で実施してきた
授業の講義をもとに書かれたものだ。
経済学における因果推論の歴史があまり長くないのには
理由がある。
疫学や生物統計学では
「臨床試験」や「治験」と呼ばれる実験が可能だ。
しかし、経済学をはじめとする社会科学分野では、
実験は極めて難しい。
人間を対象にした実験をするには、
資金や倫理的な面に加え、政治的に困難が伴うことも多い。
このことが経済学から因果推論を遠ざけていたと見られている。
ところが、2000年代になると、経済学にはさらに新しい動きが
起こった。
実験経済学者であるシカゴ大学のジョン・リストや、
開発経済学の専門家集団であるマサチューセツツ工科大学の
貧困アクションラボ(J-PAL)の研究者グループが、
さまざまな壁を乗り越えて、
大規模な社会実験を実施し始めたのである。
貧困アクションラボは「ランダム化比較試験の専門機関」
とも言うべきもので、
ランダム化比較試験を用いた研究ばかりしているという徹底ぶりだ。
彼らは「政治的流行に左右されやすい政策を、
エビデンスに基づくものにする」という目標を掲げ、
ランダム化比較試験を「政策評価の理想形」と呼ばれるまでに
その地位を押し上げることに成功した。
経済学では、因果推論に基づいて政策の効果測定を行う
研究領域のことを「政策評価」と呼んでおり、
近年その体系化が急速に進展している。
疫学における因果推論
経済学・統計学とは別の流れで発展してきた因果推論の
考えかたもある。
その1つが疫学における因果推論である。
個人を対象にして病気の原因や治療法を研究するのが
「医学」研究だとすると、
「疫学」とは集団を対象として病気の原因や予防などを
研究する学問のことである。
医師や看護師など医学系のバックグラウンドがある方にとっては
この疫学における因果推論のほうが馴染みがあるかもしれない。
1990年代半ばにイスラエル系アメリカ人の計算科学者である
ジューディア・パールがDAG(因果ダイアグラム)と呼ばれる図を用いて
因果関係を明らかにする方法を開発した。
その後、因果ダイアグラムは、ハーバード大学の
ジェイムス・ロビンスやミゲル・ハーナン、UCLAの
サンダー・グリーンランドらによって、
医学や疫学の世界に広められた。
その結果、医学部や公衆衛生大学院でこの方法論が受け入れられ、
教育されるようになった。
因果ダイアグラムの最大の特徴は、
矢印を用いた図で因果関係を表現することである。
実は本書でしばしば登場している、矢印を用いて因果関係や
相関関係を表した図も
因果ダイアグラムであると考えることができる。
交絡因子は「原因と結果の両方に影響を与える第3の変数」
であるため、原因と結果の両方に矢印を引くことができた場合、
この第3の変数は交絡因子であると考えられる(図表8-2)。
そして、交絡因子であることがわかれば、マッチング法や
重回帰分析を用いて交絡因子の影響を取り除かないと、
因果関係を正しく評価することはできない。
一方で、矢印の向きが逆で、
原因から第3の変数に矢印が引ける場合には、
この第3の変数は
交絡因子ではないことがわかる
(因果関係の経路の中間にあるため「中間変数」と呼ばれる。図表8-3)。
中間変数に重回帰分析などを用いて対処してしまうと、
原因の本来の影響を過小評価してしまうことが知られている。
-------------------------------------------------------------------------------
(注)ルービンの因果モデルでは、すべての人には2つの
「潜在的な結果」があるとされた。
つまり、介入があるときの潜在的な結果と、
介入がないときの潜在的な結果の2つである。
しかし、どの人もそのいずれか片方しか観察できない。
実際に介入を受けた人は、介入を受けなかった場合の
潜在的な結果は観察できない。
一方で、実際には介入を受けなかった人は、
介入を受けたシナリオにおける潜在的な結果が観察できない。
つまり、すべての人がいずれか片方の潜在的な結果しか
観察できないということが、
因果推論の根本的な問題であるとルービンは考えた。
-------------------------------------------------------------------------------
本書の要約を以下に掲載します。
本書の記述は非常に分かりやすくなっています。
著者の聡明度がうかがわれます。
以下にご関心のある方はぜひ本書をご覧ください。
それは本当か?
設問
|
因果関係
有無
|
チョコレートの消費量が増えると ノーベル賞受賞者が増える? |
△
|
メタボ検診を受けていれば長生きできる |
×
|
医療費の自己負担割合と健康の関係 |
基本的には×
|
高齢者の医療費の自己負担割合が 増えても死亡率は変わらない |
○
|
女性医師は男性医師より優れている |
ある状況で○
|
「小さく生んで大きく育てる」は正しいか |
×
|
受動喫煙は心臓病のリスクを高めるか |
○
|
認可保育所を増やせば母親は就業するか |
×
|
最低賃金と雇用量の間に因果関係はあるか |
×
|
テレビを見ると子どもの学力は下がるか |
△
|
母親の学歴と子どもの健康の間 に因果関係はあるか |
○
|
女性管理職を増やすと企業は成長するのか |
ある国で×
|
勉強ができる友人と付き合うと学力が上がる? |
×
|
偏差値の高い大学に行けば収入は上がる? |
×
|
因果関係を証明する方法
方法名
|
内容
|
ランダム化
比較試験 | ランダムに分けた2グループを、介入群(検証しようとする条件を与えるグループ)と対照群(そうでないグループ)にして、結果の比較を行う。 |
例:メタボ検診受診者と非受診者で健康の差を測定する。 | |
自然実験
| たまたま起きた実験のような状況を利用して分析する。 |
例:入院患者のみを受け持つ医師の30日死亡率の差を過去のデータで分析した。 | |
差の差分析
| 介入群と対照群の介入前後の差を比較する。 |
例:広告を打った地域の売上の伸び(差)と広告を打たなかった地域の売上の伸び(差)を比較する。 | |
操作変数法
| 操作変数とは、結果には直接影響を与えないが、原因に影響を与えることで、間接的に結果に影響を与える可能性のある変数のことを言い、その状況下で結果を比較する。 |
例:テレビがない地域とテレビがある地域(家庭の生活状況等は同じ)での学力への影響の測定。 | |
デザイン
回帰不連続 | 連続的な値を持つ対象に対して人為的に限界値(カットオフ値という)を設定して与える条件を変更した場合に、その限界値の前後で大きな変化がみられるかどうかを分析する。 |
例:70歳で医療費の自己負担割合が3割から1割になる→受診率は大幅に上がるが、死亡率に変化はない!! | |
マッチング法
| 結果に影響を与えるような共変量(共通の変量)を用いて、対照群の中から、介入群によく似たサンプルをマッチさせて、比較する方法。マッチングが成り立つための条件は、結果に影響を与えるような共変量がすべて観察可能であるということである。 |
例:年齢、生まれた場所、学力テストの成績、出身高校の規模、両親の学歴や職業等の条件が同じ学生が、偏差値の高い大学に入った場合に卒業後の賃金に差があるかを調査した。 | |
重回帰分析
| 複数因子間の相関分析である。 |
例:飲酒・喫煙と肺がんの関係を分析する。それぞれの影響を測定できる。 |
因みに、
システム企画研修㈱が提供している問題分析の手法である
問題点連関図手法では、因果関係を本格的に追求します。
これまで、何万人かの方がこの手法を学びました。
それで分かったことは、
優秀で仕事ができる方の中に、
因果関係の整理がまったく苦手な人がいることです。
左が原因、右が結果の関係で整理します。
そこで、おかしいと思ったら「左だから右である」と読んでみなさい、
と指導するのですが、それでもダメなのです。
間違いの例:
0 件のコメント:
コメントを投稿