世界はデータで動いている 中学レベルで学ぶ統計・データリテラシー教材

相関関係 vs 因果関係:見えるデータと隠れた真実

アイスクリームと水難事故の奇妙な関係

夏になると、アイスクリームの売上が増える。同時に、水難事故も増える。
じゃあ「アイスクリームを食べると事故に遭いやすくなる」のか?当然、そんなわけない。
両方とも「気温が高くなる」ことが本当の原因だ。これが相関関係と因果関係の違いなんだ。
相関関係とは、2つの事柄が「一緒に変化する」という関係。身長が高い人は靴のサイズも大きい、勉強時間が長い人はテストの点数も高い、気温が上がるとかき氷の売上も上がる——こういう関係。でも、「一緒に変化する」ことと「原因と結果」は全く別物。
因果関係は「原因と結果」の関係。雨が降ったら地面が濡れる——これは明確な因果関係。でも、アイスと水難事故は相関があっても因果関係はない。どちらも「暑い夏」という共通要因の影響を受けているだけ。データを見るとき、この2つを混同すると、とんでもない間違いをしてしまう。

面白い相関関係の罠

携帯電話の所持率が高い国は学力も高い?これも相関関係だけど、携帯を持つと頭が良くなるわけじゃない。
本当の要因は「経済発展度」かもしれない。豊かな国は携帯も普及するし、教育にもお金をかけられる。
朝ごはんを食べる生徒は成績が良い?これも本当に朝ごはんが原因なのか?生活習慣全体がしっかりしている家庭の子どもは、朝ごはんも食べるし、勉強時間も確保できている——そういう可能性もある。
「第三の要因」を常に考える必要がある。
海賊の数が減ると地球温暖化が進む?昔と比べて海賊は減り、同時に気温は上がっている。でも、海賊と温暖化に因果関係はない。
こういう「偽の相関」はいくらでも見つけられる。
データの数が少なすぎる場合も要注意。特殊な条件での観察だけで判断すると、間違った結論に達する。

データの裏側を読む力

2つの事柄に関係があるように見えたら、まず「他に影響している要因はないか?」を考えよう。「本当の原因は別にないか?」「偶然の一致ではないか?」——こういう視点が大事だ。
確認バイアスにも注意が必要。自分の考えに都合の良いデータだけを見る、反例を無視する——こういう傾向は誰にでもある。
相関関係と因果関係を区別できるようになると、ニュースや広告の見方が変わってくる。
「○○すれば△△になる」という主張を見たとき、「本当に因果関係があるのか?」と疑問を持てるようになる。
健康食品の広告で「飲んだ人の80%が満足」と書いてあっても、「プラセボ効果じゃないの?」「比較対象はあるの?」と考えられる。
データの裏側まで考える力——これがデータリテラシーだ。
見えているデータだけじゃなく、見えていない真実を探す。それができるようになったとき、君は本当の意味で「データを読める人」になれる。