世界はデータで動いている 中学レベルで学ぶ統計・データリテラシー教材

分析ってどうするの? 仮説と検証のナゾを解こう

データ分析は料理に似ている

データがたくさんあっても、「で、どうすればいいの?」と困ったことない?データ分析は料理に似ている。材料(データ)があっても、何を作るか(目的)が決まらないと始まらない。
「売上のデータを分析して」じゃダメ。「なぜ先月の売上が下がったのか原因を知りたい」——こういう具体的な問いがないと、分析は始まらない。
データ分析の基本的な流れは、問題を明確にする→仮説を立てる→データを集める→分析する→結論を出す、という5つのステップ。特に大事なのが「仮説を立てる」こと。「きっと○○が原因だろう」と予想してみる。この予想があるから、どんなデータを集めるべきか、どう分析するべきかが決まってくる。
例えば、「なぜ学校の欠席者が増えたのか?」という問題。仮説A:インフルエンザが流行しているから。仮説B:修学旅行の疲れが出ているから。仮説C:テスト期間でストレスが溜まっているから——こうやっていくつか仮説を立ててみる。
問題を明確にする、仮説を立てる、データを集める、分析する、結論を出すという5つのステップ

仮説を検証する方法

次に、各仮説を確かめるためのデータを集める。
仮説A確認用なら、保健室の利用記録、地域のインフルエンザ患者数、欠席理由の詳細。
仮説B確認用なら、修学旅行の日程、修学旅行参加者の欠席率、学年別の欠席状況。
こうやって、仮説に合わせて必要なデータを特定していく。
実際にデータを分析してみる。グラフを作って視覚化したり、数値を計算して比較したり、パターンや傾向を探したり。
もう一つの例で見てみよう。「雨の日は電車が遅れる?」という疑問。仮説は「雨の日は晴れの日より電車が遅れやすい」。過去1年間の天気データと電車遅延データを集めて分析してみると、天気別の平均遅延時間は、晴れ2.3分、曇り2.8分、雨4.7分、雪8.2分。結論:仮説は正しい。雨の日は晴れの日の約2倍遅れやすい。
でも、ここで終わりじゃない。「なぜ雨の日は遅れるのか?」という新しい疑問が生まれる。乗客が増える?信号トラブル?線路の状態?——こうやって、一つの分析から次の疑問が生まれていく。

良い仮説を立てて分析思考を身につける

良い仮説には共通点がある。まず「具体的で検証可能」であること。
「頑張れば成績が上がる」じゃダメ。「勉強時間が2倍になれば、テストの点数が10点上がる」——こういう風に、数値で表現できる仮説が良い。
複数の仮説を考えることも大事。「なぜカフェが混雑するのか?」という問いに対して、天気が悪いから、近くでイベントがあるから、SNSで話題になったから、新メニューが人気だから——色々な可能性を考える。
よくある間違いもある。「結論ありきの分析」(最初から答えを決めて、それに合うデータだけ探す)、「相関と因果の混同」(「関係がある」ことと「原因と結果」は別物)、「サンプルサイズの無視」(3人に聞いて「みんなそう言ってる」はダメ)。
データ分析の考え方は、勉強だけじゃなく日常生活でも使える。「なぜこのお店は人気なの?」「どうして今日は道が混んでるの?」——こういう普段の疑問を、分析思考で考えてみる。
部活選びで過去の活動実績を調べる、進路選択で就職率や満足度を確認する、買い物で口コミや評価をチェックする——決断するときにデータを使う習慣をつけよう。