世界はデータで動いている 中学レベルで学ぶ統計・データリテラシー教材

分析結果の読み方と判断

データを疑う目を持とう

データ分析の結果を見せられたとき、「すごい!」と感動する前に、まず「本当にそうなの?」と疑問を持つことが大切だ。データは真実を語ることもあれば、誤解を招くこともある。
「そのデータ、どこから来たの?」——まず確認すべきは、サンプルサイズ(何人・何件のデータ?)、収集方法(アンケート?実験?観測?)、収集時期(いつのデータ?)、収集範囲(どの地域・年齢層・条件?)。
「中学生の95%がスマホを持っている」——これ、全国?それとも都市部だけ?何人に聞いた結果?いつの調査?同じ「95%」でも、条件が違えば意味が全く変わってくる。
グラフの「トリック」にも注意。縦軸の範囲が98万円〜102万円だと、4%の増加なのに、グラフでは巨大な変化に見える。縦軸を0円から始めれば、実際の変化の大きさが正しく表現される。円グラフも要注意。3D効果で誤解を招いていない?全体が何を表しているか明確?
相関関係と因果関係も区別しよう。アイスクリームの売上と水難事故件数は相関があるけど、アイスクリームが水難事故の原因ではない。本当の原因は「暑い夏」という共通要因だ。
情報を疑っている人のイラスト

平均値の罠を見抜け

「平均年収800万円の会社」——すごそう!でも実態は?社長が5000万円、部長4人が各1000万円、一般社員95人が各300万円。合計100人で平均は1185万円だけど、95%の人は300万円。平均値は極端な値に引っ張られる。
確認すべき指標は、中央値(データを並べたときの真ん中の値)、最頻値(最も多い値)、分布(データのばらつき具合)。
「統計的に有意」という言葉も要注意。薬Aと薬Bで「有意差」があっても、実際の効果の差が1%なら実用的ではない可能性がある。サンプル数が多ければ小さな差でも「有意」になる。統計的に有意≠実用的に重要なんだ。
ニュース記事を見るとき、「最新の研究によると...」→どんな研究?「専門家は語る...」→どの分野の専門家?「△△が××倍に増加」→元々の数値は?商品広告では、「利用者の95%が満足」→何人中95%?「従来品比30%向上」→何と比べて?「科学的に証明」→どんな実験で?
こういう質問を常に持つことが大事だ。

批判的思考を鍛える

信頼できる分析の特徴は、透明性(方法論が明確に記載)、再現性(他の人が同じ結果を得られる)、客観性(先入観や利害に左右されない)、限界の明示(できること・できないことが明確)、多角的検証(複数の方法で確認)。
怪しい分析の兆候は、結論ありき(最初から答えが決まっている感じ)、都合の良いデータだけ(不利な結果は隠している)、過度な一般化(限定的なデータから広い結論)、感情的表現(科学的でない煽り文句)、検証困難(方法や生データが非公開)。
SNSの情報を見るとき、拡散される情報ほど疑って、感情的な反応を誘う内容は要注意、元のソースまで確認する——これを習慣にしよう。
完璧な情報はない、不確実性の中で決断する、新しい情報で判断を更新する、「保留」も立派な判断——こういう柔軟な姿勢が必要だ。
質問する習慣(常に「なぜ?」「本当に?」)、ソース確認(元の情報まで辿る)、複数視点(異なる立場の意見も聞く)、数字の感覚(桁や比率の感覚を鍛える)——これらを実践することで、データに振り回されるのではなく、データを活用する人になれる。
データ分析の結果は強力な道具だけど、使い方を間違えると危険な武器にもなる。正しい読み方と判断力を身につけよう。