世界はデータで動いている 中学レベルで学ぶ統計・データリテラシー教材

用語集

中学生向けデータリテラシー教材 - 50音順表示

  • 遺伝形質いでんけいしつ
    親から子に受け継がれる特徴のことです。背の高さ、目の色など。メンデルは何世代にもわたってえんどう豆の交配こうはい実験を行い、この形質がどのような規則性きそくせいで受け継がれるかを統計的に明らかにしました。
    伊能忠敬いのうただたか
    江戸時代の日本の地図作成者です。日本全国を測量して、正確な日本地図を作りました。膨大なデータを手作業で整理し、統計的な手法を使って精度の高い地図を完成させました。データ活用で社会に大きな価値を生み出した歴史的な例です。
    因果関係いんがかんけい
    「AだからBが起こった」という原因と結果の関係のことです。例えば、雨が降ったから地面が濡れた——これは明確な因果関係。でも、「アイスクリームを食べる人が多い月は水難すいなん事故も多い」という場合、両方とも「気温が高い」という別の要因が原因かもしれません。データを見るときは、「本当に原因と結果なのか」を慎重に判断することが大切です。
    円グラフ
    全体を100%として、各要素がどのくらいの割合を占めているかを示すグラフです。予算の内訳うちわけ、好きな給食のメニューの分布など、全体に対する比率を理解するのに最適。ただし、複数の円グラフを比較するときは、数値で表した方が正確です。
    オープンデータ
    政府や自治体、企業などが公開しているデータで、誰でも自由に使えるものです。人口統計とうけい、天気のデータ、交通情報など、生活に役立つ情報がたくさんあります。ただし、そのままでは使いにくいことが多く、整理したり形式を変えたりする作業が必要。このデータを上手に活用できると、社会の課題解決に役立てることができます。
    折れ線グラフ
    時間とともに変化する様子を追うのに向いたグラフです。1週間の気温の推移すいい、株価の動き、ウイルス感染者数など。線の上下で傾向が一目瞭然いちもくりょうぜん。複数の線を重ねて比較することもできます。変化の速さや方向を視覚的に理解できます。
  • 確証かくしょうバイアス
    自分の意見に都合の良い情報ばかり集めて、反対の情報は無視してしまうかたよった見方のことです。例えば「猫は気分屋だ」と思っている人は、猫が勝手に行動するときだけ覚えていて、甘えてくる様子は忘れてしまいます。データを使うときは「自分の考えに合わない情報」もしっかり見ることが大切です。
    確率かくりつ
    「ある出来事が起こる可能性」を0%から100%の数字で表したもの。0%は絶対に起こらない、50%は半々、100%は必ず起こるという意味です。サイコロで1の目が出る確率は約17%(1/6)。ただし「100回振ったら17回出る」という意味ではなく、「何度も繰り返したときの平均的な傾向」を表しています。
    期待値きたいち
    サイコロを何度も振ったときに平均的に出現する値のことです。例えば、1~6の目が同じ確率で出るサイコロなら、期待値は(1+2+3+4+5+6)÷6=3.5。「平均するとこのくらいになるはず」という意味ですが、実際に1回目が3.5の目が出ることはありません。期待値は「長い目で見た傾向」を表す重要な考え方です。
    ギャンブラーの錯覚さっかく
    「最近当たっていないから、次は当たりやすいはず」と考えることです。例えば、コインを10回投げて全部表が出ても、11回目に裏が出る確率は変わらず50%のまま。前の結果は次の結果に影響しません。この勘違いをしやすいので「ギャンブラーの錯覚」と呼ばれています。確率を理解するために、知っておきたい大切な考え方です。
    極座標きょくざひょうグラフ
    円を中心として、角度と距離で座標を表すグラフです。トサカ図ローズチャートはこのタイプ。時間の周期性や方向の情報を表現するのに向いています。通常のグラフより複雑ですが、特定の情報を表現するのに非常に効果的です。
    偶然ぐうぜん
    サイコロを振ったときの1の目が出るか、それとも別の目が出るか——こうした「どうなるか予測できない出来事」を偶然といいます。偶然に見える出来事でも、何度も繰り返すとある規則性きそくせいや傾向が現れることがあります。これが確率やデータの世界で大事なポイント。天気や宝くじの当たり外れなど、毎日の生活には偶然がいっぱい。その偶然を数字で理解する力が、これからの社会で重要になります。
    グラフの色選択
    グラフを作る時に、見やすく分かりやすい色を選ぶことです。色だけで区別すると、色覚特性がある人には見えにくいかもしれません。そのため、色だけではなく模様や形も変えるといいでしょう。データを「正確に」「公平に」伝えるために、色選びは思った以上に重要です。
    グラフの使い分け
    目的に合ったグラフを選ぶことです。量を比較するなら棒グラフ、変化の様子を追うなら折れ線グラフ、全体に対する割合なら円グラフ、2つの項目の関係なら散布図。同じデータでも、グラフの種類が違うと、受け取るメッセージも変わります。「何を伝えたいか」を最初に決めることが大切です。
    クリミア戦争
    19世紀(1853年~1856年)にオスマン帝国とロシアの間で起きた戦争です。この戦争で活躍したフローレンス・ナイチンゲールが、データと統計の力で医療改革を実現しました。歴史の教科書に登場する出来事ですが、データリテラシーの歴史を考えるときにも重要な事件です。
    トサカ図
    フローレンス・ナイチンゲールが考案した特別なグラフの一種です。円を12等分して各月を表し、色分けで死因を区別し、面積で死亡者数を表現します。数字の表だけでは伝わらなかった「病院の衛生えいせい改善の必要性」が、このグラフで一目瞭然いちもくりょうぜんになりました。データを見える化する工夫の歴史的な例です。
    コレラ拡散マップ
    イギリスの医師ジョン・スノウが、1854年のロンドンでコレラがどこで発生したかを地図上にまとめたものです。感染者が多い場所を調べることで、感染源が特定の井戸であることを発見。これが現代の疫学えきがくの基礎となり、地図とデータを組み合わせた分析の先駆けになりました。
  • 散布図さんぷず
    2つの項目の関係を見るためのグラフです。横軸よこじくに身長、縦軸たてじくに体重をとると、身長と体重の関係が点の散らばり具合で分かります。点が一直線に近いと強い関係がありますが、バラバラに散らばっていると関係が弱いということ。2つのデータの結びつきを視覚的に理解できる便利なグラフです。
    サンプル
    全体を調べるのは難しいので、その一部を選んで調べる対象のことです。例えば、全国の中学生1,000万人すべてにアンケートをするのは不可能。そのため1万人を選んで調べます。大切なのは「代表的なサンプルを選ぶ」こと。一部の学校だけではかたよったサンプルになってしまいます。
    死因図表しいんずひょう
    ナイチンゲールが創案したグラフの本来の呼び方です。クリミア戦争での兵士の死因を分類し、予防可能な病気で亡くなった人がいかに多いかを示しました。現代では「トサカ図」や「ローズチャート」と呼ばれることが多いですが、元々の名称です。
    渋川春海しぶかわはるみ
    江戸時代の日本の天文学者です。正確なこよみを作るために、統計的なデータ収集と計算を行いました。ヨーロッパの科学的知識を学びながら、日本独自の暦法れきほうを確立。データと科学の力で、社会に貢献した人物です。
    ジョン・スノウ
    19世紀のイギリスの医師です。ロンドンのコレラ流行時に、患者の位置を地図上にプロットして、感染源が特定の井戸であることを発見。地図とデータを組み合わせた分析の先駆けとなり、現代の疫学えきがくの基礎を確立しました。
    生存者せいぞんしゃバイアス
    成功した例だけに注目して、失敗した例を見落とすかたよった見方のことです。例えば「成功した起業家きぎょうかは朝5時に起きている」というデータがあっても、失敗した人の中にも早起きの人がいるかもしれません。統計分析では「見えている部分だけでなく、見えていない部分」も考えることが大切です。
    選択せんたくバイアス
    都合の良いデータだけを選んでしまうかたよった見方のことです。学校の友達だけにアンケートを取って「みんなスマホを持っている」と言うのは危険。全国的には持っていない中学生もたくさんいるはずです。公平で正確なデータ分析には、サンプルの選び方が非常に重要です。
    相関関係そうかんかんけい
    2つの事柄が「一緒に変化する」という関係のことです。気温が高くなるとアイスクリームの売り上げも増える、勉強時間が長いほどテストの点数も高い——こうした関係を相関関係といいます。大切なのは「一緒に変化する」ことと「原因と結果」は別物だということ。相関があっても因果関係いんがかんけいとは限りません。
    測量そくりょう
    地面の形や距離を正確に計測することです。伊能忠敬いのうただたかが日本全国の測量を行って、正確な地図を作りました。統計的なデータを集めて分析することで、複雑な対象を正確に理解できる——この原理は現代のデータ分析にも通じています。
  • 第三の要因だいさんのよういん
    2つの事柄が相関そうかんしていても、実は別の隠れた要因が両方に影響しているかもしれないということです。気温が高い月はアイスクリーム売上も水難すいなん事故も増えますが、原因は「暑さ」という第三の要因。データを見るときは「他にどんな要因が隠れているか」を常に考えることが大切です。
    大数たいすう法則ほうそく
    試行しこう回数が増えれば増えるほど、結果が理論値りろんちに近づくという法則です。サイコロを6回振ると1の目は期待値きたいち1回程度。でも実際には0回かもしれません。でも600回振ると、理論値の100回にぐっと近づきます。少ない回数では予想とズレることが多いですが、繰り返すと傾向が見えてくる——これが大数の法則です。
    単位たんい基準きじゅん明確化めいかくか
    グラフを作るときに、何の単位を使っているか、どこから0が始まっているか、基準は何かをはっきり示すことです。例えば、縦軸たてじくが0から始まっていないグラフは、見かけの差が実際より大きく見えてしまいます。データを正確に伝えるために、こうした細かい情報が不可欠ふかけつです。
    直感ちょっかん確率かくりつのズレ
    人間の予感や感覚と、実際の確率が一致しないことです。「6回振れば1の目は必ず出る」という直感は間違い。確率の世界では、「長い目で見た傾向」が大切。この違いを理解することが、データリテラシーの第一歩です。
    データクリーニング
    データの中から誤りや不正確な部分を見つけて直す作業です。日付の表記を統一する、数値から不要なカンマを除去じょきょする、空白や異常値いじょうちをチェックする。こうした細かい作業が、後の分析結果を左右する重要なステップです。
    データ構造こうぞう
    データがどのような形で整理されているかということです。表の形(何列あるか)、ファイルの種類(ExcelかCSVか)、文字コードは何か——こうした情報をデータ構造といいます。データを分析する前に、必ず「どんな構造か」を確認することが大切です。
    データ整形せいけい
    2段組のデータを1列に直したり、途中の不要な空行を削除したり、形式を統一したりして、データを使いやすい形に整える作業です。人間には見やすくても、コンピューターには処理しにくい形になっていることが多い。この整形作業が分析時間の大部分を占めることもあります。
    データ整理
    大量のデータを、体系的たいけいてきに整いやすくする作業の総称です。ファイル名を統一する、フォルダを整理する、不要なデータを削除する、記録方法を決めるなど。データを整理する習慣があると、後で必要な情報を素早く見つけられます。
    データの確認かくにん
    データを使う前に、その内容をしっかり確認する作業です。ファイルの形式は何か、文字コードは何か、データはどんな構造になっているか、不自然な値や空白はないか。こうした確認を丁寧に行うことが、後の分析ミスを防ぎます。面倒な作業ですが、とても重要です。
    データの読み解き
    グラフや数字の背景にある意味を理解することです。「〇〇が増えた」という事実だけでなく、「なぜ増えたのか」「他の要因はないか」「この傾向は続くのか」といった視点を持つこと。データの裏側まで考える力が、データリテラシーの本質です。
    データビジュアライゼーション
    数字や情報を図や画像に変換して、見やすく分かりやすくすることです。難しい統計データも、グラフにすれば一目瞭然いちもくりょうぜん。ナイチンゲールのトサカ図がまさにそうです。「複雑な情報を視覚的に理解できる形にする」という大切な技術です。
    データ分析・処理
    データから意味のある情報や規則性きそくせいを引き出す作業です。売上データから「どの商品が人気か」を見つけたり、学生の成績データから「どの科目に課題があるか」を発見したりします。データの価値は、整理・分析して初めて生まれます。
    データリテラシー
    データを読んだり、理解したり、活用したりする力のことです。確率の意味を理解する、グラフから正しい結論を導く、バイアスに気付く——こうした力の総称がデータリテラシー。これからの社会を生きるために、かかせないスキルになってきています。
    統計学者とうけいがくしゃ
    データを集めて分析し、社会の傾向や法則を見つけることを専門とする人です。ナイチンゲールは看護師でありながら、優れた統計学者でもありました。現代では統計学の知識は、多くの職業で必要とされる重要なスキルになっています。
  • バイアス
    かたよった見方」という意味の言葉です。自分の経験や思い込みで、公平な判断ができなくなることを指します。誰もが何らかのバイアスを持っています。大切なのは「自分にはバイアスがあるかもしれない」と意識し、複数の視点からデータを見ることです。
    パターン
    データの中に隠れている規則性きそくせいや繰り返しのことです。例えば、毎週月曜日に来客が多い、夏の電力消費が高い、といった規則性。複雑に見えるデータでも、パターンを見つけることで、未来の予測や意思決定(いしけってい)が可能になります。
    比較ひかく
    2つ以上のものを並べて、違いや共通点を見ることです。「去年と今年の売上を比較する」という場合、比較する条件を同じにすることが大切。条件が違うと、正確な比較ができません。データ分析では「何と何を比較するか」が重要です。
    必然ひつぜん
    「絶対に起こる」という意味の言葉です。偶然の反対。でも実は、偶然に見える出来事も、背景には必然的な原因があることがあります。例えば、天気は気象現象という科学的な必然性で起こっています。偶然と必然、確率の世界を理解することで、世界の見え方が変わります。
    フローレンス・ナイチンゲール
    19世紀のイギリスの看護師です。クリミア戦争で活躍し、統計学の知識を使ってデータを可視化(グラフ化)し、病院の衛生えいせい改善を実現しました。「近代看護の母」として知られていますが、実は「データの力で社会を変えた人物」でもあります。
    平均へいきん
    複数の数値を足して、その個数で割った値のことです。クラス30人のテスト平均点は全員の点を足して30で割ります。平均は全体の傾向をつかむのに便利ですが、極端に高い点や低い点の影響を受けやすいという弱点もあります。
    ぼうグラフ
    量を比較するのに向いたグラフです。クラスの教科別平均点、商品別の売上など、数値の大小を視覚的に比べられます。左右に並べて比較しやすく、中学生が最初に学ぶグラフの種類です。シンプルですが、非常にわかりやすく、実務でも広く使われています。
  • 前処理まえしょり
    オープンデータをそのままでは使えない形から、分析可能な形に変える作業です。文字コード変換、2段組を1列に直す、不要な空行を削除するなど。地味な作業ですが、データ分析の時間の大部分を占めることもあります。
    見える化
    数字や情報を図や画像にして、分かりやすくすることです。ナイチンゲールのグラフがいい例。複雑なデータも、グラフにすれば一瞬で理解できます。「見える化」は、問題を発見したり、他の人に情報を伝えたりするための強力な武器です。
    無限
    数や対象に終わりがなく、いくらでも続くことです。例えば、同じ条件で何度でも引けるオンラインガチャでは、確率は毎回変わりません。このような場合、確率は一定です。
    メンデル
    19世紀のオーストリアの神父で、遺伝学の基礎を作った人物です。えんどう豆の交配こうはい実験を何度も繰り返し、統計的に親の形質けいしつ(特徴)がどのように子に受け継がれるかを明らかにしました。科学的な観察とデータの力で新しい学問を開拓した例です。
    文字コード
    文字をコンピュータで処理するときの規則のことです。日本語は「Shift-JIS」や「UTF-8」などの複数の文字コードがあります。異なる文字コードのファイルを開くと「文字化もじばけ」が起こります。データ処理の最初の段階で確認が必須です。
    モデル
    複雑な現象を簡略化かんりゃくかして表現したものです。例えば、天気予報は気象データとコンピュータモデルで計算して作られます。モデルは完璧ではありませんが、複雑なものを理解するのに役立ちます。データ分析では「モデルを作る」ことで、未来を予測することもできます。
  • 有限
    数や対象に終わりがあることです。例えば、箱の中のくじの数が決まっている場合、引くたびに残りの数が減っていきます。このような場合、確率は変化します。
  • ローズチャート
    トサカ図と同じく、極座標きょくざひょうグラフの一種です。特に「薔薇ばらのような形に見える」という理由から、ローズチャートと呼ばれることがあります。ナイチンゲール本人の1858年の図を指すときはトサカ図、極座標グラフ全般を指すときはローズチャートという使い分けもあります。
    レーダーチャート
    複数の項目を放射状に配置し、それぞれの値を線で結んで形として表すグラフです。能力や特徴のバランスを一目で比較できます。極座標グラフの一種です。
  • ABC
    CSVファイル
    Comma-Separated Values(カンマで区切られた値)の略です。表をシンプルなテキスト形式で保存したもの。Excelで開くこともできますが、機械処理に向いています。オープンデータはCSV形式で提供されることが多いです。