第四章 統計の嘘の見抜き方

嘘には3つの種類がある。 嘘、真っ赤な嘘、そして統計だ。
− ベンジャミン・ディズレイリ −

■TOPへ 論理的思考力と議論とディベート

統計の嘘8【平均には三つの種類がある】

統計で平均値を算出する方法には三つの種類があります。それぞれ、平均値(算術平均)・中央値・最頻値という名前で呼ばれています。三種類の平均の特徴を解説します。

■1.平均値(算術平均)
算術平均とは、一般的に平均値と呼ばれるもので、すべての標本の合計値を、標本数で割った数を指します。

例えば、10世帯の平均所得を調べる場合、全体のうち5世帯の所得が400万円で、残り5世帯の所得が500万円なら、全世帯の平均所得は450万円になります。下がそのグラフです。

(単位:一万円)

A B C D E F G H I J 平均値
所得 400 400 400 400 400 500 500 500 500 500 450



算術平均では全体の分布がどうなっているのかが分かりにくい点に注意してください。 例えば、10世帯中9世帯の所得が200万円で、残り1世帯の所得が2700万円の場合でも、平均所得は450万円になります。下がそのグラフです。

(単位:一万円)

A B C D E F G H I J 平均値
所得 200 200 200 200 200 200 200 200 200 2700 450


一部の世帯が平均を大きく吊り上げています。9割の世帯は200万円で生活しているのに、算術平均では平均所得が450万円と、2.25倍にもなります。
算術平均値 = 全標本の和÷標本数

■2.中央値
中央値とは、全標本のうち、ちょうど真ん中の順位にある標本の数値を指します。標本数が偶数の場合は、真ん中に最も近い二つの標本の数値を足して、二で割った数値が中央値になります。

中央値は算術平均よりも実情をよく表している数値だと言えるでしょう。下のグラフでは、7世帯の所得の中央値は300万円になります。

(単位:一万円)

A B C G E F G 平均値 中央値
所得 200 230 270 300 500 800 1200 500 300

(単位:一万円)
ちょうど真ん中の順位にいるDさんの所得が中央値になります。つまり、Dさんを除く世帯の半数は中央値よりも所得が高く、もう半数は中央値よりも所得が低いということがわかります。

では、日本の世帯所得での算術平均値と中央値を比較してみましょう。

算術平均値と中央値では100万円以上の差があります。
中央値に関する詳しい解説(Wikipedia)

■3.最頻値
最頻値とは、基準の数値を一定の範囲で階級分けしたとき、最も多くの標本が集中する階級を指します。最頻値はより大多数の実感に近い数値だと言えるでしょう。

下のグラフでは、所得を100万円単位で階級分けした場合、8世帯中最も多くの標本が集中する階級は300万円以上400万円未満なのでこれが最頻値になります。

(単位:一万円)

A B C D E F G H 平均値 最頻値
所得 200 300 300 300 300 600 600 1200 475 300〜400未満

(単位:一万円)
最も多くの世帯が300万〜400万円未満の所得で生活していることがわかります。
最頻値に関する詳しい解説(Wikipedia)

「NHK高校講座ライブラリー」で三種類の平均を解説している回を視聴できます。

関連サイト
詭弁術の考察―統計の利用2

次のページ
前のページ
■HOMEへ 統計の嘘(ウソ)の見抜き方
■TOPヘ 論理的思考力と議論とディベート


目次
■統計のウソを見抜く方法。
●統計のウソ1【比較対象の定義が異なる】
●統計のウソ2【偏った標本】
●統計のウソ3【少ない標本】
●統計のウソ4【誘導的な質問】
●統計のウソ5【空気を読んで答える人】
●統計のウソ6【見栄をはる人】
●統計のウソ7【利害関係のある調査員】
●統計のウソ8【平均には三つの種類がある】
●統計のウソ9【視覚でごまかす】
【動画で学ぶ統計の基礎】
■ニセ科学とインチキ実験を見抜く方法。
●インチキ実験1【対照実験をしない】


統計のウソを見破る方法についてもっと知りたい方には、ダレル・ハフ氏の『統計でウソをつく法』をお薦めします。

お客様がこのサイトを採点してください。
アンケートにコメントをして頂けると、今後の改善により役立ちます。
(どの項目についての評価かなど)

ご意見、ご感想用の掲示板はこちらです。

  1. 無料アクセス解析
inserted by FC2 system