「平均」を信じられないの話(年収別割合から日本社会を見たとある考察)
さて「平均」というワードは一般的とか中心的ななどのイメージがあり、かつ、計算した数値のためか安心感の持てるとても便利なワードとして日常的によく使われています。
しかし、「平均」と実態がかけ離れている場合でも、特に説明もなくそのまま使われていたりもする、ちょっと厄介な数値でもあるのです。極例をあげると、東京駅でランダムに100人の人に声をかけて年収アンケートを行ったとします。たまたまビルゲイツがいたら(日本人にいるはずがないし、日本人じゃないけど)、その結果の平均値はどうなるでしょうか?完全につりあがっておかしくなりますよね?
(年収は不明ですが、マイクロソフトの持ち株含むとビルゲイツは億とか兆とか年収があると言われてるようです)極端な例ですが、このような事象は身近でもよくあるのではと思います。
この偏った「平均」を補正して見るために、全体としてどうなのかを見る度数分布が一緒にほしいところです。加えて付け加えるなら、データの両端にある極端なものを取り除いて考察を行いたい、その方がしっくりくるケースもあります。
さっそく試しに何か事例で考えてみよう、そうしよう!
ということで、今回は前からずっと気になっていた年収別の給与所得者数について調べます。(国税庁のサイトにある「民間給与実態統計」を利用。ちなみに公務員や日雇い労働者は含まれないデータとなります。)
2014年の平均年収は全体で415万、男性で514万円、女性で272万円となっていました。ダウンロードしたエクセルデータから年収別に給与所得者数を並べた度数分布表を作ると
どうでしょう?灰色のグラフが全体(男女合計)を表しています。
平均415万より下側にある棒グラフの割合が圧倒的に多い気がしませんか。
これはビルゲイツの例え話であったように、少数の超高所得者がいることで偏りがあるため、平均が実態感覚としては少し上がっているように感じるためです。もちろん数値的には正しい結果ですし、感覚的にずれているのは僕かもしれませんが・・・。
そこで、上位5%の給与者をデータからカット、同様に下位5%の超低所得者もカットして、グラフを作り直してみました。(上位・下位の合計10%の人を削った後の人数で、再計算して年収別の割合をだしています。)
※ここからは仮定の話、あくまでざくりとした一考察ですので、鵜呑みにはせずにお読みください。
さあどうでしょうか?全体(男女合計)で平均415万という数字に対する考え方がまた少し変わったのではないでしょうか?
上位5%の所得者を削ると、灰色グラフの全体(男女合計)で給与所得者の割合をザクッと見ると・・・
・100万円台までの合計 約21%
・200万円台までの合計 約40%
・300万円台までの合計 約59%
・400万円台(500万円未満)までの合計 約75%
ちょっとびっくりな数字です。500万円未満の給与者を合計すると75%になってしまいます。正確なデータを洗って算出まではしていませんが、ザクッと見積もって真ん中にいる人(中央値)で250万円くらい、平均値で約380万くらいでしょうか。
今回のデータの扱い方や結果について、
「いやいやちょっとひどすぎるのでは?おかしいよ!?」とか、「年収300万円以下の人口が40%があるし、リアリティーがあるかも!?」とか、それぞれで何か刺激になっていれば幸いです。
個人的には、単身世帯、母子家庭世帯、障害者世帯、年齢別などの切り口で複数のデータを見ると、もう少し日本全体や貧困層、若者層などの実態にせまれるのかなと感じています。さておき、「平均」という数値を疑うことをきっかけに、その数値のまわりにあること、裏にある情報などに目が向く・気づくようになるのではないでしょうか。
今回は「平均」と「度数分布」をほんの少しだけ紹介しました。世の中には数字マジックというものがありまして、統計解析を勉強すると世の中の数字の見方が変わって、少しだけ謎が解けたりして楽しくなります。おそらく、たぶん、メイビーですが(笑)
一から統計解析の勉強は難しいですが、興味のある方もない方もぜひ読んでいただきたいのが『ヤバい統計学』。統計解析についてできるだけやさしく解説・・・とはいえやっぱり少し難しいですが、感覚としては掴めるかなと。
統計解析は別にいいやっという方は、世の中を数字を細かくおった事例を紹介してくれている『ヤバい経済学』が簡単に面白く読めてお勧めです。
0コメント