統計の魔術
 ニュースでちょっと変なものをやっていました。京都の某大学で屋内禁煙を実施しているというニュースです。この中で学生の喫煙について、新入生と4年生を比較すると、4年生では喫煙者は5倍に増えているとか?そういったことをいっています。これって変ですね。だって新入生って大多数が未青年でしょ?それなら喫煙率そのものの算定基準には・・・まあ、こういった不思議な統計があるということですね。
 浪人生と現役生の割合がこんな数値に繁栄するのならちょっと厄介ですね。だって二浪以上の浪人生の割合が高いということになってしまいますからね。
 しかし、統計というのは様々な魔術を含みますから難しいですね。ただ厄介なのは、実績が0のとき、翌年1でも数値があると、前年比の何倍になるのでしょうか?こういったものは大変ですね!
 しかし、統計の魔術というのは、近頃流行の株式公開では結構大きな要件になっているような気がしますね。だって、人間って上昇率という魔術にとらわれやすいような気がするからです。
 たとえば、10円のものが50円になると5倍になったといいますね。もし、50円のものが50円あがって100円になると、同じだけの利益があるはずなんですが、2倍の伸び率になります。さらに100円のものが150円になると、同じ50円の上昇なんですが1.5倍にしかなりません。どうです数の魔術は、意外と新しいものにはこのような魔術が通用するようです。
 私もかつては受験屋でした。そうなると、偏差値と得点というものを使い分けることが必要になってきます。まあ、厳しいお母さん方は良くやっていましたが、平均点が低い時の偏差値の高いやつ、これは得点も低いので得点の低さで、もっと頑張れ!あと80%まで何点あるぞ!なんて言えますし。平均点が高くて、偏差値が低くなるとき、みんなもう少し得点しているのだから頑張れよ!なんていえますからね。
 ただ、この偏差値にしても、かなり問題があります。それは平均点が非常に高い場合や非常に低い場合です。このときにはあまり当てになりませんからね。
 まあ、私は受験屋であると共に、なぜかテスト処理関連のシステム設計もやっていましたから、結構大変な目にもあいましたね。一番驚いたのは、偏差値というものが25から75二しかならないと信じていたことでしたね。
 普通、母集団の数が多い場合、そして平均点が50点から60点程度のところにあるとき、間違いなく偏差値は25から75までの間に入ります。しかし、母集団が少なく、多くの受験生がある一定のばらつきの中に入ってくるときで、平均点が高いとき、ダントツで悪い成績を取ると・・・びっくりしましたね!だって-19なんて偏差値が出てしまいますからね。これには驚きました。偏差値19ではないんですから。本来最低の25からさらに・・・とんでもなく低いんですね。
 まあ、この場合は、正規分布曲線に近づけるためのダミーを入れ損ねて計算したというのもありましたが、受験者数の関係と、平均点がそこそこまともな点数でしたからあまり気にしていなかったというものでした。まあ、気が付いたところで、この母集団に対して正規分布に近づけるためのダミーの導入は・・・実際、実用的な範囲から逸脱するものですから、結局諦めて、25を割り込むときは25にしろ!という命令を書いてお終いにしましたね。ですから、結構統計ってあっているようで・・・かなり疑問な代物ですね。
 ですから、母集団の異なるもので比較することが如何に難しいのか、また、比較対象が何であるかによって統計そのものの意味が変わってしまいますからね。まあ言い方ですね。
 A君とB君が100m走をしました。A君は堂々の2位、B君は、残念ながらビリから2番でした。なんてどうですか?間違ってはいないけれども、事実を大きく曲解しているような気もします。
 さて、身の回りの統計はどんな基準で作られているのか?あまり客観的なものはありませんからね。せいぜい踊らさせないように注意しないといけませんね。