なぜ「本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本」だけでは駄目なのか

しょーへーさんに問題を指摘されてしまいました。あうあう。


「本書のみで統計の勉強は十分と勘違いする人が多い」のがもし妥当だとしたら、分析すべきはなぜそうなるのかってことじゃないのか。
あー、確かにそうですね。その説明を省いて「統計を理解せずに統計を用いている人が多くて嘆かわしい」的な論理は弱いしちょっと傲慢でした。僕自身の素朴な体験を前提にそれを説明せずに記述しちゃいました。
僕なりの「本書のみで統計の勉強は十分と勘違いする人が多い」ことの分析としては、

  1. 意外にも心理学に統計の知識は必須だった
  2. 心理学は基本的に文系分野で高校で文系だったひとも多いので数学に弱い
  3. しかし、統計を勉強しないことには心理で卒論を書くことが難しい
  4. ならば、一冊くらいで簡単に勉強したい
  5. ゆえに、この本を読んでいればいいだろう

ということ。
本書のメリットを明確にすると、寺井滋氏のレビューとも多少かぶるけれども、

  1. 記述統計が簡単に網羅されている
  2. ゆえに、尺度水準について留意することができる
  3. 推測統計の基本的原理と限界が簡単に説明されている
  4. 記述統計・推測統計の考え方が数理的側面を省いて簡単に説明されている

だと思います。一方、デメリットは、

  1. 説明されている統計的検定は主に実験法に用いられる方法にのみ主眼がおかれていること
  2. ゆえに、調査法においてまで実験法で主に用いられるの手法(カイ二乗検定・t検定・分散分析)を安易に行ってしまいがち
  3. これらの手法の成立する統計的前提条件は指摘されているものの、必ずしも強調されていない

だと思います。この本は推測統計学の入門書ではあるものの、推測統計を実際使ってみる、あるいは推測統計を根拠としている言説を読み解くためには不十分です。
特に、臨床系の人は統計に弱いと云いますが、臨床系の人が行う研究は質問紙法が多いと思うので(実験法だったら良いのですが)この本だけでは不十分です。というか、この本を読んで統計の勉強を終えてしまうのは弊害が多い。
これは、某心理学の教官の某演習での言葉です。

あのさあ、君が云っている独立変数ってもともとは間隔尺度だろ?それをわざわざ名義だか順序尺度に戻して情報量を少なくする意味ってあるの?たくさん質問紙項目とっておきなががら回答者に失礼じゃん。それは君が出来る推測統計が分散分析だけだってことだろ?先行研究ちゃんと勉強した?先行研究では分散分析がが使われてたの?だとしたらその先行研究の分析は妥当なの?君が云ってる独立変数を間隔尺度のまま説明変数にして、従属変数を基準変数にして回帰分析すればいいってだけじゃん。それ、ちょっとやり直しだよ。
この演習は卒論のデータを持ち寄っての演習だったので、卒論提出目前にこういうことを云われて、進退窮まって泣いてしまう学生さんが居てかわいそうでした。これはひとえに、ここであげられているようなテキストだけを使って統計を勉強したが故に起きてしまった問題です。
説明すると、例えば不安に関する質問紙を実施して、その変数が間隔尺度としてが1〜50までをとるとして、それをt検定なり分散分析の独立変数に落とすと、1〜25までを不安低群、25〜50までを不安低群としてしまう。せっかく1〜50まで被験者から取ったのに、それをたったの不安高群・低群の1〜2までの変数に落としてしまう。ここに問題がある。
しかしながら、ここで注意すべきなのは、間隔尺度で取った変数を名義尺度に落として分散分析を行うことが必ずしも無駄だというわけではない。時には有益な場合もある。
それは、データを平面上にプロットしてU時型の相関関係が得られた場合だ。これに対しては普通の方法で回帰分析や多変量解析(重回帰分析・共分散構造分析)を行っても見出せない関係だ。
例えば、お酒を適度に飲むと健康にいいという関係の場合、飲酒量と健康度は直線的関係ではなくて、U字型の関係になる。その場合、回帰分析や多変量解析ですると、説明変数を二乗した項を作ったりとか、変数を標準化したりしなきゃいけないとか、説明変数間の相関があると多重共線性の問題が出たりとかいささか面倒。そうなると、尺度水準を落としてでも分散分析を行ったほうが、分析を行うほうも簡単だし、分析を見るほうにも親切。
妥協案としては、実験法、あるいは要因計画を使ったり読んだりする人は

を読むこと。質問紙法や多変量解析を使ったり読んだりする人は、

を読むことですかねえ。
まあ、でも、統計に対してあくまで厳密な態度を取ってしまうと、推測統計がほんとうに使えなくなってしまう。故に、僕なんかは質的研究というところに視点を移さざるを得なくなった。それは、例えばエスノグラフィーだったりもします。しかし、これらの手法も適応範囲の限界と妥当性がわからないでいます。
と、久々に統計にヒートアップしてしまいました。間違いがあったらご指摘お願いします。