公認心理師 2018-113

心理学研究で行われている統計的仮説検定において利用される有意水準の説明として、最も適切なものを1つ選ぶ問題です。

問113 心理学研究で行われている統計的仮説検定において利用される有意水準の説明として、最も適切なものを1つ選べ。
① 帰無仮説が真であるとき帰無仮説を棄却する確率である。
② 帰無仮説が真であるとき帰無仮説を採択する確率である。
③ 対立仮説が真であるとき帰無仮説を棄却する確率である。
④ 対立仮説が真であるとき帰無仮説を採択する確率である

統計については色々わかりやすい本もありますが、私は昔からブルーバックスから出ている「推計学のすすめ-決定と計画の科学」を基盤としつつ他書で肉付けをしています。

1968年に出た本なので、かなり古いですね。

公認心理師や臨床心理士の試験では、細かい計算が出ることはほぼ無いと想定でき、むしろ一つひとつの概念やその成立過程をしっかりと理解しておくことが求められると考えられます。

こうした「なぜそのような考え方をするのか」という点に、きちんと答えてくれる上記のような本は少ないように感じています。

解答のポイント

有意水準の考え方をきちんと把握していること。

必要な知識・選択肢の解説

まずは「有意水準」について理解しておきましょう。

例えば、ある人が超能力を使って「さいころの目の奇遇を操ることができる」と宣言したとします。

そして実際に1000回振った時に、奇数の目が542回出たとします。

この人に「さいころの目の奇遇を操ることができる」超能力が備わっているか否かを統計的仮説検定にて検証するには、以下のような手順を踏みます。

  1. 「超能力は存在しない」という仮説を立てる:これを「帰無仮説」と呼びます。
  2. 1の仮説を検証する実験を行う:きちんと「統制」して行うこと。
  3. 1の仮説が正しいと考えた場合(超能力が無いと考えた場合:すなわち帰無仮説が真であると仮定したとき)、奇数の目が542回出たという結果が偶然によって生じる確率を計算します。ちなみに、ここでは奇数の目が542回~1000回まで出る確率を合わせて「危険率」(=有意水準)として計算します。
  4. 3の危険率が、あらかじめ決めておいた小さな確率(5%とか1%とか)よりも小さいならば、「そんな少ない確率の出来事が起こるはずがない」と考えて、1の帰無仮説を捨てます(棄却する)。すなわち、超能力の存在を認めたことになります(この際、5%以下の確率で「そんな少ない確率の出来事が起こってしまった」という場合もあり得ます。こちらについては以下で説明しています)。
    一方、あらかじめ定められた確率よりも大きければ、1の帰無仮説は捨てられないので、超能力は認められないということになりますね。

上記のプロセスの中で、いくつか疑問を持つ方もおられると思います。

少し詳しく述べていきます。

まず「なぜわざわざ「帰無仮説」というものを立てて検証するのか?」について考えていきます。

普通、仮説というものは正しくなることを狙って立てますよね。

統計的仮説検定では、立てた仮説をもとに事象の起こる確率を計算しなければならないため、「仮説は厳密でなければならない」という制約があります。

先ほどの超能力の例で考えてみると、仮に「超能力がある」という仮説を立てると、サイコロを振って100%奇数の目を出せる能力から、90%、80%、70%…などの色々なレベルの能力を想定する必要が出てきて、全てを検証するのは事実上不可能となってしまいます。

それに対して「超能力が無い」という仮説はたった1つであり、これが棄却できるかを検証することで超能力の存在を確かめやすくなります。

こうした理由から、わざわざ帰無仮説という「無に帰す」ことを目指した仮説を立てるわけです。

もう1点ですが、上記にも記した通り「危険率」とは「有意水準」のことです。

なぜわざわざ「危険率」という表現をするのでしょうか。

上記の例を引くと、1000回振って奇数の目が542回出る確率は1%です。

統計的仮説検定では、この数値を「自然にはめったに起こらない」と捉え、「超能力が無い」という仮説を捨てて、超能力という要因の存在を認めます。

しかしながら、1%という数字は小さいですが、やはり1%は「超能力が無いにも関わらず、そういう割合が出てしまう」ことがあり得るわけです。

つまり、超能力が本当は無いにも関わらず、超能力をあるとしてしまう可能性が1%存在するわけですね。

こういった「間違う危険」があるので、有意水準のことを「危険率」と呼びます。

こうした統計的仮説検定において「間違ってしまうパターン」はおおむね2つほど提示されています。

それが「第一種の過誤」と「第二種の過誤」で、それぞれを以下に説明しておきましょう。

第一種の過誤とは「TypeⅠError」や「偽陽性」等とも呼ばれ、帰無仮説が実際には正しいのに棄却してしまう過誤のことを指します。

対して第二種の過誤とは「TypeⅡError」や「偽陰性」等とも呼ばれ、帰無仮説が実際には誤りなのに棄却しない過誤を指します。

つまり、帰無仮説が「真」であるにもかかわらず、標本のデータによって帰無仮説を棄却してしまう(帰無仮説が棄却されるような標本が得られる)ことを第一種の過誤と呼び、帰無仮説が「偽」(対立仮説が「真」)であるにもかかわらず、標本のデータでは帰無仮説を棄却できないことを第二種の過誤と呼ぶわけです。

上記の例では、「第一種の過誤」では、超能力による操作はできなかったのに、できたと見なしてしまうことであり、対して「第二種の過誤」では、超能力による操作ができたのに、できなかったと見なしてしまうことを指すわけですね。

最後に、5%とか1%などという数字は、慣例的に決められているものであって、何か根拠があってのものではありません(この点は臨床心理士の過去問でもよく出ています)。

ただし、基準は統計学ではなく、自然科学・社会科学・人生観・社会観のレベルで存在します。

例えば、飛行機が墜落する可能性を1%としたら、非常にまずいことがわかりますよね。

つまり、危険率を何%にするかは、仮説が正しいにも関わらず、仮説を棄却するという過ちを犯した場合の、被る損害の大きさによって決めるべき問題といえます。

さて、ここまでを土台として、各選択肢の解説に入っていきましょう。

① 帰無仮説が真であるとき帰無仮説を棄却する確率である

では、この選択肢の内容が「統計的仮説検定において利用される有意水準の説明」として適切か否かを考えていきましょう。

本選択肢の「帰無仮説が真である」とは、例えば「超能力はない」という帰無仮説を立てるわけですが、それが「正しい」というデータが得られたということになります。

「帰無仮説が正しい」わけですから、「帰無仮説を棄却する」のはおかしいと考えてしまいがちですが、ここにこの問題のミソがあります。

先述の通り、帰無仮説が「真」であるにもかかわらず、標本のデータによって帰無仮説を棄却してしまう(帰無仮説が棄却されるような標本が得られる)ことを第一種の過誤と呼びます。

つまり、有意水準とは「帰無仮説が正しいにも関わらず、得られたデータが帰無仮説を棄却してしまう危険率」でもあるわけです。

ですから、「帰無仮説が真であるとき帰無仮説を棄却する確率である」という本選択肢の内容を読み替えると「帰無仮説が正しい、つまり帰無仮説を棄却できないにも関わらず、得られたデータによって帰無仮説が棄却されてしまう確率」であり、これを有意水準と称するわけです。

よって、選択肢①が最も適切といえます。

② 帰無仮説が真であるとき帰無仮説を採択する確率である。

統計的仮説検定の手続きから得られる結果は「帰無仮説を棄却できる」「できない」の2つだけであり、採択に関する考慮は一切ありません。

選択肢②のように「帰無仮説(超能力が無い)が正しいと考えたときに、その仮説を採択する確率」とすると、統計的仮説検定の考え方と矛盾が出てきてしまいます。

よって、選択肢②は不適切と言えます。

③ 対立仮説が真であるとき帰無仮説を棄却する確率である

選択肢③の場合「「超能力がある」とするとき「超能力が無い」という仮説を棄却する確率=有意確率」という公式となります。

何となく正しいような気もしますが、こちらは前提に誤りがあります。

統計的仮説検定では、「帰無仮説が真である」と仮定して進められるものであり、対立仮説は帰無仮説が棄却されたときに自動的に採択されるものです。

すなわち、帰無仮説と対立仮説は排反であるため、帰無仮説が棄却された場合は自動的に対立仮説が採択されます。

以上より、選択肢③は不適切と言えます。

④ 対立仮説が真であるとき帰無仮説を採択する確率である

先述の通り、帰無仮説と対立仮説は排反であるため、帰無仮説が棄却された場合は自動的に対立仮説が採択されます。

選択肢④の場合「「超能力がある」とするとき「超能力が無い」という仮説を採択する確率=有意確率」という公式となり、何を言っているのかよくわからないことになります。

統計的仮説検定では「帰無仮説」が「棄却できる」「棄却できない」を検証するためだけのものであり、対立仮説についてはその結果から自動的に採択の可否が決まるものです。

よって、選択肢④は不適切と言えます。

7件のコメント

  1. 有意水準を超える確率の場合、帰無仮説は真となり、帰無仮説を棄却できない状況にある。
    これは「差があるかないか、効果があるかないか確定できない」のであって、仮説を採択するということとは意味合いが異なる。
    →真の場合:棄却できない

    有意水準以下の低確率の場合、「差がある」、「効果がある」といえるので帰無仮説は棄却される。
    この場合、帰無仮説は偽である。
    →偽の場合:棄却できる

    なので、本問の正解とされる①は、帰無仮説の棄却に関しては明らかに間違っている。
    「誤り」ではあるが、好意的にとらえると、帰無仮説が真の場合に対立仮説を採択する「第1種の誤り」を意図的に問う問題だと解釈できる。
    これは、有意水準とは誤りを犯す危険性のある水準(危険率)であること、を問う問題であろう。

    1. 補足1
      ①の「帰無仮説が真であるとき帰無仮説を棄却する」ことは「第1種の誤り」になる。
      本問で問題とされているのが、「帰無仮説の棄却における正しい可否」ではないこと注目しなければならない。正しい可否を考えると、①は間違いになる。帰無仮説が真であるならば棄却してはならないからだ。

      講談社の「赤本 公認心理師 国試対策2021」の本問解説には、「第1種の誤りを犯す可能性を有意水準と呼ぶのである」と記載されている。また、同じく別ページにおける有意水準の説明として「第1種の誤りを犯す確率は、設定した有意水準に等しい」との記載もあるが、正しくは「第1種の誤りを犯す確率【の上限】は、設定した有意水準に等しい」であろう。
      あくまで、有意水準で示される確率は、第1種の誤りが生じる確率なのではなく、第1種の誤りが生じる可能性の上限値であることに注意が必要である。(あくまで可能性=上限の問題である。有意水準を5%に設定したからといって、第1種の過誤が必ず5%生じるわけでもなく、また、有意性の認められるデータすべてが第1種の過誤であるわけもない。)

      1. コメントありがとうございます。

        本当ですね、「真」と「偽」の解釈を完全に逆にして考えていました。
        (それで解説しておかしいと気が付かないのがマズいのですけど…)
        体裁を整えるのと併せて、修正しておきました。

      2. すみません。文章を推敲しているうちに時間が経ち、返信に気づきませんでした。

        真と偽のややこしさ、有意水準を確率という意味の分かりにくさ、有意水準を第1種の過誤の確率として単純にイコールで結んでいいのかどうか、が絡む難問でした。

        1. いえいえ。
          確かにわかりにくい問題でしたね。
          有意水準=危険率ですが、両方の側面から見た説明ができるので、イコールで良いのでしょうが、こうやって問題で出ると悩みますね。

          それにしても今見直してみると2018年の解説は甘いですね。
          まぁ、私が受験して自分のための解説という形で始めたから仕方ないのですが。
          ここ数年のような「人に見られることを意識している」内容にはなっていませんね。

          直すのも面倒ですから、指摘をもらったところから直すという形にしております。

  2. なぜ、単純にイコールで結んではいけないと考えたかというと、補足1でも書いたように、有意水準を5%に設定したからといって、第1種の過誤が必ず5%生じるわけでもなく、また、有意性の認められるデータすべてが第1種の過誤であるわけでもないからです。
    つまり、「偽陽性」の問題があるからです。(真陽性/偽陽性・真陰性/偽陰性についてはウィキペディアの「第一種の過誤と第二種過誤」を参照してください。)
    どうやら、偽陽性のみを第1種の過誤とし、偽陽性のみを第2種の過誤とするようなのです。そうでなければ、有意水準以下の結果のすべてを過誤のあるデータ(有意性がないデータ)としてすべて却下しなければならなくなります。それは、有意性を示すことができない=新しい手法や効果ある発見などが提示できなくなることを意味するのではないでしょうか。

    1. (1)①の「帰無仮説が真であるとき帰無仮説を棄却する確率である」は「第1種の過誤を犯してしまう確率である」の言い換えである。
      (2)第1種の過誤とは、有意水準より低い確率のデータのうち、偽陽性のものを指す。

      この2つの前提が成立するとすれば(間違いなくすると思いますが)、

      本問において①は「帰無仮説が真であるとき帰無仮説を棄却する【可能性のある】確率【の上限値】である」という記述であるべきで、かつ、この括弧に入れた補足抜きでは有意水準が本来持つ重要な意味を欠いているため、正解とはみなせない。
      よって、「正解なし」。

      となります。

      有意水準とは、やはり、帰無仮説の真偽を分けるもの、というのが第一義的な意味なんです。
      それを無理やり第1種の過誤を使ってひっかけ問題に仕立て上げたのが実情でしょう。
      きっちり考察をすすめると問題自体が過誤を犯しているということが分かります。

      追記
      上のコメントで「偽陽性のみを第2種の過誤とする」と書いてしまいましたが、正しくは「偽陰性のみを第2種の過誤とする」です。
      過誤(ミス)は誰でも犯すものですw

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です