妥当性にはいくつか種類があります。
代表的なのは構成概念妥当性・内容的妥当性・基準関連妥当性になります。
これらについて詳しく述べていきましょう。
まず構成概念妥当性・内容的妥当性・基準関連妥当性は以下のようなものです。
- 構成概念妥当性:
測定しようとしている構成概念または心理学諸特性を検査でどのくらい測定できているかを問う概念。 - 内容的妥当性:
あるテストや検査の項目が、測定しようとする内容領域に適切であるかどうかの程度。専門家が理論的に判断する。 - 基準関連妥当性:
測定したものが、それとは別の外的基準とどの程度関連があるかによって判断されるもの。
そして、これらはまた細かく分類されていきます。
以下で挙げていきます。
ちなみに図の赤字の部分は、過去に臨床心理士資格試験で出題された箇所になります。
構成概念妥当性に分類されるもの
- 収束的妥当性:
理論的に同じ構成概念を測定していると考えられる別の検査との相関で示される妥当性。
相関係数が高いほど妥当性が高い。 - 弁別的妥当性:
別の構成概念を測定していると考えられる検査との相関で示される妥当性。
相関が低いほど妥当性が高い。 - 因子妥当性:
データの因子分析を行い、下位尺度が予測通りの因子に分かれるかどうかを検討することで示される妥当性。
弁別的妥当性については、例えば、「うつ病」と「非うつ病のうつ状態」を見分ける場合などに大切になってきますね。
MMPIなどは「うつ病」ではなく「うつ状態」を検出するとされていますが(もちろん、うつ病も検出されることになる)、これらを分けて検出できるようにしたい場合は弁別的妥当性が重要になってくるわけです。
こんな感じのイメージですね。
内容的妥当性に分類されるもの
- 表面的妥当性:
検査が被験者にとって妥当であるか、または何を測定しているように見えるかを表す概念。これが低いと被験者のテストに対する動機づけを損なう可能性がある。
テスター、テスティの両方が判断する。 - 論理的妥当性:
測定される領域があらかじめ明確に決められているときに、テストの質問項目や課題内容がその領域を十分に代表しているか否かを示し、専門家によって判断される妥当性。
表面的妥当性はちょっと馴染みづらい考え方かもしれません。
一般に心理検査では、結果に歪みが生じないように「受験者が何を測っているか分からない」ことが重視されることも多いですから。
ですけど、例えば就職適性を測る検査の場合などでは「こんな質問で何を測ってるんだよ?」と思われると、曖昧に答えてしまうなどの反応が出てきてしまいかねませんよね。
このように、検査によっては表面的妥当性が重視されることもあるということです。
こんな感じのイメージですね。
基準関連妥当性に分類されるもの
- 併存的妥当性:
作成した検査と基準となる検査を同時に実施する場合を指す。
例えば、テストと面接を同時に行って、その評価の相関を見る等。 - 予測的妥当性:
作成された検査より後に基準となる検査を実施する場合を指す。将来の特性や行動が検査によってどれくらい予想可能かを表す(入試と入学後の成績、試験と売上、など)。
公認心理師試験が始まって、各社が「模擬試験」を作成していますね。
私は「模擬試験」であるならば、それがどの程度の予測妥当性を示したのかを公開すべきだと考えています(しているのかな?)。
つまり、模擬試験での点数が高かった人が、実際に公認心理師でも点数が高かったならば、その模擬試験は予測妥当性が高いと言えるわけですよね。
予測妥当性が高ければ、その模擬試験を来年度の受験生が受けることに大きな価値が見出されるわけです。
予測妥当性が高い模擬試験であれば点数が低くても、その内容を何度も勉強することで合格に近づいていると統計的に言えるわけですからね。
また、「模擬試験」と銘打つからには公認心理師の「模擬」であるはずなので、やはり妥当性を示すことでその名称に力を持たせることが求められると考えています。
私が公開しているものを「確認テスト」という名称にしているのはそういうわけです。
あくまでもブループリントの小項目にある知識を「確認」するためのものであり、実際に公認心理師試験を模したものではないということですね。
このようなイメージになります。
その他の妥当性
上記以外の妥当性についてもいくつか挙げておきます。
これらは公認心理師にも臨床心理士にも出題されていませんが、一応。
- 内的妥当性:
研究から導き出された結果の正当性、因果類推(因果関係)の適切さを表す。 - 外的妥当性:
研究結果がどの程度他に適用できるかという一般化の可能性を表す。 - 交差妥当性:
ある標本で重回帰式などの予測式が成り立つとき、別の標本で同じ予測式が成り立つかどうかを確認すること。
例えば、アメリカで標準化された視覚検査が日本人に当てはまらない場合、交差妥当性が低いと言える。 - 差異妥当性:
瞳孔反射を測定することで、脳腫瘍がある人とない人を高い確率で識別できるとすれば一般にこの方法は差異妥当性が高いという。
特定の基準変数との相関は高いが、それ以外の基準変数とは相関が低いこと。
以上です。