公認心理師 2022-5

妥当性に関する問題です。

妥当性にも様々ありますが、せめて伝統的な妥当性概念については理解しておくことが大切だったと思います。

問5 心理学の実験において、独立変数と従属変数の因果関係の確かさの程度を表すものとして、最も適切なものを1つ選べ。
① 内的妥当性
② 収束的妥当性
③ 内容的妥当性
④ 基準関連妥当性
⑤ 生態学的妥当性

関連する過去問

なし
※「妥当性の種類」や「信頼性と妥当性」などの記事は過去にありました。

解答のポイント

伝統的な妥当性に関して理解している。

研究結果の検証に関する概念を理解している。

選択肢の解説

② 収束的妥当性
③ 内容的妥当性
④ 基準関連妥当性

心理検査等で何かしらの計測を行う場合、対象の特定の側面について、できるだけ客観的に、かつ正確に測定できることが重要になってきます。

その計測が「良い計測である」と見なすための基準として「信頼性」と「妥当性」があります。

まずはこれらについて概観していきましょう。

誤差をできるだけ取り除き、計測値を真の値に近づけるのが「良い計測」と言えます。

ただし真の値自体は不明ですから、実際には誤差の大きさを何らかの方法で推測し、誤差が少ない方が「良い計測である」と見なすことができるわけです(誤差が少ない=真の値に近い、と見なす)。

こうした誤差の少ない測定であるか否かという基準の一つが「信頼性」であり、同一の対象に対する計測を多数回独立に繰り返した場合の、計測値間の一貫性の程度のことであり、信頼性係数で表現されます。

難しく思うでしょうが、要は「何度やっても同じような結果になる」ということが信頼性であり、それを数値で示したのが信頼性係数というわけです。

明確な基準があるわけではありませんが、0.7~0.8以上の信頼性係数が得られれば、信頼性のある計測であると判断して良いでしょう。

なお、ここでは詳しい解説は省きますが、信頼性係数を測る方法として、再検査法・平行検査法・折半法などがあり、それぞれ再現性・等価性・内的整合性という信頼性の概念を測定しています。

「良い計測である」と見なすためのもう一つの基準が「妥当性」になります。

いくら信頼性が高くても、計測値が一貫して真の値からずれていては良い計測とは言えません。

妥当性とは「計測したい対象を的確に計測できている程度」のことであり、もっと簡単に言えば「測りたいものを測れているか否かの程度を表したもの」になります。

妥当性に関しては、1960年代ごろから内容的妥当性・基準関連妥当性・構成概念妥当性などが妥当性の中心を成すものとして採用されることが多いという流れがあるので、これらをまずは解説していきましょう。

内容的妥当性とは、検査や尺度において、想定されている構成概念をすべて偏りなく網羅しているか否かを表す指標です。

内容的妥当性の特徴として、その分野の専門家やテスト利用者(そのテストを受ける人や実施する人)の判断の一致度で推定されるということが挙げられます。

内容的妥当性は大きく「表面的妥当性:検査が被験者にとって妥当であるか、または何を測定しているように見えるかを表す概念。これが低いと被験者の検査に対する動機づけを損なう可能性がある」と「論理的妥当性:測定される領域があらかじめ明確に決められているときに、検査の質問項目や課題内容がその領域を十分に代表しているか否かを示す概念。専門家によって判断される妥当性」に分けられます。

このように、選択肢③の内容的妥当性は「独立変数と従属変数の因果関係の確かさの程度を表すもの」ではないことがわかりますね。

続いては、基準関連妥当性についてです。

基準関連妥当性は、検査の得点が、それとは独立した外部基準とどの程度相関を示すかで表されます。

基準関連妥当性は、当該テストと外的基準の結果が同時に得られる場合を指す「併存的妥当性」と、外的基準の結果が当該テストよりも後に得られる場合を指す「予測的妥当性」に分けることができます。

「併存的妥当性」は学力テストのように同時期に得た別の基準に基づいて判断する場合であり、「予測的妥当性」は入学後の成績を基準として入学試験の妥当性を判断するような場合ですね。

基準関連妥当性は、妥当性を検証する方法の中では比較的容易に実施できるものではありますが、どのような外的基準を選択するのかによって結果が異なること、外的基準そのものの妥当性をどのように担保するのかといった問題が残る方法とされています。

他にも、当該テストや外的基準の信頼性が低い場合には、両者の相関係数が低くなることにも注意が必要であり、こうした問題の存在を踏まえると、基準関連妥当性だけで妥当性を保証することはできないので、その他の方法と組み合わせて妥当性の検証を進めることが重要になってきます。

このように、選択肢④の基準関連妥当性は「独立変数と従属変数の因果関係の確かさの程度を表すもの」ではないことがわかりますね。

最後に構成概念妥当性についてです。

構成概念妥当性は、計測しようとしている理論的構成概念をどの程度測定できているかを示すものです。

心理学の研究においては構成概念の性質が明確でない場合がほとんどなので、多面的な評価方法が求められます。

すなわち、同じ構成概念を計測すると推定される2つの方法間で結果が一致し、違う概念を計測する方法間では一致しないことを確かめることが必要になってきます。

前者は、理論的に同じ構成概念を測定していると考えられる別の検査との相関で示される妥当性として「収束的妥当性」が挙げられ、相関係数が高いほど妥当性が高いとされます。

後者は、別の構成概念を測定していると考えられる検査との相関で示される妥当性として「弁別的妥当性」が挙げられ、相関係数が低いほど妥当性が高いとされるわけです。

収束的妥当性はイメージしやすいと思いますが、弁別的妥当性は少しわかりにくいかもしれません。

例えば、「うつ病のうつ症状」を査定する検査を作成する場合、単なる「心理的な落ち込み」という状態像との弁別が必要になりますから、これらを測る検査同士の相関が低いことが求められるわけです。

このように、選択肢②の収束的妥当性は「独立変数と従属変数の因果関係の確かさの程度を表すもの」ではないことがわかりますね。

なお、1990年ごろまでは、当該テストの結果を解釈し、またそこから何らかの推論を行うことについて、そのテストが測定しようとしている構成概念に関する理論と十分な整合性を持っているかを問題にし、基準関連妥当性・内容的妥当性・構成概念妥当性の3つが妥当性を構成すると考えられてきました。

その後、妥当性は、構成概念妥当性1つに集約して考えることが主流となり、Messickによれば構成概念妥当性を検証するためには、①内容的側面、②本質的側面、③構造的側面、④一般化可能性側面、⑤外的側面、⑥結果的側面など、様々な側面からの証拠に基づいて検証を行う必要があり、従来提案されてきた様々な妥当性は、それらの証拠を支えるものとして位置づけられています。

いずれにせよ、選択肢②~選択肢④は不適切と判断できます。

① 内的妥当性
⑤ 生態学的妥当性

心理学における実験法では、独立変数を操作して従属変数の振る舞いを調べていきます。

そのとき、独立変数以外の剰余変数が従属変数に影響しないように統制していきます。

剰余変数を統制するのは「独立変数の操作が、従属変数の変化を生んだ」という結論の確からしさを高めるためであり、この「独立変数の操作が、従属変数の変化を生んだという結論の確からしさ」のことを「内的妥当性」と呼びます

特に実験法の一種である個体内実験法では、個別の個体について得られる結論の内的妥当性を高めるために、個別の個体について剰余変数や攪乱要因の影響を統制しながら、各個体に複数の独立変数の値を適用し、従属変数の測定を多数回繰り返します。

内的妥当性の保証を危うくするような要因は「内的妥当性への脅威」と呼ばれ、様々な種類の脅威が挙げられています。

「内的妥当性への脅威」としては、時間経過による成熟、慣れなどがあり、研究では「内的妥当性への脅威」をなるべく排除して、内的妥当性の高い研究を行うことが重要になってきます。

内的妥当性が高い研究を行うためには、独立変数と従属変数以外の、従属変数に影響を与える可能性のある変数の影響について、一定化(影響を与えそうな要因について、すべて同じ値にしてしまうこと:性別という要因が影響を与えそうならば、被験者を男性のみにしてしまうという方法)、バランス化(影響を与えそうな要因について、比較する水準間で全体として同じになるように揃える:性別という要因が影響を与えそうならば、実験で取り上げる要因のどの水準にも男女を同数ずつ割り当てる)、ランダム化(影響を与えそうな要因について、それぞれの水準にまったくランダムに被験者を割り当てること)、一事例実験(たった一つの事例に基づく実験計画法:)などによって十分に統制する必要があります。

以上のように、あらかじめ交絡が起こらないように配慮しておくことで、内的妥当性の高い研究を目指すことができるが、実際には、影響を与えてくる変数は無限にあると言えるので、その中でも主だった変数について優先的に統制するということになります。

上記の通り、「内的妥当性」は独立変数の操作が、従属変数の変化を生んだという結論の確からしさのことを指しますが、これに対して、研究の結果がどの程度一般的なものであるか、他の文脈に一般化できるか否かの程度のことを「外的妥当性」と呼びます。

特定の個体を対象とした実験において独立変数と従属変数の関数関係が見いだされたとき、その実験では検討しなかった他の場面や時点、独立変数を操作する際の他の順序と組み合わせ、他の個体などに対してもその関数関係を一般化できる程度のことを「外的妥当性」と呼ぶわけです。

具体的には、ある論文について、その論文自体の方法・解析・結果の再現性・考察・結論が適切かどうかを示すのが「内的妥当性」であり、その論文の内容が目の前の対象に当てはまるか否かを示すのが「外的妥当性」になるわけです。

外的妥当性の検討のためには、直接的反復(元の実験と同じ実験場面において、同じ個体に対して異なる時点で実験を繰り返したり、元の実験の個体と同様の特徴をもつ他の個体を用いて同じ実験を繰り返すこと)や系統的反復(対象とする個体の特徴や、実験の手続きや場面などの一部を意図的に元の実験から変化させて、一般化が可能な範囲を系統的に探索する)などが行われることになります。

この「外的妥当性」のサブタイプと言えるのが「生態学的妥当性」になります。

生態学的妥当性は、もともとブルンスウィックの用語で、ある環境において、知覚を行う側が用いる近刺激(例えば、網膜像の大きさ)が、遠刺激(例えば、実際の対象の大きさ)を認識する上での情報としてどれほど適切か、という関係性を示すものでした。

つまり、有機体にとって、感覚受容器に与えられた刺激である近刺激が、環境的事象に到達するための手がかりとして役立つ程度を示す概念が生態学的妥当性の元々の意味だったわけです。

その後、「生態学的妥当性」はより広範に使われるようになり、研究が行われた実験的状況から得られた結論が、現実的で文化的に意味ある実際的場面において、どれほど一般的妥当性を有しているかを示す用語として用いられるようになりました。

つまり、外的妥当性は「研究結果が、研究対象者とは異なる特徴をもつ対象や、異なる方法で研究された対象、より長期間追跡された対象に一般化できるかを問うもの」であるのに対して、生態学的妥当性とは「その研究結果が、日常生活における自然な状況に一般化できるかどうかを具体的に検討するもの」になるわけですね。

似ているけど微妙に異なるので、生態学的妥当性は外的妥当性のサブタイプと見なしていいだろうと思います(調べるものによっては同じものと見なしている場合もありましたが、ここでは別のものと見なして解説しました)。

以上より、独立変数の操作が従属変数の変化を生んだという結論の確からしさのことを「内的妥当性」と呼び、研究が行われた実験的状況から得られた結論が、現実的で文化的に意味ある実際的場面において、どれほど一般的妥当性を有しているかを示す概念を「生態学的妥当性」と呼びます。

よって、選択肢⑤が不適切と判断でき、選択肢①が適切と判断できます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です