信頼性の概念と算出法

以前、信頼性と妥当性について述べました(こちらです)。
その中でも信頼性は、再現性・等価性・内的整合性という3つの概念で測定されることが多いです。
それを少し詳しく述べていきましょう。

まずは各概念を簡単に説明すると以下の通りです。

  • 再現性(安定性):
    検査結果の再現性が高く、同一の検査対象であるなら何度測定を繰り返しても同じような測定値が得られるほど、安定しており信頼性が高いとする概念のこと。
  • 等価性:
    検査が測ろうとしている構成概念と同じ、あるいは似通った概念を測る他検査と一定の関係が認められれば、信頼性が高いとする考え方の概念のこと。
  • 内的整合性(内的一貫性):
    検査の尺度内部で回答のバラツキがないことを意味する。
    尺度内の各項目が構成概念を同じように測ることができて、バラツキがなく、一貫していることを信頼性が高いとする考え方の概念のこと。
イメージしにくいのは内的整合性かなと思いますが、こちらは外の基準と比べたりするのではなく、その検査を構成している項目同士が同じような力を持っているかを見るものです。
不安検査で、ある項目が不安を検出する力が5くらいあっても、別の項目が2しかないと項目間のバラつきが大きいと判断されるわけですね。
さて、この3つはあくまでも信頼性を見るための「概念」にすぎません。
この各概念に沿って、実際に信頼性を測定する「方法」が必要になります。
その「方法」によって検出されるのが「信頼性係数」となります。
「概念」と「方法」の組み合わせについては以下の通りです。
右側にあるのが各概念に沿った代表的方法となりますね。
以下では各推定法を簡単に述べていくことにしましょう。
再検査法
再現性(安定性)によって信頼性を推定する方法。
一定期間(2週間から1ヶ月)をおいて、同じ検査を行い、その二つの得点間の相関係数を信頼性係数とする。
平行検査法(代理検査法)
等価性によって信頼性を推定する方法。
測定したい検査と、項目数・質問内容の難易度・測定したい構成概念・分布・平均値・分散などがほぼ等しい検査を作成もしくは使用して、その二つの検査間の相関係数を信頼性係数とする。
折半法
内的整合性(内的一貫性)によって信頼性を推定する方法。
同一の対象に2回検査を実施することが困難な場合もある。そこで、例えば、ある検査を偶数項目と奇数項目に折半し(奇遇法)、二つの尺度とみなしてその相関係数を信頼性係数とする。このやり方を「スピアマン・ブラウンの公式」と呼ぶ。
クロンバックのα係数
内的整合性(内的一貫性)によって信頼性を推定する方法。
例えるなら項目群の可能なすべての組み合わせについて相関係数を算出して平均を求めたような感じ。そのため、折半法をより一般化した推定方法と言える。
α係数は0~1の値を取り、1に近づくほど信頼性が高い。ただし、このやり方だと、項目の中に似通ったものがあるほど、信頼性係数は高くなってしまう。
項目数を増やすほどに信頼性は高くなってしまう。
キューダー=リチャードソンの公式
内的整合性(内的一貫性)によって信頼性を推定する方法。
2値的採点(例えば、正答を1に、誤答を0)の項目のみから構成されるテストに適用できる。
項目分析
内的整合性(内的一貫性)によって信頼性を推定する方法。
検査作成時に、予備調査によって得られたデータから各項目の等質性や鑑別力を検討し、適切でない項目を除外したり、表現や内容の一部を修正したりすることで検査を精錬してゆく重要な手続きであり、必要に応じて予備テスト→項目分析のプロセスを数回繰り返すこともある。
コーエンのκ(カッパ)係数
再現性(安定性)によって信頼性を推定する方法。
2回の調査の安定性や、偶然の一致を考慮した二人の評定者間の評定の一致度を表す。
すなわち「偶然の一致率(Pc)を考慮した一致率の算出法」となる。
X(一致率)=(P0-Pc)/(1-Pc)

ちなみにコーエンのカッパ係数は、1回臨床心理士資格試験でも出題されているので記載しました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です