公認心理師 2023-6

心理学実験に関する用語を選択する問題です。

手持ちの資料でいくら探しても操作チェックが出てこないので苦労しました。

問6 心理学実験において、実験者が設定した刺激が適切に機能しているかを確認することを表す用語として、最も適切なものを1つ選べ。
① 準実験
② 条件づけ
③ メタ分析
④ マッチング
⑤ 操作チェック

解答のポイント

実験計画を適切なものにするための各概念を把握している。

選択肢の解説

① 準実験

実験計画法では、実験者が独立変数を他の変数と交絡させることなく操作することが前提となっています。

しかし、現実には、実験者が統制や操作ができない変数を独立変数として扱いたいことがあります。

例えば、年齢や性別、パーソナリティなど、参加者に備わった特性は操作できないし、疾病への罹患など、倫理的に操作することが認められない変数もあります。

このような場合、従属変数に影響を及ぼすことが予想される他の交絡変数をできる限り統制した上で、関心のある変数を独立変数と見なして実験を行う方法を「準実験法」と呼びます。

(※剰余変数=独立変数以外に従属変数に影響を与える恐れのある変数、交絡変数=独立変数と従属変数の両者に影響を与える(両者と関連がある)変数、なので微妙に違いはあるが、同じものとして表記されていることもある)

よく用いられるのは、あらかじめある特性を測るテスト課題を行い、この得点に基づいて参加者を高得点群と低得点群に分け、この群の違いを独立変数の水準の違いとして扱うなどの方法です。

全ての参加者の特性をできるだけ等しくする斉一化、比較する群の間でマッチングなどの方法があります。

一般的な理想的な実験モデルは、完全無作為により実験群と統制群とに分けて実験群にのみ操作・介入を行う方法ですが、準実験は理想的な実験モデルを現実場面で作るのが困難な場合に用いられる方法の総称です。

以上より、準実験は「実験者が設定した刺激が適切に機能しているかを確認すること」ではないことがわかります。

よって、選択肢①は不適切と判断できます。

② 条件づけ

条件づけとは、個体に特定の随伴性操作を系統だって施すことで、当該個体がそれまでに有していた刺激や反応の機能を変容する一連の手続き、事態、過程を指します。

学習を、経験による新しい刺激や反応の機能の獲得と考えるならば、条件づけはその経験の主要な位置を占めることになります。

条件づけの中核部を占める主要な随伴性には、①刺激:刺激、②反応:刺激、③刺激:反応:刺激の3種類があり、①は古典的条件づけ、②はオペラント条件づけ、③は弁別オペラント条件づけを担っています。

進化の歴史を通じて獲得されてきた、条件づけによる反応や刺激の新しい機能の獲得機構についての研究は、単に心理学における学習領域だけにとどまらず、脳科学、機械学習といった心理学周辺の諸科学にも大きな影響を与えてきました。

一応、研究法の中に「条件づけ」という概念が存在しないか調べてみましたが、やはり本選択肢はいわゆる学習の「条件づけ」を指していると捉えて解説しました。

ですから、条件づけは「実験者が設定した刺激が適切に機能しているかを確認すること」ではないことがわかりますね。

よって、選択肢②は不適切と判断できます。

③ メタ分析

同一の研究課題について行われた複数の研究結果を統計的手法によって統合する方法を「メタ分析」と呼びます。

具体的には、各研究で推定された効果量から、統合された効果量を推定する方法です。

メタ分析の発想は、複数の結果を統合することで、サンプルサイズが大きくなり、単一の結果と比べて信頼性の高い結論を導くことが可能になるというものです。

メタ分析の一般的な手順は、①問題設定、②文献検索、③研究のコード化、④統計解析、⑤結果の解釈があります。

問題設定では、どのような研究課題についてメタ分析で検討するのかを明確にします。

また取り上げる研究に関して構成概念、研究対象者、研究方法、効果量、公表年代、公表形態などについてもあらかじめ明確にしておく必要があります。

文献検索では、問題設定で明確にした内容に従い、文献データベースを利用した検索を行います。

必要な文献を見落とさないために、複数のデータベースを利用したり、キーワードを変えたりして検索を行い、文献が見つかれば、引用索引データベースを利用することで新たな文献を見つけることができます。

研究のコード化では、収集した文献から各研究の特徴を整理し、統計解析のためのデータを作成します(書誌情報、研究対象者、研究方法、サンプルサイズ、効果量を表にまとめます)。

統計解析では、研究のコード化で作成した各研究の効果量をもとに、統合された効果量を推定しますが、その際のモデルとしては、固定効果モデル、変量効果モデル、ベイズモデルが用いられることになります(これらのモデルの詳細な説明は省きます)。

結果の解釈では、統計解析で得られた統合された効果量やその信頼区間を利用して結論を導きます。

その際、各研究の効果量から統合された効果量を導く過程を視覚化した森プロット(こちらのサイトなどを参照)を利用すると良いとされています。

このようにメタ分析は、個々の研究で得られた知見を統合し、学問分野における理論の発展に貢献するが問題点もあります。

メタ分析では主に学術雑誌から論文を集めますが、学術雑誌では有意差があった、あるいは大きな効果が見られた研究が論文として掲載される傾向にあり、逆に有意差が無かった研究は研究者が手元において公表しない傾向にあります。

前者のことを「出版バイアス」の問題、後者のことを「ファイル引き出し問題」と呼び、これらの問題がメタ分析の結果を歪めてしまいます。

出版バイアス問題の影響を見つける方法として漏斗プロットがあり、これは効果量を横軸に、サンプルサイズを縦軸にとり、各研究をプロットした散布図になります。

このようにメタ分析は「同一の研究課題について行われた複数の研究結果を統計的手法によって統合する方法」であり、「実験者が設定した刺激が適切に機能しているかを確認すること」ではないことがわかりますね。

よって、選択肢③は不適切と判断できます。

④ マッチング

こちらは剰余変数の相殺に関する用語です。

実際の実験場面では、すべての剰余変数に対して除去や一定化ができるわけではありません。

例えば、参加者の知能や性格など、剰余変数の除去や一定化が不可能な場合もあります。

剰余変数の相殺とは、それらの剰余変数は互いに相殺させることで、影響をできるだけ小さくすることを指します。

剰余変数の相殺については、「参加者の割り当てによる相殺」と「実験計画による相殺」の2つに分けて述べていきますが、「参加者の割り当てによる相殺」の代表例がマッチングです。

マッチングとは、研究の単位(通常は参加者)を従属変数に対して影響を与えると考えられる剰余変数の値がなるべく等しくなるよう、複数のグループに分け、各グループ内から独立変数の各条件に対し、参加者を同数ずつ得る方法です。

例えば、参加者が男性18人、女性24人だったとして、3群に等しい人数を割り振る際に、各群に男性を6人、女性を8人ずつにすることで、すべての群における性別の違いによる影響をほぼ等しくすることができます。

マッチングによる統制は、統制を行った剰余変数の影響を(ほぼ)取り除くことができるが、研究の単位(参加者の割り当て)に限界があるため、すべての剰余変数をマッチングすることは不可能です。

そのため、剰余変数の中でも、自分の行う実験に最も影響の大きいと考えられる剰余変数からマッチングさせていくことが重要になります。

このように、マッチングとは「比較する群間で、影響力の大きい剰余変数の値をできる限り一致させること」であり、本問の「実験者が設定した刺激が適切に機能しているかを確認すること」ではないことがわかりますね。

よって、選択肢④は不適切と判断できます。

⑤ 操作チェック

研究を行うにあたって、手続きが標準化できるのであればそれが望ましいのは言うまでもありません。

しかし、研究の領域によっては、手続きを標準化するあまり、独立変数のインパクトを欠いてしまい観察反応の問題を招いてしまったり、独立変数の操作の強さを欠くことでそもそも独立変数の効果が検出できなかったりするときには、手続きをある程度柔軟に変更することも考慮される必要があります。

例えば、「きちんとした身なり」の標準的手続きを「スーツ姿」としたり、「自尊心の高低」の標準的手続きを「試験成績のフィードバック」として良いかと考えると、それぞれの概念を決まりきった方法で代表させることが難しいと理解できるはずです(1つの手続きで研究者の間で合意できればいいけど、それは実際には難しい)。

こうした事情のため、手続きの柔軟な変更が必要な場合があり、それを適切に行えば独立変数の操作の強さとインパクトの強さの両方を達成できますが、留意すべき点もあります。

特に、変更された手続きの心理的等価性を直接に保証する客観的方法はないので、①変更した手続きが変更前の手続きと比べて異なる結果を生み出さなかったことによって結果論的に保証される、②操作チェックによって間接的に保証される、などによって確認していくことになります。

本選択肢にも示されている「操作チェック」とは、例えば、「きちんとした身なり」に関する標準的実験の中で「あなたはその男性をきちんとした身なりだと思いましたか?」と尋ねてみたり、「自尊心の高低」に関する実験では自尊心テストを実施するなどして、ある手続きがその概念を代表していたかを間接的にチェックする方法です。

他の実験の例も示しておきましょう。

例えば、ある研究で「好意的な発言内容は欺瞞度が低い」ということを立証するため、好意型の発言(ごめん、出かけてた。今晩電話してもいい?)、中立型の発言(ごめん、出かけてた。電話したの何時ごろ?)、非好意型の発言(ごめん、出かけてた。一昨日はこっちが電話したのに、いなかったんじゃなかった?)という3つの発言型を提示しましたが、そもそもこれら3つの型の発言内容は本当に、各々好意型・中立型・非好意型と考えて良いのか、という問題が出てきます。

このように研究者が用意した刺激が、研究参加者の側でも確かに、研究者の意図通りに機能していることを確かめねばなりませんが、こうした確認のことを「操作チェック」と呼ぶのです。

この研究の場合、操作チェックのため、欺瞞度以外に好意度尺度(快い‐不快な、好意的な‐非好意的な、…)を設けた結果、好意度得点の高い順に、好意型→中立型→非好意型になっており、好意度に関する操作の成功が確認されました。

もしも操作チェックが失敗した場合は、実験の前提条件が満たされていないことになりますから、実験をやり直すことになります。

上記から操作チェックについて何となくイメージできたかなと思いますが、この内容は本問の「実験者が設定した刺激が適切に機能しているかを確認すること」と合致することがわかりますね。

よって、選択肢⑤が適切と判断できます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です