行動の学習に関する問題です。
中身としては古典的条件づけ及びオペラント条件づけに関する基本的な事項を問うていると言えます。
問86 行動の学習について、正しいものを1つ選べ。
① 古典的条件づけでは、般化は生じない。
② 味覚嫌悪学習は、脱馴化の典型例である。
③ 部分強化は、連続強化に比べて反応の習得が早い。
④ 危険運転をした者の運転免許を停止することは、正の罰である。
⑤ 未装着警報音を止めるためにシートベルトをすることは、負の強化である。
関連する過去問
解答のポイント
古典的条件づけ、オペラント条件づけの基本的な理解が備わっている。
選択肢の解説
① 古典的条件づけでは、般化は生じない。
般化は、古典的条件づけや弁別オペラント条件づけにおいて、条件づけの結果、条件刺激や弁別刺激だけでなくそれらに類似した刺激によっても反応が生起されることを指します。
古典的条件づけの代表例である、パヴロフの研究を踏まえて考えてみましょう。
当初、イヌは音を聞くだけでは耳をそばだてるだけで、唾液分泌は生じません。
次に、食物と音との対呈示を行い、これを繰り返すと、音だけを聞かせてもイヌは唾液を分泌し始めました。
音は唾液分泌に対して中性刺激でしたが、古典的条件づけの結果、唾液分泌というエサに対する無条件反応と同様の反応を誘発するようになったわけですね。
この時の中性刺激(この場合は音)は、無条件反応と結びついて、その反応を誘発するようになると「条件刺激」と呼ばれます(エサは無条件刺激、唾液分泌は無条件反応、音によって誘発されるようになった唾液分泌は条件反応になる)。
つまり、条件刺激は、無条件刺激と繰り返し対呈示することで、無条件反応と同様の条件反応を誘発するようになるわけですね。
さて、ここからが般化のお話です。
条件反応は条件刺激によって誘発されますが、条件刺激に類似していれば他の刺激もある程度条件反応を誘発します。
この効果を「般化」と呼び、この時誘発される条件反応の量や大きさは用いられた新しい刺激と、元の条件刺激との類似度に依存しています。
1分間100拍のメトロノーム音と食物による唾液分泌とを条件づけるなら、90拍や80拍のメトロノーム音を聞かせても唾液分泌が生じ、その量は80拍より90拍の方が多くなります。
同じような現象は、同じく古典的条件づけで有名なアルバート坊やでも検証されていますね。
白ネズミと大きな音を対呈示されて白ネズミに対して恐怖反応が条件づけられたアルバート坊やですが、白ネズミはもちろん、ウサギ、毛皮、サンタクロースのお面、綿に対しても程度は異なりますが恐怖反応を示し、他の刺激に般化が生じていることがわかります。
以上のように、古典的条件づけでは般化が生じることが確認されています。
よって、選択肢①は不適切と判断できます。
② 味覚嫌悪学習は、脱馴化の典型例である。
味覚嫌悪学習は20世紀半ばにガルシアが発見したことにちなんで「ガルシア効果」とも呼ばれ、特定の食べ物の接種後に内臓不快感を経験すると、その食べ物の味覚刺激への嫌悪反応が学習されることを指します。
要は、ある食べ物を摂取した後に体調が悪くなると、その食べ物の味を長く記憶にとどめ、以後同じ食べ物が提示されても、その味を手掛かりとしてその食べ物を嫌悪するようになる、あの現象のことです(私は近所のラーメン屋の味がこの現象のせいでダメになりました)。
この学習は味覚情報と内臓感覚情報の脳内連合学習の結果生じるということを、ガルシアらが動物行動実験により明らかにしたわけですね。
内臓不快感を喚起する手続きとして、動物実験では塩化リチウムの腹腔内投与などが用いられますが、ヒトでは車酔いやがんの化学療法の副作用による内臓不快感によっても生じます。
味覚刺激と内臓不快感は結び付きやすいのですが、電気ショックのような外部からの嫌悪刺激とは結び付きにくく、内臓不快感は光や音といった刺激とは結び付きにくいといった連合の準備性があります。
この学習は、未経験の味を有する溶液(条件刺激)を摂取させた後で、胃腸障害を引き起こすなどの不快感を招く薬物(無条件刺激)を注射すると、動物は条件刺激と無条件刺激の結びつきを学習し、次に条件刺激を与えてもその味を手掛かりとして接種を拒否します。
条件刺激は無条件刺激に先行する必要があり、この学習は古典的条件づけ学習に相当すると見なされ「条件づけ味覚嫌悪」「味覚嫌悪学習」などと表現されました。
上述の通り、この学習は古典的条件づけによる学習と見なされていたのですが、味覚嫌悪学習はが「味覚刺激と内臓不快感の対提示が1回でも十分な学習が成立する」ことと、「味覚刺激と内臓不快感の感覚が数時間に及んでも学習が可能」であるという点で、従来の条件づけの規則に沿っていないことが指摘されました。
特に後者については、条件づけにおける「接近の原理(アリストテレスの「連合による学習の第一法則」の一つで、同じ時点あるいは同じ場所で起きた二つの経験は接近連合する傾向がある、という考え。条件づけでは条件刺激と無条件刺激が接近しているほど学習が生じやすく、離れているほど学習が生じにくいことが明らかにされている)」に矛盾することから問題となり、学習の法則に「生物学的制約」を考慮すべきであるという考え方の一つの端緒となりました。
先ほど「味覚刺激と内臓不快感は結び付きやすいのですが、電気ショックのような外部からの嫌悪刺激とは結び付きにくく、内臓不快感は光や音といった刺激とは結び付きにくい」と述べましたが、実はこの検証過程でGarcia&koellingは「生物学的制約」を示したのです。
ガルシア&ケーリングは、味、光+音、外部刺激といったいくつかの刺激との連合を試みたわけですが、その結果、「味>光+音>外部刺激」という連合の生じやすさに違いがあることがわかったのです。
このような連合の選択性が存在するのかについて、生物学的および進化論的な制約を受けるという説明がなされ、生体が学習するうえで何を必要としているかは進化の過程によって違いがあり、動物は特定の事柄を特定の方法で学習するため「事前にプログラム化」されているという動物生態学の主眼点と一致する結果が得られたわけです。
通常ラットは自然の中で食物を選ぶのに味覚に頼りますから、味と吐き気の間の連合は促進されるが、音や光と吐き気は促進されにくいのが自然です。
また、自然環境では寒さや外傷の様な外的要因に由来する痛みの多くは外的刺激によって生じていますから、音や光と電撃の間の連合は促進されるが、味と電撃の間では連合の促進がされにくいとも言えそうです。
また、動物種が異なれば、連合されやすい刺激が異なることも示されており(鳥は音や光の方が連合されやすい)、これらの実験結果から「生物学的制約を受ける」という考えは成立しています。
こうした「人間や動物の行動に現れる強力な生物学的要因」の発見により、古典的条件づけにおいて刺激による連合することが出来るかどうかは、生物学的および進化論的な制約を受けることが明らかとなったということです。
さて、こうした味覚嫌悪学習ですが、脱馴化との関連を考える上で脱馴化について述べていきましょう。
同じ刺激を繰り返し呈示されることで、その刺激に誘発される反応が減衰・消失する馴化であり、そこに新しい刺激を呈示すると減衰・消失していた反応が復活しますが、この現象を脱馴化と呼びます。
赤ちゃんの寝かしつけにおいて、①赤ちゃんが背中のトントンでうとうとしている(馴化)、②トントンのテンポを変えたり、トントンを止めたりする、③赤ちゃんが目を覚まし、泣き始める(脱馴化によって起こる)、などが馴化‐脱馴化の例とされていますね。
こちらを利用して乳児の認知検査を行っていますね(馴化‐脱馴化法など。「公認心理師 2022-60」参照)。
さて、味覚嫌悪学習で起こることをこうした「馴化‐脱馴化」のパラダイムで説明可能か否かをまずは考えてみましょう。
脱馴化によって「食べ物の味覚への拒否反応」が生じるとするなら、馴化の段階では「元々、ある食べ物への拒否反応があったけど、食べ続けることで徐々に慣れてきた」という前提が求められますね。
これは味覚嫌悪学習での、①そもそもその拒否反応が元々存在して、何度も呈示されたことで慣れたという理屈は無い、②1回の対呈示で成立する、③味覚情報と内臓感覚情報の脳内連合学習の結果生じるとされている、などの点から脱馴化で味覚嫌悪学習現象を説明するのは無理があると言えます。
以上より、選択肢②は不適切と判断できます。
③ 部分強化は、連続強化に比べて反応の習得が早い。
こちらは強化スケジュールに関する選択肢になりますね。
同じ行動が自発するたびに毎回強化子の提示を行うことを「連続強化」と呼び、反応に時々強化を行うことを「部分強化(または間歇強化)」と呼びます。
Skinnerはこの「反応をいつ強化するか」という環境側から見た規則を「強化スケジュール」と呼びました。
本選択肢で問われている「反応の習得」だけに注目をすれば、連続強化の方が習得が早いとされています。
ただし、連続強化よりも部分強化の方が消去抵抗が高い(つまり、消去されにくい)とされており、この現象を「部分強化効果」と呼びます。
毎回強化された方が反応と強化の結びつきは強くなり、消去されにくくなると考えられがちですが、実際の消去抵抗は部分強化の方が高いです。
このため、この効果を強化矛盾、あるいは発見者の名を付してハンフレイズのパラドックスと呼ぶこともあります。
教科書等を読んでも、連続強化と部分強化の比較をするときには必ずと言っても良いほど上記の消去抵抗の違いについて述べられています。
ですが、本選択肢で問われているのは「反応の習得が早い」という点になり、消去抵抗の大きさではありません。
よって、単に「反応の習得が早い」のは連続強化の方になるわけです、本選択肢は上記のような知識を有していることを見越してのひっかけと言えます。
よって、選択肢③は不適切と判断できます。
④ 危険運転をした者の運転免許を停止することは、正の罰である。
⑤ 未装着警報音を止めるためにシートベルトをすることは、負の強化である。
オペラント条件づけの反応と結果の随伴性には、反応すれば刺激が与えられる場合と、反応すれば刺激が除去される場合があり、刺激には報酬(強化刺激)と嫌悪刺激(罰刺激)があります。
これらの刺激と随伴性の組み合わせによって、オペラント条件づけは以下のように分けられます。
- 正の強化:反応したときに報酬を与えると、反応が増加する。
- 正の罰:反応したときに嫌悪刺激を与えると、反応が減少する。
- 負の罰(オミッション):反応したときに報酬を除去すると、反応が減少する。
- 負の強化(逃避学習と回避学習):反応したときに嫌悪刺激を除去すると、反応が増加する。
「正・負=刺激を与えるか否か。与えたら正で、除去すれば負」「強化・罰=反応が増加すれば強化、反応が減少すれば罰」ということになりますね。
これらを踏まえて、ここで挙げた選択肢を見ていきましょう。
選択肢④の「危険運転をした者の運転免許を停止することは、正の罰である」ですが、危険運転という反応をした者に対して「運転免許を停止する」というのは、報酬を除去することになります。
そして、運転免許を停止することで期待されるのは、危険運転をしなくなることであり、元々行っていた反応が減少することですよね。
ですから、「報酬を除去して反応が減少する」ということになり、これは負の罰ということになり、正の罰ではありませんね。
続いて、選択肢⑤の「未装着警報音を止めるためにシートベルトをすることは、負の強化である」ですが、シートベルトをすることで「未装着警報音が止まる」わけですから、嫌悪刺激が除去されることになります。
それによって期待されるのは、シートベルトを装着するという行動の増加になりますね。
ですから「嫌悪刺激を除去して反応が増加する」ということになり、これは負の強化ということになります。
以上より、選択肢④は不適切と判断でき、選択肢⑤が適切と判断できます。