学習におけるシェイピングの機能に関する問題です。
解答自体はそれほど難しくありませんが、正答以外の選択肢が何を指しているのか理解していることが重要です。
問86 学習におけるシェイピングの機能として、最も適切なものを1つ選べ。
① 直前に生じた反応の頻度が増えるようになる。
② 条件刺激とその他の無関連刺激を区別できるようになる。
③ それまでには自発していなかった反応が生じるようになる。
④ 他者の行動の観察後に、それに類似した行動をするようになる。
⑤ 刺激源への接近又は離反の方向性を持った運動を行うようになる。
選択肢の解説
① 直前に生じた反応の頻度が増えるようになる。
⑤ 刺激源への接近又は離反の方向性を持った運動を行うようになる。
オペラント条件づけの反応と結果の随伴性には、反応すれば刺激が与えられる場合と、反応すれば刺激が除去される場合があり、刺激には報酬(強化刺激)と嫌悪刺激(罰刺激)があります。
これらの刺激と随伴性の組み合わせによって、オペラント条件づけは以下のように分けられます。
- 正の強化:反応したときに報酬を与えると、反応が増加する。
- 正の罰:反応したときに嫌悪刺激を与えると、反応が減少する。
- 負の罰(オミッション):反応したときに報酬を除去すると、反応が減少する。
- 負の強化(逃避学習と回避学習):反応したときに嫌悪刺激を除去すると、反応が増加する。
「正・負=刺激を与えるか否か。与えたら正で、除去すれば負」「強化・罰=反応が増加すれば強化、反応が減少すれば罰」ということになりますね。
こうした概念より、選択肢①の「直前に生じた反応の頻度が増えるようになる」というのは、強化という概念を指していると考えられます。
選択肢⑤は走性(自由に運動できる生物が外界の刺激に対して一定方向に移動または運動する性質。刺激の方に向かう場合を正の走性、遠ざかる場合を負の走性といい、刺激の種類により走光性・走化性・走熱性・走流性などに分ける)のことを指しているのかと思いました。
しかし、「行うようになる」という表現から、もともとそうでなかったものが「刺激に接近したり離反するようになる」ということを示唆しているので(走性は生まれつきのもの)、やはり学習関連の概念で考えていくと、やはり上記のオペラント条件づけの刺激と随伴性の組み合わせが一番近いように思えます。
刺激を与えるか否かによって、「強化:刺激源に近づく」「罰:刺激源から遠ざかる」ということが起こることを指していると考えられます。
単に「近づく‐遠ざかる」という言葉で表していいのか疑問なので、絶対に合っているとは断言できませんが、一番近い概念がこちらのように思います。
以上より、選択肢①および選択肢⑤は不適切と判断できます。
② 条件刺激とその他の無関連刺激を区別できるようになる。
こちらは弁別に関する説明になっていますね。
古典的条件づけや弁別オペラント条件づけにおいて、条件づけの結果、条件刺激や弁別刺激だけでなくそれらに類似した刺激によっても反応が生起されるようになることを「般化」と呼びます。
類似の概念として「弁別」があり、2つ以上の刺激のそれぞれに対して異なる反応をすることを指します。
古典的条件づけにおいて条件刺激によっては条件反応が誘発されるが、他のある刺激によってその反応が誘発されることが無い状態を「弁別」と言い、条件刺激によって誘発される他の刺激によっても誘発されるなら「般化」と呼びます。
オペラント条件づけにおける「般化」と「弁別」は、弁別刺激が変数となっており、ある弁別刺激下でのみある反応の自発頻度が高く維持され、別の刺激下ではその反応が自発されないか、または自発頻度が低く維持されることを「弁別」と言い、そうなった状態は弁別刺激が反応を統制している状態です。
また、弁別刺激以外の刺激の下で、その反応の自発が確認されるとき「般化」と呼びます。
本選択肢では「条件刺激」という表現を用いているので、古典的条件づけを念頭に置いていることがわかりますね。
条件刺激によっては条件反応が誘発されるが、他のある刺激によってその反応が誘発されることが無い状態を「弁別」と呼びますから、本選択肢の説明は弁別に関するものと捉えて良いでしょう。
よって、選択肢②は不適切と判断できます。
③ それまでには自発していなかった反応が生じるようになる。
シェイピングとは、複雑で新しい行動を獲得させるために、標的行動を小段階(=スモールステップ)に分けて達成が容易なものから順に形成していく方法です。
オペラント条件づけでは、対象にある反応が見られたときに報酬を与えて「強化」をしていき、条件刺激と条件反応の連合を強めていきます(スキナーの提唱したプログラム学習の基礎をなすのがシェイピングです)。
ただ、目標行動が複雑な場合、そうした行動が一度に生起されることが期待しにくくなります。
例えば、イヌに「三回まわってワン」を覚えさせたいときに、その行動が自然環境下で一度に生じることは非常に少ないわけです(生起頻度が少ないと強化できないので学習が成立しなくなる)。
ですから、そういう時に「1回まわる」→報酬で強化→「2回まわる」→報酬で強化→…→「吠える」→強化、といった具合の手順を踏むわけですね(言い換えれば、生起頻度が高い・容易なものから強化していくわけですが、これが「スモールステップ」と称されるわけですね)。
このようにシェイピングでは、通常は最初に単純な反応が要求され、その反応をより複雑で洗練されたものにしていくために、強化の基準を徐々に厳しく変化させていきます(それを可能にするために、小さい段階(スモールステップ)を積み重ねていくわけです)。
強化の操作を重視し、行動それ自体を変化させていく過程と言えますね。
シェイピングを成功させるための留意点として、①標的行動を正確に明確化する、②すでに達成できている行動を確認し、シェイピングされるべき行動を選択する、③大きすぎず小さすぎないステップのサイズを設定する、などが挙げられます。
このようなシェイピングの説明は、本選択肢の内容に合致するものと捉えられます。
自然状況では生じないような複雑な反応を、シェイピングを通して学習することができるということですね。
以上より、選択肢③が適切と判断できます。
④ 他者の行動の観察後に、それに類似した行動をするようになる。
こちらはモデリングの説明文になっていますね。
モデリングとは、バンデューラが模倣や観察学習といった用語を統一する概念として1960年代に提唱した言葉です。
モデルを観察することによる学習や既存の行動の変容・修正など(制止や脱制止なども含む)をモデリングと呼びます。
モデリングの効果は、子どもの攻撃行動(Bandura,1961)やジェンダーの発達に関する実験で検証されました。
バンデューラの行った実験で最も有名なのが、たくさんのおもちゃの中から、大人のモデルがトラの風船に対して特に乱暴な行動をするのを見た子どもが、その後、同じ状況に置かれたときに大人のモデルと同じ行動をする率が高くなることを示した実験です。
実験では、対象の子どもたちを3つのグループに分けて実験が行われました。
- Aグループの子どもたちには、人形に対して大人たちが攻撃的な行動をとっている映像が見せられました。その映像の中では、大人がボボ人形を叩いたり、蹴ったり、罵声を浴びさせている様子が録音されていました。
- Bグループの子どもたちには、人形に対して大人たちが攻撃的な様子を一切見せない映像が見せられました。大人たちはこの映像の中では他のおもちゃで遊んだり、静かに過ごしていました。
- Cグループの子どもたちには、何も映像を見せませんでした。
その後、子どもたちをそれぞれ人形を含めたおもちゃがたくさんある部屋に入れて観察したところ、Aグループの子どもたちは、BグループやCグループに比べて、人形に対して攻撃的な言動が遥かに多いことが見受けられました。
バンデューラ以前には、人間の模倣行動を模倣学習としてハルの動因低減説(つまり、報酬をもらえるから模倣が起こる)で説明されていました。
これに対して、バンデューラは上記のような実験結果を以って、模倣行動の成立に必ずしも報酬を必要とせず、直接経験も試行錯誤もないままに学習が成立するというモデリングの考え方を示しました。
以上のように、本選択肢の内容はモデリングの説明になっていると言えます。
よって、選択肢④は不適切と判断できます。