6.3 オペラント条件付け

06 学習

行動形成

Skinnerがオペラント条件づけの実験でよく用いたのが、 行動形成という方法です。行動形成shaping(反応形成、シェイピング)では、目標とする行動だけに報酬を与えるのではなく、目標とする行動の漸次的近似にも報酬を与えます。なぜ行動形成が必要なのでしょうか?強化が働くためには、生物がまず行動を示す必要があることを忘れてはいけません。 行動形成が必要なのは、生物が自発的に最も単純な行動以外を示す可能性が極めて低いからです。行動形成では、行動を小さな達成可能なステップに分解していきます。具体的には、以下のようなステップを踏んでいきます。

  1. 望ましい行動に類似した反応を強化する。
  2. 次に、より望ましい行動に近い反応を強化する。以前に強化した反応はもう強化しない。
  3. 次に、さらに望ましい行動に近い反応を強化し始める。
  4. 望ましい行動にますます近いものを強化し続ける。
  5. 最後に、望ましい行動のみを強化する。

行動形成は、複雑な行動や行動連鎖behavior chainを教える際によく使われます。Skinnerは行動形成を使って、ハトにスキナー箱のキーをつつくといった比較的単純な行動だけでなく、円を描くように回る、8の字を描くように歩く、さらにはピンポンをするといった、変わった行動や楽しい行動も教えていました。行動形成で重要なのは、刺激の弁別です。Pavlovの犬のことを思い出してください。Pavlovはベルの音には反応し、似たような音には反応しないように犬を訓練しました。こうした弁別は、オペラント条件づけや、行動形成においても重要です。

学習へのリンク

Skinnerのハトがピンポンをする動画

行動形成が動物に行動を教えるのに有効であることは容易に理解できますが、人間にはどのように作用するのでしょうか?例えば、子供が部屋の掃除をするようになることを目標にしている親の場合を考えてみましょう。行動形成を使って、目標に向かって段階的に習得させていきます。全ての課題を実行するのではなく、段階を設定し、それぞれの段階を強化するのです。まず、おもちゃを1つ片付けます。次に、おもちゃを5つ片付けます。その次は、10個のおもちゃを片付けるか、本や服を片付けるかを選択します。4つ目は、2つのおもちゃ以外を片付けます。そうして、彼は自分の部屋全体をきれいにします。

一次強化子と二次強化子

シール、褒め言葉、お金、おもちゃなどの報酬は、学習を強化するために使用することができます。もう一度、Skinnerのネズミの話に戻りましょう。ネズミはどのようにしてスキナー箱のレバーを押すことを学んだのでしょうか?ネズミは、レバーを押すたびに餌が与えられていました。動物にとって、食べ物は明らかに強化子といえます。

では、人間にとっては何が良い強化子となるのでしょうか?例えば、太郎君が部屋をきれいにするとおもちゃがもらえるというやり方を紹介しました。サッカー選手の三郎君はどうでしょうか?もし、三郎君がゴールを決めるたびにキャンディをあげていたら、一次強化子primary reinforcerを使っていることになります。一次強化子とは、生得的に強化の性質を持った強化子のことです。この種の強化子は(生得的なので)学習されるものではありません。水、食べ物、睡眠、住まい、セックス、触覚などが一次強化子です。また、快楽も一次強化子です。生物はこれらのものに対する欲求を失うことはありません。ほとんどの人にとって、とても暑い日に涼しい湖に飛び込むことは強化されますし、涼しい湖は水が人を冷やしてくれる(身体的な必要性)だけでなく、喜びをもたらすので、生来強化されるものなのです。

二次強化子secondary reinforcerには本質的な価値はなく、一次強化子と結びついて初めて強化子としての価値を発揮します。例えば、三郎君がゴールを決めるたびに「ナイスシュート!」と声をかけるというように、愛情と結びついた褒め言葉は二次強化子の一例です。もう一つの例であるお金は、基本的な欲求を満たすもの(食料、水、住居などの一次強化子)や他の二次強化子を買うために使うことができて初めて価値を持ちます。もしあなたが太平洋の真ん中の離島にいて、山のようなお金を持っていたとしても、使うことができなければ、そのお金は役に立ちません。 ステッカーチャート(ごほうびシールを貼るための表)のシールはどうでしょうか?これも二次強化子です。

ステッカーチャートのシールの代わりに、トークンを使うこともあります。トークンも二次強化子ですが、これを報酬や賞品と交換することができます。トークンエコノミーと呼ばれる行動管理システム全体が、このようなトークンによる強化子の使用を中心に構築されています。トークンエコノミーは、学校、刑務所、精神病院など、さまざまな場面で行動を修正するのに非常に効果的であることがわかっています。例えば、CangiとDaly (2013)の研究では、自閉症の児童のグループにおいて、トークンエコノミーを使用することで、適切な社会的行動が増加し、不適切な行動が減少することがわかりました。自閉症の子どもたちは、つねったり叩いたりするような破壊的な行動をとる傾向があります。この研究では、子どもたちが適切な行動(叩いたりつねったりしない)をとったときには、「穏やかな手quiet hands」というトークンを受け取りました。叩いたり、つねったりすると、トークンを失ってしまいます。子どもたちは、指定された量のトークンを数分間の遊び時間と交換することができました。

子どもの行動修正

親や教師は、子どもの行動を変えるために、しばしば行動変容を行います。 行動変容とは、オペラント条件づけの原理を用いて、望ましくない行動をより社会的に受け入れられる行動に切り替えることで、行動の変化を図るものです。教師や保護者の中には、いくつかの行動を列挙したご褒美シール表を作成する人もいます(図6.11)。 ステッカーチャート は、本文で説明したように、トークンエコノミーの一形態です。子どもたちが行動をするたびにシールをもらい、一定の数のシールをもらうと、賞品、つまり強化子をもらうことができます。目標は、容認できる行動を増やし、不作法な行動を減らすことです。罰を与えるのではなく、望ましい行動を強化することが最善であることを覚えておきましょう。教室では、教師は生徒が手を挙げることや、ホールで静かに歩くこと、宿題を提出することなど、さまざまな行動を強化することができます。家庭では、親がステッカーチャートを作成して、おもちゃを片付けたり、歯を磨いたり、夕食を手伝ったりしたときにご褒美を与えるとよいでしょう。 行動変容が効果的であるためには、強化が行動と結びついていなければなりません。強化は子どもにとって重要であり、一貫して行われなければなりません。

A photograph shows a child placing stickers on a chart hanging on the wall.
図6.11 ステッカーチャートは、正の強化の一形態であり、 行動変容のためのツールである。この子供が望ましい行動を示して一定数のシールを獲得したら、アイスクリーム屋さんに行ってご褒美をあげよう。

タイムアウトTime-outは、子どもの行動変容に使われるもう一つの人気のあるテクニックです。これは、負の罰の原則に基づいて動作します。子どもが望ましくない行動をすると、目の前の望ましい活動から外されます(図6.12)。例えば、太郎と弟の次郎が積み木で遊んでいるとします。次郎がお兄ちゃんに向かって積み木を投げたので、親であるあなたは「今度やったらタイムアウトにするよ」と注意します。数分後、次郎はさらに太郎にブロックを投げつけました。あなたは次郎を数分間部屋から追い出しました。戻ってきた次郎はもうブロックを投げません。

行動変容の手法としてタイムアウトを導入する場合、知っておくべき重要なポイントがいくつかあります。まず、子どもが好ましい活動から外され、好ましくない場所に置かれていることを確認します。子供にとって望ましくない活動であれば、子供にとっては活動から外される方が楽しいので、この手法は逆効果になってしまいます。次に、タイムアウトの長さが重要です。一般的には、子どもの年齢1歳につき1分が目安です。次郎は5歳なので、5分間のタイムアウトになります。タイマーを設定しておけば、子どもは自分が何分タイムアウトをしなければならないかを知ることができます。最後に、保育者として、タイムアウトの間、いくつかのガイドラインを心に留めておいてください。子どもにタイムアウトを指示するときは落ち着いて、タイムアウト中は子どもを無視して(保育者の注意がいたずらを助長する可能性があるから)、タイムアウトが終わったら子どもを抱きしめたり、優しい言葉をかけたりしてください。

写真Aは、数人の子どもが遊具に登っているところ。写真Bは、ベンチに一人で座っている子どもです。
図6.12 タイムアウトは、保育者が行う一般的な負の罰である。子どもが悪さをしたときに、望ましくない行動を減らそうとして、望ましい活動から外す。例えば、(a)子供が友達と遊び場で遊んでいて、他の子供を押してしまった場合、(b)悪さをした子供を短時間、その活動から外す。
タイトルとURLをコピーしました