7.5 知能の測定法

07 思考と知能

学習目標

  • 知能検査がどのように開発されたかを説明する
  • IQテストの使用の歴史を説明する
  • 知能検査の目的と利点を説明できる
Amazon.co.jp: マシュマロ・テスト 成功する子、しない子 (早川書房) eBook : ウォルター ミシェル, 柴田 裕之: 本
Amazon.co.jp: マシュマロ・テスト 成功する子、しない子 (早川書房) eBook : ウォルター ミシェル, 柴田 裕之: 本

皆さんは「IQ」という言葉をよく耳にし、それを知能の概念と結びつけていると思いますが、IQとは本当はどのような意味なのでしょうか?

IQとはintelligence quotient(知能指数)の略で、知能を測定するためのテストで得られたスコアのことです。心理学者の間では、知能(より適切には、複数の知能)を表現する方法がいろいろあることは、すでにご存じのとおりです。

同様に、知能を測定するためのツールであるIQテストは、その開発と使用において議論の対象となってきました。

IQテストはどのような場合に使用されるのでしょうか?その結果から何が得られ、人々はその情報をどのように利用するのでしょうか?知能検査には確かに多くの利点がありますが、その一方で、これらの検査を取り巻く限界や論争にも注意する必要があります。例えば、IQテストは、優生学運動のような陰湿な目的を支持する論拠として用いられることがあります(Severson, 2011)。悪名高い最高裁判例「Buck v. Bellバック対ベル訴訟」は、この種のテストによって「精神薄弱」と判断された一部の人々の強制的な不妊手術を合法化し、結果として約65,000件の不妊手術が行われました(Buck v. Bell, 274 U.S. 200; Ko, 2016)。今日では、心理学の訓練を受けた専門家のみがIQテストを実施することができ、ほとんどのテストの購入には心理学の上級学位が必要とされています。ソーシャルワーカーや精神科医など、その分野の他の専門家は、IQテストを実施することができません。

このセクションでは、知能テストは何を測定するのか、どのようにスコアリングされるのか、そしてどのように開発されたのかを探っていきます。

知能の測定

人間の知能に対する理解は、伝統的な知能や学術的な知能に焦点を当てた場合、やや限定的であるように思われます。では、知能はどのようにして測定できるのでしょうか?また、知能を測定する場合、実際に測定しようとしているものを的確に測定する(IQテストが知能の有効な測定手段として機能する)ためにはどうすればよいのでしょうか。以下では、知能テストがどのように開発され、どのように使用されてきたのか、その歴史を探っていきます。

IQテストは、1世紀以上にわたって知能の代名詞となっています。1800年代後半、Sir Francis Galtonサー・フランシス・ゴールトンは、最初の広範な知能テストを開発しました(Flanagan & Kaufman, 2004)。彼は心理学者ではありませんでしたが、知能検査の概念に貢献したことは現在でも感じられます(Gordon, 1995)。

信頼性のある知能テスト(信頼性とは、これまでの章でご説明したように、テストが一貫した結果を出せること)は、1900年代初頭に、Alfred Binetアルフレッド・ビネーという研究者によって本格的に始まりました(図7.13)。Binetは、フランス政府から、学校生活に支障をきたす可能性のある子供たちを判定するための知能テストの開発を依頼され、そのテストには、言葉を使った課題が多く含まれていました。アメリカの研究者たちは、このようなテストの価値をすぐに理解しました。スタンフォード大学のLouis Termanルイス・ターマン教授は、Binetの研究に改良を加え、テストの実施方法を標準化し、何千人もの異なる年齢の子どもたちをテストして、各年齢の平均点を算出しました。その結果、テストは正規化され、標準化されました。これは、テストが母集団の十分な数の代表的標本に一貫して実施され、スコアの範囲が釣鐘曲線(正規分布曲線、後述)になることを意味します。標準化standardizationとは、テストの実施方法、採点方法、結果の解釈が一貫していることを意味します。標準化とは、年齢層などのグループを比較してデータを収集するために、多くの人にテストを実施することです。得られたデータは、将来のスコアを解釈する際の基準となる規範(参照スコア)となります。規範とは、ある集団が何を知っているべきかという期待値ではなく、その集団が何を知っているかを示すものです。テストを標準化することで、新しいスコアの信頼性を高めることができます。 この新しいバージョンのテストは、スタンフォード・ビネーStanford-Binet知能検査Intelligence Scaleと呼ばれました(Terman, 1916)。驚くべきことに、このテストの最新版は現在でも広く使用されています。

写真Aは、アルフレッド・ビネの肖像画。写真Bは,人間の顔を描いた6枚のスケッチである。これらの顔の上には「Binet-Simon Scaleのためのガイド」というラベルが貼られています。顔は2人ずつ3列に並んでおり、これらの列には "1, 2, 3 "と書かれています。下部にはこう書かれています。"心理クリニックは、これらのカットとp.225のカットの貸し出しについて、フィラデルフィアの準教育長であり、後進国児童調査委員会の委員長であるオリバー・P・コーンマン博士の好意に感謝している。1910年12月31日の委員会の報告書、付録を参照"
図7.13 フランスの心理学者 Alfred Binet は知能検査の発展に貢献した。b)このページは、1908年版のビネーシモン式知能検査のページである。テストを受ける子供たちは、それぞれのペアのどちらの顔がきれいかを尋ねられた。

1939年、第一次世界大戦の退役軍人を研究対象としていた心理学者のDavid Wechslerデイヴィッド・ウェクスラーが、アメリカで新しいIQテストを開発しました。Wechslerは、知能とは「人が目的を持って行動し、合理的に考え、環境に効果的に対処するためのグローバルな能力」であると考え、1880年から第一次世界大戦までに使用された他の知能テストのいくつかの下位検査を組み合わせました(Wechsler, 1958, p. 7)。Wechslerは、このテストをウェクスラー・ベルビューWechsler-Bellevue 知能検査Intelligence Scaleと名付けました(Wechsler, 1981)。この下位検査の組み合わせは、心理学の歴史の中で最も広く使われている知能テストの1つとなりました。その後、ウェクスラーWechsler 成人知能検査Adult Intelligence Scale(WAIS)に名称が変更され、何度か改訂されていますが、テストの目的は初代からほとんど変わっていません(Boake, 2002)。

現在,Wechslerが開発した知能検査には,WAIS-IV(Wechsler Adult Intelligence Scale-fourth edition),WISC-V(Wechsler Intelligence Scale for Children),WPPSI-IV(Wechsler Preschool and Primary Scale of Intelligence-IV)の3種類があります(Wechsler, 2012)。

これらのテストは、アメリカの学校や地域で広く使用されており、再校正のために定期的に標準化が行われています。WISC-V は、再校正の一環として、全米の何千人もの子どもたちに実施され、現在テストを受けている子どもたちは、同年代の子どもたちと比較されています(図 7.13)。

WISC-Vは、14の下位検査で構成されており、それが5つの指標を構成し、その指標がIQスコアとなります。5つの指標とは、言語理解Verbal Comprehension 視空間認知Visual Spatial流動性推理Fluid ReasoningワーキングメモリーWorking Memory処理速度Processing Speedのことです。テストが終了すると、5つの指標それぞれのスコアと全検査Full Scale IQが表示されます。この採点方法は、知能は複数の認知領域における複数の能力から構成されているという理解を反映しており、子どもが各テスト項目の答えにたどり着くまでに使用した心的プロセスに焦点を当てています。

興味深いことに、定期的な再調整によって、「フリン効果」と呼ばれる興味深い観察結果が得られました。フリン効果Flynn effectとは、この傾向を最初に指摘したJames Flynnジェームズ・フリンにちなんで名付けられたもので、世代が変わるごとに、前の世代よりもIQが著しく高くなるという観察結果のことです。しかし、フリン自身は、IQスコアの上昇は、必ずしも若い世代がより知的であることを意味するものではないと主張しています(Flynn, Shaughnessy, & Fulgham, 2012)。

結局のところ、知能テストがどの程度有効なのかという疑問が残ります。確かに、最新版のIQテストでは、言語能力以外の能力も評価されますが、IQテストで評価されるべき具体的な能力や、どのようなテストが個人の知能を真に測定できるのか、IQテストの結果をどのように利用するのかは、いまだに議論の対象となっているのです(Gresham & Witt, 1997; Flynn, Shaughnessy, & Fulgham, 2012; Richardson, 2002; Schlinger, 2003)。

死刑と知的障害のある犯罪者

Atkins v. Virginiaアトキンス対バージニア事件は、米国最高裁における画期的な事件でした。1996年8月16日、Daryl Atkinsダリル・アトキンスWilliam Jonesウィリアム・ジョーンズという2人の男が、強盗、誘拐をした後、地元のアメリカ空軍の飛行士であるEric Nesbittエリック・ネスビットを射殺しました。臨床心理士はArkinsを鑑定し、裁判でAtkinsのIQは59であると証言しました。IQスコアの平均は100であるため、心理学者はAtkinsを “軽度の精神遅滞 “と結論づけました。

陪審員はAtkinsを有罪とし、死刑を宣告しました。Atkinsと彼の弁護士は、最高裁判所に上訴しました。2002年6月、最高裁は以前の判決を覆し、知的障害のある犯罪者の死刑執行は憲法修正第8条で禁止されている「残酷で異常な刑罰」であるとの判決を下しました。裁判所はその判決文にこう書いています。

精神遅滞mental retardationの臨床的定義では、平均以下の知的機能だけでなく、適応能力の著しい制限も必要とされる。精神遅滞者は、善悪の区別がつくことが多く、裁判を受ける能力がある。しかし、その障害のため、定義上、情報を理解し処理する能力、コミュニケーション能力、過ちを抽象化して経験から学ぶ能力、論理的な推論を行う能力、衝動を制御する能力、他人の反応を理解する能力が低下している。このような能力の低下は、刑事罰を免除するものではなく、個人の責任を軽減するものである。(Atkins v. Virginia, 2002, par.5)。

また、裁判所は、知的障害者の死刑執行に反対する州議会のコンセンサスがあり、このコンセンサスはすべての州に通用するものであると判断しました。最高裁判決では、当時広く使われていた「精神遅滞」や「知的障害」の定義を各州に委ねました。誰に死刑を執行できるかは、州によって定義が異なります。Atkins事件では、陪審員は、弁護士との接触が多く、知的刺激を受けていたため、IQが上昇したとされ、死刑執行に耐えうる頭脳になったと判断しました。死刑執行日が決まった後、共同被告のWilliam Jonesの弁護士がJonesに「証拠と一致するAtkins氏に対する証言をするように」と指導していたことが明らかになり、死刑執行停止を受けました(Liptak, 2008)。この不正行為が発覚した後、Atkinsは無期懲役に減刑されました。

Atkins v. Virginia 事件(2002)は、知性をめぐる社会の信念に関するいくつかの問題を浮き彫りにしています。Atkins事件で最高裁は、知的障害は意思決定に影響を与えるので、そのような犯罪者が受ける罰の性質に影響を与えるべきだと判断しました。しかし、知的障害の境界線はどこに引かれるべきなのでしょうか。2014年5月、最高裁は、関連する事件(Hall v. Floridaホール対フロリダ)において、IQスコアを囚人が死刑の対象となるかの最終判断に用いることはできないという判決を下しました(Roberts, 2014)。

正規分布曲線

知能テストの結果は、釣鐘曲線bell curve(釣鐘の形をしたグラフ)に従います。釣鐘曲線が心理テストで使用される場合、このグラフは、ある特性(この場合は知能)の人間集団における正規分布を示しています。人間の特性の多くは、自然にこの曲線に従います。例えば、女性の同級生を身長順に並べると、アメリカ人女性の平均身長である5フィート4インチ(約163㎝)〜5フィート6インチ(約168㎝)の女性が多く集まっていると考えられます。この集団は、アメリカ人女性の平均身長を表すベルカーブの中央に位置することになります(図7.14)。4フィート11インチ(約150㎝)に近い女性は少ないでしょう。同じことが、平均以上の身長を持つ女性、つまり5フィート11インチ(約180㎝)に近い女性にも当てはまります。自然界で釣鐘曲線を見つけるコツは、標本数を多くすることです。標本数が多くないと、釣鐘曲線がより広い人口を代表している可能性は低くなります。代表標本representative sampleとは、一般の人々を正確に表している人口の部分集合のことです。例えば、教室にいる女性の身長だけを測定したとしても、実際には代表標本にはならないかもしれません。女子バスケットボールチームがこのコースを一緒に受講したいと思っていて、全員があなたのクラスにいるとします。バスケットボール選手は平均よりも背が高い傾向があるので、あなたのクラスの女性は、アメリカ人女性の人口を代表する標本にはならないかもしれません。しかし,あなたの学校のすべての女性を標本とした場合,彼女たちの身長は自然な釣鐘曲線を描くことになるでしょう。

ベルカーブのグラフは、"Height of U.S. Women. "と書かれています。X軸には "Height"、Y軸には "Frequency "と書かれています。身長5フィートと5フィート5インチの間で、頻度は曲線のピークまで上昇し、その後、身長5フィート10インチになるまで同じ速度で落ち始めます。
図7.14 あなたの身長は平均以下か、平均か、平均以上か?

これと同じ原理が知能テストのスコアにも当てはまります。テストを受けた人は、知能指数(IQ)と呼ばれるスコアを得ます。長年にわたり、さまざまな種類のIQテストが開発されてきましたが、スコアの解釈方法は変わりません。ほとんどのIQテストでは、IQスコアの平均値は100です。標準偏差standard deviationは、データが母集団の中でどのように分散されているかを表し、大きなデータセットに対して意味を与えるものです。釣鐘曲線は、標準偏差を使って、すべてのスコアが平均スコアからどのように分散しているかを示します(図7.15)。現代のIQテストでは、1つの標準偏差は15ポイントです。つまり、85点のスコアは、”平均よりも1つ標準偏差が低い “と表現されます。115点と70点ではどうでしょうか。

IQスコアが平均値の上下1標準偏差の範囲内(85~115の間)にあるものは平均的とみなされ、人口の68%がこの範囲のIQスコアを持っています。130点以上のIQスコアは、優れたレベルとみなされます。

ベルカーブのグラフは、"Intelligence Quotient Score "と表示されています。X軸には "IQ"、Y軸には "人口 "と書かれています。IQ60から始まった人口は、IQ100で曲線的なピークを迎え、その後同じ割合で減少していき、IQ140でゼロに近い状態になります。
図7.15 大多数の人のIQスコアは85から115の間です。

IQスコアが70未満の人は、人口のわずか2.2%しかいません(American Psychiatric Association [APA], 2013)。知能検査で平均値より約2標準偏差低いスコア(平均値100のテストで約70)を獲得し、適応機能に大きな障害があり、これらの認知および適応障害が18歳以前に存在していた場合、知的障害intellectual disability(ID)と診断される可能性があります。かつては精神遅滞mental retardationとして知られていましたが、現在では知的障害intellectual disabilityと呼ばれており、軽度mild中等度moderate重度severe最重度profoundの4つのタイプがあります(表7.4)。『The Diagnostic and Statistical Manual of Psychological Disorders』には、各下位グループの基準が記載されています(APA, 2013)。

知的障害のタイプ割合説明
軽度85%読み書きおよび数学において、小学3~6年生程度のスキルレベル;雇用され、自立した生活を送ることができる。
中等度10%基本的な読み書きのスキル;機能的なセルフケアのスキル;若干の監視が必要
重度5%機能的なセルフケアスキル;日常生活の環境や活動を見守る必要がある
最重度1%未満言語または非言語でのコミュニケーションが可能な場合がある;集中的な監視が必要
表7.4 認知機能障害の特徴

一方、知能スペクトルの反対側には、IQが最も高い範囲にある人たちがいます。釣鐘曲線を見ればわかるように、人口の約2%があてはまります。IQスコアが130以上の人や、特定の分野で優れた知能を持つ人は、ギフテッドgiftedであると考えられます。昔、「知能の高い人は不適応である」という俗説がありました。この考えは、才能のある子供たちに関する画期的な研究によって否定されました。1921年、Lewis Termanルイス・ターマンは、IQが135以上の1500人以上の子供の縦断的研究を始めました(Terman, 1925)。彼の研究によると、これらの子供たちは、教育を受け、成功した大人になり、実際によく適応していました。(Terman & Oden, 1947)。

また、Termanの研究では、被験者の体格や魅力が平均以上であることが示されており、それまでの高知能者は「弱者」であるという俗説が払拭されました。非常に高いIQを持つ人の中には、知性の発見・研究・育成を目的とした組織であるメンサMensaに入会する人もいます。メンバーは人口の上位2%のIQスコアを持っている必要があり、グループへの参加申請で他の試験に合格する必要がある場合もあります。

精神遅滞

これまでは、IQスコアが70未満で、適応能力や社会的機能に著しい遅れがある場合は、精神遅滞と診断されていました。この診断名が付けられた当初は、社会的な汚名を着せられることはありませんでした。しかし、やがて、この診断名から「知恵遅れretard」という下品な言葉が生まれました。”Retard “は、特に若い人たちの間で嘲笑として頻繁に使われ、”mentally retarded “や “retard “という言葉が侮辱になるまでになったのです。そのため、DSM-5ではこの診断名を「知的障害intellectual disability」としています。多くの州ではかつて、このような認知機能の遅れを診断された人たちを対象とした精神遅滞の部門を設置していましたが、ほとんどの州では部門の名称を発達障害またはそれに類似した言葉に変更しています。Social Security Administrationは、今でも「精神遅滞」という言葉を使っていますが、プログラムから排除することを検討しています(Goad, 2013)。

この章の前半では、言語が私たちの考え方にどのように影響するかについて説明しました。この部門の名称を変更することで、発達障害者に対する人々の見方に影響があると思いますか?名称が変わることで、人々の尊厳が増すでしょうか?発達障害や認知障害を持つ人への期待は変わるでしょうか?それはなぜでしょうか?

なぜ知能を測定するのか?

IQテストの価値は、教育現場や臨床現場で最も明らかになります。学習障害や深刻な行動上の問題を抱えていると思われる子供は、IQテストによって、その子供の問題の一部が同年齢の人々の平均値と有意に異なるIQスコアによるものなのかを確かめることができます。IQテストやその他の知能測定を行わなければ、特別な支援を必要とする子どもや大人を効果的に特定できないかもしれません。また、裁判所では、被告人が裁判に何らかの形で参加できないような特別な事情や酌量すべき事情があるかどうかを判断するために、IQテストが用いられています。また、社会保障局に障害者手当を求める際にもIQテストの結果が利用されます。

以下の事例は、IQテストの有用性と利点を示しています。コネチカット州の学校で問題を抱えていた14歳の少女、キャンディスは、裁判所の命令で心理学的評価を受けることになりました。彼女は中学3年生で通常の教育を受けていましたが、すべての科目で落第点を取っていました。彼女は決して優秀な生徒ではありませんでしたが、いつも次の学年には合格していました。彼女は、授業中に声をかけてくれた先生をよく罵倒していました。また、他の生徒と喧嘩をしたり、万引きをしたりすることもありました。評価を受けに来たとき、キャンディスはすぐに、先生や他のスタッフ、建物、宿題など、学校のすべてが嫌いだと言いました。両親は、娘が先生や他の生徒たちとは違う人種であるため、いじめられていると感じていると述べています。先生を罵る理由を聞かれたキャンディスは、「答えがわからないときにしか声をかけてくれない。毎回友達の前でバカみたいな顔をして『わからない』と言うのは嫌。先生たちは私に恥をかかせるの。」と答えました。彼女は、IQテストを含むさまざまなテストを受けました。IQテストでの彼女のスコアは68点でした。キャンディスのスコアは、彼女が支援なしで通常の教育クラスで優秀な成績を収める、あるいは成功する能力があることを示しているでしょうか?なぜ彼女の困難に気づかず、対処しなかったのでしょうか?

おすすめ関連書籍

Amazon.co.jp: 心理学 第5版補訂版 : 鹿取 廣人, 杉本 敏夫, 鳥居 修晃, 河内 十郎: Japanese Books
Amazon.co.jp: 心理学 第5版補訂版 : 鹿取 廣人, 杉本 敏夫, 鳥居 修晃, 河内 十郎: Japanese Books
タイトルとURLをコピーしました