認知心理学
印刷するには、[ファイル] メニューの [印刷] をクリックします。
認知心理学
III. 感覚・知覚の過程

今、音楽会で、オーケストラの演奏をきいている場面を考えてみよう。大勢の楽団員や多種多様な楽器がみえ、また彼らがその楽器を演奏している様子がみえる。楽団員は、左右と奥行き方向にひろがって配置され、その手前の中央には後ろ向きの指揮者がタクトをふりながら指揮をしている。奥にいる楽団員の中には前の人にかくれて見えにくい人もいる。つややかな茶色にぬられた弦楽器は、床の木部とはその質感が明らかにちがい、また金管楽器も形状や色の違いばかりでなく、つやの違いがあるのに気づく。ききなれた旋律の中に、むかって右側のチェロやコントラバスからは腹をゆさぶるような低音が、また第1バイオリンのパートからはなめらかな弦の高音が、そして中央後部のトロンボーンからはつんざくような金属音がきこえてくる。

コフカは名著「ゲシュタルト心理学の諸原理」の中で、「なぜ物は現に見えるとおりに見えるのか」と問いをたて、これにこたえるのがゲシュタルト心理学の課題だとのべた。認知心理学もまさにそのように問いをたて、それにこたえようとする。つまり認知心理学は、現に目の前にくりひろげられる知覚風景を、現象学的に記述するよりは、むしろ現に知覚されていることが、なぜそのように知覚されるのかを知る(説明する)試みなのである。

そこで先の音楽会の知覚風景を念頭におきながら、認知心理学では、これをどのように理解しようとし、その際、何が問題になるのかを考えてみることにしよう。認知心理学のモデルでは、まず外界の多様な情報が人間の感覚器官に入力情報として摂取されるところから出発する。ここでは視覚と聴覚に話を限定しよう。

1. 感覚過程

視覚の水準では、たとえばある弦楽器から反射された光(視覚情報)が網膜の明暗をとらえる視細胞や、それぞれ赤色、緑色、青色をとらえる視細胞によって並列的にとりこまれ、その後、3次元的なその楽器の面を構成するように、とりこまれた視覚情報の輝度とスペクトルがその目的に応じて並列に分散処理される。聴覚の水準では、さまざまな楽器から発せられた音波が鼓膜につたえられ、そこで鼓膜の機械的振動に変換され、次にそれが耳小骨を経由して蝸牛(かぎゅう)管につたえられ、その基底膜を振動させる。そして、この基底膜にある内有毛細胞や外有毛細胞の働きによってその音波の周波数分析がおこなわれる。眼球運動:耳

2. 感覚器における情報処理

感覚器における細胞レベルの処理や分析は、感覚器に固有の制約をもち、視覚の場合は、光エネルギー(電磁波)だけが処理され、聴覚の場合には、音波だけが処理される(これを感覚器に対する適刺激という)。また古典的研究が明らかにしてきたように、適刺激であっても、それが処理可能となるためには、一定の範囲内の強度であることが必要である。処理されて知覚をもたらすのに必要な下限の強度の刺激を刺激閾(しげきいき)または絶対閾、上限の強度の刺激を刺激頂といい、また知覚可能な最小の刺激間強度を弁別閾という。刺激閾と刺激頂については、人間の耳に聞こえる音波は16~20000Hz(ヘルツ)の間であって、それを下まわるかあるいは上まわる振動数の音はきこえないという例がわかりやすい。また、弁別閾はそれぞれの感覚の様相によってことなるが、一般に基準となる刺激をS、弁別閾をΔSとするとき、ΔS/Sの比は一定であることが知られており、これはウェーバー比とよばれている。

3. 感覚記憶

さて、このように末梢器官で処理され、心的表象(頭の中の記号)に書きかえられた多様な情報は、感覚記憶とよばれる機構に短時間保持され、そこでどの情報をより高次の処理にかけるか選択される。選択され処理された情報は、次の短期記憶に貯蔵され、それ以外の情報はそこで消失する。このことは、情報はたんに感覚過程から知覚過程へと、一方通行にながれるものではなく、すでに稼働している知覚過程から感覚過程の情報が、逆向きの影響をうけることがあること、したがって両過程は、相互作用することが示唆される。

視覚の場合の感覚記憶をアイコニック・メモリーiconic memoryとよび、そこに保存される情報をアイコンiconとよぶ。この記憶容量はきわめて大きく、またその保持時間はスパーリングの実験から、およそ0.2秒前後といわれている。また、聴覚の場合の感覚記憶をエコイック・メモリーechoic memoryとよび、そこに保存される情報をエコーechoとよぶ。エコーはアイコンよりもかなり保持時間が長いことが知られている。

4. 知覚過程

先の音楽会風景で、今、指揮者の向かい側にいるビオラ奏者のビオラに注意をむけるとしよう。視覚の場合、まず網膜において処理された輝度とスペクトルから、どのようにしてビオラという物体の認識が、可能になるかが問題になる。ビオラは奏者の動きによって、あるいは聴衆である自分のちょっとした姿勢の変化によって、その形態のさまざまな側面をみせる。それは奥行きのある特有の形をもった3次元の物体としてみえ、こい茶色のつやのある肌理(きめ:テクスチャー)をもつものとみえる。

今日の認知心理学では、まずこれを「面」の再構成の問題と考える。3次元の面は形、両眼視差、陰影、肌理、色、明るさ、動きなどの次元をもっているが、網膜で処理された段階の情報では、これらの次元に関する情報が一体になっており、次の処理段階でこれらの次元(視覚モジュールという)がある程度独立して並列処理され、それらが最終的に統合されて、ビオラの知覚をもたらすと考えられている。

5. 視覚的パターン認知

第1に、古くはゲシュタルト心理学が明らかにした図と地の分化である。選択的注意がビオラにむけられるとき、それが図になって前景にでて、その周辺の人や楽器は背景となって後景にしりぞく。最近の研究によれば、図の処理には解像度の高い低速処理がおこなわれる視覚チャンネルがつかわれ、地の処理には解像度の低い、しかし高速処理が可能な視覚チャンネルがつかわれるという。もちろん図と地の処理は、図の領域を図として明確に分化させるばかりでなく、輪郭や奥行き(奥行き知覚)の情報処理など、ほかの処理過程と密接にむすびついている。

第2は欠落情報の補完の問題である。網膜の乳頭(いわゆる盲点)には光に反応する視細胞がないので、外界刺激がそこを横切って像をむすぶ場合には、われわれは途中でとぎれた形を知覚するはずであるが、実際にはそうはならない。そこから、視覚には欠如した情報を視野のほかの情報から補完するような働きがあることが予想される。

補完には断続した線分を1本の連続した線分にする完結化、欠落した色の部分をうめあわせる充填(じゅうてん)化があることが知られている。今、円形の一部に正方形をのせるとき、そこにできる図形は、正方形全体と円の一部が切れた図形とが、ぴったり隣接してできた図形とはみえない。むしろ正方形の背後に円図形があるとみるほうが自然である。欠落した部分を補完してその「固有輪郭」を構成することは、パターン認知には欠かせない働きである。

ある刺激パターンがあるとき、そのパターンが外的対象の何に対応するか、いいかえれば、そのパターンの意味は何かを知る働きをパターン認知という。これは、脳内あるいはコンピューターの場合は、システム内に書きこまれている概念(ある対象についての内的表象、コンピューターの場合はその対象についての知識表現)と、入力情報とをマッチングさせる過程でもある。

5.A. 鋳型照合モデル

その中でも、もっとも単純で以前から考えられてきたのは、頭の中にいくつもの鋳型があらかじめあって、それと入力情報とが照合されるという鋳型照合template matchingの考えである。実際、カエルの網膜には、虫の像(あるいはそれに似た形)がうつったときに応答する細胞があることが知られている。また、初期のコンピューターの図形認識は、この鋳型照合のモデルにもとづいておこなわれるものが多かった。

このモデルは、刺激パターンの大きさや傾きなどが鋳型とずれた場合にどうするかに問題をのこしている。すなわち、ことなる条件それぞれに対応する鋳型を考えるのは、鋳型の数が膨大にならざるをえない点で問題であり、また刺激パターンのほうをあらかじめ正規化するように前処理がほどこされるのだと考えるのも、その正規化の複雑な処理を考えなければならない点が問題である。

こうして、鋳型照合モデルはさまざまな難点をもつと当初から考えられてきたが、最近では鋳型を実空間の中で考えない、新しい鋳型照合モデルも提出されている。

5.B. 特徴抽出

次に考えられるのは、ある図形を他から区別してとらえるうえに有効な複数の示差的特徴(distinctive features=水平・垂直・斜めの線分、閉曲線、交点など)を抽出してリストをつくり、個々の示差的特徴の有無によって、その形を代表させる(内的表現とする)というモデルである。このような特徴分析的な認知モデルとしては、セルフリッジのアルファベット文字を識別するためのパンデモニアム・モデルが有名である。

たとえば文字Rの識別は、その刺激パターンがまず「イメージ・デーモン」の層において内的表象(内部表現)に変換され、次にその変換されたデータが「特徴検出デーモン」の層(これは28個の特徴のリストからなる)において、それぞれの特徴の有無に関する並列処理をうけ、その出力が「認知デーモン」の層にいれられる。この「認知デーモン」は特定のアルファベット文字をみはっていて、特徴検出デーモンからの出力に該当するものがあれば活性化する。これによっていくつか活性化する文字があるなかで、特徴検出デーモンからの入力を多数ふくむものが「決定デーモン」の層で判別されて、「R」という文字の最終認知に到達する。

この特徴検出に関しては、神経生理学的水準でもそれに類するものがあることが知られている。たとえば前出のヒューベルとウィーゼルは、ネコの視覚受容野の神経細胞には、単純細胞、複雑細胞、超複雑細胞の3種があって、それらは線分、傾き、角、境界などの刺激特性に選択的に反応することをみいだし、これらを特性検出器とよんでいる。また、視覚神経系の中には、両眼視差や刺激の動きとその方向などの特性を抽出する神経回路があることも発見されており、それらは奥行き知覚や運動知覚に関連があるといわれている。

5.C. 3次元知覚モデル

これまでみてきたのは2次元のパターン認知であったが、実際の物体の知覚は、ほとんどが3次元的である。ここで、網膜の2次元的なデータからどのようにして3次元的な特徴を再構成するのか(認知するのか)という問題が生じる。しかもその物体の同定は、観察者の移動や対象物の動きによって観察点が変化すれば、3次元の物体の2次元的像の形状がいちじるしく変化するという制約のもとでおこなわれなければならない。

とくに工学的な画像処理などでの対象の同定過程では、観察点に左右されない形状の特性抽出が必要になってくる。マーによれば、どのような物体も、長さと太さがことなる何個かの円筒形によって、内的表象(内部表現)をえがけるという。ちなみに人間は、頭部、胴体、両手、両足の合計6個の円筒形で表示される。同じくビーダーマンは、弧や線分から構成されるジオンgeonという名の36種の立体(のちには24個に縮減)を考え、これによって物体の内部表現を考えようとしている。

5.D. 総合による分析モデル

以上のモデルは対象の特徴を分析し、いわばボトムアップ型に情報処理を考えるものであった。そこでは背景や文脈効果、知覚主体の動機付けなど、周辺情報や主体的要因が顧慮されていない。これに対してナイサーは「総合による分析モデル」を提唱する。それによれば、刺激の予備的分析、背景情報や文脈情報との対照、既存の知識などにもとづいて、まず対象についての仮説が構成される(この刺激パターンはAである、という仮説的同定判断がなされる)。次に、その仮説的対象から予想される特徴が、あたえられた刺激にふくまれているかどうかの分析がおこなわれる(これが対象Aであるなら、それはその示差的特徴fをもっているはずだ)。それが検出されれば同定は確定し、仮説とことなる特徴がみいだされれば仮説が修正されて同じ処理がくりかえされる。

総合と分析が循環する情報処理がおこなわれ、最終的な認知に到達する。このモデルは、刺激の情報処理が仮説からトップダウン型に展開されるという点で、これまでのモデルとはことなり、選択的注意や刺激の特徴探索が、その暫定的仮説に規定されることを示唆している。

5.E. ナイサーからの発展

ナイサーのこのモデルは、パターン認知における文脈効果や選択的注意の問題を喚起して、多数の研究を生みだした。一般に対象の認知は、それが文脈に適合している場合には、促進され、適合していない場合には、妨害される。また、対象があいまいであるときほど文脈効果はいちじるしいことも知られている。ここに文脈とは、ある事物がどのようなものと同時にあらわれることが多いか、という空間的文脈、ある事象は、どのような継起においてほかの事象とつながっているか、という時間的文脈にわかれ、それぞれは、後出の経験的知識(スキーマやスクリプトあるいはヒューリスティクス)に依存している(シェム)。

6. 選択的注意

感覚器で処理された情報がアイコニック・メモリーにはいっているときは、まだ前注意の状態にある。そこには外界の多様な情報がはいっているはずであるが、われわれの認知はそのごく一部分にかぎられるところをみると、そこに情報の取捨選択がはたらき、それを支配しているのが選択的注意の過程であると考えられる。この選択的注意は、視覚的にはたらくばかりでなく、聴覚的にもはたらく。大勢の人の声の中から特定の人の声をききわけることができるのは、選択的聴取の働きによる。

選択的注意の働きはさまざまなメタファー(比喩)によって考えられてきた。そのひとつはスポットライト・メタファーである。これは一定の注意領域内にある情報の処理が促進され、しかもその注意領域が移動するという考えにもとづくもので、このスポットライトの大きさや移動の速さなどがしらべられている。

もうひとつはズームレンズ・メタファーである。これは注意領域の大きさは知覚事態によってかわるのではないか、との考えにたち、カメラのズームレンズは、ひろい視野をカバーするときは、その空間解像度は低下し、視野がせまく限定されるときには、その空間解像度はあがるところから、注意にもこのズームレンズの働きに相応する働きがあるのではないか、というものである。このメタファーは、いろいろな点でスポットライト・メタファーと対立するので、種々の実験によってどのような事態にどちらのメタファーがより適切かの条件がしらべられている。

6.A. 眼球運動との連関

選択的注意と眼球運動との関係は、注視点のサッケード(飛躍運動)によってしらべられてきた。たとえば、周辺視野にある目標物がとらえられるとき、そこに注視点がさっと移動し、中心視によってそれをとらえなおすような変化がおこる。このときの注視点の移動をサッケードとよぶ。

一般に1点に凝視点が停留している時間は、およそ0.2秒、そして停留点から次の停留点までのサッケードに要する時間は、およそ0.05秒、さらにサッケードの間は、網膜情報処理が抑制されることが知られている。このようなサッケードが、選択的注意と関係があることはいうまでもない。

6.B. さまざまな課題

これまで、認知心理学の問題の立て方や議論の仕方を駆け足で概観してきた。音楽会のシーン全体を視野にとらえた状態から、ビオラ奏者に注意をむけ、さらに楽器のビオラに注意をむけ、その3次元的な物体をビオラと同定する過程が、さまざまなモデルでどのように説明されるかをみてきた。しかし、古典的な知覚研究との関連からすれば、なお形や大きさの恒常性(知覚の恒常性)という問題や、奥行き知覚の問題、奏者の運動と知覚との関係などが明らかにされなければならず、ひとつの知覚的風景の視覚面にかぎってさえ、それを今の認知心理学の枠組みのもとに完璧に理解することがいかにむずかしいかがわかるだろう。

さらに聴覚的側面についていえば、オーケストラの演奏をとおして耳にはいってくるさまざまな楽器の音が末梢感覚器において周波数分析にかけられることは、すでにみたとおりである。しかし少なくとも、わたしの耳は、楽器全体がかなでる音のハーモニーをききながら、他方でそれぞれの楽器の音をその位置に定位することができ、また注意をビオラにむけるときには、その音のハーモニーの中に、バイオリンやチェロの音とは区別してそのビオラの音をききわけることさえできる。

このような音源定位の問題や音脈分凝の問題もわれわれの聴覚的認知の基本的な問題であろう。つまり、聴覚の末梢部位でえられた情報がどのように分解されて、音源定位と音脈分凝をもたらすかという問題である。

さらに、今きこえてくる旋律は、ある作曲家のある作品のある楽章であることをわたしは知っており、次にどのような旋律がくるかを予期し、しかも、すでに何度もききなれた著名な指揮者による名盤の演奏と比較して、今耳にするその演奏がうまいのかへたなのかの審美的な判断もおこなっている。音楽会である演奏をきくということは、このように現在の聴取経験と過去の経験とが混交するなかで、審美的判断をもふくむさまざまな認知が同時進行するということなのである。このような視覚的、聴覚的な知覚過程に記憶過程がからんでくることはいうまでもない。