목 차
1. 서론
2. 신경망 모형
3. 과학적 지식의 표현
4. 과학적 설명
5. 결론
--------------------------------------------------------------------------------
발행자명 중앙대학교부설 중앙철학연구소
학술지명 철학탐구
ISSN
권 14
호
출판일 2002.
처칠랜드의 연결주의적 과학철학
Churchland′s Connectionist Philosophy of Science
이영의
(Rhee, Young-Eui)
2-210-0201-05
영문요약
Connectionism as a cognitive architecture of mind can suggest a new powerful way to study philosophy of science. Recently, a new naturalized trend has emerged to view traditional problems of philosophy of science in the perspective given by cognitive science. I think that the trend can be classified as a new school in philosophy of science, and, accordingly, called as the connectionist philosophy of science. In this paper I explicate the scope and limit of connectionist philosophy of science by examining its typical theory suggested by Churchland, a leading philosopher in the area. The paper goes to some fundamental items of Churchland′s connectionist philosophy of science- recurrent neural networks, distributed knowledge representation, and theory of scientific explanation based on similarity and prototype.
--------------------------------------------------------------------------------
1. 서론
인지 체계를 연구하는 인지과학은 다양한 인지 현상들이 발생하는 구조를 '인지 구성'(architecture of cognition)이라는 개념을 통하여 설명한다. 인지과학은 1950년대 후반 이후로 기호주의(symbolism)와 연결주의(connectionism)에 의해 주도되어 왔기 때문에 인지 구성에 관한 대표적 이론들은 그 두 가지 접근에서 나타난다 기호주의에 따르면 인지는 기본적으로 현재 우리가 사용하는 폰 노이만 방식의 "컴퓨터적 구성"을 갖는다. 즉 인지는 기호로 표시된 정보를 규칙에 따라서 처리하는 과정이다. 반면에 연결주의는 인지의 물리적 기반인 뇌의 구성을 강조하기 때문에 "뇌적 구성"을 제시한다. 연결주의에 따르면 인지는 수많은 신경세포들이 상호 연결된 망에서 나타나는 현상이므로 신경세포들의 연결과 작동을 모의한 인공 신경망 모형을 이용하여 설명되어야 한다.
철학자들은 전통적으로 사고를 명제 중심적으로 분석하고 설명해왔다. 철학자들은 명제가 사고의 기본 단위이며, 사고는 명제들에 논리학의 추론규칙과 같은 규칙들의 조작을 통하여 발생한다고 생각해왔다. 기호주의는 인지 구성에 관한 한 기본적으로 명제 중심적인 철학적 접근과 일치한다. 반면에, 연결주의는 명제 중심적인 접근을 부정하기 때문에 인지과학 뿐만 아니라 철학의 분야에서도 "혁명적인 영향"을 미칠 수 있다. 연결주의는 그 동안 철학 분야에서 주로 심리철학을 중심으로 활발하게 논의되어 왔으며 우리는 이미 그 혁명적 영향을 처칠랜드(Churchland)의 제거적 유물론을 통하여 감지할 수 있다.
연결주의가 철학의 분야에 수용되는 과정에서 두 가지 점에서 기호주의와는 매우 다른 양상을 보이고 있다. 우선, 연결주의가 심리철학에서 활발하게 논의되고 있는 사실과는 대조적으로 과학철학에서는 그렇지 못하다. 인지 구성의 이론으로서 연결주의가 심리철학에 중요한 함축을 갖는 것이 사실이라면, 과학적 추리와 그 결과인 이론 체계를 다루는 과학철학에도 동일한 함축을 갖는다는 것은 분명하다. 이 글에서 나는 과학철학을 연구하는데 있어서 연결주의에 근거를 두는 접근을 연결주의적 과학철학(connectionist philosophy of science)이라고 하겠다. 인지과학이 활성화된 1970년대 이후로 인지과학과 과학철학의 밀접한 관계를 예견하고 그 관계를 집중적으로 연구한 사람들이 있다. 예를 들어, 싸이먼(Simon)은 과학적 발견의 과정을 모의하는 프로그램(BACON)을 만들어서 귀납 이론을 검토하고, 글리무어(Glymour)는 인과적 추리를 모의하는 프로그램(TETRAD)을 제시했다. 이러한 선구자들은 과학적 추리에 관한 철학 이론들을 프로그램에서 실제로 작동하여 검사하려고 하기 때문에 인공지능은 과학철학의 이론들의 "시험 장소"에 해당한다. 싸이먼과 글리무어는 명제 중심적인 과학철학을 지지하기 때문에 기호주의를 인지 구성의 이론으로서 가정하였다. 연결주의적 과학철학은 아직까지는 발전의 초기 단계에 있다. 기호주의적 과학철학에 비교해 볼 때 연결주의적 과학철학은 소수의 학자들에 의해 연구되고 있는데, 그 중 대표적인 철학자로서는 벡텔(Bechtel: 1994, 1996), 처칠랜드(1989: 1992), 기어리(Giere: 1992, 1994, 2002), 타가드(Thagard: 1989, 1992)를 꼽을 수 있다.
연결주의적 과학철학은 연구자에 따라 그 내용이 상당히 다르지만 그들의 철학을 하나의 이름으로 부를 수 있는 근거는 연결주의에 기반을 두고 있다는 점이다. 이 글은 "연결주의적 과학철학이란 무엇인가"라는 질문에 대해 구체적인 예를 제시함으로써 그 대답을 추구하는 출발점을 제공한다. 나는 이 글에서 연결주의적 과학철학이 기반을 두는 인공 신경망을 중심으로 처칠랜드가 제시하는 연결주의적 과학철학을 구성하는 기본적 특징을 제시할 것이다. 논의 순서는 다음과 같다. 2장에서는 연결주의적 과학철학의 토대를 이루는 인공 신경망 모형을 구성하는 몇 가지 핵심 요소들이 검토되고, 3장에서는 인공 신경망에서 과학적 이론이 표현되는 방식이 검토된다. 마지막으로 4장에서는 처칠랜드의 과학적 실명에 관한 이론이 비판적으로 검토된다.
2. 신경망 모형
인지 구성의 이론으로서의 연결주의가 갖는 일차적 특징은 인간의 뇌를 기반으로 하는 인지 모형을 제시한다는 데 있다. 연결주의자들은 기호주의를 적절한 "인지 이론"이라고 생각하지 않으며, 인지를 분석하는데 있어서 올바른 접근은 인지 현상의 모체인 뇌에 기반을 둔 구성이어야 한다고 주장한다.
인간의 뇌를 연구하는 신경과학은 아직까지는 발전의 초기 단계에 있기 때문에 우리가 뇌를 "과학적으로 이해하고 있다"고 자신 있게 말할 수 있기까지는 상당한 시간이 필요할 것이다. 그러나 우리는 지금까지의 신경과학의 연구 성과를 바탕으로 뇌의 작용에 관한 기본적인 사항들을 설명할 수 있게 되었다. 신경과학의 연구 결과에 의하면, 인간의 뇌는 무게가 1,500g 정도이고 약 천억개 이상의 신경 세포들로 구성되어 있다. 신경세포는 기본적으로 세포체, 수상돌기, 축색돌기로 구성되어 있는데, 하나의 신경세포는 다른 신경세포로부터 수상돌기를 통해 전기 화학적 정보를 수용하여 축색돌기를 통해 다른 신경세포로 정보를 전달한다. 하나의 신경세포의 축색돌기와 다른 신경세포의 수상돌기의 연결을 시냅스라고 한다. 신경세포들의 전형적인 전기 화학적 정보의 교환은 시냅스의 한쪽에 있는 축색돌기의 종말에서 신경전달 물질이라고 불리는 화학물질이 방출되고 신경전달 물질이 다른 신경세포의 수상돌기의 세포막에 작용하여 전위를 변화시키는 과정을 통하여 발생한다. 방출된 신경전달 물질의 종류에 따라서 세포막에서의 전위차가 증가하거나 감소하는데, 전위차가 감소되는 시냅스를 흥분적 연결, 증가되는 시냅스를 억제적 연결이라고 한다.
연결주의는 뇌의 구조와 작용을 모의하는 인공 신경망(artificial neural network, 이하 신경망)을 구성하여 인지를 설명한다. 신경망에 대한 연구는 1940년대 초에 맥쿨로치와 피츠(McCulloch and Pitts: 1943)에 의해 시작되었다.1) 맥쿨로치와 피츠는 신경망의 활동을 기술하기 위해 기호논리학을 이용했는데 논리적 기호들로 표현된 추리들이 신경망에서 계산될 수 있음을 증명했다. 이와 같이 형식적으로 표현된 신경망이 무한한 메모리를 갖추게 되면 범용 튜링기계(Universal Turing machine)와 동일한 계산 능력을 갖게 된다는 점에서 그들의 이론은 신경망 연구의 기초를 제공하였다는 데 그 의의가 있다. 그러나 맥쿨로치와 피츠가 제시한 신경망개념이 현재와 같은 대규모의 신경망으로 발전하기까지는 많은 이론들이 필요하게 된다.2) 신경망 이론은 다음과 같이 대략 세 가지의 단계를 거쳐서 발전해왔다. 첫째, 맥쿨로치와 피츠가 제안한 신경망은 오작동이나 부분적 손상의 경우에서는 제대로 작동하지 않는 문제점을 갖고 있었는데 그 문제는 주어진 과제를 다수의 기본 단위들이 동시에 수행하는 병렬 처리와 기본 단위들의 다중 연결을 이용한 분산 처리를 통하여 해결되었다.3)
둘째, 신경망에서의 기억과 학습의 문제는 헤브(Hebb)에 의해 해결되었다. 헤브의 제안에 따르면, 기억은 신경세포들의 연결에 저장되고 학습은 시냅스의 수정에 의해 발생한다. 헤브가 제안한 시냅스의 수정 개념은 주어진 과제를 수행하면서 동시에 학습할 수 있는 신경망 연구를 촉진했다. 로젠블랏(Rosenblatt)은 수정 가능한 연결을 갖는 신경망이 패턴들의 집합을 분류하도록 훈련할 수 있음을 증명했다. 그는 자신이 개발한 신경망을 퍼셉트론(perceptron)이라고 불렀는데, 퍼셉트론은 고정된 연결 가중치와 절대적 억제를 사용하는 이전의 신경망과는 달리 상대적 억제를 지닌 가변적 연결 가중치를 갖는다. 로젠블랏에 의해 병렬 분산 처리와 학습과 같은 연결주의의 기본 개념들이 완성됨으로써 초기의 신경망 연구는 거의 완성되었다.
초기의 신경망 연구자들은 자신들이 개발한 신경망 모형이 기호주의적 계산 모형과 근본적으로 다르며 새로운 종류의 인지 모형이라고 생각했다. 그러나 이러한 자신감은 민스키와 파페트(Minsky and Papert)가 퍼셉트론이 패턴 인식과 계산의 도구로서 근본적 한계가 있다는 점을 증명함으로써 흔들리게 된다. 예를 들어, 퍼셉트론은 배타적 선언(exclusive or)의 함수를 계산할 수 없다는 것이 드러났다. 민스키와 파페트는 신경망이 배타적 선언의 함수를 계산하기 위해서는 입력층과 출력층 사이에 숨겨진 층(hidden layer)이 있어야 하는데, 숨겨진 층을 갖는 다층 신경망에 대한 학습의 절차는 구성될 수 없을 것이라고 예측했다. 이러한 예측은 퍼셉트론과 신경망 연구에 결정적으로 부정적인 영향을 미쳤고 1970년대는 기호주의가 인공지능과 인지과학의 주류를 형성하게 된다. 그러나 신경망 연구는 1980년대에 들어서 다층 신경망의 훈련 방법을 비롯한 새로운 이론들이 개발됨으로써 활성화되었다. 이러한 현상은 한편으로는 기호주의에 기반을 둔 인공지능 연구의 문제점들이 드러나고 다른 한편으로는 신경생리학에 관심을 갖는 인지과학자들이 늘어나는 것과 시기적으로 일치한다. 1980년대의 연결주의의 부활을 주도한 맥클랜드와 루멜하트(McClland and Rumelhart)는 다층의 신경망을 학습시키는 강력한 방법인 역전파(back propagation) 방법을 개발했다 다층 신경망에 관한 학습 이론의 개발이 신경망 이론의 발전에서 마지막 단계에 속한다.
신경망은 기본적으로 다음과 같이 구성된다. 신경망은 뇌를 구성하는 신경세포를 기본 단위(unit)로 모의하고, 신경세포의 수상돌기와 축색돌기는 전선, 시냅스는 가중치를 갖는 저항으로 모의한다. 기본 단위는 활성화의 값을 갖고, 특정한 기본 단위가 다른 기본 단위로 보내는 신호의 강도와 다른 기본 단위에 대한 영향력의 정도는 활성화의 값에 의해 결정된다. 기본 단위에 주어진 모든 입력값은 가중치와 함께 곱해지고 그러한 계산의 합은 더해져서 해당 기본 단위의 전체 입력이 된다. 개별적 기본 단위의 연결에는 가중치가 부여되는데, 가중치가 양수이면 연결은 기본 단위를 흥분시키고 음수이면 억제시킨다 그러므로 연결 가중치의 수정을 통해서 연결 방식이 수정되면 연결을 통하여 표현되는 지식의 구조가 변하게 된다. 연결 가중치의 수정으로 인한 표현된 지식의 변화를 학습이라고 한다. 앞에서 거론된 역전파의 학습 방법은 두 가지 단계로 구성된다. 먼저, 하나의 입력이 신경망에 주어지고, 신경망이 한 동안 작동한 추에 출력층에 있는 기본 단위들의 값이 부여된다. 만약 단위들이 부여된 값을 갖게 되면 초기 가중치들은 그대로 유지된다. 만약 그렇지 못하면, 가중치들은 실제값과 목표값의 차이에 따라서 수정된다. 이러한 차이는 입력층에서 출력층에로의 방향과는 정반대의 방향으로 차례로 전달되어서 숨겨진 층과 입력층층에서의 가중치의 수정을 야기하게 된다. 이러한 연결 방식을 가진 신경망의 전체 상태는 하나의 벡터량으로 표현된다.
신경망이 적절한 방식으로 작동하기 위해서는 학습이 필요하다는 사실은 인지 구성에 함축하는 바가 크다. 우선, 신경망에서의 학습은 "귀납으로부터의 학습 과정"을 모의하는 것이라고 볼 수 있다. 또한, 인지는 기호주의가 전제하듯이 규칙 준수적이 아니라는 점이 드러난다. 신경망은 입력으로부터 목표값이 출력될 때까지 학습되지만, 기호주의적 모형과는 달리 모든 과정을 통제하는 규칙들의 집합이 필요하지 않다. 가장 단순한 인지 구성의 모형은 하나의 입력층, 숨겨진 층, 출력층으로 구성된 3층 신경망 모형인데, 인지 현상을 구체적으로 모의하기 위해서는 그 보다 훨씬 복잡한 모형이 필요하다. 인지과학자들은 인지 현상들을 모의하기 위해서 다음과 같은 두 가지 방향을 택하고 있다. 우선, 하나의 숨겨진 층이 아니라 필요한 만큼의 숨겨진 층을 이용하는 것이다. 또 다른 방향은 세 가지 층 이외에 특정한 과제를 수행하는 새로운 층을 도입하는 것이다. 예를 들어 조단(Jordan, 1986)은 운동 조종과 같은 연속적 현상을 모의하기 위해서 통상적인 세 가지 층 외에 맥락층(contexts units)을 가진 신경망 모형을 제안했다. 그가 제시한 모형에서 기존의 층들은 기본적 모형에서와 동일한 기능을 하고, 맥락층은 출력층과 그 자체로부터 정보를 받아서 현재까지의 처리를 기억하는 기능을 한다. 조단이 제안한 신경망과 같은 종류의 다층신경망을 재귀적 신경망(recurrent network)이라고 하는데, 그러한 신경망은 음소들의 순서, 운동의 순서, 선박의 회전 순서 등을 모의하는데 성공적으로 적용되었다. 다음에 논의될 처칠랜드의 연결주의적 과학철학은 역번파 학습과 재귀적 신경망을 기본으로 하는 신경망 모형을 전제로 한다.
3. 과학적 지식의 표현
앞에서 논의된 신경망은 일반적 인지 모형으로 제시되었으므로 일상적 지식뿐만 아니라 과학적 지식에도 적용될 수 있다. 기호주의에서는 지식, 특히 과학적 지식은 명제로 구성되며 언어적으로 표현된다. 그러나 앞에서 보았듯이 신경망에서 지식이 표현되는 방식은 기호주의 경우와는 근본적으로 차이가 난다. 신경망에서 지식이 표현되는 방식을 검토하기 위해서 개별적 기본 단위가 표현하는 대상이 무엇인가를 생각해 보자. 연결주의자들은 신경망을 구성하는 기본 단위들이 표현하는 대상에 대해 두 가지 다른 해석을 제시하고 있다. 먼저 개별적 기본 단위는 개념 또는 명제를 표현한다고 보는 입장이 있는데, 이러한 입장에서 지식을 표현하는 방식을 국소적 (지식) 표현(local representation)이라고 한다. 국소적 표현을 가진 신경망이 표현하는 것은 개개의 기본 단위가 표현하는 개념 또는 명제들이 적절한 관계에 놓여있는 상태에서 표현되는 전체적 지식이 될 것이다. 과학적 추리의 경우는 전체적 지식은 이론이 된다. 국소적 표현을 수용하는 신경망으로서는 타가드가 구성한 에코(Echo) 프로그램이 좋은 예에 해당한다.4)
한편, 국소적 표현 방식과는 달리 지식 표현의 단위를 개별적 기본 단위가 아니라 전체 신경망으로 보는 입장이 있다. 이러한 입장에서 지식을 표현하는 방식을 분산적 (지식) 표현(distributed representation)이라고 하는데 세흐노브스키와 로젠버그(Sejnowski and Rosenberg: 1987)가 구성한 넷토크(NETtalk)의 경우가 그 대표적인 예에 속한다. 분산적 표현을 지지하는 입장에 따르면, 신경망 전체가 하나의 지식을 표현하기 때문에 개별적 기본 단위는 지식의 구성 요소가 아니다. 분산적 표현을 지지하는 연구자들에게는 기본 단위가 표현하는 것이 무엇인가라는 질문은 인식론적 질문이 아니라 생리 화학적 질문에 해당한다. 기본단위에서 표현되는 것은 전기 화학적 부호들이며 지식의 기본 단위인 개념과 명제가 아니다. 개념과 명제는 기본 단위가 아니라 그러한 기본 단위들이 모여서 구성하는 벡터 공간에서 표현된다. 그러므로, 신경망의 활성화 상태를 나타내는 벡터 공간이 인식론적으로 그리고 의미론적으로 의미 있는 개념 공간이 된다.
이제 분산적 표현의 방식을 가진 재귀적 다층 신경망에서 과학적 지식이 표현되는 방식을 검토해보자. 신경망에서 입력층은 인지 체계가 처한 환경으로부터 정보를 수용한다. 입력층에서 발생하는 환경으로부터의 정보의 수용은 감각기관에서의 지각의 과정에 대응된다. 지식의 기원에 관한 경험주의적 전통에 따르면, 과학적 지식과 같은 추상적 지식 체계는 체계적인 과학적 관찰과 실험으로부터 주어지는 자료를 기반으로 성립한다. 그러한 자료들이 어떠한 방식으로 법칙과 이론에 연결되는가에 대해 일반적으로 일치된 견해는 없지만, 일차적인 감각적 정보의 단계는 범주화와 개념화의 과정을 거쳐서 추상적인 단계로 이행한다는 점에 대해서는 인지과학자들간에 일반적 합의가 이루어져 있다. 특정한 개념을 갖는다는 것은 그 개념의 사례들의 속성들에 대해 안다는 것을 의미한다. 개념에 관한 전통적인 견해에 따르면, 개념의 속성들은 그것을 정의하기 위한 필요충분조건이다. 심리학자들은 이러한 입장을 고전적 견해라고 부르는데, 고전적 견해는 근본적 문제점들을 갖는다는 사실이 드러났다. 가장 치명적인 문제점은 일차적으로 자연종과 같은 개념도 필요충분조건으로서의 속성들에 의해서 정의하기가 사실상 불가능하다는 것이다. 심리학자들은 실험을 통하여 사람들이 특정한 대상이 특정한 개념의 사례인가를 판단하는데 있어서 대표성을 기준으로 한다는 점을 발견했다. 이러한 발견으로부터 개념에 관한 새로운 견해가 등장하게 되는데, 처음으로 로쉬(Rosch: 1975, 1978)에 의해 전형 이론(prototype theory)으로서 체계화되었다. 전형 이론에 따르면, 개념의 사례들은 속성들을 공유하는 정도에 의해서 해당 개념의 대표성이 판단된다. 로쉬의 전형 이론은 비트겐쉬타인(Wittgenstein, 1953)의 가족유사성 개념에 기반을 두고 있다. 가족의 구성원들이 일정한 정의적인 특성들을 갖지 않으면서도 서로 생김새가 비슷하듯이 개념의 구성원들 역시 서로 성질들을 공유한다는 점에서 닳았다는 것이다. 예를 들어, 새와 박새는 깃털이 있고, 날 수 있고, 몸집이 작고, 곤충을 먹고, 노래한다는 속성들을 공유한다. 반면에, 새와 대머리수리는 깃털이 있고, 날 수 있다는 속성만을 공유한다. 그러므로, 박새는 대머리수리에 비하여 새에 대한 보다 더 전형적인 사례이다. 특정 개념에 관한 가장 많은 속성을 공유하는 사례를 전형이라고 하는데, 로쉬의 분석에서는 박새가 새라는 개념의 전형이다.
신경망에서의 지식표현의 방식은 개념을 정의하는 필요충분조건이 아니라 개념의 사례들의 공통적 성질을 통한 유사성을 이용한 접근에 의해 더 잘 설명된다. 우리의 관심을 개념에서 이론으로 전환해보자. 과학적 이론이 신경망에서 표현되는 방식에 관한 처칠랜드의 이론은 앞에서 검토된 신경망, 특히 재현적 신경망과 인지심리학자들이 제시하는 유사성 개념에 기반을 두고 있다.5) 이론의 표현에 판한 처칠랜드의 설명이 전통적 철학적 설명과 차이가 나는 점은 신경망에서의 벡터 공간을 중심으로 전개된다는 것이다. 처칠랜드에 의하면, 이론은 매우 구조화된 전형이며, 그 전형은 벡터공간에서의 특정한 점에 해당한다. 특정인의 세계에 관한 전체적 이론은 그 사람의 뇌의 공간에서의 특정한 점이다.6) 즉, 특정인의 세계에 대한 전체적 이론은 그의 신경망을 최적화 상태로 유도한 가중치들의 할당 방식이다. 우리는 주로 교육과 학습을 통하여 세계에 관한 이론을 형성한다. 그러한 형성 과정에서 이론을 구성하는 개념들 또는 국소 이론들의 충돌을 예상할 수 있는데 그의 인지 체계는 적절한 가중치를 부여하는 방식으로, 즉 학습 과정을 통하여 중요한 충돌을 해소할 것이다. 이처럼 인지체계에서 나타나는 중요한 충돌들이 해결된 상태를 "최적화 상태"라고 하고, 개인의 전체 이론은 바로 최적화 상태를 유도한 가중치 할당의 방식이다.
처칠랜드는 신경망에서 이론이 표현되는 방식을 설명하기 위해서 유사성에 기반을 둔 전형 개념을 적응한다. 처칠랜드에 따르면 특정인의 세계에 관한 전체 이론은 신경망의 벡터공간에서 특정한 위치를 점유하는 점으로 표현되며, 이론을 구성하는 개념들은 벡터 공간의 분할이다.7) 그의 주장을 앞에서 논의된 전형 개념을 이용하여 표현하면, 전체적 이론은 신경망의 전체적 벡터공간에서 나타나는 다양한 벡터들의 합 벡터이고, 그것은 외부 세계에 대한 그 사람의 전형이다. 한편, 전체적 이론을 표현하는 합벡터를 분할하는 다양한 벡터들은 일반적으로 사용되는 의미에서의 이론에 해당한다. 처칠랜드는 전체적 이론과 특정한 이론의 관계를 벡터들의 합 관계로 설명한다. 즉, 전체적 이론은 학습이 그 사람의 고차원적 신경세포적 활성화 공간, 즉 벡터공간에 걸쳐서 산출되는 분할들의 집합으로 구성되며, 열역학과 같은 특정 이론은 그러한 전체적 활성화 공간에서의 특정한 전형의 하부 부분으로 이해된다. 하부 부분으로서의 특정 이론은 다시 개념들이라는 하부 구조를 갖게 된다.8)
과학 이론을 신경망에서 구현되는 벡터 공간에서의 점이라고 보는 처칠랜드의 견해는 이론에 관한 전통적인 입장과는 매우 다르다. 그의 입장은 이론에 관한 공리적 입장에서 보면 충격적일 수 있지만 의미론적 입장과는 충분히 양립 가능하다. 예를 들어, 처칠랜드도 지적하고 있듯이, 이론에 관한 반 프라센(van Fraassen: 1980)의 견해에서 전체적 이론은 하나의 복잡한 술어라고 설명된다.9) 그러나 처칠랜드의 생각과는 달리 신경망의 지식표현 능력에 대해 회의적인 관점을 가진 인지학자들이 있다. 예를 들어, 포도와 르포르(Fodor and Lepore: 1992)는 신경망이 의미를 표현할 수 없다는 비판을 제기했다. 신경망의 의미론적 문제는 이 글의 주제를 벗어나지만, 처칠랜드(1992)는 최근 포도 등의 비판에 대해서 벡터공간의 의미론적 구성과 표현된 의미들의 변환을 효과적으로 보여주었다는 점은 지적할 필요가 있다.10)
4. 과학적 설명
지금까지 우리는 신경망의 작동에 관한 기본 사항들과 과학적 지식이 신경망에서 표현되는 방식을 살펴보았다. 신경망에서 과학적 지식이 표현되는 방식을 수용하면 처칠래드가 제시하듯이 과학적 설명은 신경망에서 발생하는 유일한 의미 있는 사건, 즉 "벡터의 활성화"일 것이다. 이제 신경망에서 표현된 과학적 지식 체계에서 설명이 이루어지는 방식을 살펴보자. 처칠랜드는 과학적 설명을 최상의 설명에로의 추리(inference to the best explanation)의 맥락에서 이해한다. 최상의 설명에로의 추리 이론에 따르면, 과학적 설명은 기본적으로 특이한 현상 또는 사건의 발생에 대한 가장 나은 설명을 추구하는 추리 과정에서 나타난다. 우리의 관심을 '최상의 설명'으로서의 설명이 신경망에서 발생하는 방식에 초점을 맞추기로 하자.
처칠랜드에 따르면 특정한 현상을 설명하는 것은 그 현상을 재인하는 과정과 본질적으로 동일하다. "설명적 이해는 잘 훈련된 신경망에서 하나의 특정한 전형 벡터의 활성화이다. 그것은 문제가 되는 경우를 하나의 일반적 유형, 즉 해당 생물체가 자세한 그리고 충분한 정보를 가진 표현을 갖고 있는 유형의 하나의 사례로 이해하는 것이다"(1989: 210). 과학적 설명은 유기체가 어떤 상황(피설명항)을 유리한 방향으로 처리하도록 만드는 전형(설명항)을 활성화하는 것이다. 처칠랜드에게 있어서 어떤 물체를 감각적으로 재인하는 것과 어떤 사실을 과학적으로 설명하는 것은 전형의 활성화이다. 앞에서 보았듯이, 감각적 재인 과정은 잘 훈련된 신경망에서 특정한 전형을 나타내는 벡터를 활성화시키는 과정이다. 그러므로, "최상의 설명"으로서의 과학적 설명은 지각적 재인과 마찬가지로 "가장 적절한 전형의 활성화"이다(1999: 218). 과학적 설명 이론들에서 나타나듯이, 과학적 설명의 대표적 유형은 이론을 이용하여 구체적인 사례를 설명하려고 한다. 과학적 설명은 이론적 부분과 감각적 부분이 접촉하는 과정에서 성립한다. 과학적 설명에 관한 전통적인 이론들은(아리스토텔레스, 포퍼, 헴펠의 이론) 그 과정을 연역적 관계라고 보았지만, 관찰과 실험의 과정에서 발생하는 감각적 재인 과정을 구체적으로 고려하지 않았다. 논리와 경험을 강조했던 논리경험주의 과학철학자들은 그러한 재인 과정을 "주어진 것"이라고 표현했다. 처칠랜드의 입장이 이전의 과학철학과차이가나는 것은 그 "주어진 것"을 포함하는 설명 이론을 제시한다는 것과 (심리학과는 달리) 재인 과정을 심리적 수준이 아니라 신경 생리적 수준에서 설명한다는 것이다.
과학적 이론과 설명에 관한 처칠랜드의 견해는 명제 중심적 과학철학의 입장에서 보았을 때 이질적으로 보일 것이다. 처칠랜드의 입장은 인지과학과 과학철학의 밀접한 관계를 강조하는 철학자의 입장에서 보았을 경우에도 충격적일 수 있다. 글리무어가 그 대표적인 예이다. 글리무어는 처칠랜드의 연결주의적 과학철학은 물리적 상태와 전산적 상태를 혼동하고 있으며,11) 자신이 제시한 과학철학의 중심 문제들을 전혀 설명하지 못하기 때문에12) 진정한 과학철학의 이론이 될 수 없다고 비판한다. 글리무어가 제시한 비판이 사실이라면, 즉 처칠랜드의 연결주의적 과학철학이 글리무어가 지적한 문제를 다루고 있지 않고 설명할 수 없다면, "특수적"과 대조적인 의미에서의 "일반적" 과학철학의 이론이라고 볼 수는 없다. 글리무어가 제시한 질문들은 전통적으로 과학철학의 문제들이기 때문에 어떠한 일반적 과학철학 이론이라도 그 질문들을 회피할 수 없다. 처칠랜드는 글리무어의 비판에 대해 그의 이론은 그 질문들을 모두 다루었으며, 글리무어가 그러한 비판을 하게 된 것은 자신의 글을 충분히 읽지 않았기 때문이라고 응수한다. 그러나 객관적인 입장에서 보았을 때 논쟁의 핵심은 처칠랜드가 글리무어의 질문들에 대답을 제시했는가의 여부가 아니라 처칠랜드가 제시하는 대답의 이론적 효율성이다. 그러므로 우리는 처칠랜드의 이론 중에서 글리무어의 질문과 직접적으로 관련된 부분을 구체적으로 살펴볼 필요가 있다.
먼저 "어떻게 이론이 공유되는가"라는 글리무어의 질문에 대한 처칠랜드의 설명을 살펴보자. 처칠랜드는 파동 이론을 공유하면서도 그것의 참에 대해서는 상반된 입장을 취하는 두 과학자의 예를 제시한다.13) 즉, 호이겐스는 파동 이론이 빛에 대해서 참이라고 생각하고 뉴턴은 입자 이론을 참이라고 보았다. 처칠랜드는 그들이 각자 자신의 활성화 공간에 걸쳐서 비슷한 분할 집합을 갖기 때문에 파동 이론을 공유하고 있다고 주장한다. 즉, 그들은 파동 이론에 대한 유사한 전형을 소유하고 있으며, 그 전형은 활성화를 통하여 적절한 방식으로 비슷한 인지적, 언어적, 조작적 행위를 산출한다. 그러나 그들이 가진 전형 이론은 상이한 방식으로 활성화된다. 호이겐스의 경우에서 그 전형은 수면파, 음파, 광파에 접했을 때 활성화되지만, 뉴턴의 경우는 그 전형은 단지 수면파와 음파에 접했을 경우에만 활성화된다. 뉴턴이 광파적 현상에 접했을 때, 활성화되는 전형은 입자 이론이다. 처칠랜드의 주장에서 핵심은 "호이겐스와 뉴턴의 활성화 공간은 매우 비슷하게 분할되어 있다"는 주장이다. 어떻게 매우 다른 방식으로 가중치가 부여된 두 가지 신경망들이 벡터공간에서 개략적으로 동일한 또는 유사한 분할을 생성할 수 있는가? 이에 대한 처칠랜드의 대답은 전체적 이론과 부분적 이론의 구분에서 발견된다. 호이겐스와 뉴턴의 경우에서 파동 이론은 전체적 이론이 아니라 부분적 이론이다. 부분적 이론으로서의 파동 이론은 파동 현상들에 관한 전형이다. 처칠랜드가 주장하는 점은 마치 박새와 대머리수리가 유사성을 중심으로 새라는 개념의 사례로 분류되듯이 파동이라는 과학적 개념은 호이겐스와 뉴턴의 경우에서 매우 비슷한 적용 사례를 갖는다는 것과 그러한 유사성은 개념 공간의 유사한 분할을 의미한다는 것이다.
이제 과학적 설명에 관한 평가 기준을 고려해 보자. 처칠랜드에 따르면 전형의 활성화, 즉 최상의 설명으로서의 과학적 설명이 연결주의적 과학철학에서 평가될 수 있는 네 가지의 차원이 있다.14) 즉 과학적 설명은 문제가 되는 일반적 유형을 충분히 묘사해야 하고, 강한 보증성(또는 낮은 애매성)을 가져야 하며, 다른 대안적 전형에 비하여 정확해야 하고, 가장 통합적 인지 구성의 부분이어야 한다. 처칠랜드는 그러한 기준 중에서 통합성의 기준을 강조하면서 통합성은 단순성과 밀접한 관련이 있다고 본다. 즉, 다른 모든 사정이 같을 경우 보다 단순한 이론이 보다 더 일반적이다.15) 통합성의 기준에 따르면, 활성화 공간에 걸쳐서 가장 단순하거나 또는 가장 통합된 분할을 형성한 신경망은 새로운 경우에 접하여 그것이 지닌 지식을 일반화하는데 보다 더 낫다. 그러한 신경망은 적절하게 통합된 유사성의 요인들을 갖고 있기 때문에 새로운 상황을 재인하는 데 더 낫다.
처칠랜드의 연결주의적 과학철학이 갖는 문제점을 글리무어가 제기한 문제를 중심으로 살펴보았다. 우리는 글리무어와 처칠랜드의 대립을 전통적인 기호주의적 과학철학과 연결주의적 과학철학의 대립으로 이해해야 한다. 위에서 보았듯이, 처칠랜드는 글리무어가 제기한 문제들에 대해 "대답"을 제시하고 있으며, 글리무어의 비판과 비슷한 비판들에 대해서도 대답할 수 있다. 문제는 처칠랜드가 제시하는 대답이 질문을 제기한 사람이 기대하는 그러한 종류의 대답이 아니라는 점에 있다. 즉, 기호주의적 과학철학을 지지하는 글리무어의 입장에서 보면, 처칠랜드의 대답은 "진정한" 대답이 아니다. 따라서 글리무어가 처칠랜드의 연결주의적 과학철학은 중요한 문제를 전혀 다루고 있지 않다고 비판한 것은 잘못이며, 그의 비판은 연결주의적 과학철학은 그가 생각하는 "진정한" 의미에서의 과학철학이 될 수 없다는 주장으로 해석되어야 한다. 여기서 인지과학분야에서 기호주의자들과 연결주의자들의 논쟁이 과학철학에서도 재현되고 있음이 드러난다. 이러한 논쟁이 공허하지 않기 위해서는 연결주의 과학철학자들은 인지과학의 역사에서 배울 점이 있다. 인지과학의 역사에서 기호주의와 거의 동시에 태동한 연결주의가 1970년대에 이르러서야 본격적으로 연구되기 시작한 것은 연결주의자들이 기호주의자들이 제기한 문제를 충분히 해결할 수 있다는 점을 보였기 때문이다. 마찬가지로 연결주의적 과학철학자들은 기호주의적 과학철학자들이 제기한 문제들을, 비록 그들이 명제 중심적인 접근과는 매우 다른 방식을 채택하고 있지만 그럼에도 불구하고, 충분히 해결할 수 있다는 점을 이론적으로 보여주어야 한다.
5. 결론
지금까지 논의를 바탕으로 나는 연결주의적 과학철학의 이론적 완결성을 언급하면서 이 글을 마치려고 한다. 연결주의적 과학철학으로서의 처칠랜드의 이론은 아직까지는 이론적으로 완결되지 않았다. 그가 제시한 이론이나 글리무어의 비판에 대한 대답에서 나타나듯이 기본 개념들이 충분히 설명되지 않은 채로 사용되고 있다. 즉, 처칠랜드는 과학적 설명과 지각적 재인의 공통점을 강조한 나머지 그 차이점의 중요성을 무시하는 경향이 있다. 그러나 지각과 설명은 유사성뿐만 아니라 차이점도 갖는다. 지각은 거의 항상 즉각적이지만, 설명에 대한 탐구는 때로는 시간이 요구된다. 또한 처칠랜드의 연결주의적 과학철학은 왜 지각을 하는 것과는 달리 설명을 하는 것이 어려운가를 설명해야 한다. 물론, 연결주의적 과학철학은 신경망을 기반으로 하기 때문에 그것의 완결성은 신경망의 발전과 신경과학의 진보와 보조를 같이 할 것이다. 어떤 과학철학적 문제는 현재의 신경과학의 수준에서는 설명이 불가능할 수도 있다. 그럼에도 불구하고 그 이론을 구성하는 기본 개념의 의미의 명확성에 대한 요구는 신경과학의 발전과는 무관한 문제이다.
--------------------------------------------------------------------------------
참고문헌
Anderson, J. R. and Rosenfeld, E. eds.(1988), Neurocomputing: Foundations of research, MIT Press.
Bechtel, W.(1994), "Natural deduction in connectionist systems", Synthese 101, 433-463.
Bechtel, W.(1996), "What should a connectionist philosophy of science look like?", In R. N.
McCauley, ed., The Churchlands and their critics, Basil Blackwell.
Bechtel, W. and Abrahamsen, A.(1991), Connectionism and the mind, Blackwell.
Churchland, P. M.(1988), Matter and consciousness: An contemporary introduction to the philosophy of mind, MIT Press.
Churchland, P. M.(1989), A neurocomputational perspective: The nature of mind and the structure of science, MIT Press.
Churchland, P. M.(1992), "A deeper unity: Some Feyerabendian themes in neurocomputational form", in R. Giere ed., 341-363.
Churchland, P. M.(1998), "Conceptual similarity across sensory and neural diversity: The Fodor/ Lepore challenge answered", Journal of Philosophy 95, 5-32.
Churchland, P. S.(1986), Neurophilosophy: Toward a unified understanding of the mind-brain, MIT Press.
Churchland, P. M. and P. S. Churchland(1998), On the contrary: critical essays, 1987-1977, MIT Press.
Fodor, J. and Pylyshyn, Z.(1988), "Connectionism and cognitive architecture: A critical analysis", Cognition 28, 3-71.
Fodor, J. and Lepore, E.(1992), Holism: A shopper′s guide, Blackwell.
Giere, R. ed.(1992), Cognitive models of science, University of Minnesota Press.
Giere, R. ed.(1994), "The cognitive structure of scientific theories", Philosophy of science 61, 276-296.
Giere, R. ed.(2002), "Scientific cognition as distributed cognition", in P. Carruthers, S. Stich, and M. Siegal eds, Cognitive basis of science, Cambridge University Press. Chapter 15.
Jordan, M.(1989), "Attractor dynamics and parallelism In a connectionist sequential machine", in Proceedings of the eighth annual meeting of the cognitive science society, Erlbaum.
McCulloch, W. S. and Pitts, W.(1943), "A logical calculus for the ideas immanent in nervous activity", Bulletin of mathematical biophysics 5, 115-133, Reprinted in Anderson and Rosenfeld(1988), 18-27.
Rosch, E. and Mervis, C.(1975), "Family resemblances: Studies in the internal structure of categories", Cognitive psychology 7, 573-605.
Rosch, E.(1978) "Principles of categorization", in E. Rosch and B. Lloyd(eds.), Cognition and categorization, Lawrence and Erlbaum, 27-48.
Smolensky, P.(1987), "The constituent structure of connectionist mental states: A reply to Fodor and Pylyshyn", Southern Journal of Philosophy, Supplement 26, 137-161.
Thagard. P.(1988), Computational philosophy of science, MIT Press.
Thagard. P.(1989), "Explanatory Coherence", Behavioral and brain science 12, 435-502.
Thagard. P.(1992), Conceptual revolutions, Princeton Univ. Press.
van Fraassen, B.(1980), Scientific image, Oxford University Press.
Wittgenstein, L.(1998), Philosophical investigations, Blackwell.
--------------------------------------------------------------------------------
각 주
1 기호주의의 기반을 제공하는 "튜링 기계"의 개념은 1937년에 등장하였다.
2 연결주의 이론의 발전은 J. R. Anderson and E. Rosenfeld (1988)을 참조.
3 이러한 이유로 신경망 모형은 병렬분산처리(PDP) 모형이라고도 불린다.
4 P. Thagard (1989). 타가드(1988)는 그 이전에 귀납추리를 모의하기 위해서 기호주의에 기반을 둔 파이(PI) 프로그램을 제안하기도 했는데, 연결주의적 과학철학이 기호주의적 과학철학에 비하여 장점이 있기 때문에 그러한 전환을 했는지는 분명하지 않다.
5 이 글과 직접적으로 관련된 처칠랜드의 연결주의적 과학철학은 주로 그의 책(1989) 9장, 10장, 11장, (1992)에 제시되어 있다.
6 P. M. Churchland(1989), 177쪽.
7 P. M. Churchland(1989), 178쪽.
8 P. M. Churchland(1989), 232-234쪽.
9 반 프라센과 처칠랜드의 과학철학은 중요한 차이점을 갖고 있기 때문에 그러한 일치는 피상적일 수 있다. 또한 처칠랜드는 이론의 구조에 관한 자신의 입장과 반 프라센의 입장과의 공통성을 지목하고 있지만, 처칠랜드의 입장과 가장 가까운 입장은 실제로 이론에 관한 의미론적 입장, 유사성 개념, 연결주의 구성을 중심으로 하는 과학철학을 제시하는 기어리의 이론(Giere, 1992, 1994, 2002)에서 나타난다.
10 신경망의 의미에 관한 포도와 필리쉰(Fodor and Pylyshyn, 1988)의 고전적 비판에 대한 논의는 스몰렌스키에 의해 부분적으로 해소되었다. 스몰렌스키(Smolensky, 1987)는 처칠랜드의 벡터합 설명 방식과는 달리 벡터합과 벡터곱을 동시에 이용하는 텐서망을 제안하여 신경망이 포도가 강조하는 언어의 구성성을 갖는다는 점을 보였다.
11 C. Glymour(1992), 466쪽.
12 글리무어는 다음의 다섯 가지 문제점을 제시했다. (1) 특정인의 전체적 이론이 단지 그의 시냅스적 연결의 가중치라면, 그리고 어떠한 명제도 국소적으로 표현되지 않는다면, 어떤 전체적 이론(예를 들어, 열역학과 진화론)의 부분은 무엇인가? (2) 어떤 사람이 가정적으로 고려는 하지만 믿지는 않는 이론은 무엇인가? (3) 어떻게 사람들은 이론들을 공유하는가? (4) 이론을 검사하는 것은 무엇인가? (5) 사람들이 이론들에 대해 논쟁을 할 때 그들이 하고 있는 것은 무엇인가? C. Glymour(1992), 465쪽.
13 P. M. Churchland(1989), 171, 234, 237-241쪽; P. M. Churchland(1992), 477-478쪽.
14 P. M. Churchland(1989), 220-223쪽.
15 P. M. Churchland(1989), 179-181쪽.
--------------------------------------------------------------------------------
이력사항
이영의
(Rhee, Young-Eui)
고려대 철학과 강사
'퍼온~사유..! > 구조와 기능.' 카테고리의 다른 글
[ㅍ] 유전자 알고리즘을 이용한 최적화 (0) | 2008.05.07 |
---|---|
[ㅍ] 수리철학연구-비트겐슈타인 (0) | 2008.05.06 |
[ㅍ] 퍼스의 실용적 기호 (0) | 2008.05.06 |
[ㅍ] 주체성의 구성을 사유하기 (0) | 2008.05.06 |
[펌] 인공지능 구성의 철학 (3) (0) | 2008.04.27 |