社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
当前位置:首页>>分支学科>>逻辑学

【谭笑】对默会知识涉身问题的实验研究的分析

 

 

默会知识的涉身问题一直有诸多争议,在全面具身和无身主义这两端各执一词,即对默会知识而言,身体是否是不可或缺的,以及在多大程度上不可或缺。柯林斯和埃文斯基于以往一些经典思想实验提出最小具身论题,认为对于某种默会知识而言,并非与之有关的身体的每个部分都是不可或缺的,只要具备了最基本的身体的部分,仍可以掌握和运用此类默会知识。他们针对性地设计了“模拟游戏”这一实验,定量地检验这一争议。该实验目的在于验证他们反驳了全面具身的观点,并且在一定程度上试探最小具身的限度在哪里。本文认为这一实验并不能达成其检验目的,实验结果与最小具身论旨之间存在跳跃。

一、默会知识涉身问题的两种对立观点和最小具身论旨

默会知识因为不能完全表述为明确的命题知识,因此是一种异于传统“知识”概念的知识形态。而默会知识的默会原因之一就是它与人的身体紧密关联在一起。对于这部分知识是否最终能够通过人工智能实现一直存在长期的争论,是否只能在人的身体上实现,多大程度上依赖身体等。面对这一问题,历来有两种对立态度,一种是对人工智能的乐观主义之下,认为人的认知不过就是信息处理和计算,因此人的所知都能转换成机器来实现;另一种是对此的质疑,认为人的身体在认知中扮演着重要的角色,很难转换成计算语言、通过人工智能完全实现。

20世纪五六十年代人工智能开始发展、兴盛以来,一直有一股乐观主义的坚定支持者。其中的典型观点就是人类的认知活动就是大脑的信息处理过程,将各种输入以不同的计算方式进行处理,然后输出。专能的涉身立场最早具有影响力的研究是德雷弗斯(Hubert Dreyfus)做出的。他认为当时人工智能遇到的一些问题(例如学习、运用自然语言)不是暂时的挫折,而是根本性的,因为这些能力是依附于身体上的,只能在人的身体上实现,而不能在欠缺身体的计算机上实现。所以“把人同机器(不管它建造的多么巧妙)区别开来的,不是一个独立的、周全的、非物质的灵魂,而是一个复杂的、处于局势中的、物质的躯体。给人工智能招致麻烦最多的,正是智能行为的躯体方面,确实如此”[1]244。德雷弗斯的基本理由在于只有身体才能灵活地判断局势、进行全局的模式识别,这些功能是所有其他局部具体功能的前提。

从专能涉身出发发展到较强的全局性论题,即认为在认知上、掌握默会知识方面,需要完整、全面的身体参与其中。其主要的理由是知识之间是相互关联的,我们用某部分身体所获得、感受、理解的知识是与需要其他身体部分所获得的知识处在网状结构中的。如果缺失后一部分的知识,我们对于前者知识的意义的理解也将是不完整的。因而完整的身体对于获得更完整的知识和意义是必需的。然而全局性论题所面临的问题是它意谓着以下的推论:只有具备了同样或同类的身体,才能具有同样的默会知识。这一推论正是模拟游戏实验所针对的,它们试图说明不同程度的身体也能具有同样的默会知识,从而来反驳全局性论题。

柯林斯、埃文斯认同身体对于掌握专能的重要性,但他们认为我们显然并不总是需要整个身体,因为各种类型的残疾人也能掌握非常多专能。因此他们在专能上主张最小涉身,并据此提出了交互式专家的概念。他们起初通过对几个传统的思想实验进行重新讨论来考察身体在专能中的作用[2],以及我们需要多大程度上的身体,主要针对的是语言这一项社会技能,因为语言包含了大量的社会性默会知识。

柯林斯、埃文斯是在非具身和全体具身之间折衷,他们同意德雷弗斯认为学习语言需要身体,只有当我们的身体浸淫在相关的社会实践中时才能学会语言。柯林斯、埃文斯赞同维特根斯坦认为身体实际上决定了我们对于世界的理解和刻画方式。但他们认为并不是全部的身体,而是与说语言的共同体成员进行交流的身体部分。德雷弗斯关注个人,而柯林斯、埃文斯关注社会集体中的专能。集体专能中以自然语言为最典型又最艰难的代表。集体专能的特点就是专能的掌握依赖于人是否成为集体的真正一员,或者说这两个概念是相互依赖的,掌握了集体专能才能成为集体的一员,而成为集体的一员才能拥有相应的集体专能。例如英语有一种它自己的生活形式,独立于每一个使用英语的人。唯一能使人成为一个流利的英语使用者就是让他扎根在一个讲英语的社群中并吸取这种能力。唯一能维持这种能力的也是保持扎根在社群中,并跟上一般英语的用法。从这种观点来看,计算机不能拥有并维持流利的英文表达的原因是在于我们并不能完全知道如何使得它们变成一个讲英语的社会的普通成员。

因此只需要有最小部分的身体能够使得自己与这个社会一直保持联系,持续成为社会成员,就能保证掌握自然语言这项专能,包括在语言背后隐藏的大量默会知识。最关键的部分包括用于处理语言的大脑部分、学习语言和讲语言的嘴、喉和获得语言的耳朵等声学配置。

与此同时,他们主张,有这样一类只依赖最小身体部分的专家的存在,称为交互式专家(interactive expert),他们并不直接参与相关专能的实践,也不做出直接的贡献,因此他们并不需要整个身体参与,但是他们拥有大量相关领域的默会知识,有能力对该领域做出咨询、建议等。他们的专能称之为交互式专能(interactive expertise)[3]例如,柯林斯、埃文斯认为高度残疾人玛德莱纳(Madeleine)是最小具身论旨和交互式专家的典型例证。她生来就是盲人和残疾人,甚至不能读盲文。但是她通过别人读给她的书中学习到了很多关于世界的知识。她只有一个最小的“身体”来参与到周围社会成员的正常活动中去,但是她学会了像其他人一样自如地、流利地说话,并成为了一个具有超凡智力和文学水平的女性。她是依靠他人的形象、语言和词汇所传递的形象等填补、维系她的想象。她学习语言知识纯粹是靠浸淫在他人的语言中,而不是在构成生活形式的全面活动中。但另一方面柯林斯、埃文斯认为这也并不说明学习语言不需要身体,因为玛德莱纳尽管丧失了大部分的身体感觉,但最起码仍然有身体前后的概念,也能被其他人推着到处走,与这个世界有一定的物理活动,有身体的界线。

二、“模仿游戏(Imitation Game)”实验

柯林斯、埃文斯通过“模仿游戏”实验来检验最小具身论旨是否真实可靠,交互式专能是否存在,并且定量地给出多大程度上可靠。“模仿游戏”类似于图灵测试,通过问答测试,旨在判断受试者是否已经很好地掌握了该默会知识。[4]图灵测试是图灵(Alan Turing)1950年的论文中提出的一种实验,让参与者通过键盘的交谈来判断面对的到底是计算机还是人类。模仿游戏则是让一位不露面的人去假装另一种人,例如男人假装自己是一个女人、无神论者假装自己是一个信教人士回答人们所提出的问题,并将这些答案与一位真正的女人或信教人士的回答去比较,从而判断这位不露面的人是否掌握了另一种人的相关知识,包括明述的和默会的。

柯林斯、埃文斯试图用这个实验论证纯粹地通过语言进行社会化,而不参与相关的物理活动就能与全部身体投入到这种生活形式中去得到差不多的效果,只是不可能完全通过具体的命题性知识来获取。他希望突出交互性专能的概念,人类事务中很多都是通过单纯的语言方案来完成的,并不需要实际的物理参与,这一点在以往的哲学文献中都并没有引起关注。模仿游戏中受试者是没有或不能进行该默会知识的物理参与的人,例如色盲的人获得关于颜色的语言。

模拟游戏主要设计了针对色盲、音盲的两种。色盲实验的基本前提是大约百分之五的男性不能分辨红和绿,但是他们从生下来就处在一个色彩语言的环境中,他们关于色彩语言有最充分的交互式专能,但没有贡献型专能。强的交互假设(strong interactional hypothesis)主张色盲的人应当在模拟游戏中成功地伪装成视力正常的人。如果不是设计专门的贡献型专能的实验,色盲人士很难被发现。音盲实验的基本前提是非常少数的人能非常准确地听出一个音符,就像看到它一样。但大多数的人并不能准确听出来是什么音符,因而可以称之为音盲。所以音盲的人并没有浸淫在音准感知人群的语言中。可以推测音盲伪装成音准感知者更容易被发现与色盲实验相反。

实验之前预期结果为:

伪装者

目标专能

预期结果

A色盲

模仿正常视力

判断者不能识别参与者

B正常视力

模仿色盲

判断者能够识别参与者

C好乐感

模仿音盲

判断者不能识别参与者

D音盲

模仿好乐感

判断者能够识别参与者

也就是说社会中的少数人群模仿多数人群的专能通常会成功,因为他们长期生活在这样的环境中,而多数人群模仿少数人群的专能则通常会被识别出来,因为他们并不熟悉对方的生活方式。

实验程序为:在色盲和音盲实验中,用实现设计好的软件通过无线网络将三台电脑连接起来,判断者坐在一台电脑前,可以输入任何有关于该默会知识的问题。问题被同时输送给两位参与者,其中一位是色盲伪装成正常视力者,另一位是正常视力者自然作答。当两位参与者作答后,答案会立即、平行显示在判断者的屏幕上。判断者可以做出猜测并提供一个可信程度。然后判断者开始下一个问题,直到判断者觉得没有什么可以进一步追问的了。通常情况下,判断者在问完六个问题之后就觉得没有什么可以追问的了。问题中不能包含直接针对身体功能的问题,例如问眼前的桌子是什么颜色的。

为了防止因为判断者的判断能力问题出现的偏差,选择的是那些本身也具有目标专能的人。例如性别模仿游戏中,来判断模仿女性是否成功的判断者是一个女人。如果参与者是要伪装成正常视力者,那么判别者则是正常视力者。这样做的重要性在于判别者“知道你说的是什么”(knowing what you were talking about)。判别者在判断时还要做出确信程度的区分:1.我不太知道谁是谁。2.我有一点知道谁是谁——但我比较不确定。3.我基本知道谁是谁——比较确定。4.我非常肯定知道谁是谁。如果判断者从一个确定层级改变为另一个确定层级,他们需要解释为什么。整个过程会被录下来。

实验分为两个阶段,第一阶段是实时交流,第二阶段没有实时交流,通过一般的电子邮件交流。以色盲组为例来说明一下实验结果。实验结果如图1所示:

 

1 实验结果对比柱状图

左侧的柱形难识别情形指的是预期中被认为拥有相关专能的人被识别出来的情况,右侧的柱形识别情形指的是预期中被认为不具有相关专能的人被识别出来的情况。从实验结果上来看,与预期结果一致,识别情形中的正确率比难识别情形中的要高得多。[5]

柯林斯、埃文斯还在这两个实验的基础上进行了一个特殊的“引力波实验”,受试者是柯林斯本人。他长年对引力波专家进行田野调查,因此他对引力波领域中的知识和引力波科学家共同体中的默会知识有非常深入的了解。因此他对自己进行了一个模拟测试——即他模仿引力波科学家来检验自己是否掌握了引力波领域中的默会知识。

第一阶段是让一批明白实验意图的引力波科学家通过邮件来提问,柯林斯与其他的引力波科学家作答,然后寄给其他的引力波科学家去判断,看能否鉴别出柯林斯并非是引力波科学家。第二阶段选择了其他专业的物理学家,还有哲学家、社会科学家等来当判断者,然后他们选出一位引力波科学家,其中两位非专业人士识别出了引力波科学家,一位选了柯林斯,五位认为他们不能抉择。

柯林斯和埃文斯认为他们一系列的模仿游戏实验充分说明了交互性专能的存在、最小具身论旨。[5]因为很多通过了该实验的受试者并没有目标领域的相关实践活动,甚至相关身体部分,但他们并不能被分辨出来,这说明他们也能习得这部分集体型默会知识。

三、关于实验的讨论

模仿游戏实验在实验过程、数据处理方面都很谨慎致密,本文想要讨论的是这一实验本身能否证明交互式专家、最小具身命题。以色盲组为例,实验结果直接说明的是:色盲也能掌握正常人关于颜色的语言、正常人却不能反之掌握色盲的颜色语言。柯林斯、埃文斯希望由此说明有一部分人由于长期浸淫在一种集体文化之中,他们即便不参与相关实践,也能完全通过这种对答测试。通过了这一测试则意味着受试者掌握了相关主题的集体性默会知识,他们就是只需要部分身体的交互式专家。色盲没有准确看到颜色的相关身体结构,必然没有直接参与关于颜色的实践。因此如果色盲也被证明掌握了关于颜色的默会知识和交互式专能的话,那么就说明并不需要全部的身体参与就能掌握相关默会知识。

然而从这两个结果要能证明交互式专家、最小具身命题成立需要以下的几个条件:

(1)集体性默会知识基本存在于语言之中;

(2)可以通过模仿游戏(纯粹语言对答)判别是否掌握该集体性默会知识;

(3)成功通过了模仿游戏的人获取默会知识完全/基本是通过语言,而不是通过身体,或者说身体没有参与该默会知识的实践。

(4)相关感受类的语言的习得与身体的感知直接相关。

下文将针对这些必需条件一一进行回应。

首先,从实验设计上来看,实验预设了关于颜色的集体性默会知识就包含在关于颜色的语言之中,如果受试者能够自如地就颜色与正常人进行交谈,就能说明他/她掌握了关于颜色的集体性默会知识。模仿游戏已经排除了对受试者进行任何直接的身体型默会知识的检验,而只能根据语言来进行判断。除语言沟通之外并没有其他更为客观的方式判断是否掌握了集体性默会知识,或者身体欠缺的人所掌握的集体性默会知识与正常人所掌握的该项集体性默会知识是相同的。这是一种对能力的外在论的、行为主义的判断方式。也就是说,柯林斯他们所理解的集体性默会知识是将它等同于外在表现出来的行为,只要两个人能做出同样的行为——在实验中是做出同样程度的对答——就说明他们掌握同样的集体性默会知识,而不管他们内在的认知状态是否一致。可以想象,尽管在模拟游戏这个有限时间、有限交流形式的检验中不能分辨身体缺陷和正常人,但这两类人在获得和运用专能的方式是不同的。色盲人士是通过补偿性的方式来获得相关专能,而正常人可以通过亲知(acquaintance)来获得。因而他们对于颜色相关集体性默会知识的掌握和理解也是不同的。可以看出,模仿游戏实验设计所针对的是基于外在论理解框架下的集体性默会知识,而没有考虑内在认知状态的集体性默会知识。

另外,在这种语言中蕴藏的或者实验中所能体现出来的是集体性默会知识还是明述知识呢?可以从下面两则实验中的实际问答得以一窥。

在辨别盲人还是视力正常人的测试中,视力正常的裁判问了如下问题:“你对网球感兴趣吗?在电视里看网球比赛吗?你对鹰眼裁判系统怎么看?鹰眼系统能帮助裁判或运动员做出更好的判断吗?人类裁判能做多准确的判断,他们能分辨出是在界内还是出界1毫米、2毫米、1厘米、2厘米吗?取决于什么呢?”通过受试者的回答能够判断他们对鹰眼系统的了解程度是否和真正看过电视网球比赛的人的了解程度差不多,以此来辨别他们是否是盲人。

盲人裁判问了如下问题:“能否告诉我你多大、大概几岁登记成为盲人?你使用一些什么出行辅助工具?”被试人的答案“我十岁成为盲人”会让裁判生疑,因为很少有人是一夜之间致盲的,通常是一个渐进的过程。“我使用一根白色的棍子和导盲犬”这样的答案也让裁判认为不真实,因为盲人裁判本人很少会同时使用棍子和导盲犬,只会用一种,而且会将白色的棍子称之为“手杖”。

这些问题的答案似乎都能够通过明确的语言来进行解释和提示,尤其是盲人裁判的对答系列,由于比较简单和短促,似乎一本简单的指导手册就能帮助受试者通过模拟测试。例如指导手册上简单地说明盲人的生理特点和生活习惯等,这些显然是明述知识,受试人就能通过模仿游戏。所以模仿游戏是否测试的是明述知识呢?这是集体性默会知识容易造成误解和混淆的一点。对于这些集体性的社会规则,每一条都能通过明述知识的方式表达出来,而其“默会”之处在于这些“规则”是不能穷尽并且随情境有各种变化,拥有集体性默会知识不是掌握了大部分的这些“规则”,而是掌握了如何在任何情境下做出恰当的反应。例如关于鹰眼系统的对答中,正常视力的人在看过它的工作模式后会具备一系列的相关知识,包括其工作时的相关空间的想象,并知道这一技术在社会评价中的大致看法,与传统判别方式的对比等等一系列的知识。理论上,这些知识是不可被明述规则所完全涵括的。因此模仿游戏实验的这种实验设计确实能检验到默会知识部分。

第二,模仿游戏到底检验了什么?

集体性默会知识说到底是一种社会融洽(social fluency),对于它的定位和检验实际是在复杂的社会情境、集体沟通中才能完成的,“测试性”的交谈是在多人之间同时进行的、测试者之间是彼此沟通的、对受试者的判断是相互影响的、测试的情境是无比复杂的。像实验中这样的去情境的一对一交谈只能做到最简单的检验。例如检验一个人是否掌握了一个国家的交通方面的默会知识,标准是他/她是否能在不同的路段上、不同的时间段(上下班高峰、戒严封路、节假日等)、面对不同的行人、车辆都能做出自如地应对。检验一个人是否掌握了在北京这一特定地域和文化中的默会知识,标准是他/她能否在不同的情境中自如地行为,与不同的人群进行顺畅的沟通。检验一个人是否具有引力波领域内的集体性默会知识,标准是他/她面对该领域中的实验、计算持有什么态度、如何与他人协同、如何对待异常数据等。而实验中,受试者只用回答测试者的问题即可,并且每次的问题通常只在六个左右,这与实际情境中的测试还是相去甚远。实际情境比模仿游戏实验要复杂得多,而正是这种复杂才更突显出集体性默会知识是一种审时度势、灵活运用的能力,而不是对明述规则的掌握。因此,相对简单的模拟游戏所能测试出来的只是一个人是否对另一种人的生活有一定程度上的了解并能稍微深入地谈论它。德雷福斯甚至评论柯林斯在模拟游戏实验中实际上揭示了图灵实验不能验证人类语言的独特流畅性。[4]

柯林斯、埃文斯或许对此会做出补充性的回应,即接受检验的、身体欠缺的人所掌握的默会知识只是部分的集体性默会知识,即通过语言传达和检验的这部分集体性默会知识。模仿游戏实验也明确排除了直接验证身体型默会知识。然而他们在大多数论文中都将掌握某集体性默会知识等同于会说某一领域中的特定语言,这二者之间是一种循环定义。如果做这样的限定,那么实验所想要确立的“交互型专能”的概念的意义就并不大了。因为能够使受试者通过模仿游戏实验——仅仅在限定时间中不能以语言的方式与正常人区别开来——的那部分默会知识相对于整个集体性默会知识(更不要说所有的默会知识)来说非常少。而他们所希望确立的交互型专能要能够与真正领域中的专家长期无障碍的沟通大量问题、提出相关局面建议和意见、扮演咨询角色等。模拟游戏中所能判断出的专能不足以承担这样的功能。

更进一步地,这个实验的另一个目的是证明最小具身命题,如果将默会知识限定在语言表达部分的集体性默会知识的话,模仿游戏实验确实验证了这一程度上的最小具身命题。准确地说,它的意义更多在于打破了全面具身论。但是去除掉所有的身体型默会知识、只选取集体性默会知识中的小部分,最小具身命题所具有的代表性同样也非常弱了。我们对于最小具身命题的期待是在更为一般性的意义上默会知识对身体的依赖程度,并由此来看由其他实现形式(例如人工智能)来获取默会知识的可能性。

第三,交互式专家的默会知识的习得过程中真的没有参与相关实践、只是通过语言传递的吗?重新回顾一下色盲模拟游戏实验和柯林斯引力波专家模拟游戏实验。柯林斯和埃文斯认为色盲没有相关身体条件,于是没有参与关于颜色的实践。实际上这是把人的感知、认知活动看作是感官之间独立的,例如颜色只有眼睛的某些部分参与。但人的认知活动恰恰是整体性的,不同感官之间相互影响,并且在感知之初就有一些格式塔式的预判。色盲人士对于颜色本身不能准确地感知,但是他/她能看到事物的形状、触摸事物的质地、判断事物出现的时机等等,甚至红绿色盲能根据逻辑推理来判断交通灯此刻的信号,综合这些所有的认知因素,他们对于颜色是有一定感知的。他们缺乏的是对颜色的亲知而已。

另外,他们整个身体实际上参与了很多关于颜色的实践,他们要接受红绿灯的交通规则、要注意着装中颜色的协调、听关于颜色的笑话、品尝和选择不同颜色不同营养的食物等等。这些都是他们学习到关于颜色的默会知识的身体条件。

同样的,柯林斯对于引力波的了解并不仅仅是通过语言的交流,他同时也去参观了相关的实验室,经常参与他们的会议,见到相关的专家、目睹他们争论的过程、看到人们对不同观点的态度、表情等等,这些情境实际上都有助于他了解该行业领域中的状况。

最后,在身体各部分的关系、身体与大脑的关系上面,柯林斯也处理得过于简单,并不是某一部分独立地负责某一认知任务。大量的认知科学研究表明,人的感知是各部分配合、协调的结果。例如人类的恐惧情感不是仅由大脑完成的,而是由瞳孔、毛孔、肾上腺素等等身体部分对环境做出反应后才有了大脑感受到恐惧的结果。身体的各部分之间同样如此,尽管玛德莱娜的肌肉丧失了活动能力,但是她的皮肤将为她提供更敏锐的、补偿性的触觉感知。[6]

与此相关的,身体的感知与更高阶的认知活动、特别是语言的习得和运用之间的关系并不是如此简单。他们虽然没有直接地感受到这一种身体体验,但是其他的身体体验能够帮助他们形成相似的第一人称的感受。玛德莱娜虽然没有经历过爱情,但是她在生活中也体验过喜悦、心痛、向往等情绪,这些与她能够谈论爱情、甚至写出动人情诗这些语言活动是相关联的。[4]也就是说高阶的认知活动与相关的身体感知并不是一一对应的简单线性关系,而是更为复杂的联系。通过了模仿游戏实验的人所掌握的集体性默会知识——也就是自如谈论该主题的能力与需要的身体部分之间的关系并不是那么容易确认的。

模仿游戏实验的意义在于它确认了我们学习一种相关语言和这部分语言中所包含的默会知识并不需要整个的身体,否认了全面具身,一定程度上说明了部分的身体帮助我们掌握了相当数量的默会知识,但却很难说它验证了最小具身论旨。首先,模仿游戏实验只涉及到纯语言范畴内能包含的集体性默会知识,并且是在行为主义的理解下的集体性默会知识,这部分默会知识相对于整个默会知识来说比例比较小,因此其结论的代表性很有限。然后,如果我们跳出行为主义的框架,来追究这些集体性默会知识的获取过程及其在主体中的内在认知状态时,问题就更为突出。成功通讨模拟游戏实验的受试者们并非纯粹通过语言获得,而是大量地参与了与主题相关的实践活动。在这一过程中大量地依赖了身体的其他非语言功能部分。身体的感知与更高阶的认知活动、特别是语言的习得和运用之间的关系并不是简单的对应关系。即使是身体感知部分缺失的残疾人,他们也能通过身体其他部分的活动来补偿获得缺失部分的感知,习得关于这种感知的语言能力。因此,模拟游戏实验并没有很好地控制实验对象的干扰项,独立地展现默会知识和身体的关系,没有实现其实验目标。

本论文于在“北京科哲论坛”(2015年第6)上宣读,受益于论坛参与者的讨论,在此表示感谢。

 

【参考文献】

[1]德雷福斯.计算机不能做什么[M].北京:生活·读书·新知三联书店,1986.

[2]COLLINS H,EVANS R.Rethinking expertise[M].Chicago:University of Chicago Press,2007.

[3]COLLINS H.Interactional expertise as a third kind of knowledge[J].Phenomenology and the cognitive sciences,2004,3(2):125-143.

[4]SELINGER E,DREYFUS H,COLLINS H.Interactional expertise and embodiment[J].Studies in history and philosophy of science,2007,38:722-740.

[5]COLINS H,EVANS R,RIBERO R,et al.Experiments with interactional expertise[J].Studies in history and philosophy of science,2006,37(4):656-674.

(原载《科学技术哲学研究》2017年第6