记忆的编码、储存、保持与提取

记忆几乎是我们认知世界最重要的工具。只要想想一下失去记忆的能力就可以明白它对我们有多重要:我们将无法记住自己的过往,没有任何实质性的外来,无法与他人建立感情和联系等等。我们与记忆相处的经验如此之多,但并不总能明白记忆是如何产生与存储的。本文想要从以及的编码、存储、保持和提取等角度对记忆加以考察。

记忆的编码和储存

记忆产生的生物学基础是我们大脑的神经元的可塑性,也就是说大脑的神经元结构有随着经验而改变的能力。如果稍微细致区分则是:人脑主要依靠脑的额叶结构产生和提取记忆,颞叶结构永久存储这些记忆。

那么记忆以何种形式在这些神经基础上产生呢?如果仔细观察会发现,我们并不将所有处理过的信息存入记忆,它们大部分不会引起我们的注意,小部分会短暂的停留,更小的部分被我们进行加工,只有很少的部分才会进入到长期记忆当中。

短期记忆可以分为视觉感觉记忆以及听觉感觉记忆。作为记忆加工的第一步,这些刚刚输入大脑的视觉和听觉感觉如何得到短期保存呢?实验表明,存在视感觉存储,即一种能有效保持视觉刺激中的所有信息的记忆系统。这种短暂的视觉感觉记忆有时候也称为视像记忆。这些信息如果没有被注意并得到进一步的加工就会流失掉。同样的,有证据支持短暂的听觉存储的存在,这些记忆可以成为声像记忆。这些感觉信息短暂地存储在大脑皮层的感觉记忆中,使我们能够对其进行加工。

通过短暂记忆之后,信息进入了短时记忆。短时记忆理论认为被注意到的信息会进入短时记忆当中。短时记忆的容量有限,可以用记忆广度来进行衡量。一种流行的说法认为人类能同时保持注意的物体在五到九个之间也是对记忆广度的一种标书。短时记忆被复述之后才可能进入到长时记忆。也有研究认为,记忆进入长时记忆的关键不在于复述时间的长短,而在于加工的深度。

除了短时记忆,还有一种理论认为我们存在工作记忆。工作记忆是我们进行信息加工的时候临时存储我们记忆的部分。

那么工作记忆在哪里发生?如何发生?巴德利假设存在两种不同的系统:视觉空间画板和语音回路,他们由中枢执行系统控制,是保持信息的伺服系统,也是工作记忆的一部分。例如,我们在计算15x35的时候可能同时形成了书写部分乘法问题的视觉表象,并在语音贿赂中复述部分乘积结果。工作记忆的存在于灵长类动物的额叶存在密切关系,额叶的不同区域似乎负责保存工作记忆中不同类型的信息。

工作记忆如何进入长时记忆呢?长时记忆又是如何被激活的?决定记忆的可得性的量称为强度,强度越强,记忆越容易提取。研究发现,当记忆得到练习的时候,它的强度以幂函数形式增加。幂定律的神经基础是前额叶的激活驱动着海马的长时程增强效应,这种激活能够形成记忆和增强记忆。

那么是不是练习是影响记忆的唯一途径呢?并非如此。简单的重复学习并不会改善记忆的成绩。一个人在学习时如何加工材料是非常重要的。一种方式称为增细加工,包括创建和需要记忆的事物有关并对他有多补充和扩展的额外信息。对材料进行有意义的增细加工可以改善记忆。除此之外,研究还发现越是增加细节的加工越能得到较好的记忆效果,即使加工的不是材料的含义。

关于长时间记忆,一个有趣的现象是,在很多增强记忆的自助书籍当中都介绍了地点记忆法:就是沿着一条特定的路径,把需要记忆的事物与路径上的物品联系起来。这种方法被证明是有效的,其原理在于:第一,这个方法利用有序的事物来重组无序的事物。第二,通过视觉表象,建立场所与项目之间的联系,使我们对材料的加工更有意义,也更细致。

另一种常见的体验是,我们对于小说这类作品的记忆要远远强于对课本的记忆,即使我们想要记住后者的意愿要强烈得多。这是因为我们更容易对小说进行增细加工,并且好的小说能够引发对于细节的思考。研究发现,实际上我们记住的材料的数量取决于加工水平而不取决于学习意愿,也就是说一个人是否有意识地学习与记忆没有关系,重要的是人们如何去加工呈现的材料

记忆的保持

当记忆进入长时记忆之后并不是一成不变的。我们经常感到记忆随着时间流逝逐渐模糊以至于无法再有效提取。那么这些记忆是不是被永久性的遗忘了呢?研究发现,一些看似已经遗忘的记忆,其中一些仍然储存在记忆当中,通过,比如神经刺激的方法是可以重现的。关于记忆随着时间消退的速度,一般认为记忆痕迹强度的消退是保持时间的幂函数。

为何记忆无法长期保持呢?第一种解释是记忆痕迹的强度简单的随着时间而消退,另一种理论是遗忘的干扰理论。遗忘的干扰理论是说,我们记忆的消退是因为学习干扰。比如学习一个项目的新关联对象时,会导致对旧关联对象的遗忘。比如记忆的扇面效应:与一个概念相关联的事实越多,提取其中任何一个事实的速度就越慢。新学习的材料也会对先前存在的记忆形成干扰。

目前的研究倾向于认为,遗忘既因为记忆痕迹强度的自然消退,也是因为来自其他记忆的干扰。然而干扰效应出现的一个重要限制条件是:只有学习多条没有内在联系的信息时,才会发生干扰,相反,当信息存在某种程度的冗余时则不会发生干扰。

记忆产生过程中的另一个有趣的现象是:为了记住学习材料,人们会使用他们能记住的东西来推断自己可能学习过的内容。在进行会议的时候,相比于提取精确的事实,人们常常会去判断什么可能是真的。比如在学习过程中对学习的材料进行增细加工时,人们不仅会回忆更多所学的内容,而且也会回忆那些没有学过但是由他们自己推断出的内容。

既然我们的记忆有很多内容是基于推断的,那么我们还可以信任我们的记忆吗?有很多研究发现,当人们在接受误导性的采访时,可能会制造出虚假的记忆。我们用来分辨记忆与想象的过程十分脆弱,信息的来源很容易就被混淆了。我们混淆经验和想象的神经学基础是海马。海马对虚假记忆表现出了与真实记忆同样的高激活反应,因而导致我们不能分辨出哪些是真正经验过的,哪些是想象出来的。但是海马旁回对真假记忆的反应不同,因此通过训练我们可以提高对虚假记忆的抵制能力。

记忆的提取

当我们需要提取记忆的时候,外部环境和内部环境是否对我们的表现有影响?研究发现,如果学习时的外部环境和内在状态和测验时的一直,人们就会表现出较好的记忆。

除了前面提到的有意识的记忆,关于记忆还有很多有趣的研究是围绕我们并没有意识到的记忆展开的。有时候我们会发现自己知道的一些事情是无法描述的。内隐记忆就是用来描述这些我们无法有意识地会议的知识。外显记忆则是描述我们可以有意识地回忆的知识。研究表明,这两种记忆在我们大脑中的实现相当不同。新的外显记忆形成于海马区域,但是旧的记忆可以在皮层结构中被内隐地启动。外显记忆也称为陈述性记忆,主要指我们能够外显地会溢出事实性记忆。在陈述性记忆系统内,存在着情景记忆和予以记忆的区分,情景记忆包含着知识获得的时间和地点的信息。

我们如何表征知识

我们所接受的外部信息、学习的知识,都会以某种形式存在于我们脑中。那么它们是以怎样的方式存在呢?除了神经连接层次的影响,在整个心理认知的层次如何实现?

我们倾向于记住意义

关于信息处理的第一个有趣发现是:我们倾向于记住信息包含的意义而不是信息的具体表述。信息本身具有物理存在,无论是作为声音信号、文字信号,还是色彩、形状都是信息本身的物理形式,它们本身并无特定的意义。但是经过人脑的加工之后,它们得以包含某种意义。我们的大脑倾向于记住这些意义而不是这些物理信息本身。不同的信息可能表达同样的意义,但是我们似乎并不擅长记住这些不同信息的细节。

整体来说,我们的记忆在一开始可以记住细节,但是很快就会遗忘,而倾向于记住意义。这一事实给我们的启示之一:是如果将随意的组合转换为有意义的东西,记忆的效果会比较好。

获取知识的通道

那么在我们的心理层面,意义或者说知识是实现的呢?既然我们获取知识的主要途径是语言和图像,那么知识的表征是否也和这些通道有关系呢?

第一种理论将我们对知识的表征称为通道无关符号系统。认知心理学提出了命题表征的概念。命题是能够从意义上判断出是真是假的最小单元。

命题是可以作为独立断言的语言单元。比如人在记忆一个复合句的时候,会将句子分解成一组表征句子中的简单命题的抽象意义单元。那么命题如何表征知识呢?根据研究显示,人们在记忆一个复合句时,会将句子分解成一组表征句子中简单命题的抽象意义单元。知识的可以借由概念之间的关系网络来表征。

与此相对的是知觉符号系统理论。这种理论认为所有的信息都是根据特定知觉通道的特异性来表征,而且基本上是知觉的。也就是说,人们对信息是作了知觉性的解释。还有一种观点认为认知是具身的,也就是说它来自身体和外界的互动,并与之持续的交织在一起。根据这种观点,认知依赖于身体带来的体验,而身体拥有不可分割地相互联系的特定的直觉和运动能力,并且它们共同组成了孕育推理、记忆、情绪、语言和其他所有心理活动的母体。

如果信息是通道特异的,那么信息在不同的知觉和运动通道当中如何转换呢?。一种观点被称为多通道假设,该观点认为不同的直觉和运动系统关联着不同的表征,我们有将一种表征直接转换为另一种表征的方法。另一种观点是通道无关假设,它认为存在一个中间抽象的系统,并且我们有在知觉和运动表征与这种抽象之间来回转换的系统。

图示的表征

概念网络图示是用来表示概念知识的两种该模型。图示与计算机技术中的数据结构有相似性。图示按照一种插槽的结构来表征类别知识,插槽说明了类比成员的各种属性的价值。属性和价值相互匹配组成了图示。研究发现,人们将推断某物体具有他所属类比的默认值,除非他们发现了明显的例外情况。一个类别的不同成员类属于该类比的程度会有所不同,越是典型的成员就越具有加工优势。

概括化和实例化的争论

机器学习的模型一般来说有两种原理。其一是实例化,典型实现是广度模型。其工作原理是通过将训练样本的特征加以提取并转换为宽度模型的特征向量的权重。其二是概括化,典型实现是深度神经网络。其工作原理将训练样本的特征转换为不同层次的特征向量。第一种模型的特点是记忆性好,对已经出现的例子具有良好的预测功能,但是对于没有出现过的样本可能判断失误。第二种模型的特点是概括性好,对没有出现过的例子也具有良好的适用性,但问题在于有些例子属于特例不能被纳入开阔话当中。

关于概念知识如何得以表征一直以来有两种对立的理论。一种认为我们可以从事实中提取出一般的抽象概念和原理,另一种认为我们只存储实例。这二者其实和机器学习用于表征模型的方式类似。人类概念知识的表征更有可能的是二者的结合,也就是说我们一方面归纳了很多规律,一方面记住了很多特定的实例,

问题解决与计算机算法

我们时时刻刻都在解决不同的问题,隐形或者显性的,长期或者短期,紧急或者迟缓的。

我们是如何解决这些问题的呢?如果我们对这些待解决的问题加以考察就会发现,所有的问题都带有明确的目标导向,我们可以将问题最初的状态成为初始状态,目标结果称为目标状态,中间过程成为中间状态。从初始状态到达目标中间所有可能的路径成为问题的解空间,使问题从一种状态转移到另一种状态的方法可以称为算子,随后问题的解就是这些算子的有效排列。人类解决问题的过程就可以看作是在解空间内进行搜寻,每一条可行路径都对应着问题的解法。

这种看法十分类似于计算机算法当中的搜索算法。以走迷宫问题为例。初始状态是妻子置于初始位,最终问题状态是棋子移动到迷宫的出口,从初始到结束所有可能的上下左右移动的状态组合就构成了问题的解空间。每种通往迷宫出口的路径都是合理的路径。

我们在问题解决的时候并不会对每种可能路径都同等考虑,那样将过于复杂耗时。更多时候我们是凭借经验和知觉选择路径,计算机算法同样如此。有时候我们想要解决的问题的解空间有时候过于巨大,比如围棋,黑白两方的棋子都可以下载棋盘的任何位置,计算机不可能遍历所有路径,因此算法需要对可能路径的搜索进行优化,剪枝大部分路径从而使问题可能计算完成。

算子用于代表我们解决问题的具体步骤和办法。学习新算子第一种方法是发现。当我们在问题空间中随机行走的时候有可能会得到问题的正确解答,如此我们便发现了解决问题有效算子和路径。第二种方法通过他人传授或者观察实例得到。获得新算子的另一种常见途径是类比。在一个问题中行得通的算子在另一个相似甚至完全不同的问题中同样有可能行得通,这样的算子应用就是类比。

实际上,在面对问题的时候,我们的问题有可能不是没有算子,而是由多宗算子可以选择。那么如何找到正确的算子呢?一个普遍的原则是差异降低。也就是说,选择最大限度地减少当前状态与目标状态之间的差异的非重复算子。差异降低原则和机器学习中的梯度递降原则类似:沿着梯度最小的方向,也就是离目标变化最快的方向移动。但同时我们也知道梯度递降的一个问题是可能得到局部最优解而不是全局最优解。而有时候为了得到全局最优解需要选择并非当前最快的路径,梯度递降法就有问题了。在人类解决问题的过程中这样的原则同样适用:在适当的时候选择长期最佳策略而非短期最佳策略更好。

另一个主要方法是手段-目的分析,即创造一个新目标使得算子得以运用。比如说如果发现解决一个问题的关键在于创造某个条件,那么目标就变成了创造这个条件,这样新目标就产生了,运用这个关键条件解决原有问题的算子就得以运用了。和差异降低相比,手段-目的的优点在于其分析不会马上丢弃当前不能得到应用的算子。比如如果一个算子暂时不能得到应用,手段-目标分析会聚焦于如何使算子起作用,即消除组织一个算子得到应用的差异。以消除这种差异为目标的子目标称为算子子目标。

手段-目的分析对于我们解决问题有什么启示呢?手段-目的分析提供了一种非常有用的解决问题的框架。在这种框架之下,我们首先考虑当前状态与目标状态的差异,然后聚焦于消除差异,并将消除这些差异当做子目标,在解决子目标的过程中我们会遇到新的差异,然后我么不断重复子目标-差异消除的过程一直到当前状态和目标状态一致。

这样的模型在解决一般问题的过程中固然有用,但是往往我们会遇到一些困难。比如如何找到目标状态和当前状态的真正差异。假设我的目标是成为一个优秀的工程师,那么成为一个优秀的工程师需要哪些技能,这些技能和我当前的技能的差异在哪里呢等等。在很多情况下我们并不真正清楚目标状态的定义是什么,更不清楚目标状态和当前状态的差异是什么。在了解真是的差异之前就贸然采取行动缩小差异可能是在缘木求鱼。

专业技能学习

我们的大脑结构会随着专业技能的学习而变化。人们越是能够熟练地完成某项任务,在执行那项任务中就可能越少用到脑,进行这项任务所需要的能量就越少。于此同时,当我们成为一项任务的专家之后,我们完成这项任务的方法也会发生变化。

专业技能的学习一般分为三个阶段:认知阶段关联阶段自主阶段。认知阶段是对技能进行陈述性编码。在关联阶段,最初的错误会被逐渐发现和改正,成功操作所需的各种要素之间的联系被强化了。在自助阶段,整个技能的操作过程会变得越来越自动化和迅速,中枢认知开始退出任务执行的过程。认知技能的提高是练习的幂函数,即技能的提高初期会较快,随后越来越慢,经过长时间的保持之后只会出现轻微的提高。

在一个人成为专业技能的专家的过程中,技能的组织如何变化?首先是基于思考的陈述性知识转化为模式驱动的成熟性知识,这个过程称为程序化。程序化使得人们在执行例如骑自行车这样的任务时不再需要思考该怎么做。另一方面,如果我们将解决一个问题或者一部分问题所需要的技能看作一个动作序列,学习执行这些动作序列的过程称为技法学习。许多小问题会反复出现,通过技法学习可以解决他们。大型的复杂问题则不会重复出现,但是他们具有相似的结构,我们可以学会如何组织解决整个问题的办法。这种学习如何把问题解决的过程组织起来以把握一类问题的一般结构叫做策略学习。比如物理学中的专家策略是向前推理,程序设计中的专家策略是宽度优先开发程序。

在我们解决问题的过程中,我们会学会感知问题的有效解决过程。比如一个物理问题所隐含的原理隐含在它的表层特征之下,专家们学会了看出这些隐含的原理并根据他们来表征问题。专业技能增长的一个重要维度是有能力以一种更有利于产生有效解决方案的方式来感知问题。

关于专业技能的变化,另一个发现是专家对于自己专业领域相关的信息有着特别强的记忆能力。以国际象棋为例,专家们记忆棋局的能力比新手强,而且他们更善于记忆棋局的模式。同时,专家们存储了很多问题的解,而对于低水平的起手来说,这些都是需要解决的新问题。这些记忆的信息使他们具有两个优势:首先是他们在解决这些问题的时候几乎没有出错的风险,因为他们已经存储了正确的解法。其他由于他们存储了这么多正确的分析,他们可以专注于解决更复杂的问题和全局策略。总的来说就是,专家能够识别很多问题中重复出现的各种要素及其模式,并且当这些模式出现的时候,不假思索就知道该怎么做。除了短期记忆,随着人们在一个领域变得更加内行,他们在长时记忆中存储和提取问题信息方面培养出了更强的能力。

那么怎样才能成为一个领域内的专家呢?为什么有的人终其一生都在从事某项工作却并不见得会成为该领域的专家呢?埃里克森认等认为,问题的关键在于他们是否进行有目的的练习。在有目的的练习当中,学习者不是机械地操作,他们有学习的动力,会得到关于自身操作的反馈,并仔细观察自己的操作和正确的操作相比,哪些做对了,哪些有差距,再集中注意消除差距。有目的的练习的另一个重要作用是它会促进专业技能所必须的神经的增长。

对于目标成为某领域专家的学习者来说,关于专业技能的知识给我们的启示是:对于复杂问题,学些专家们的解决策略是有效的提高途径。

那么一项专业领域的技能会不会对另一个领域的技能有帮助呢?有一种看法将心理能力视为一种官能,这种观点认为,心理是由诸如观察、注意、辨别以及推理等一般官能集合而成的,可以用于锻炼个部分肌肉相似的方法锻炼这些官能。锻炼的内容无关紧要,最重要的是努力的程度。如果按照这种观点,技能的迁移将会是广泛的,普遍发生的。但是经过了长久的研究我们仍然无法找到证据支持这种观点。实际研究发现,把技能迁移到类似的领域时通常会遭遇失败,因而更不可能迁移到非常不同的领域。

桑代克提出了相同要素说来说明技能的迁移。在桑代克看来,人的心理并非由一般的官能组成,而是由一些特殊的习惯和联想构成。根据桑代克的观点,只有当两个活动具有共同情景-反应要素的时候,一个活动中的训练才能迁移到另一个活动中。桑代克的观点被证明过于狭窄,低估了迁移可能发生的广度。

现代心理学认为技能间的迁移只发生在这些技能有相同的抽象知识要素的时候。这对教育的启示是更多的关注基础知识成分,使用基础知识成分识别并确保学生能全部掌握这些成分的方法将提高教学质量。

认知的个体差异

我们早已知道,人类的妊娠期、儿童期在所有哺乳动物中都是最长的之一。虽然儿童在五岁即已完成了神经系统的发育,但其身体的发育则要等到成年才能完成,漫长的儿童期使得人类有时间来发展一个硕大的脑并获得大量的社会知识。

从儿童到承认,人类认知能力的发展经过了那些阶段呢?根据皮亚杰的理论,儿童的认知发展具有四个阶段:感知运动阶段,前运算阶段,具体运算阶段和形式运算阶段。当然这些阶段不是离散的,所有这些能力都是连续发展的。皮亚杰还观察到,儿童在不同阶段的对守恒的理解沿着各个成长阶段而发展。

所谓守恒即对世界的理解和知识在各种变换之下保持不变。比如感知运动阶段的守恒,儿童必须了解物体经过时间和空间的变换仍然存在。前运算阶段和具体运算阶段的守恒:。形式运算阶段的守恒:能够理解作为现代科学的一部分的理想守恒,包括能量守恒和动量守恒这样的概念。随着儿童的发展,他们越来越深刻地认识到在何种变换之下客体的那些特征能保持不变。

儿童认知能力的发展即有心理能力发展的贡献也有知识增长的贡献,也即更好的思维和更好的知识。研究发现两岁之前儿童的神经系统发育对认知发展的贡献比两岁之后更重要,体现在神经元连接的增加。心理能力发展既包括工作记忆容量的增大,也包括信息加工速度的提高。而一方面我们的知识也会增长。年幼儿童经常在各种任务中比年长儿童表现差,因为他们拥有较少的相关知识和交叉的策略,而随着记忆内容的知识的增长和策略的丰富,我们在记忆任务中的表现也会增强。

是不是认知能力会随着年龄的增长而不断增长呢?在认知能力测验中,老年人通常表现会差一些,然而这主要是因为这类测验要求被试者快速完成任务,研究发现老年人在完成较慢的任务上表象更好。另一方面,脑细胞的确会随着年龄增长逐渐残废,但新的脑细胞也会同时产生,并且其间的连接更有效率。总之,随着年龄的增长,知识的增加和神经功能的损失之间存在着竞争,并共同影响着我们的认知能力。一般来说,人的智力产出的顶峰出现在二十来岁之后的三十来岁。

我们如何测量认知能力呢?在美国流行的智商测试有两种:斯坦福-比奈测验和韦氏智力测验。这两种测验可以在一定程度上预测在校生的成绩。但问题在于,智商测验测量的是内在的禀赋还是获得知识的能力,也就是先天能力和后天能力。有研究发现智商与先天资质关系紧密,然而智商和智力不是一回事,在特定领域取得成功的特定经验也许并不贡献于智商测验,比如国际象棋。智商测验确实能在一定程度上预测一个人在生活中的一般成功。

智商测验通常包括一系列子测验。这些子测验通常试图还原智力的基本因素,并找到这些因素之间的相关性。卡特尔将智力分为两个主要类别:晶态智力和液态智力。前者是指获得的知识,后者是指在新领域中推理或者解决问题的能力。还有理论认为,除此之外还存在空间智力。晶态智力对应着语言因素,液态智力对应推理因素,而空间之力对应着空间因素。推理能力得分较高的被试能够迅速执行推理过程中的每个步骤。语言能力高低额人能够迅速抽取单词的语义,并且具有强大的语言信息工作记忆。空间能力强的人能够迅速完成基本空间操作,并且经常选择空间策略而不是语言策略来完成任务。

 

决策中的三种偏差

决策一般来说可以分为两个步骤,第一步是价值判断,也就是估量决策带来的每一种可能后果的价值,第二步是估算每种结果可能出现的概率,最后得出决策带来的期望收益。通过分析每种决策带来的期望收益即可形成决策的有效依据。然而认知心理学的研究显示,人们在决策上存在一些固有的偏差。

人在决策的时候,尤其是涉及到金钱相关的决策的时候有两种特别的效应:

主观效用:即我们赋予钱财的价值,与钱财的面值并不成线性关系。

情景:

  • A: 100%概率获得100万
  • B: 50%概率获得250万

人们会倾向于选择A,虽然B的期望值是125万。因为对人们来说,100万和125万其实没有多大的差别。

主观效用的另一个特点是在损失部分更为陡峭,也就是说,人们对损失比对收益更为敏感。

情景:

  • A:50%的可能获得10美元,50%的机会损失10美元
  • B:不会发生任何事情

人们会倾向于选择B,因为他们把损失10美元看得终于获得10美元,因此选择A的期望价值是小于0的。

人们决策偏差的第二个效应是主观概率效应。

主观概率:相比于高概率事件,人们过于重视概率非常低的事件。

情景:

  • A: 1% 的机会获得400 美元
  • B: 2% 的机会获得200 美元

人们可能会更倾向于选择A,因为1%的概率并不等于2%概率的一般,在人们的主观判断中,1%的概率的权重高于2%的一半。

另一个决策的效应是框架效应。

框架效应:人们的决策随着他们对自己在效用曲线中的位置的感知而变化。

情景:一个人必须购买15美元和125美元的东西

  • A:一个商店对于15美元的东西有5美元的折扣
  • B:一个商店对于125美元的东西有125美元的折扣

人们更倾向于选择A,虽然都是5美元的折扣,但人们此时在效用曲线的不同位置,因为效用递减原则,15美元和10美元之间的差异大于125美元和120美元的差异。

语言结构

如果将一直猴子放在打印机前,给它无限的时间和无限的打印纸,总有一点它可以打出莎士比亚的名著。

这是无限猴子打印定理的一种表述。这个定理来自概率论中关于零一定理的阐述,即有些事情不是一定会发生就是一定不会发生。但从另一个角度,它也暗含了语言的两种基本性质:生成性和规则性。

语言的生成性是指,任何语言可以通过组合基本的语言要素,生成无限多的话语。

猴子可以通过随机敲击键盘除了可能写出莎士比亚的名著,还可能写出我们从未见过的竞猜著作。但并不是猴子打出的所有字符组合都可以被人阅读,在绝大多数情况下,猴子打出来的都是毫无意义的词语和句子,这是语言中规则性的约束决定的。

语言的规则性是说,语言具有一定的语法,句法,发音规则。不符合这些规则的就不能被视作一种合规的语言。

我们学习语言很大一部分都是在了解语言的规则性:那种表述是正确的,那种表述是错误的,

语言的作用如此重要,以至于说人类因为有了语言才成为人类的一点都不过分。我们在意识中进行的思维活动大部分都是依靠语言进行的,我们的描述,推理,决策过程都高度依赖语言。

那么语言和思维的关系如何?行为主义者认为思维就是不发出声音的语言。另一种观点则认为,语言虽然强烈地影响着一个人对世界的思维方式,但思维并不是语言。我们每个人都有一些个人体验可以证明思维不一定必须借助语言发生。比如我们在紧急情况下的快速判断,是来不及借助语言来进行的。但是证明思维可以不通过语言进行的难点在于,如果没有语言,我们无法向外界传达我们思维的过程,也就无法证明我们的思维不通过语言发生,也就是说,语言几乎是我们与外界交流一的唯一工具了。

几乎每个人都掌握一门母语,有很多人还掌握一门或者多门外语。然而我们常常疑惑:为什么小孩子可以轻松将一门外语学习到母语的水平,而年龄稍大的孩子和成年人学习母语和外语的成果差异如此巨大?是因为学习方式和学习环境的问题还是因为神经结果随着年龄变化不再适用于学习新语言?

一般来说,成年人学习外语的速度往往比儿童学习母语时的速度快,但在最终学习的成功性上不如儿童。

儿童在进入学校之前一般不会得到有效的母语学习指导,他们更多的是通过重复模仿和纠正来学习。但他们的学习成果已经足够让人惊叹:这个时期的儿童们也许还不具备很多知识,但他们通常已经具备流利的语言能力,可以掌握数量庞大的语言要素和隐藏在其后数量更加可观的语言规则。成年人或者较大的儿童学习外语的时候,已经具备了相当完备的思维能力,他们通常能较快的掌握语言的规则。但最终在语言表现上不如儿童。

我们可以将语言的学习成果分为三个层次:语义,句法和语音。

我们通常的感受是,有许多成年人可以熟练的通过外语表达自己的思维,但在表达的细节和准确性上有一些问题,而在语音方面表现最差。研究的证据显示,学习外语一个较为重要的时期是2到12岁,在这个年龄段内,儿童学习外语的成功程度与学习年龄相关,而年龄效应在上面提到的三个方面依次增强。

关于语言我们有无穷多的问题,语言的产生,语言和文化的相互作用,语言在个体心理层面的呈现等等。每一个问题都让人着迷。面对这些问题我们发现我们关于语言所知甚少,而那些才是真正让人心驰神往的地方。