《统计陷阱》统计学与生活

《统计陷阱》这本小册子首次出版于1954年,这一点从书中大量引用的二战期间的例子即可有所感觉,但这并不影响本书对当下的适用性。你常常可以发现书中所列举的例子在当今知识更加普遍,比如广告行业当中大量存在的偷换概念的现象。统计作为一门科学在大众中的认知实在有限,然而我们并不需要阅读统计学教材——花一整个章节介绍置信区间的概念——才能学到有效的统计思维,大量的统计陷进都基于十分简单的原理:可以选择样本数据,将相关性解释为因果性。这本《统计陷进》对这些原理进行了十分清晰的概括,并且提供了大量的例子,作者在本书最后还提供了简单易行的方法来帮助我们识别这些陷阱。阅读这本书的过程使我再次感到人类的思维方式和认知过程存在无数的偏差,修正认知模式是需要长期不懈的坚持,获得理性并不是一时半会的事情。

  • 内在有偏差的样本

统计最基本的原理就进行样本抽样。从本质上说,抽样调查的方法基于这样一个假设:样本分布和总体分布相同。但这个假设并不总是成立的。样本本身可能存在问题,从而使的抽样获得的结果和整体实际结果相差甚远。样本的内在偏差可能来自许多不同方面,比如设计抽样方案的时候不具备代表性。完全随机抽样可以保证样本具有待料性,但因为获得样本的难度过大而一般在技术上不被考虑。更加常见的做法是进行封层抽样。再比如,用户在回答抽样问题的时候并没有提供完全真实的意见。比如我们可能处于私人原因故意高报或者低报我们的收入数据。对于这类调查,除了在设计问题的时候必须更为谨慎之外,使用其他数据源来验证调查结果可以增加结果的可靠性。总之,当我们遇到统计数据的时候,首先要问,样本是如何产生的,它们具有代表性吗?

  • 精心挑选的平均数字

统计报告中的平均数是一个十分容易被操纵的概念。从报告中看到平均数的时候,我们需要了解其统计学上的含义,其中包含的数据,最好是可以了解具体的统计分布情况。大众传播中平均数的概念和统计中的平均数有很大不同,它可以用来代指统计学上的平均数,众数和中位数。这三种不同的方法可以获得完全不同的结果。另外,通过故意操纵统计中的包含的数据也可以获得不同的平均结果,这在一些专业领域比如会计领域尤其常见。我们需要做到的是了解数据背后的统计学方法。

  • 没有披露的数据

统计报告当中经常缺乏一些关键性的数据使我们无法完全了解统计结果。最典型的比如样本数量和试验方法,样本的数量过小或者实验的方法不够科学都可能导致无效结果,降低报告的可信度。使用统计中的显著值可以使我们了解统计结果的可信程度。另一方面,当我们将统计数据运用到个人生活的时候,比如根据统计结果来衡量小孩是否发育正常,我们需要知道统计的分布等更多信心以正确的解读这些数据,比如和平均值偏差多少才值得担心,在每个区间之内各分布了样本。

  • 毫无意义的工作

在社会生活的许多方面,统计数据是毫无意义的,或者是不能完全反应事情的全貌的。比如一般的之上测验只关注与阅读和抽象思维的智能,而忽略了其他的智能比如社交智能。另外,测试方法的科学性本身也会影响结果,不科学的测试设计本身会导致无效结果。在解读统计数据的时候我们还想要知道结果可能出现错误的概率。我们一般使用标准差来衡量这样的概率。仅仅进行一次实验而得出的结果包含了太多随机成分。

  • 惊人的统计图形

在解读统计结果的时候,我们对于图形比对于数字更加敏感,这就为设置统计陷进提供了空间。在解读图形的时候我们更多的关注整体的趋势,因此可以通过有选择得绘制图形来改变人们对于统计结果的印象,比如调整折线图纵坐标的起点和尺度可以造成放大或者缩小实际波动范围的效果。这样的效果等同于带领读者从不同的高度看待统计数据:用放大镜观察看大部分数据都波动剧烈,从外太空看他们的变化可以忽略不计。我们甚至可以改变纵坐标的单位来获得这样的效果,比如进行一些高深莫测的数学转换。

  • 平面图形

为了更加直观的向公众传达统计数据的变化,有些报告会使用二维图形来描述这样的变化。其中一个常见的陷进在于:这些报告是使用二维的形象来绘制的,而当我们解读的时候却会将他们还原为三维的图形,因此二维尺度上的变化在三维空间就会被剧烈当大,很多报告正是利用了这样的心理误区来操纵人们对报告的印象。比如为了表现钢铁产能在十年间增长一倍,报告可能会使用一个两倍大的炼钢炉来表现现在的钢产量,但当我们阅读的时候第二个炼钢炉在我们脑海中是第一个的大八倍。

  • 不相匹配的资料

使用统计数据来误导公众的一个伎俩就是利用一些看不见的因素。比如我们会自动寻找统计结果和需要说明的事务之间的关联,而增加一些正面因素就可能导致我们在寻找关联回路的时候从正面的角度出发。广告行业是这个陷进的重灾区,比如通过强调数据来自权威实验室来暗示药物的灭菌效果和治疗感冒之间的联系,比如在展示化妆品效果的时候让模特笑的更加灿烂。

  • 相关关系与因果关系

最显著和常见的统计陷进也许是将相关关系混淆为因果关系。人类有进行因果关系推论的本能,认识到事务之间的关系可能包含多种解释需要理性,本能总是胜过理性。有很多事务之间具有很强的相关性,在这个前提下使用一种因素来预测另一种因素是可行的,但是试图因此归纳他们之间的因果关系则是荒谬的。比如受过教育的女大学生单身的比例要高于受过教育的男大学生的比例,这并不是说说受教育会导致女大学生单身,而很可能是因为想要保持单身的女性更可能会选择大学教育。找出事务之间的关联性并不是一件容易的事情,这有时候需要专业的知识和洞见,但我们能做到的是对任何因果关心保持怀疑态度,并经常进行寻找可能关联的解读。

  • 如何进行统计操纵

在我们选择如何向他人传达统计结果的时候,有很多办法可以操纵人们对于统计结果的想法。比如使用明暗对比明显的地图,混淆中位数和平均数,故意增加数字的小数位数以显得真实,使用百分数,变化数字使用的基数等等。这样进行统计操纵的现象无处不在,因为我们在表达结果的时候总是倾向于从有利于我们的角度进行解读,同时在如何传达统计结果的时候语言所特有的模糊性就派上了用场。比如我们不会说物品价格易碎,价格低贱而总是说它们轻便、经济实惠。

  • 对统计资料的五个问题

如何更好地识别统计数据中包含的陷进呢?作者介绍了五个问题来帮助我们了解统计数据背后的真相。

第一个问题是:谁说的。我们需要了解数据的来源,努力辨别数据背后有意识或者无意识的偏差。还要对那些看似权威的结构保持警惕。在细分的专业领域,看起来类似的机构其实只能相差万里。

第二个问题我们要问:他是如何知道的?调查使用的方法是什么?样本的选取合理吗?这些都有助于我们评判统计的过程本身是否科学严谨。

第三个问题是:遗漏了什么?调查报告的样本数量多大?统计上的可信程度有多高?如果报告没有披露这些数据,我们应当对报告表示怀疑。再比如,如果使用百分数而不报告原始数据,使用平均数而不告知样本的基数也是值得怀疑的。

第四个问题是:是否有人偷换了概念?比如病例的增多是不是以为这发病率的提高?还是因为统计手段的改进使调查者的已收集更多的样本?比如将中位数当做平均数来使用。在银行和金融这些和数字打交道非常频繁的领域,偷换概念是最值得警惕的问题。

最后一个问题是:这个资料有意义吗?许多统计结果所基于的假设经不住验证,即使有准确的统计数据这些结论也毫无意义。另外很多统计的结论是基于对数据的推广,比如根据当下的结果推论以后的趋势,而实际上统计的基础往往是随时间变动的。

《影响力》大众心理学研究

自1986年出版以来,罗伯特西奥迪尼的《影响力》在全世界已经累计发行超过三百万册。如果考虑到中国地摊上的海量盗版,这本书的实际销量会更加可观。一本心理自助类书籍得到这样长盛不衰的关注,本身就是一个有趣的现象。为什么人们对影响力的话题如此感兴趣?我想最本质的原因在于:我们渴望获得对生活的控制感。

影响力匮乏

影响力匮乏是我们生活中一个永恒的主题。从说服上司支持我们的升职计划,到说服朋友去吃川菜而不是粤菜,我们在几乎所有场合都需要影响他人的能力。如果事情向我们期待的方向发展我们会感到高兴和满足,否则我们会感到沮丧和挫折。我们有多少次使用各种方法试图影响他人,就会有多少次感到自己影响力的不足。归根结底,影响力是权力的一种体现,是使他人按照我们意愿行动的能力。我们努力扩大影响力,是因为我们对工作和生活常常感到影响力不足,控制感不够。但遗憾的是,《影响力》对我们如何提升影响能力的指导性恐怕非常有限。

《影响力》最有开创性的工作也许是总结出了影响力运行的六个主要原则:互惠原则、一致原则、社会认同原则、喜爱原则、权威原则和短缺原则。作者对每个原则都作了讨论,既包括对得出这些原则的心理学实验的介绍,也包括对这些原则在日常生活中应用的呈现。随着全书的推进,作者所挑选的的例子也逐渐从强调单一因素过渡为强调多个因素,在不断复习之前原则的同时也使我们更加接近真实生活中的场景。

《影响力》在两个层面上对我们有所助益。第一是打破我们关于理性决策的幻觉,我们的日常决策尤其是消费决策远没有我们想象的那样理性。第二是帮助我们认识到影响力是一个多因素的过程,不要过于强调任何因素。自助类的书籍总是在暗示我们:面前这本书里藏着解决你生活困境的万能钥匙。然而《影响力》在指导我们如何提升影响力上着墨甚少,它的落脚点大多在提醒我们增强对影响力原则的意识。

理性决策的幻觉

如同在其他所有方面一样,我们在评估自己决策的理性程度时常常高估自己。我们认为自己决策的时候总是充满理性的,或者至少多数时候是理性的。我们很难相信自己会在不知不觉中步入许多为我们量身定做的陷进:当我们在经销商选购新车的时候,当我们在超市决定要买哪一款牙膏的时候,我们不太容易相信有许多看不见,也并不经常被我们感知到的因素正在影响着我们的决策。

西奥迪尼在书中大量引用了社会心理学和行为心理学的研究。作者用这些研究不断提醒读者,我们日常决策中存在着大量的非理性倾向。我们必须认识到,人类的思维能力是有限的,多数时候为了提高效率,我们必须放弃复杂、耗时、全局性的决策方式,而采取更加自动、更加原始和更加单一的反应方式。我们的心理倾向正是在这样反复的训练当中固定下来的。

多因素的思维方式

对于影响力我们最直观的感受是说服他人的技巧。因为多数时候影响力是通过语言呈现的,我们常常会过于强调沟通技巧对于影响和说服能力的重要性,而忽略在其他方面的投入,比如培养同事的好感度。如同作者在书中所揭示的,影响力是一个多因素的综合过程,沟通技巧只是使影响力以合适的方式陈现出来。一个只拥有良好表达能力但是为我们所讨厌的人是很难有效影响我们的。而具体到不同的场景之中,每个因素所占到的比重都不相同。从强调单一因素的思考模式转变为强调多因素的思考模式是认知进步的重要一步。

书中另一个有趣的话题是关于影响力的道德边界。作者反复强调影响力的运用应该遵循道德原则,但我们也要提高辨识恶意影响的能力。这个问题和权力的运用一样值得思考:以何种方式运用影响力才称得上道德?或者如同马基雅维利在《君主论》所呈现的观点:道德从来都不应该是权力的运行基础。这是我们每个人要问自己的问题。

内容简介

互惠原则是人类合作的基础。我们总想对恩惠给与同样的回报,无论是出于负债感还是出于感激之心。电影《教父》开篇,教父帮助棺材店老板解决了纠纷,但一直要等到大儿子被对手乱枪打死,教父才找到棺材店老板要求对方为儿子整理遗容作为回报。互惠这个原则在人类社会当中具有广泛而深刻的意义。我们在潜意识里将对朋友的帮助视作对关系的一种投资,我们期待在需要的时候朋友也会给与我们相同的帮助。在职场上我们将对他人的帮助视作一种资产,我们需要时时为这样关系注入新的资金,才能在需要帮助的时候顺利获得支持。可以说,互惠是关系的本质,如果一段关系不能产生互惠,那么这段关系将会很难维持下去。

作者在书中还提到另一个有趣的现象:谈判中的让步也是互惠原则的一种体现。人们并未付出实质性的代价,仅仅是谈判中的让步就会让人感到受到了恩惠。书中提到了许多互惠原则的应用,比如很多公司提供免费咨询服务,但是当我们咨询完毕之后,很可能就会觉得有义务选择这家公司的服务而不是不进行比价。

承诺原则一方面来自于我们想要努力保持言行一致的道德压力,另一方面也来自于我们渴望简化判断过程、依循旧例的思维倾向。我们一直被教育要履行承诺,所以一旦我们作出了承诺,要求维持言行一致的自我便会跳出来推动我们履行承诺。作出决定之后的我们甚至会主动寻找出更多的理由来进一步增强我们决定的合理性。比如我们对于挑选出的家具会更加喜爱。这样的一致性原理背后其实是深层次的对于思考和选择的痛苦的回避,一旦做出决定我们便会认定这个决定,将它放诸脑后,因为我们知道重新审视判断不仅带来精神上的紧张,更可能带来后悔的痛苦。

社会认同原则是从众效应的一种延伸。身处人群的时候,我们总是感到有必要跟人群保持一致,这不光是因为跟群体一致让我们有被接纳的感觉,还因为特立独行需要承受巨大的压力。比如及时知道情景喜剧中加入的是录制笑声,我们也会情不自禁的跟着一起笑。比如欣赏歌剧的时候,如果不跟着鼓掌我们会怀疑自己是不是过于苛刻。

从众效应是人类最基本的心理模式之一,它很有可能来来自于一种防御性的本能,也就是在信息不完全的时候依靠群体的行动行动,因为进一步确认信息在很多情况下是非常危险的。很多群体动物有瞭望员的角色,当它们发现危险的时候就会警告群体,虽然并不是每个成员都直接看到了危险,但它们更多的选择先相信群体的动向。

喜好原理是说我们更愿意答应自己喜欢的人的要求。在之前关于亲密关系的文章中,我曾列举过喜欢的若干原理,比如我们喜欢与自己相似的,喜欢外表有吸引力,喜欢喜欢我们的,比如对方给我们很多称赞。我们在与新认识的朋友建立管理时总是努力从家乡、学校、居住过的城市甚至兴趣爱好寻找共同点,因为我们知道这样的相似性更能带来好感。正因如此,拥有魅力的人在人群中总是具有更他的影响力,所以我们经常选出外表出众的政治人物。

权威原则是与权力直接相关的原则:权威就是权力。人类天然愿意听从专家和权威。我们依赖知识权威给我们提供宝贵而高效的路径,帮助我们制定出色的决策。作为社会性的动物,我们自然的崇拜组织中的权威,组织当中更高职位的人的话语自带着额外的分量。我们在文化当中创造出来各种各样关于权威的符号用以表明自身的身份、品味和阶级与他人不同。比如豪车、高级西装或者定制礼服,精美的首饰还有奢侈品等等。在知识越来越纷繁负责,分工越来越精细的今天,我们原来越需要依靠权威帮我们进行甄别。也正因如此, 我们在商业广告当中看到越来越多的专家形象和元素。

短缺原理是说:东西越少,要的人越多。我们经常见到商家强调某件商品库存有限或者限期打折。商家们用这样的方式提醒我们商品是稀缺的,我们需要抓紧机会购买。短缺原理在之前关于亲密关系的文章中也有讨论:比如家人的阻挠让罗密欧与朱丽叶更想要跟对方在一起。如果某件东西不仅稀缺,而且我们必须通过竞争才可能得到它的时候,我们得到它的愿望就会变得更加强烈。比如房产经纪会无意中透露所看到这套房有很多人想要买,这套房产立刻变得更有吸引力了。

Intimacy, Linking, and Loving During Early Adulthood

Note from <Development Across A Life Span>, Chapter 14: Social and Personality Developmetn in Early Adulthood

  • The Social Clocks of Adulthood

The social clock means the psychological timepieces that records the major milestones in people’s life. For example, the typical man completed his education by his early 20s, started a career, and married at later mid-20s.

The social clock is determined by the culture, they actually reflect the expectation of the society in which we live. For example, the social clock in China are different from the social clock in the US. Each of us has a social clock that provides us with a sense of whether we have reached the major benchmarks of life early, late, or right on time in comparison to our peers.

  • Intimacy V.S. Isolation Stage

During the period of postadolescence into the early 30s, the young adults focus on developing close, intimate relationship with other. Erik Erikson regarded yound adulthood as the time of the intimacy-versus-isolation stage.

  • Falling in Love

How do we fall in love with each other? Stimulus-value-role theory believes there are patterns during the course people fall in love. In the first stage, the relationship are built on surface, physical characteristics such as the way a person look. On the value stage, the relationship is characterized by increasing similarity of values and beliefs. In the role stage, the relationship is built on specific roles played by the participants, say the coupled may define themselves as boyfriend-girlfriend.

  • Passionate and Companionate Love

Some psychologists suggest that our love relationships can fall into two different categories: passionate or companionate. Passionate(or romantic) love is a state of powerful absorption in someone. Companionate love is the strong affection that we have for those with whom our lives are deeply involved.

  • Labeling Theory

According to the labeling theory of passionate love, the individuals experience romantic love when two events occur together: intense physiological arousal and situational cues suggesting that the arousal is due to love. This explains why people may feel deepened love when when they experience continual rejection or hurt from their assumed lover: it suggests that such negative emotions can produce strong physiological arousal, and then interpreted as being caused by “love”.

  • Intimacy, Passion, and Commitment

Robert Sternberg suggests that love is made up of three components: intimacy, passionate, and decision/commitment. These components can be combined to form eight different types of love depending on which of the three components is either present or missing from a relationship. For example, a couple has been happily dating a few months, but have not made any plans for a future together is a romantic love, where intimacy and passion are presented but the commitment is in absent. For a long term relationship, it is not necessary that all three aspects have to be present.

Over the course of a relationship, the three aspects of love would vary in strength. The passion is strong on the early stage, however, gradual comes down in later stage. This means the type of love between a couple also changes along the course, say, from the romantic love to the companionate love, where the Pyhsical passion has taken a back seat.

  • Is Love the Only Factor?

Is love the only factor for marriage? The notion that couples need to be in love was not “invented” until the middle age. Is love the only thing that matters? Different culture would rate different factors, for example, in Chin men ranked good health most important and women rated emotional stability and maturity most critical.

There are two trends in the marriages: homogamy is the tendency to marry someone who is similar in age, race, education, religion and other basic demographic characteristics. Marriage gradient is the tendency for men to marry women who are slightly younger, smaller and lower in status, while women to marry men who are slightly older, larger and higher in status.

  • Attachment Style

Attachment refers to the positive emotional bond that develops between a child and a particular individual. Most infants fall into one of the three attachment categories: securely attached child, avoidant infants and ambivalent infants. It seemed clear that there are continuities between infants’ attachment styles and their behavior as adults. For example, people secure adults tend to provide more sensitive and supportive care, being responsive to their partner’s psychological needs.

我是谁:社会中的自我概念

本文试图回答下列问题:

  • 什么是自我概念?
  • 自我概念由哪些因素决定?

你如何回答我是谁这个问题?

如果你感到这个问题的哲学意味过重,不妨回想一下你是如何向一个陌生人介绍自己的,这时你的脑中一定有了不少答案。你可能会提供很多描述性质的答案,但我猜它们大部分都可以归于下面四种之一:

  • 生物特征,例如:我黄皮肤,黑头发
  • 社会角色,例如:我是在某互联网公司工作的程序员
  • 个性特征,例如:我好奇心强,性格偏外向,待人友善
  • 存在特征,例如:我是生活在地球上的人类

你的这些回答的集合就构成了你关于自我概念的描述。也就是说,自我概念就是你关于我是谁这个问题的答案的集合,用更正式的语言描述,就是个体关于自己是谁或者其特征是什么的信念的集合。

问题在于:我们的自我概念从何而来呢?

社会角色

我们或多或少都扮演着某些社会角色,这也是我们定义自我最常用的方法。一个社会角色包含权利、义务、期待以及常态行为等等。不论是某学校的学生还是某公司的程序员,在我们的自我概念当中,社会角色永远是最重要的组成。我们会面对自己所扮演的社会角色,并倾向于按照社会规范的期望去行动。莎士比亚的说法更能生动地诠释社会角色的概念

世界是一个舞台,所有男男女女不过是一些演员。他们都有下场的时候,也都有上场的时候。一个人的一生中可能扮演者好几个角色。

All the world is a stage, and all the men and women merely players. They have their exits and their entrances. And one man in his time plays many parts.

社会比较

我们对于自己才能,智力,道德品质的判断比得基于某个坐标才得以进行,这个坐标多数时候是他人。我们通过与他人的比较来确定自己在某个特征上所处的水平。我们感到智力高,是因为我们认为周围人的智力不如我们,我们认为自己能力强是因为和能力较差的人发生比较。我们的社会生活大部分都是围绕社会比较而进行的,这样的比较无时无刻不在进行。多数时候,我们能够成功得将这些从社会比较中得来的优越感或者嫉妒心隐藏起来,但是总可以从行为当中找到蛛丝马迹。比如,对于比我们差的人,我们有时候会不经意中流露出对他们意见的轻视。

社会认同理论

社会认同理论认为,我们从属于何种团体是我们自我概念的重要来源。在事物的认知上,人类倾向于将事物分类并标签化从而简化和加快认知过程。对于人的认知同样如此:我们将人进行社会群体归类,然后应用已经习得的关于这个群体的预设来了解他们。比如,如果一个人从事软件开发,那么我们倾向于认为他沉醉技术,不善交往,如果一个人从事保险销售,那么我们倾向于认为他能说会道,并会提醒自己小心他的诱导。

我们可以把群体想象成一个圈,社会认同便是将符合某些特征的人归入圈子之中。圈子,也就是社会群体,自然将人群分为圈内的我们和圈外的他们。我们倾向于提高自己所从属的社会群体的地位,同时贬低所不从属的社会群体的地位来获得自我形象上的提升。比如在知名互联网公司工作的工程师会倾向于认为自己公司的工程师水平比非著名公司的工程师水平更高。我们还倾向于夸大圈子之中成员的相似性,以及不同圈子之间的差异性。

一般来说,建立社会认同的过程分为三个步骤:

  • 社会归类:对他人进行社会群体的归类
  • 社会认同:将自己归类到某个社会群体,并产生认同
  • 社会比较:将自己所属的群体和其他群体进行比较

社会认同理论对于我们的启示之一在于,一旦我们将自己归入某个群体之后就很容易产生一种虚幻的优越感,这种优越感会妨碍我们看清自己和他人。

其他决定我们自我概念的因素还包括:

  • 成功和失败的经验

自我概念不是一成不变的,失败的经验和成功的经验都会影响我们的自我概念。当然我们在阐释成功和失败的原因时会表现出维护和提升自我形象的偏见:自我服务偏见,在后面的文章中我会进行介绍。

  • 他人对我们的评价

我们对自己的认知很大程度上是由我们对于他人如何评价我们的感知决定的。如果我们认为他人肯定和认同自己,会差生积极的自我意象,相反则会产生较差的自我意象。当然,多数时候,我们想象当中他人对自己的评价都是高于实际的,这也是为什么很多人并不那么敢于听到他人对自己真实评价的原因。

  • 集体主义还是个人主义的文化传统

究竟我们所处的社会是崇尚个人主义还是崇尚集体主义在很大程度上影响了我们的自我概念。个人主义文化,比如美国文化会更向前自我的概念。集体主义文化中,自我的概念则被削弱。

记忆的编码、储存、保持与提取

记忆几乎是我们认知世界最重要的工具。只要想想一下失去记忆的能力就可以明白它对我们有多重要:我们将无法记住自己的过往,没有任何实质性的外来,无法与他人建立感情和联系等等。我们与记忆相处的经验如此之多,但并不总能明白记忆是如何产生与存储的。本文想要从以及的编码、存储、保持和提取等角度对记忆加以考察。

记忆的编码和储存

记忆产生的生物学基础是我们大脑的神经元的可塑性,也就是说大脑的神经元结构有随着经验而改变的能力。如果稍微细致区分则是:人脑主要依靠脑的额叶结构产生和提取记忆,颞叶结构永久存储这些记忆。

那么记忆以何种形式在这些神经基础上产生呢?如果仔细观察会发现,我们并不将所有处理过的信息存入记忆,它们大部分不会引起我们的注意,小部分会短暂的停留,更小的部分被我们进行加工,只有很少的部分才会进入到长期记忆当中。

短期记忆可以分为视觉感觉记忆以及听觉感觉记忆。作为记忆加工的第一步,这些刚刚输入大脑的视觉和听觉感觉如何得到短期保存呢?实验表明,存在视感觉存储,即一种能有效保持视觉刺激中的所有信息的记忆系统。这种短暂的视觉感觉记忆有时候也称为视像记忆。这些信息如果没有被注意并得到进一步的加工就会流失掉。同样的,有证据支持短暂的听觉存储的存在,这些记忆可以成为声像记忆。这些感觉信息短暂地存储在大脑皮层的感觉记忆中,使我们能够对其进行加工。

通过短暂记忆之后,信息进入了短时记忆。短时记忆理论认为被注意到的信息会进入短时记忆当中。短时记忆的容量有限,可以用记忆广度来进行衡量。一种流行的说法认为人类能同时保持注意的物体在五到九个之间也是对记忆广度的一种标书。短时记忆被复述之后才可能进入到长时记忆。也有研究认为,记忆进入长时记忆的关键不在于复述时间的长短,而在于加工的深度。

除了短时记忆,还有一种理论认为我们存在工作记忆。工作记忆是我们进行信息加工的时候临时存储我们记忆的部分。

那么工作记忆在哪里发生?如何发生?巴德利假设存在两种不同的系统:视觉空间画板和语音回路,他们由中枢执行系统控制,是保持信息的伺服系统,也是工作记忆的一部分。例如,我们在计算15x35的时候可能同时形成了书写部分乘法问题的视觉表象,并在语音贿赂中复述部分乘积结果。工作记忆的存在于灵长类动物的额叶存在密切关系,额叶的不同区域似乎负责保存工作记忆中不同类型的信息。

工作记忆如何进入长时记忆呢?长时记忆又是如何被激活的?决定记忆的可得性的量称为强度,强度越强,记忆越容易提取。研究发现,当记忆得到练习的时候,它的强度以幂函数形式增加。幂定律的神经基础是前额叶的激活驱动着海马的长时程增强效应,这种激活能够形成记忆和增强记忆。

那么是不是练习是影响记忆的唯一途径呢?并非如此。简单的重复学习并不会改善记忆的成绩。一个人在学习时如何加工材料是非常重要的。一种方式称为增细加工,包括创建和需要记忆的事物有关并对他有多补充和扩展的额外信息。对材料进行有意义的增细加工可以改善记忆。除此之外,研究还发现越是增加细节的加工越能得到较好的记忆效果,即使加工的不是材料的含义。

关于长时间记忆,一个有趣的现象是,在很多增强记忆的自助书籍当中都介绍了地点记忆法:就是沿着一条特定的路径,把需要记忆的事物与路径上的物品联系起来。这种方法被证明是有效的,其原理在于:第一,这个方法利用有序的事物来重组无序的事物。第二,通过视觉表象,建立场所与项目之间的联系,使我们对材料的加工更有意义,也更细致。

另一种常见的体验是,我们对于小说这类作品的记忆要远远强于对课本的记忆,即使我们想要记住后者的意愿要强烈得多。这是因为我们更容易对小说进行增细加工,并且好的小说能够引发对于细节的思考。研究发现,实际上我们记住的材料的数量取决于加工水平而不取决于学习意愿,也就是说一个人是否有意识地学习与记忆没有关系,重要的是人们如何去加工呈现的材料

记忆的保持

当记忆进入长时记忆之后并不是一成不变的。我们经常感到记忆随着时间流逝逐渐模糊以至于无法再有效提取。那么这些记忆是不是被永久性的遗忘了呢?研究发现,一些看似已经遗忘的记忆,其中一些仍然储存在记忆当中,通过,比如神经刺激的方法是可以重现的。关于记忆随着时间消退的速度,一般认为记忆痕迹强度的消退是保持时间的幂函数。

为何记忆无法长期保持呢?第一种解释是记忆痕迹的强度简单的随着时间而消退,另一种理论是遗忘的干扰理论。遗忘的干扰理论是说,我们记忆的消退是因为学习干扰。比如学习一个项目的新关联对象时,会导致对旧关联对象的遗忘。比如记忆的扇面效应:与一个概念相关联的事实越多,提取其中任何一个事实的速度就越慢。新学习的材料也会对先前存在的记忆形成干扰。

目前的研究倾向于认为,遗忘既因为记忆痕迹强度的自然消退,也是因为来自其他记忆的干扰。然而干扰效应出现的一个重要限制条件是:只有学习多条没有内在联系的信息时,才会发生干扰,相反,当信息存在某种程度的冗余时则不会发生干扰。

记忆产生过程中的另一个有趣的现象是:为了记住学习材料,人们会使用他们能记住的东西来推断自己可能学习过的内容。在进行会议的时候,相比于提取精确的事实,人们常常会去判断什么可能是真的。比如在学习过程中对学习的材料进行增细加工时,人们不仅会回忆更多所学的内容,而且也会回忆那些没有学过但是由他们自己推断出的内容。

既然我们的记忆有很多内容是基于推断的,那么我们还可以信任我们的记忆吗?有很多研究发现,当人们在接受误导性的采访时,可能会制造出虚假的记忆。我们用来分辨记忆与想象的过程十分脆弱,信息的来源很容易就被混淆了。我们混淆经验和想象的神经学基础是海马。海马对虚假记忆表现出了与真实记忆同样的高激活反应,因而导致我们不能分辨出哪些是真正经验过的,哪些是想象出来的。但是海马旁回对真假记忆的反应不同,因此通过训练我们可以提高对虚假记忆的抵制能力。

记忆的提取

当我们需要提取记忆的时候,外部环境和内部环境是否对我们的表现有影响?研究发现,如果学习时的外部环境和内在状态和测验时的一直,人们就会表现出较好的记忆。

除了前面提到的有意识的记忆,关于记忆还有很多有趣的研究是围绕我们并没有意识到的记忆展开的。有时候我们会发现自己知道的一些事情是无法描述的。内隐记忆就是用来描述这些我们无法有意识地会议的知识。外显记忆则是描述我们可以有意识地回忆的知识。研究表明,这两种记忆在我们大脑中的实现相当不同。新的外显记忆形成于海马区域,但是旧的记忆可以在皮层结构中被内隐地启动。外显记忆也称为陈述性记忆,主要指我们能够外显地会溢出事实性记忆。在陈述性记忆系统内,存在着情景记忆和予以记忆的区分,情景记忆包含着知识获得的时间和地点的信息。

我们如何表征知识

我们所接受的外部信息、学习的知识,都会以某种形式存在于我们脑中。那么它们是以怎样的方式存在呢?除了神经连接层次的影响,在整个心理认知的层次如何实现?

我们倾向于记住意义

关于信息处理的第一个有趣发现是:我们倾向于记住信息包含的意义而不是信息的具体表述。信息本身具有物理存在,无论是作为声音信号、文字信号,还是色彩、形状都是信息本身的物理形式,它们本身并无特定的意义。但是经过人脑的加工之后,它们得以包含某种意义。我们的大脑倾向于记住这些意义而不是这些物理信息本身。不同的信息可能表达同样的意义,但是我们似乎并不擅长记住这些不同信息的细节。

整体来说,我们的记忆在一开始可以记住细节,但是很快就会遗忘,而倾向于记住意义。这一事实给我们的启示之一:是如果将随意的组合转换为有意义的东西,记忆的效果会比较好。

获取知识的通道

那么在我们的心理层面,意义或者说知识是实现的呢?既然我们获取知识的主要途径是语言和图像,那么知识的表征是否也和这些通道有关系呢?

第一种理论将我们对知识的表征称为通道无关符号系统。认知心理学提出了命题表征的概念。命题是能够从意义上判断出是真是假的最小单元。

命题是可以作为独立断言的语言单元。比如人在记忆一个复合句的时候,会将句子分解成一组表征句子中的简单命题的抽象意义单元。那么命题如何表征知识呢?根据研究显示,人们在记忆一个复合句时,会将句子分解成一组表征句子中简单命题的抽象意义单元。知识的可以借由概念之间的关系网络来表征。

与此相对的是知觉符号系统理论。这种理论认为所有的信息都是根据特定知觉通道的特异性来表征,而且基本上是知觉的。也就是说,人们对信息是作了知觉性的解释。还有一种观点认为认知是具身的,也就是说它来自身体和外界的互动,并与之持续的交织在一起。根据这种观点,认知依赖于身体带来的体验,而身体拥有不可分割地相互联系的特定的直觉和运动能力,并且它们共同组成了孕育推理、记忆、情绪、语言和其他所有心理活动的母体。

如果信息是通道特异的,那么信息在不同的知觉和运动通道当中如何转换呢?。一种观点被称为多通道假设,该观点认为不同的直觉和运动系统关联着不同的表征,我们有将一种表征直接转换为另一种表征的方法。另一种观点是通道无关假设,它认为存在一个中间抽象的系统,并且我们有在知觉和运动表征与这种抽象之间来回转换的系统。

图示的表征

概念网络图示是用来表示概念知识的两种该模型。图示与计算机技术中的数据结构有相似性。图示按照一种插槽的结构来表征类别知识,插槽说明了类比成员的各种属性的价值。属性和价值相互匹配组成了图示。研究发现,人们将推断某物体具有他所属类比的默认值,除非他们发现了明显的例外情况。一个类别的不同成员类属于该类比的程度会有所不同,越是典型的成员就越具有加工优势。

概括化和实例化的争论

机器学习的模型一般来说有两种原理。其一是实例化,典型实现是广度模型。其工作原理是通过将训练样本的特征加以提取并转换为宽度模型的特征向量的权重。其二是概括化,典型实现是深度神经网络。其工作原理将训练样本的特征转换为不同层次的特征向量。第一种模型的特点是记忆性好,对已经出现的例子具有良好的预测功能,但是对于没有出现过的样本可能判断失误。第二种模型的特点是概括性好,对没有出现过的例子也具有良好的适用性,但问题在于有些例子属于特例不能被纳入开阔话当中。

关于概念知识如何得以表征一直以来有两种对立的理论。一种认为我们可以从事实中提取出一般的抽象概念和原理,另一种认为我们只存储实例。这二者其实和机器学习用于表征模型的方式类似。人类概念知识的表征更有可能的是二者的结合,也就是说我们一方面归纳了很多规律,一方面记住了很多特定的实例,

问题解决与计算机算法

我们时时刻刻都在解决不同的问题,隐形或者显性的,长期或者短期,紧急或者迟缓的。

我们是如何解决这些问题的呢?如果我们对这些待解决的问题加以考察就会发现,所有的问题都带有明确的目标导向,我们可以将问题最初的状态成为初始状态,目标结果称为目标状态,中间过程成为中间状态。从初始状态到达目标中间所有可能的路径成为问题的解空间,使问题从一种状态转移到另一种状态的方法可以称为算子,随后问题的解就是这些算子的有效排列。人类解决问题的过程就可以看作是在解空间内进行搜寻,每一条可行路径都对应着问题的解法。

这种看法十分类似于计算机算法当中的搜索算法。以走迷宫问题为例。初始状态是妻子置于初始位,最终问题状态是棋子移动到迷宫的出口,从初始到结束所有可能的上下左右移动的状态组合就构成了问题的解空间。每种通往迷宫出口的路径都是合理的路径。

我们在问题解决的时候并不会对每种可能路径都同等考虑,那样将过于复杂耗时。更多时候我们是凭借经验和知觉选择路径,计算机算法同样如此。有时候我们想要解决的问题的解空间有时候过于巨大,比如围棋,黑白两方的棋子都可以下载棋盘的任何位置,计算机不可能遍历所有路径,因此算法需要对可能路径的搜索进行优化,剪枝大部分路径从而使问题可能计算完成。

算子用于代表我们解决问题的具体步骤和办法。学习新算子第一种方法是发现。当我们在问题空间中随机行走的时候有可能会得到问题的正确解答,如此我们便发现了解决问题有效算子和路径。第二种方法通过他人传授或者观察实例得到。获得新算子的另一种常见途径是类比。在一个问题中行得通的算子在另一个相似甚至完全不同的问题中同样有可能行得通,这样的算子应用就是类比。

实际上,在面对问题的时候,我们的问题有可能不是没有算子,而是由多宗算子可以选择。那么如何找到正确的算子呢?一个普遍的原则是差异降低。也就是说,选择最大限度地减少当前状态与目标状态之间的差异的非重复算子。差异降低原则和机器学习中的梯度递降原则类似:沿着梯度最小的方向,也就是离目标变化最快的方向移动。但同时我们也知道梯度递降的一个问题是可能得到局部最优解而不是全局最优解。而有时候为了得到全局最优解需要选择并非当前最快的路径,梯度递降法就有问题了。在人类解决问题的过程中这样的原则同样适用:在适当的时候选择长期最佳策略而非短期最佳策略更好。

另一个主要方法是手段-目的分析,即创造一个新目标使得算子得以运用。比如说如果发现解决一个问题的关键在于创造某个条件,那么目标就变成了创造这个条件,这样新目标就产生了,运用这个关键条件解决原有问题的算子就得以运用了。和差异降低相比,手段-目的的优点在于其分析不会马上丢弃当前不能得到应用的算子。比如如果一个算子暂时不能得到应用,手段-目标分析会聚焦于如何使算子起作用,即消除组织一个算子得到应用的差异。以消除这种差异为目标的子目标称为算子子目标。

手段-目的分析对于我们解决问题有什么启示呢?手段-目的分析提供了一种非常有用的解决问题的框架。在这种框架之下,我们首先考虑当前状态与目标状态的差异,然后聚焦于消除差异,并将消除这些差异当做子目标,在解决子目标的过程中我们会遇到新的差异,然后我么不断重复子目标-差异消除的过程一直到当前状态和目标状态一致。

这样的模型在解决一般问题的过程中固然有用,但是往往我们会遇到一些困难。比如如何找到目标状态和当前状态的真正差异。假设我的目标是成为一个优秀的工程师,那么成为一个优秀的工程师需要哪些技能,这些技能和我当前的技能的差异在哪里呢等等。在很多情况下我们并不真正清楚目标状态的定义是什么,更不清楚目标状态和当前状态的差异是什么。在了解真是的差异之前就贸然采取行动缩小差异可能是在缘木求鱼。

专业技能学习

我们的大脑结构会随着专业技能的学习而变化。人们越是能够熟练地完成某项任务,在执行那项任务中就可能越少用到脑,进行这项任务所需要的能量就越少。于此同时,当我们成为一项任务的专家之后,我们完成这项任务的方法也会发生变化。

专业技能的学习一般分为三个阶段:认知阶段关联阶段自主阶段。认知阶段是对技能进行陈述性编码。在关联阶段,最初的错误会被逐渐发现和改正,成功操作所需的各种要素之间的联系被强化了。在自助阶段,整个技能的操作过程会变得越来越自动化和迅速,中枢认知开始退出任务执行的过程。认知技能的提高是练习的幂函数,即技能的提高初期会较快,随后越来越慢,经过长时间的保持之后只会出现轻微的提高。

在一个人成为专业技能的专家的过程中,技能的组织如何变化?首先是基于思考的陈述性知识转化为模式驱动的成熟性知识,这个过程称为程序化。程序化使得人们在执行例如骑自行车这样的任务时不再需要思考该怎么做。另一方面,如果我们将解决一个问题或者一部分问题所需要的技能看作一个动作序列,学习执行这些动作序列的过程称为技法学习。许多小问题会反复出现,通过技法学习可以解决他们。大型的复杂问题则不会重复出现,但是他们具有相似的结构,我们可以学会如何组织解决整个问题的办法。这种学习如何把问题解决的过程组织起来以把握一类问题的一般结构叫做策略学习。比如物理学中的专家策略是向前推理,程序设计中的专家策略是宽度优先开发程序。

在我们解决问题的过程中,我们会学会感知问题的有效解决过程。比如一个物理问题所隐含的原理隐含在它的表层特征之下,专家们学会了看出这些隐含的原理并根据他们来表征问题。专业技能增长的一个重要维度是有能力以一种更有利于产生有效解决方案的方式来感知问题。

关于专业技能的变化,另一个发现是专家对于自己专业领域相关的信息有着特别强的记忆能力。以国际象棋为例,专家们记忆棋局的能力比新手强,而且他们更善于记忆棋局的模式。同时,专家们存储了很多问题的解,而对于低水平的起手来说,这些都是需要解决的新问题。这些记忆的信息使他们具有两个优势:首先是他们在解决这些问题的时候几乎没有出错的风险,因为他们已经存储了正确的解法。其他由于他们存储了这么多正确的分析,他们可以专注于解决更复杂的问题和全局策略。总的来说就是,专家能够识别很多问题中重复出现的各种要素及其模式,并且当这些模式出现的时候,不假思索就知道该怎么做。除了短期记忆,随着人们在一个领域变得更加内行,他们在长时记忆中存储和提取问题信息方面培养出了更强的能力。

那么怎样才能成为一个领域内的专家呢?为什么有的人终其一生都在从事某项工作却并不见得会成为该领域的专家呢?埃里克森认等认为,问题的关键在于他们是否进行有目的的练习。在有目的的练习当中,学习者不是机械地操作,他们有学习的动力,会得到关于自身操作的反馈,并仔细观察自己的操作和正确的操作相比,哪些做对了,哪些有差距,再集中注意消除差距。有目的的练习的另一个重要作用是它会促进专业技能所必须的神经的增长。

对于目标成为某领域专家的学习者来说,关于专业技能的知识给我们的启示是:对于复杂问题,学些专家们的解决策略是有效的提高途径。

那么一项专业领域的技能会不会对另一个领域的技能有帮助呢?有一种看法将心理能力视为一种官能,这种观点认为,心理是由诸如观察、注意、辨别以及推理等一般官能集合而成的,可以用于锻炼个部分肌肉相似的方法锻炼这些官能。锻炼的内容无关紧要,最重要的是努力的程度。如果按照这种观点,技能的迁移将会是广泛的,普遍发生的。但是经过了长久的研究我们仍然无法找到证据支持这种观点。实际研究发现,把技能迁移到类似的领域时通常会遭遇失败,因而更不可能迁移到非常不同的领域。

桑代克提出了相同要素说来说明技能的迁移。在桑代克看来,人的心理并非由一般的官能组成,而是由一些特殊的习惯和联想构成。根据桑代克的观点,只有当两个活动具有共同情景-反应要素的时候,一个活动中的训练才能迁移到另一个活动中。桑代克的观点被证明过于狭窄,低估了迁移可能发生的广度。

现代心理学认为技能间的迁移只发生在这些技能有相同的抽象知识要素的时候。这对教育的启示是更多的关注基础知识成分,使用基础知识成分识别并确保学生能全部掌握这些成分的方法将提高教学质量。

认知的个体差异

我们早已知道,人类的妊娠期、儿童期在所有哺乳动物中都是最长的之一。虽然儿童在五岁即已完成了神经系统的发育,但其身体的发育则要等到成年才能完成,漫长的儿童期使得人类有时间来发展一个硕大的脑并获得大量的社会知识。

从儿童到承认,人类认知能力的发展经过了那些阶段呢?根据皮亚杰的理论,儿童的认知发展具有四个阶段:感知运动阶段,前运算阶段,具体运算阶段和形式运算阶段。当然这些阶段不是离散的,所有这些能力都是连续发展的。皮亚杰还观察到,儿童在不同阶段的对守恒的理解沿着各个成长阶段而发展。

所谓守恒即对世界的理解和知识在各种变换之下保持不变。比如感知运动阶段的守恒,儿童必须了解物体经过时间和空间的变换仍然存在。前运算阶段和具体运算阶段的守恒:。形式运算阶段的守恒:能够理解作为现代科学的一部分的理想守恒,包括能量守恒和动量守恒这样的概念。随着儿童的发展,他们越来越深刻地认识到在何种变换之下客体的那些特征能保持不变。

儿童认知能力的发展即有心理能力发展的贡献也有知识增长的贡献,也即更好的思维和更好的知识。研究发现两岁之前儿童的神经系统发育对认知发展的贡献比两岁之后更重要,体现在神经元连接的增加。心理能力发展既包括工作记忆容量的增大,也包括信息加工速度的提高。而一方面我们的知识也会增长。年幼儿童经常在各种任务中比年长儿童表现差,因为他们拥有较少的相关知识和交叉的策略,而随着记忆内容的知识的增长和策略的丰富,我们在记忆任务中的表现也会增强。

是不是认知能力会随着年龄的增长而不断增长呢?在认知能力测验中,老年人通常表现会差一些,然而这主要是因为这类测验要求被试者快速完成任务,研究发现老年人在完成较慢的任务上表象更好。另一方面,脑细胞的确会随着年龄增长逐渐残废,但新的脑细胞也会同时产生,并且其间的连接更有效率。总之,随着年龄的增长,知识的增加和神经功能的损失之间存在着竞争,并共同影响着我们的认知能力。一般来说,人的智力产出的顶峰出现在二十来岁之后的三十来岁。

我们如何测量认知能力呢?在美国流行的智商测试有两种:斯坦福-比奈测验和韦氏智力测验。这两种测验可以在一定程度上预测在校生的成绩。但问题在于,智商测验测量的是内在的禀赋还是获得知识的能力,也就是先天能力和后天能力。有研究发现智商与先天资质关系紧密,然而智商和智力不是一回事,在特定领域取得成功的特定经验也许并不贡献于智商测验,比如国际象棋。智商测验确实能在一定程度上预测一个人在生活中的一般成功。

智商测验通常包括一系列子测验。这些子测验通常试图还原智力的基本因素,并找到这些因素之间的相关性。卡特尔将智力分为两个主要类别:晶态智力和液态智力。前者是指获得的知识,后者是指在新领域中推理或者解决问题的能力。还有理论认为,除此之外还存在空间智力。晶态智力对应着语言因素,液态智力对应推理因素,而空间之力对应着空间因素。推理能力得分较高的被试能够迅速执行推理过程中的每个步骤。语言能力高低额人能够迅速抽取单词的语义,并且具有强大的语言信息工作记忆。空间能力强的人能够迅速完成基本空间操作,并且经常选择空间策略而不是语言策略来完成任务。

 

决策中的三种偏差

决策一般来说可以分为两个步骤,第一步是价值判断,也就是估量决策带来的每一种可能后果的价值,第二步是估算每种结果可能出现的概率,最后得出决策带来的期望收益。通过分析每种决策带来的期望收益即可形成决策的有效依据。然而认知心理学的研究显示,人们在决策上存在一些固有的偏差。

人在决策的时候,尤其是涉及到金钱相关的决策的时候有两种特别的效应:

主观效用:即我们赋予钱财的价值,与钱财的面值并不成线性关系。

情景:

  • A: 100%概率获得100万
  • B: 50%概率获得250万

人们会倾向于选择A,虽然B的期望值是125万。因为对人们来说,100万和125万其实没有多大的差别。

主观效用的另一个特点是在损失部分更为陡峭,也就是说,人们对损失比对收益更为敏感。

情景:

  • A:50%的可能获得10美元,50%的机会损失10美元
  • B:不会发生任何事情

人们会倾向于选择B,因为他们把损失10美元看得终于获得10美元,因此选择A的期望价值是小于0的。

人们决策偏差的第二个效应是主观概率效应。

主观概率:相比于高概率事件,人们过于重视概率非常低的事件。

情景:

  • A: 1% 的机会获得400 美元
  • B: 2% 的机会获得200 美元

人们可能会更倾向于选择A,因为1%的概率并不等于2%概率的一般,在人们的主观判断中,1%的概率的权重高于2%的一半。

另一个决策的效应是框架效应。

框架效应:人们的决策随着他们对自己在效用曲线中的位置的感知而变化。

情景:一个人必须购买15美元和125美元的东西

  • A:一个商店对于15美元的东西有5美元的折扣
  • B:一个商店对于125美元的东西有125美元的折扣

人们更倾向于选择A,虽然都是5美元的折扣,但人们此时在效用曲线的不同位置,因为效用递减原则,15美元和10美元之间的差异大于125美元和120美元的差异。