前不久,意大利考古学家声称,他们在佛罗伦萨一座女修道院下面找到了可能是达·芬奇名作《蒙娜丽莎》人物原型的头骨,目前正试图提取DNA并重建此人的面容。

众所周知,DNA分子涵盖了生物遗传所需要的几乎所有信息,研究者早已发现头色、肤色、有无雀斑,眼耳口鼻的大小位置都是由基因决定的。但是以目前的技术水平,直接反映面容特征的DNA信息是零碎和不完整的。

令人惊喜的是,科学家将利用统计学手段研究人类的多个基因和面部特征的关系,一张脸将被定位成231个数据,而这231个数据都一样的两张脸是几乎不可能存在的。如此,我们便有望建立DNA信息决定面部特征的模型。

DNA虽然为法医鉴定提供了极大的便利,但是事实上,德国、比利时以及美国的印第安纳州和怀俄明州明确规定了该手段的非法性。毕竟DNA推断仍可能百密一疏,更何况DNA信息的本质涉及个人的隐私问题。

在佛罗伦萨圣厄休拉修道院遗址,意大利考古人员挖掘出了可能是《蒙娜丽莎》人物原型的遗骸。 Photo by Eric Vandeville/ABACAPRESS-COM

据英国《每日邮报》5月19日报道,由意大利考古学家希尔瓦诺·文塞提(Silvano Vinceti)教授所领导的团队日前在佛罗伦萨圣厄休拉修道院遗址下面的地窖中挖掘出了一副头骨,目前正试图提取DNA并重建此人的面容。此人的遗体如此受到重视的原因在于,她或许就是达·芬奇经典作品《蒙娜丽莎》的模特丽莎·格拉迪尼(Lisa Gherardini)。

如果能够成功提取DNA的话,文塞提教授会将该DNA序列与另两座教堂内的丽莎两个儿子的遗骸DNA进行对比。通过序列比对,研究人员可以确定被挖掘的遗骸的身份,并根据DNA信息重构出《蒙娜丽莎》模特的面部 。

文塞提教授是否能够成功,尚是未知之数。但是,如果一个人的DNA真的能够告诉我们他长什么样子,我们的生活将有怎样的变化呢?

试想准妈妈怀孕时,医生从羊水中取出一些婴儿细胞并分析里面的DNA然后告诉孕妇及家属,宝宝以后会长什么样,这对于准爸妈来说,到底是期待还是扫兴呢?

既然还没有出生的胚胎就可以通过DNA信息“透露”日后的长相,那么是否可以通过人工选择出最优良的候选胚胎?届时,DNA信息是造就了一个每个人都完美的社会,还是一个枯燥的社会呢?

要解答这些问题,我们不妨“破解”DNA的密码,了解它是如何影响我们的容貌的。

鱼身上发现“肤色DNA”

侦查员根据DNA信息分析出凶手是黑人而不是白人,而这个决定肤色的基因是在斑马鱼身上首先发现的。

让我们看看“蒙娜丽莎的微笑”是否可以通过DNA信息重构。在此之前,我们先了解一下发生在美国的一起利用DNA信息侦破的案件。

1992年8月至2003年3月近12年间,在美国路易斯安那州发生的连环杀人案中有7名女性被害,联系这七起杀人案件的就是凶手在现场留下的DNA。最终,非洲裔美国人德里克·托德·李(Derek Todd Lee)在DNA证据下被送上法庭。

在法医学中,利用犯罪现场的DNA来辅助确认嫌犯并不是一件新奇的事情,但是在此案中DNA所起的作用不仅限于辅助确认而是在于有效地加速了侦破过程。连环杀人案的多名目击者称凶手是一位白人男子,而DNA证据显示作案的是一位非洲裔美国人。所以此案被认为是凭借DNA这张“看不见的脸”使得罪犯被绳之以法。

那么侦破人员是如何根据DNA信息分析出凶手是黑人而不是白人呢?

众所周知,DNA分子涵盖了生物遗传所需要的几乎所有信息,所以大家也许不会惊讶DNA也能够决定一个人的肤色,但是这个看似非常顺其自然的推断却是研究人员在近期才从分子水平上揭晓的结论,从而得以应用于DNA和肤色的匹配。

基因,从广义上讲是一段具有独立功能的DNA序列,那么我们自然就可以想象到基因可以决定人的肤色。但是这个决定肤色的基因并不是从人身上,而是在斑马鱼身上首先发现的。斑马鱼是一种通体几乎透明但带有黑色斑马纹状条带的小型常见鱼。宾夕法尼亚州立大学的基思·程(Keith Cheng)教授发现,斑马鱼体内相关基因功能发生异常的时候,黑色的斑马纹变淡从而身体发黄。程教授和他的团队进一步研究发现人体中的这个基因可以改变皮肤表皮细胞中黑色素体的分布,从而从宏观上改变皮肤的颜色。

当黑色素体聚集时,皮肤表现为黑色,当分散时,表现为白色;亚洲人的皮肤表皮细胞中的黑色素体的分布聚集程度则居中,所以呈现黄色。在原始人类所生存的非洲这种强日照环境下,皮肤中聚集的黑色素体可以起到“遮阳”的作用以保护皮下的组织。但是当原始人类踏上欧亚大陆之后,聚集的黑色素体使得皮下得到的阳光过于少以至于维生素D无法正常合成,所以在百万年之久的自然选择下,在强日照环境下“功能异常”的基因却在欧亚大陆被选择,成了弱日照地区的“优良品种”。

回到一开始的案例,正是因为这个基因在非洲裔美国人和美国白人中的不同使得案件能够从DNA的信息中获得重要进展。也许大家又会问,为什么非洲裔黑人来到美国之后没有变“白”呢?毕竟他们到美国大陆才仅仅几百年,和百万年的自然选择是无法相提并论的

“蒙娜丽莎”被美化?

通过色素基因的分析,研究团队可能知道发色、肤色,甚至有无雀斑。这样我们便可能知道达·芬奇是否刻意“美化”了他的模特。

最近,在科学界和考古界炒得比较火热的一件事情就是人类的远古近亲——古人类中的尼安德特人的全基因组DNA序列被解密,大家随之而来的好奇就是,尼安德特人到底长什么样呢?

距今大约20万到3万年间,在欧洲大陆和亚洲西部生存的尼安德特人的一缕头发一直被冻存于格陵兰岛。这缕被完整保护的头发丝里涵盖了重要的考古信息—— 完整的DNA序列{#content_reference_3}。2006年11月一组来自各个国家的科学家在《科学》杂志上发表了这个古人类基因组的序列,并作出了分析。

同样是基于色素相关基因的DNA序列,研究者称至少有一部分尼安德特人有红色头发和白色皮肤并且有可能有雀斑。同时研究者还说尼安德特人的男性也有秃顶的可能性。

尼安德特人面容重建。图片来源:National Geographic

2008年9月,艺术家和科学家通过各种信息重构了尼安德特人的面容。当然,重构的面容的真实性是不能够过分保证的。不过值得庆幸的是,决定皮肤中色素的颜色和分布的一些基因已经被科学家大量研究并且基本弄清楚功能了,而且仅仅通过这些色素基因的分析就可以给我们很多关于面部的信息了。

难道电影《阿凡达》的导演詹姆斯·卡梅隆就是受到了科学家研究色素基因的启发创造了阿凡达这个蓝脸的神奇物种?

回到“蒙娜丽莎的微笑”,如果研究团队成功地拿到了丽莎·格拉迪尼的DNA,通过色素基因的分析,研究团队将有可能知道她头发的颜色、面部皮肤的颜色,甚至有可能推测她的面部是否有雀斑。这会是一个很有意思的发现,这样的话我们便可能知道达·芬奇在作画时是否刻意地去“美化”了他的模特。

“蒙娜丽莎”烫鬈发?

《蒙娜丽莎》画像中头发是鬈发,提取的DNA中应该有两个W基因。当然前提是《蒙娜丽莎》的模特没有将直发烫卷。

现在知道了DNA信息可以显示肤色、发色,但是人脸不仅仅只是这些“颜色”就可以刻画的,那我们现在就开始深入挖掘一下DNA里涵盖了哪些更多的信息以决定人到底长怎样的脸。了解了这些,或许你就能明白,重塑蒙娜丽莎的脸是否可能。

我们现在回到最基础的遗产学——孟德尔遗传学。我们暂时不深究孟德尔遗传学的准确定义,其基础就是基因型决定表型。基因型就是DNA里所携带的基因的信息,而表型就是由这些基因所决定的宏观上大家可以看到的特征。

从面部特征上来看,最经典的就是直发和鬈发了。人类有23对(46条)染色体,DNA就被包裹在这些染色体上,简单来说就是有独立功能的DNA片段(即基因)就分布在这样46条染色体上。

人类的第7对染色体上有一对基因可以控制头发中硫的含量,当硫含量高(W控制)时头发呈现为鬈发,当含量低(w控制)时头发则为直发。所以当一对染色体上的两个位置上都是W时,那么人就会是鬈发,而都是w时,就表现为直发,如果是一样一个,就是适中了。

爱美女士是不是又要问一个关于鬈发的问题了?既然鬈发是基因控制的,那我们是如何把鬈发拉直的呢?事实上,鬈发的形成就是因为头发中硫含量高,有机硫之间会产生二硫键,大家可以把二硫键想象成交联剂,有了它头发就“错综复杂”了。所以把头发拉直只要破坏这些二硫键就好了,高温就可以直接破坏二硫键,所以高温后再冷却头发就直了。

《蒙娜丽莎》画像中头发是典型的鬈发,所以我们可以几乎肯定,提取的DNA中应该有两个W基因。所以如果意大利研究团队所提取的DNA中只有w基因时,他们所挖掘到的遗骸就很有可能属于其他人。当然前提是《蒙娜丽莎》的模特没有将直发烫卷。

人类的很多表型都符合孟德尔遗传,一个或者多个类似的基因通过一些诸如上述的机制控制表型,研究者早已发现诸如嘴唇的方或圆和薄或厚、脖子的宽或窄、耳朵的大或小、耳垂是否存在、鼻子的长或短、嘴的大小、眼间距大小都是由基因决定的,并且符合孟德尔遗传的规律。

换句话说,所有信息都包含在DNA序列中。由于这些基因对表型的决定有关键性的作用,位于马里兰州的约翰霍普金斯大学将所有的这些信息系统地整理到了一个数据库中并且每天更新,研究人员可以在美国国家生物技术信息中心获取这些数据

面部透露遗传病

当这些遗传性疾病影响面部特征时,科学家便有机会找到控制这些面容特征的基因以及其DNA序列信息。

需要特别提及的是一些遗传性疾病的患者,他们有非常特别的面部特征。比如我们所熟悉的唐氏综合征患者,头部较短,面部起伏较小,眼鼻间距较小,眼角上挑,深双眼皮。这些特征显然不是一个基因或者几个基因决定的,而是由一系列的遗传病变的综合作用而形成的。

唐氏综合征患者较常人多出一条21号染色体,而这条染色体上所包含的信息之复杂以至于研究者很难完全弄清楚。

下面介绍一种研究得较为清楚的遗传病——Wolf-Hirschhorn综合征。它的发生是由于人类第四号染色体上的一小段缺失(即一段DNA的丢失)。患者面部表现为“希腊古战士头盔”型——双眼距极度拉大,鼻和上嘴唇的距离缩小,嘴下移,兔唇,尖下巴,耳廓畸形。

总体来说,患者面部不对称并且头部较小。研究者由于已知这些DNA片段的丢失会导致Wolf-Hirschhorn综合征,便在这段DNA中仔细查找可能导致相关面部症状的基因。

最终研究者在这段丢失的信息中找到了三个重要的基因。其中两个和患者的面部特征密切相关,这两个基因的功能异常将分别导致“希腊古战士头盔”型面容和兔唇。

截至目前,我们可以发现科学家在利用DNA信息重构面容的时候主要是利用DNA上携带的基因的各种信息,而这些信息的来源又主要有两种:一是研究模式生物时,比如前述的斑马鱼,另外还有小鼠、果蝇等,科学家可能会发现一些调节相关功能的基因或者基因群,然后在人中寻找这些基因,最终发现直接联系;二是通过一些罕见或者不罕见的遗传性疾病,当这些遗传性疾病影响面部特征时,科学家便有机会找到控制这些面容特征的基因以及其DNA序列信息。

当我们查看过“蒙娜丽莎”后,我们可以发现她具有圆且薄的嘴唇,较宽的脖子,适中长度的鼻子,小嘴和适中的眼间距。如果意大利的研究小组在分析DNA信息后发现基因型和上述“画面中”的表型并不相符,我们将可以知晓达·芬奇在哪些面部细节处理上发挥了自己的想像力。

统计学能否定格面容

科学家将利用统计学手段研究人类的多个基因和面部特征的关系。科学家将在人脸上使用22个坐标点用于定位,不同的人脸具有不同的数字特征。

但是以目前的技术水平,直接反映面容特征的DNA信息是零碎和不完整的。我们即使掌握了以上所有的信息,仍然很难真实地重构一张脸。人的肤色可能有相似,拥有鬈发的人很多,拥有大鼻子的人也很多,即使所有的这些面容特征都限定下来,我们仍然可以找到成千上万的人。

那么大家就会问,既然人类已经把自己的DNA的序列揭晓了,我们为什么还无法获得完整的信息呢?事实上,我们只揭晓了最基本的人类基因的信息,就像我们必须在毫无意义的一堆字母里面寻找一些规律一样,而由于人类DNA序列所涵盖的信息量极大,有29亿个字节,在这些看似无序的信息中寻找规律需要极长的时间和更新的研究方法。

说到这里,大家可能比较失望,原来我们现在还无法从DNA信息中真实地重构一张脸!由于在如此复杂的数据中使用经典的发现式研究方式已经举步维艰,科学家将融合新兴的计算机技术和数学模型来研究这样复杂的对象。

令人惊喜的是,在2008年美国人类遗传学大会上,有一篇会议摘要提到科学家将利用统计学手段研究人类的多个基因和面部特征的关系。为了刻画人脸,科学家将在人脸上使用22个坐标点用于定位,然后每两个坐标点直接的距离作为数据,那么一张脸一共就会有231个数据。

我们可以想象寻找两张这231个数据都一样的脸是几乎不可能的。从而,人脸的面部特征就被数字化了,并且不同的人脸具有不同的数字特征。在一定的数据量基础上,对这些数字化的脸和对应的DNA信息进行相关性分析,我们便可以建立DNA信息决定面部特征的模型。

不过到目前为止,我们并没有看见更新的研究进展,让我们拭目以待。这个研究结果将极大地推进人类学、考古学、生物学研究,并且成为法医鉴定的有利工具。

间接方法或许更有效

间接地依靠DNA信息判断DNA携带者所从属的种群——欧洲种群、南撒哈拉非洲种群、东亚种群或美洲土著,从而根据种群面部特征推测该段DNA携带者的面部特征。

刚才说到的所有DNA推测面部特征的方法都是直接的方法,其实在实际应用中,间接的方法更多并且更有效。比如说当拿到一些DNA信息后,通常研究者并不是直接通过DNA信息推测该DNA持有者的面部信息,而是通过这段DNA所含的信息比对已知的DNA序列的库,从而大致知道这段DNA持有者的遗传背景。

在迁徙较少的地区,研究者甚至可以定位到该段DNA持有者来自于哪个地区、哪个家族。我们回到尼安德特人的例子,研究者发现尼安德特人的DNA和现今欧亚人群的DNA的特征类似而和撒哈拉以南非洲人DNA的相似性不如前者,所以研究人员便有足够多的理由认为尼安德特人的面部特征总体类似现今欧亚人群{#content_reference_1} 。

总体来说,用间接的方法从DNA推测面部特征就是依靠DNA的信息决定该段DNA携带者所从属的种群——欧洲种群、南撒哈拉非洲种群、东亚种群或美洲土著。或者依据DNA样本的信息获取携带者来自各个种群的成分的百分比,从而根据四大种群的人面部特征推测该段DNA携带者的面部特征{#content_reference_2}。

由于《蒙娜丽莎》的模特丽莎·格拉迪尼是显赫的贵族,她的家族的后代甚至亲属的坟墓都可能被完好地保存,那么获得丽莎·格拉迪尼的DNA信息之后我们可以直接沿着这个踪迹寻找到她当时的家人,她的后代的信息,如果有幸能够找到图片资料或文字描述,对《蒙娜丽莎》的面部重建将有极大的帮助。

最后,大家想一想还有什么因素会显著影响一个人的面容。

首先就是年龄。即使是同一个人在不同年龄阶段,其面容的差异也会很大。眉毛的浓淡,胡须的有无,雀斑的多少,皱纹的多少都显著受年龄的影响。那么通过一段DNA,我们怎样才能知道DNA携带者当时的年龄呢?研究者使用端粒的长度来推测。那么什么是端粒呢?

DNA是双链结构,复制时互相为模板,但是由于复制机制本身的原因,线性的DNA每复制一次末端就会减少一点,所以如果一直这样下去DNA会越变越短,最终本身结构将受到破坏,或者某些功能损坏导致疾病,为了减慢这个过程,DNA分子末端必须有一个可以保护它的结构,这个结构就是端粒。

端粒就是染色体的DNA分子末端的重复序列,DNA每复制一次端粒就会缩短一点,但是核心的DNA则受到了保护。人体内还有一种酶,叫做端粒酶,它可以使端粒得到延长,同样也保护DNA免受损伤。

在美国甚至有人开发药物来增强端粒酶的活性以使人延年益寿。老年人细胞里端粒的长度普遍较青年人短,所以端粒的长度是年龄的有效推测依据。这是一个有效的推测,但是并不能保证百分之百的准确,比如某些运动员的端粒就较相同年龄的其他人要长。

同时,为了从端粒获取年龄的信息,我们必须保证DNA样品是完整的,我们甚至需要整条染色体,而这一点在考古学上是很难做到的,因为研究者往往得到的都是DNA的碎片。而像如前所述被完整保存的尼安德特人头发丝是极其罕见而且极其珍贵的。

然后,也是很重要的一个影响面容的因素就是所处的环境了。

环境对面容的影响是不会体现在DNA中的,这也是用DNA推测面容最大的不准确之处。比如有人故意将皮肤晒成褐色,或者有人营养不良头骨发育不全面,抑或长时间生活在干燥环境中导致皮肤粗糙。这些都是DNA信息无法推测的。

非常典型的例子就是同卵双胞胎出生后在不同环境下生长,最终的面容一般不是完全一样的。但是无论如何,使用DNA所携带的信息推测面容总体来说仍然是前景广阔的,毕竟同卵双胞胎即使在不同环境下长大,其面容也较类似。

技术突破了法律界限?

我们从来不能够百分之百地相信DNA的表型推断,警察可能会利用这些种族和面部特征的预测作为借口去针对弱势群体。更何况,DNA信息的本质是一个人的隐私,当一项科学研究有巨大应用价值时,科学就不再纯粹了,甚至在技术水平还没有达到那个高度时,我们也许必须提前思考它会带来的问题。

我们可能认为使用DNA进行法医学鉴定从而推断嫌疑犯的相貌为刑事案件的侦破提供了极大的便利,但是事实上,并不是提供便利的技术就是合法的。

1998年,荷兰一名16岁少女被残忍地强奸后杀害,一年后,法医学家彼得·德·克尼弗(Peter de Knijff)为了取证而分析了凶手精液内的DNA并由此推断凶手的种族。然而彼得·德·克尼弗的行为在当时是彻底非法的,因为荷兰法律虽然允许使用DNA信息进行传统DNA识别(比如亲子鉴定),但是当时明确规定通过DNA推断种族、相貌以及潜在的致病可能性是非法的。

大家可能不能理解如此有用的技术为什么却被认为是非法的。并且在德国,比利时以及美国的印第安纳州和怀俄明州也明确规定了该手段的非法性。

桑卡尔(Sankar)是美国国家人类基因组研究院的一名成员,她指出尽管使用DNA推断诸如种族、面部特征等表型是具有很高准确性的,但是这种推断从本质上来讲还是一个概率事件,意思就是说我们从来不能够百分之百地相信DNA的表型推断,即使它可以给我们超过百分之九十的把握。警察可能会利用这些种族和面部特征的预测作为借口去针对弱势群体。

大家可能会问如此地严格控制这项技术是不是过于保守了。可能确实是,但是由于DNA信息的本质是一个人的隐私,当权力机构或者公众需要查看个人隐私时,这永远是一个敏感而需要小心谨慎的行为。

参考文献:

[1]{#reference_3} Rasmussen, M., et al., Ancient human genome sequence of an extinct Palaeo-Eskimo. Nature. 463(7282): p. 757-62.

[2]{#reference_1} Green, R.E., et al., A draft sequence of the Neandertal genome. Science. 328(5979): p. 710-22.

[3]{#reference_2} Graham, E.A., DNA reviews: predicting phenotype. Forensic Sci Med Pathol, 2008. 4(3): p. 196-9.

本文已发表于2011-06-04《东方早报 身体周刊》,题为《透过DNA再现“蒙娜丽莎的微笑”》