图片来源:Brad Swonetz
德国少年Steve Horvath和他的双胞胎兄弟Markus、好朋友Jorg Zimmermann发起了一个“吉尔伽美什计划”,旨在为3人定期讨论数学、物理学、哲学提供一个平台。Horvath表示,《吉尔伽美什》是古代苏美尔人的一部史诗,描述了乌鲁克城的统治者寻找一种能永驻青春的植物的故事。巧合的是,“我们3人经常讨论的话题就是科学如何延长寿命”。
1989年,在他们最后一次讨论时,3人达成了这样的共识:今后的职业生涯要专注于研究如何用科学延长人类寿命。Jorg着眼于计算机科学和人工智能领域;Markus专注于生物化学和遗传学领域;Steve表示,他计划用数学模型和基因网络研究如何延长寿命。Jorg如愿以偿地实现了“人工智能梦”——成为德国波恩大学的计算机科学家,Markus则成为了一名精神科医生。
Steve目前是美国加州大学洛杉矶分校(UCLA)的人类遗传学家兼生物统计学家,他说:“我已经准备好兑现承诺。”在数年的艰辛研究过程中,他被编辑和评审员多次拒绝。现在,他已经收集并分析了13000多个人类组织样本数据。他发现,细胞生物钟的运转速率和身体其他部位一样。Steve研究的精确性让其他科学家印象深刻。但是,细胞生物钟一些“有趣的例外”可能为研究人类衰老提供了线索。
Horvath从表观遗传学角度研究细胞生物钟。表观遗传学是指在基因组序列不变的情况下,可以决定基因表达与否、并可稳定遗传下去的调控密码。随着细胞的老化,表观改变的模式也会发生变化。为了弄清如何判断一个人的年龄,Horvath研究了数百例细胞样本中DNA的位置,并分析这些位置发生甲基化的频率。
Horvath发现了一种基于DNA甲基化状态的算法,这种算法能非常准确地估计年龄——不是根据细胞本身,而是根据细胞生长环境。例如,白血球的存活周期可能只有几天或数周,但它却携带着一位50多岁捐赠者的生命特征,误差仅在数年之间。除了白血球之外,从大脑、结肠以及许多其他器官提取的DNA也一样含有人体的生命特征。以往的推算方法单纯依靠年龄的生物标记,而这种标记只存在于1到2种组织中。新方法打破了原有的束缚,包括追溯年龄的黄金法则——天冬氨酸外消旋化技术,该技术只能依靠测量牙齿或者骨头内的蛋白质判别年龄。
Horvath说:“我希望找到一种适用于大多数组织的方法。这是一个非常冒险的尝试。”现在,这场“赌博”似乎有了回报。去年他的文章首次发表。时钟算法的中间误差在3.6年之间,这意味着依靠该方法,研究者能够从宽泛选择的组织中推断出捐赠者的实际年龄,误差控制在43个月之间。若给出特定的组织,准确性会更高,例如:单独给出唾液样本,误差缩小到2.7年之间;给出特定白血球,误差在1.9年之间;若给出大脑皮层组织,则误差仅在1.5年之间。时钟算法的实际测量结果显示,当给出从胚胎中提取的干细胞时,结果鉴定为极度年轻;当给出从百岁老人大脑提出的样本时则显示大约为100岁左右。
加州大学旧金山分校的Elizabeth Blackburn说:“这些紧密的相关性表明细胞中存在着一些看似不变的模式。”因染色体终端的研究,Blackburn曾获得诺贝尔奖。“这可能是生物界尚未发现的一条线索。”
Horvath论文发表后的数月,其他研究人员也在不断扩充该研究。科学家认为该研究有广泛应用前景。澳大利亚昆士兰大学数量遗传学系主任Peter Visscher说:“这是很新奇的东西。如果Horvath是对的,那么在衰老的过程中,真的存在类似表观遗传的时钟在起作用。这个发现非常重要。”
艰难的研究
Horvath一直坚持吉尔伽美什项目的研究,为此他补修了数学博士学位和生物统计学博士学位,并于2000年加入UCLA遗传学研究所。2006年,Horvath在获得了终身教职后开始专注于老化研究,为此他不断研究基因活动在整个生命过程中的变化。研究由一名博士生具体执行,通过统计过滤器来完善基因转录数据,以期能够找到一个明显的生物年龄标记。但经过1年多,Horvath和那名博士生仍没有找到符合要求的目标。他们总结道:如果真有生物年龄标记存在于基因转录数据中,那么它可能因为人与人的不同、器官与器官的差异而被湮没。尽管研究未取得进展,Horvath仍决定继续这种大胆而充满想象力的研究项目,但却不再邀请学生和博士后参与。Horvath说:“为了一个不太可能完成的项目而断送别人的前程,我认为这是不公平的。”
2011年,研究有了起色。Horvath在UCLA的同事Eric Vilain领导了另一个研究小组。作为小组成员,Horvath从68名成年人的唾液样本中提取DNA用于研究甲基化模式。Vilain小组原本在研究一种与性取向相关的表观遗传模式,但最终一无所获。Horvath和同事决定利用手中的数据检测是否能够将其应用于老化研究中。
在人类的DNA中,甲基通常附着在CpG点上,后者是胞嘧啶处理鸟嘌呤的地方。一段正常的人类基因组含有超过2800万个CpG点,但是用于探测甲基化样本的微阵列技术只能发现极少的一部分:老式机器只能定位2.7万个点,而新型机器也只能找到48.5万个点。
获得成功
Horvath很幸运,他在一个简单的统计模型中获得了成功,该模型研究的内容是:在一滴唾液中有多少细胞含有只在特定两个CpG点发生甲基化的DNA。研究指数与实验参与者的年龄大致一致,相关性为0.85或者说准确度为85%,平均误差在5年之间。
尽管是在继续他人的研究,但Horvath在研究中确认,甲基化模式与另外多种类型的细胞间的相关性更加密切,例如大脑和血液。突然,一个曾经被Horvath排除的想法再次涌现出来:或许在人体的各个部分都可以找到生物年龄标记。
但这是一个很艰难的研究,Horvath需要将包括年龄和DNA甲基化信息在内的无数数据集全部综合在一起。甲基化谱被应用于许多医学研究,通常是与老化不同的研究领域。且由于收集和处理方式的不同,数据很难进行对比。Horvath担忧:“如果这些数据是由不同的实验室以不同的方式收集的,那么如何才能使数据库具有可比性?”
Horvath以英国伦敦大学学院的Andrew Teschendorff的工作为基础,设计了一种将甲基化谱规格化的方法,并把它们置于同样的基础上。除此之外,对于实验中出现的一些不确定因素,Horvath采取了直接忽视的态度——这是一个大胆的策略,他希望这不会影响到模型的准确性。
准确性确实没有受到影响。在2012年早期,Horvath将新算法应用到基因组的16 CpG 点中,并得出有9种组织与实际年龄的相关性为96%。新算法的准确度非常惊人:血液样本的中间误差为3年,脸颊黏膜拭子的中间误差仅为18个月。
遭遇否定
但是,两份杂志的编辑否定了Horvath的论文。Horvath认为,编辑否定论文的最关键一点在于:它太美好了,所以不可能是真的。他们怀疑时钟模型的设计或许与训练数据相符,但Horvath没有足够的测试数据来充分证明这一点。
尽管被拒绝,但Horvath仍顽强地坚持收集数据,并扩充运算法则。截至2012年12月,他的甲基化数据库囊括了51种非癌症组织,外加20种癌症组织,年龄测量者已经能覆盖353个CpG点。
去年春天,审查结果返还到Horvath手里,里面充斥着更多怀疑。虽然再次被否定,Horvath却并没有指责审查人员的怀疑,他说:“每一个研发生物标记的科学家都对此有充足的心理准备,一组很强的生物标记的相关性大约为0.6或0.7。”例如,年龄与染色体终端的相关性低于0.5,而根据Horvath的时钟置换算法,该数据为0.96。Horvath坦承,就连自己也不能完全相信这一研究结果,除非有其他独立研究者也认可这份研究。
这一次,Horvath不再默默地接受现实,他说:“当我读完审查人员的评论后,我在接下来的10分钟里做了3件事。首先,我从冰箱里拿出3瓶啤酒,然后喝光。之后,我回到电脑前写了一封给编辑的信。最后,我把信通过邮箱发了过去。” 几个月后,这项研究发表在《基因组生物学》(Genome Biology)杂志上。
网友评论