财新传媒
位置:博客 > 科学松鼠会 > 开放基因组资料库的下一步:基因解码

开放基因组资料库的下一步:基因解码

一个国际研究团队在今年四月十九日出版的《公共科学图书馆·生物学》期刊中,发表了一篇文章,介绍了编码人类基因组功能要素的庞大资料库,提供的资料包括基因、RNA 转录体及其他产物,现在都将开放给科学社群、学校、科学作家和公众使用。

这篇论文中介绍了一个叫作「ENCODE」(Encyclopedia Of DNA Elements)的计划,文中提到该团队不断努力解读人类基因组序列的研究成果,同样也可当作如何使用目前产出资料的导览手册。

ENCODE 团队中来自美国宾州州立大学的生物化学及分子生物学教授Ross Hardison 说,这个计划背后的哲学是认为科学知识要开放、透明的一种态度,以及跨次要学科间的合作。 ENCODE 紧接在一个现已完成的人类基因组计划(Human Genome Project)后而来,后者的努力目标在于辨识人类DNA 中为数大概两万到两万五的基因,且同样也是基于资源开放共享的信仰,为后续科学发现和公众的科学知识铺路。

Hardison解释,在人类基因组序列中有大约三十亿的碱基对(base pair),使得信息的编码和解读变成了相当困难的任务。 「我们有个崇高的目标:辨识人类基因组中每个核苷酸(nucleotide)的功能。我们不只是发现给予细胞资讯和产生蛋白质的基因,同样也想知道是什么决定了蛋白质在正确的细胞中、正确的时机下被制造出来。找到控制基因表现的DNA 成分,就是该计划的主要目标。」

Hardison 也提到,人类DNA 序列通常被描述成是一种语言,但要是没有解读的关键秘诀,亦即对『文法』的全面理解,这些序列对我们来说可能也只是一团混乱的字母罢了。

在这份论文中,该团队展示了ENCODE 资料,如何可立即有用于解读疾病与DNA 序列间因人而异的关联—单核苷酸多态性(single nucleotide polymorphisms, SNPs)。举例来说,科学家知道一个叫MYC 的基因中的DNA 变异体,和许多癌症相关,但这关联背后运作的机制一直到最近都还是个谜团。 ENCODE 的资料已被用来证实,这些突变体会改变某些蛋白质的结合,导致MYC 基因的表现增强,因而促成癌症的形成。与人类疾病相关的其他DNA 变异体,ENCODE 也能够对这些研究有所助益。

开放基因组资料库的下一步:基因解码 - 科学松鼠会 - 科学松鼠会

开放基因组资料库的下一步:基因解码 - 科学松鼠会 - 科学松鼠会

  评论这张
转发至微博
推荐 8