千人基因组计划(1000 Genomes Project)于2008年初启动。该计划的目标是测定选自全世界的至少一千个人类个体的全基因组DNA序列,绘制迄今为止*详尽的、*有医学应用价值的人类基因组遗传多态性图谱。
一晃两年半过去了,千人基因组计划有哪些进展呢?近日,在冷泉港基因组生物学会议上,千人基因组计划成员透露,该计划将会在夏天结束前对1100个样品进行测序,作为整个测序计划的一部分。
Wellcome TrustSanger研究院的生物信息学专家RichardDurbin作为该计划的发言人,表示目前已完成了近500个样品的测序工作。他们预计在今年年底前对1900个样品进行测序,并承诺在2011年底完成约2500个样品的测序工作,包括来自印度和南亚的样品。
目前的数据模拟暗示欧洲人群拥有约1.9到2千万个SNP,其中800万个SNP的等位基因频率大于1%,600万个SNP在0.1到1%之间,及250万个****的SNP。大约有一半的等位基因是每个群体私有的。
在过去的几年间,千人基因组计划采用了一套试验计划,包括欧洲和非洲三人的深度测序,三个群体中每个60人的低覆盖度测序,以及700个样品的外显子捕获和测序。
Durbin表示,通过这些试验计划,研究人员在欧洲和非洲人中分别鉴定出约400万和500万个SNP,在低覆盖度样品中发现了1450万个SNP,在外显子测序试验中发现约12,700个SNP,以及数千个缺失,结构变异和插入。
在低覆盖度数据组所鉴定出的1450万个SNP中,大约800万个是新颖的,其中100多个万SNP只出现在非洲约鲁巴群体中。而高覆盖度的数据暗示细胞系的体细胞突变是种系新生突变的7-12倍。Durbin表示,到目前为止的数据暗示,在评估数百个样品时,低覆盖度策略对于发现变异体已足够。
作为该项目的主要支持者和共同发起人,深圳华大基因研究院已经完成并发布了**个中国人的高质量基因组图谱——“炎黄一号”。深圳华大基因正在进行3Tb的亚洲人基因测序以及相应的生物信息分析。