蛋白质鉴定搜索引擎
与基因相比,不同的蛋白质与生物的特性有着更为直接的关系,例如蝴蝶的幼虫和成虫的基因是相同的,但形态却不同。蛋白质在生物体的形态和生理功能形成中有决定性的作用,其研究具有重要意义。
我们的任务是识别不同蛋白质的身份。在生物质谱技术引入前,生物学家使用传统的蛋白质分析方法,一次实验只能分析一个或数个蛋白质。而现在通过使用生物质谱技术将蛋白质的信息数字化以后,一次蛋白质组学实验就能接近或超过一万种蛋白质,未来的努力目标是覆盖生物体内所有的蛋白质。生物质谱技术将蛋白质的含量信息数字化,产生质谱数据,我们则借助计算技术来对这些数据进行解析,从而还原蛋白质在生物体内的类别和含量信息,为寻找差异表达蛋白质和揭示蛋白质功能提供基础。
类似于Google搜索引擎,pFind蛋白质搜索引擎,对输入的质谱数据进行检索,得到相应的蛋白质序列。为了快速准确地鉴定蛋白质,我们在谱图预处理、数据库索引技术、搜索与匹配打分、蛋白质定量等多个方面都进行了深入的算法研究。pFind研究组自主开发和研制了全套蛋白质鉴定搜索系统pFind Studio,历经十年,数次迭代,在国内领域享有巨大的声誉,软件用户遍布全球。
十年来我们专注于蛋白质搜索引擎的计算问题,为了使我们的计算更加专业,我们还和国内多家生物研究组有合作关系。蛋白质组学的终目标是造福人类,其中直接的应用就是寻找和确认差异表达蛋白质。例如,与癌症相关的核心岩藻糖蛋白质,在癌症患者体内的含量要远远高于正常人,这样差异表达的核心岩藻糖蛋白质可以作为肝癌早期诊断标志物。