第八节 蛋白质组学和生物标志物

一、蛋白质组学简介

(一)蛋白质组及蛋白质组学

随着人类基因组序列图谱的公布,人们发现基因数量的有限性和结构的相对稳定性与生命现象的复杂性和多样性之间存在着巨大反差。人们逐渐认识到基因只是遗传信息的载体,而真正执行生命活动的是蛋白质。通过对蛋白质的研究,我们能够更清晰地了解生命活动的机制和规律,可以为探讨重大疾病机制、疾病防治、诊断和药物开发提供理论依据。蛋白质组(proteome)研究越来越受到国内外学者们的密切关注,一个以“蛋白质组”为研究重点的科学新领域便到来了。

蛋白质组这个词源于蛋白质(protein)与基因组(genome)两个词的组合,这个概念最先由Marc Wilkins提出,是指“一种基因组所表达的全部蛋白质”,广义上讲即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组随着细胞、生理病理、环境等不同而改变,即便是同一个细胞,在不同状态下其蛋白质也不尽相同。蛋白质组是一个在空间和时间上动态变化的整体。正因如此,蛋白质才能更好地成为基因功能的实施者,对于蛋白质表达水平、翻译后修饰、相互作用等的研究才更有意义和价值。蛋白质组学(proteomics)就是以上述蛋白质组为研究对象,应用各种技术手段在大规模水平上研究细胞、组织或生物体蛋白质组成及其变化规律的科学。其目的是从整体的角度分析、了解蛋白质之间的相互作用与联系,揭示蛋白质功能与生命活动、疾病发生、细胞代谢等过程的关系,从而对蛋白质进行整体而全面的认识。

国际人类蛋白质组计划是继国际人类基因组计划之后的又一项大规模的国际性科技工程。2002年10月国际人类蛋白质组组织和军事医学科学院联合主办了肝脏蛋白质组国际研讨会,倡导并提出了开展人类肝脏蛋白质组计划的建议。2003年首批行动计划包括由中国科学家牵头的“人类肝脏蛋白质组计划”和美国科学家牵头的“人类血浆蛋白质组计划”。这个国际重大合作项目围绕人类肝脏蛋白质组的表达谱、修饰谱及其相互作用的连锁图等九大科研任务,我国科学家已经成功测定出6 788个高可信度的中国成人肝脏蛋白质,系统构建了国际上第一张人类器官蛋白质组“蓝图”。直至今日蛋白质组学仍是科研和临床应用领域的热点。

(二)蛋白质组学技术方法

研究蛋白质组学的方法已经成熟,为研究翻译后调控在稳定细胞环境中的作用开辟了新领域。其主要支撑技术是双向凝胶电泳和以质谱为代表的蛋白质鉴定技术及生物信息学。近些年来,蛋白质组学经历了一场革命,并且出现了一些用于蛋白质系统分析的新技术。这些新技术的出现使得从低通量、单蛋白到高通量、全蛋白质组,从种群水平到单细胞水平,从静态到动态研究蛋白质成为可能。除了在蛋白丰度水平研究蛋白质组学外,新技术的出现使得在其他层面研究蛋白质组学成为可能。如质谱分析法和蛋白微阵列法可以检测蛋白翻译后修饰水平;显微镜法、微流体术和质谱分析法可以检测蛋白定位;显微镜法、微流体术可以检测蛋白质的半衰期;质谱分析法、蛋白微阵列法和自动生长分析法可以检测蛋白之间的相互作用。上述技术各有优缺点,相信随着技术的进步,会使蛋白质组学技术兼顾时间效益和成本效益,应用更加广泛。

二、血液蛋白质组学

人体血液中含有来源于几乎所有细胞、组织、器官的蛋白质,并且存在大量高丰度蛋白及个体差异,可以直接反映生理、病理状态。血液中的蛋白质是持续变化的,机体很多变化都能在血液蛋白质的微量变化中得到相应体现,加之其相对容易获得、创伤小,是各种疾病诊断、生物标志物发现最有价值的标本之一。长期以来,血液蛋白质组一直是研究者关注的热点,并且被人类蛋白质组组织列为首批启动的重大国际合作研究项目,在蛋白质组学研究方面会有广泛应用。

(一)血浆或血清

血液组分十分复杂,其含有多种不同蛋白质且浓度相差巨大,比如血液中的白蛋白浓度可达30g/L以上,而激素(如生长激素)在每升血清仅仅几个微克,有些蛋白含量更低。此外血液中还富含免疫球蛋白、纤维蛋白原、载脂蛋白、转铁蛋白等。这些高丰度蛋白的存在往往会掩盖低丰度蛋白的检测,而低丰度蛋白又包含了诸多与疾病有重要意义的蛋白质。因此想要实现对这些蛋白质的检测,就必须采用一些分离方法去除血浆中的高丰度蛋白从而进行蛋白质组学研究。化学提取法和免疫吸附色谱技术可以有效去除血浆中多数高丰度蛋白。血清在凝血过程中去除了血浆中的纤维蛋白原、凝血因子等,同时可能一些其他蛋白质也会因为相互作用而同时去除,相对于血清来讲,对血浆进行蛋白质组学研究更为合适。

(二)血细胞

血液中含量最多的细胞是红细胞,其含有大量的胞质蛋白及膜蛋白。2004年Kakhniashvili课题组首次应用二维凝胶电泳的方法鉴定出44种红细胞膜蛋白。此后基于质谱分析技术鉴定出的红细胞蛋白及其与之前结果的整合,构成了人红细胞蛋白质图谱,经过后来扩展共鉴定出2 000多种成熟红细胞蛋白质。

由于血小板没有细胞核,蛋白质组学是研究其生化特性的理想技术。第一批血小板蛋白质组图谱的研究于21世纪初发表,此后血小板蛋白质组学这一新兴领域快速发展。绘制血小板蛋白质组图谱似乎是一项艰巨任务但发展迅速,包括亚细胞组分分析,如血小板颗粒、血小板膜、分泌体、血小板来源的微泡和信号通路分析。这些研究发现的新信号蛋白和受体有可能作为新的药物靶点,而且蛋白质组学为血小板研究提供的数据量是巨大的,使得研究人员可以在药理学和生化水平上开展大量重点研究。

白细胞不是一个均一的细胞群,研究者通过蛋白质组学的方法鉴定出来138个中性粒细胞骨架蛋白和426个嗜酸性粒细胞蛋白。Zeng等人开发了第一个专门针对人类单核细胞的蛋白质组数据库,总共有2 237个独特的单核细胞表达基因被编录。Caron团队采用双向凝胶电泳、第三代软件分析注释和质谱相结合的方法建立了淋巴母细胞B细胞的蛋白质组图谱,共检测到约1 200个蛋白,并对其等电点、分子量和表达量进行了分析。

(三)临床应用前景及展望

近些年来,血液蛋白质组学备受追捧,如果发现如早期癌症等疾病新的生物标志物将对公共健康产生巨大影响。为了发现更多新的生物标志物,我们需要开发更快更灵敏的质谱仪,但是也不能忽略样品制备方法的改进。如果我们希望破译蛋白质组学技术提供的所有信息,则要寻找智能解决方案,结合强大的生物信息学以确定在比较分析中发现的哪些蛋白质最有可能成为有用的生物标志物。

三、尿液蛋白质组学

1996年,Marshall T等研究者首次运用双向凝胶电泳技术(two-dimensional electrophoresis,2DE)分离尿液中的蛋白质,建立了正常人尿液蛋白质组2DE图谱并提出了尿液蛋白质组学(urinary proteomics)的概念,即利用蛋白质组学技术高通量、系统性地分析和鉴定尿液中所有的蛋白质并研究其生物学功能。在人类体液中,尿液在大量通过非入侵性手段检查中具有显著的临床优势。肾脏滤过血液,许多在血液中检测到的蛋白在尿液中也是可以检测到的,包括具有潜力作为生物标志物的蛋白。除了致病机制外,尿液蛋白质组学分析还可洞察尿道中微生物和宿主-病原体之间的联系,其组成与性状可反映整个泌尿系统的状况,尤其是尿液中蛋白质种类和数量的变化携带有泌尿系统疾病发生、发展和预后的各种信息。研究尿液样品通常使用上清液而弃去沉淀物和颗粒物。

由于尿蛋白组学经典样品制备方法非常冗长和费力,有学者对四种尿液样品制备方法MStern、PreOmics In-StageTip(IST)、悬浮捕捉法和In-Solution法进行了评估,其中PreOmics和IST法消化效率最高,而S-Trap法可提供最多数量的肽和蛋白质识别。尿蛋白沉淀产生了良好的蛋白质回收和更干净的样品使分析深度提高。因此建议将蛋白沉淀法和悬浮捕捉法结合起来更常规地用于尿液检测。最开始许多研究是利用二维电泳来研究尿蛋白:2001年Spahr等学者利用液相色谱-串联质谱技术试图检测出完整的尿液蛋白质组。2006年通过将一维凝胶电泳和液相色谱与高分辨率质谱仪器相结合,提取的蛋白质数量显著增加到1 543个。到目前为止,在正常人的尿液中已经鉴定出2 000多种蛋白质。除了正常尿液中的大量蛋白质外,蛋白质/肽的组成还受到性别、年龄、饮食、时间、生活方式和生理条件等各种因素的极大影响,这种变化使正常或病变的尿蛋白组学进一步复杂化,进而使尿液中生物标志物的识别变得更加复杂,因此建立真实可靠的尿液蛋白质数据库是十分困难的。人类肾脏与尿液蛋白质组计划、欧洲肾脏与尿液蛋白质都一直致力于此方向研究。目前有人类尿蛋白质组数据库、尿液蛋白质生物标志物数据库及尿液外核体蛋白质数据库等。用于尿液蛋白质组研究的质谱技术包括:基质辅助激光解吸/电离飞行时间质谱、高分辨质谱(如傅里叶变换质谱仪、LTQ-Orbitrap质谱)和三重四极杆质谱。

尿液蛋白质组学研究技术得到了突飞猛进的发展,但仍存在有待于进一步解决的问题,如尿液标本的最佳采集时间、如何在尽可能完全地去除各种离子及高丰度蛋白质的同时避免低丰度蛋白质的丢失等。但是尿液蛋白质组学研究的广阔应用前景不容置疑,可以对泌尿系及全身其他系统疾病的发生发展机制作进一步了解,发现早期诊断标志物及干预性治疗的靶点,将成为今后探究疾病的一种行之有效的研究方法。

四、脑脊液蛋白质组学

脑脊液是至关重要的液体,可提供营养物质和信号分子并清除大脑中的代谢废物。它的组成特别是蛋白质和肽,可以反映个体的病理状态,是研究脑部疾病生物标志物、中枢神经系统病理学和疾病的首选体液。但与其他生物体液(例如血浆)相比,脑脊液的研究仍相对不足,部分原因是其样品采集方法为侵入性操作。对于脑脊液蛋白组学的相关研究大多数采用将对照组脑脊液与疾病组之间相比较的模式进行,从中寻找样品之间的差异蛋白质谱。通过应用生物信息学工具对蛋白质组学数据的生物学和功能意义提供新的信息,从而对疾病生物标志物进行鉴定。通过对脑脊液的蛋白质组学分析,发现了阿尔茨海默病、多发性硬化、细菌性脑膜炎等疾病中特殊变化的蛋白,这些蛋白参与了RNA代谢、细胞凋亡调控和炎症等,反映了疾病的发病机制。通过蛋白质谱的改变与疾病关系的分析有助于脑脊液潜在生物标志物的研究,以用于神经系统疾病的临床管理。

五、生物标志物的概念

生物标志物(biomarker)这一概念首次出现于美国国家研究委员会在1983年出版的红皮书《联邦政府风险评估》中,是医药领域一个十分热门的课题。基因组学、蛋白质组学、代谢组学及生物信息学等新兴学科的兴起,使生物标志物的研究工作得到了发展。生物标志物一般指可提供客观测定和评价的生理、病理或治疗过程中某些特征性的生化指标,通常在血液或尿液等体液中可检测到,通过对它的测定可以获知机体当前所处生物学过程中的进程。生物标志物不仅可以从分子水平探讨发病机制,而且在准确、灵敏地评价早期、低水平的损害方面有着独特的优势,可提供早期预警,用于疾病诊断、判断疾病分期或者用来评价新药或新疗法在目标人群中的安全性及有效性,很大程度上为临床医生提供了辅助诊断和治疗的依据,还可以帮助制药公司研发出更好更多的药物来治疗疾病。

自20世纪90年代蛋白质组概念提出以来,定量蛋白质组学也成为发现新生物标志物的重要途径之一,但这些标志物最终能否应用于临床还需要结合一系列实际问题。对于临床上所选择的生物标志物一般需要具有以下特点:①必须具有一定的特异性和足够的灵敏度,重复性及个体差异都在可接受的范围内;②有足够的稳定性,便于样品的运送、保存、分析;③对受试者没有损伤或损伤较小,标本容易采集及获得,能为受试者所接受。例如前列腺特异性抗原PSA可以用于前列腺癌的诊断、判断疾病的分期或者用来评价新药或新疗法在目标人群中的安全性和有效性。寻找和发现有价值的生物标志物已经成为目前研究的一个重要热点。

六、生物标志物与药物评价

近年来,研究人员越来越多的关注生物标志物在疾病诊断和药物疗效、损伤评价中的作用。随着各国药品监管部门以及药物研发者对生物标志物验证的重视,必将极大地推动临床前药物安全性评价中生物标志物的研究进展。表2-5列出了部分生物标志物对药物评价的范围。但许多新型生物标志物尚处于实验研究阶段,进入临床仍需时日。多个生物标志物联合进行药物评价,建立整个的生物标志物药物评价体系结合人工智能、统计学分析是目前研究的主要方向。

表2-5 生物标志物与常见药物评价

(王 堃)